JPH08137992A - Character identification device - Google Patents
Character identification deviceInfo
- Publication number
- JPH08137992A JPH08137992A JP6273250A JP27325094A JPH08137992A JP H08137992 A JPH08137992 A JP H08137992A JP 6273250 A JP6273250 A JP 6273250A JP 27325094 A JP27325094 A JP 27325094A JP H08137992 A JPH08137992 A JP H08137992A
- Authority
- JP
- Japan
- Prior art keywords
- character
- feature amount
- character pattern
- pattern
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 13
- 238000000605 extraction Methods 0.000 description 11
- 238000000034 method Methods 0.000 description 9
- 230000005484 gravity Effects 0.000 description 6
- 230000001174 ascending effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、読み取った文字におけ
る二値化された文字パターンから的確な文字の識別を行
う文字識別装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character identification device for accurately identifying a character from a binarized character pattern of a read character.
【0002】[0002]
【従来の技術】従来、英数字やカタカナを含む文字を識
別する技術としては、特開平1−258086号公報に
示される文字識別方式がある。この文字識別方式は、文
字の読み取りによって二値化された文字パターンからそ
の文字の輪郭を抽出し、その輪郭を形成する線分の相対
位置および予め定められた演算式により求められる特徴
量(Q値)を算出し、この特徴量と複数の文字に対応し
て予め定められた基準特徴量とを比較して、その差が最
小となるものと対応する文字を文字パターンの文字であ
ると認識している。2. Description of the Related Art Conventionally, as a technique for identifying characters including alphanumeric characters and katakana, there is a character identification system disclosed in Japanese Patent Laid-Open No. 1-258086. In this character identification method, the outline of the character is extracted from the character pattern binarized by reading the character, and the relative position of the line segment forming the outline and the characteristic amount (Q Value) and compares this feature amount with a predetermined reference feature amount corresponding to a plurality of characters, and the character having the smallest difference is recognized as a character of the character pattern. are doing.
【0003】[0003]
【発明が解決しようとする課題】しかしながら、このよ
うな文字識別方式では、識別対象の文字における大局的
な特徴を表すことはできるものの、文字の細かい部分で
の特徴を表しにくいという問題がある。例えば、文字
「6」と文字「0」とを識別する場合、文字「6」のル
ープが少し大きくなると文字「0」との特徴差を出すの
が困難であり、誤認識をしてしまう原因の一つとなって
いる。However, such a character identification method has a problem that although it is possible to represent global characteristics of a character to be identified, it is difficult to express characteristics in a fine portion of the character. For example, when distinguishing the character “6” from the character “0”, it is difficult to make a feature difference from the character “0” when the loop of the character “6” becomes a little large, which may cause misrecognition. Has become one of.
【0004】[0004]
【課題を解決するための手段】本発明は、このような課
題を解決するために成された文字識別装置である。すな
わち、本発明の文字識別装置は、識別対象の文字を読み
取り、その文字における二値化された文字パターンを得
てこれから文字の輪郭を抽出し、その特徴点から文字の
識別を行うものであり、文字の輪郭を構成する画素のう
ちの注目点に対する次の点の移動方向を所定の方向成分
に区分けする方向成分判断手段と、方向成分判断手段か
ら区分けした方向成分の情報を得て、これに応じた演算
式を用いて文字パターンの特徴を示す特徴量を算出する
特徴量算出手段と、特徴量算出手段により算出した特徴
量と、複数の文字に対して各々予め定められた基準特徴
量との間で比較を行いその差が最小となる基準特徴量に
対応する文字を文字パターンにおける文字と認識する識
別手段とを備える構成となっている。SUMMARY OF THE INVENTION The present invention is a character identification device made to solve such problems. That is, the character identification device of the present invention reads a character to be identified, obtains a binarized character pattern in the character, extracts the contour of the character from the character pattern, and identifies the character from the characteristic points. , Direction component determining means for segmenting the moving direction of the next point with respect to the target point among the pixels forming the outline of the character into predetermined direction components, and information of the segmented direction components from the direction component determining means. Characteristic amount calculation means for calculating a characteristic amount indicating a characteristic of a character pattern using an arithmetic expression corresponding to the characteristic amount, a characteristic amount calculated by the characteristic amount calculation means, and a reference characteristic amount predetermined for each of a plurality of characters. And a discriminating means for recognizing a character corresponding to the reference feature amount with which the difference between the two is compared with the character in the character pattern.
【0005】[0005]
【作用】本発明では、方向成分判断手段によって、文字
パターンから抽出した文字の輪郭を構成する画素のうち
注目点に対する次の点の移動方向を所定の方向成分に区
分けしている。また、特徴量算出手段では、この区分け
した方向成分に応じた演算式を用いて文字パターンの特
徴を示す特徴量を算出している。これによって、各方向
成分毎の特徴量を得ることができ、文字パターンの細か
な特徴に応じた特徴量の差異を明確に表すことができる
ため、この差異に基づき文字識別を的確に行うことがで
きるようになる。According to the present invention, the direction component determining means divides the moving direction of the next point of the pixels forming the outline of the character extracted from the character pattern with respect to the target point into predetermined direction components. Further, the feature amount calculating means calculates the feature amount indicating the feature of the character pattern by using the arithmetic expression according to the divided direction component. As a result, it is possible to obtain the feature amount for each direction component, and it is possible to clearly show the difference in the feature amount according to the fine feature of the character pattern. Therefore, it is possible to accurately perform the character identification based on this difference. become able to.
【0006】[0006]
【実施例】以下に、本発明の文字識別装置における実施
例を図に基づいて説明する。図1は本発明の文字識別装
置における第1実施例を説明する図で、(a)はブロッ
ク図、(b)は「6」の文字パターン、(c)は「0」
の文字パターン、(d)は方向成分を示すものである。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the character identification device of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram for explaining the first embodiment of the character identification device of the present invention. (A) is a block diagram, (b) is a character pattern of "6", (c) is "0".
Character pattern, and (d) shows a direction component.
【0007】図1(a)に示すように第1実施例におけ
る文字識別装置は、二値化された文字パターン1aを格
納するためのパターンレジスタ1と、パターンレジスタ
1から出力される文字パターン1bから公知の方法によ
り文字パターン1bの輪郭2aを抽出するための輪郭抽
出部2と、輪郭2aを構成する画素のうち注目点に対す
る次の点の移動方向を例えば4つの方向成分に区分けし
てその情報を輪郭2aに付加し、方向成分付輪郭3aを
出力する方向成分判断部3と、方向成分判断部3より得
た方向成分付輪郭3aに基づき文字パターン1bの特徴
量4aを算出する特徴量算出部4と、算出された特徴量
4aと予め定められた基準特徴量との間で比較を行い、
両者の差が最小となるのが検出されたときに、その基準
特徴量に対応する文字を文字パターン1aの文字である
と判定し、判定結果5aを出力する識別部5とから構成
されている。As shown in FIG. 1A, the character identifying apparatus in the first embodiment has a pattern register 1 for storing a binarized character pattern 1a, and a character pattern 1b output from the pattern register 1. From the contour extraction unit 2 for extracting the contour 2a of the character pattern 1b by a known method from the above, the moving direction of the next point of the pixels forming the contour 2a with respect to the target point is divided into, for example, four direction components, and A directional component determination unit 3 that adds information to the contour 2a and outputs a directional component-added contour 3a, and a feature amount that calculates the feature amount 4a of the character pattern 1b based on the directional component-added contour 3a obtained from the directional component determination unit 3. The calculation unit 4 compares the calculated feature amount 4a with a predetermined reference feature amount,
When it is detected that the difference between the two is the smallest, it is determined that the character corresponding to the reference feature amount is the character of the character pattern 1a, and the identification unit 5 that outputs the determination result 5a. .
【0008】第1実施例における文字識別装置では、例
えば図1(b)に示すような「6」の文字パターンと、
図1(c)に示すような「0」の文字パターンとの特徴
量の差を明確に表してその識別を行うものであり、以下
にその動作を説明する。In the character identifying device of the first embodiment, for example, a character pattern of "6" as shown in FIG.
The difference between the feature amount and the character pattern of "0" as shown in FIG. 1C is clearly shown to identify the difference, and the operation will be described below.
【0009】先ず、公知の文字パターン入力手段(例え
ば、デジタイザ)によって識別対象となる文字、例えば
記帳上の文字「6」を読み取り、そのxy座標の位置に
関連させて二値化されたデータから成る文字パターン1
aをパターンレジスタ1内に記憶する。そして、パター
ンレジスタ1から文字パターン1bを輪郭抽出部2へ出
力する。First, a known character pattern input means (for example, a digitizer) reads a character to be identified, for example, a character "6" on a notepad, and the binarized data is associated with the xy coordinate position. Composed character pattern 1
Store a in pattern register 1. Then, the pattern register 1 outputs the character pattern 1b to the contour extraction unit 2.
【0010】輪郭抽出部2は、パターンレジスタ1から
出力される文字パターン1bを得て、文字パターン1b
における輪郭を抽出する処理を行う。輪郭を抽出するに
は公知の方法、例えば文字パターン1bの上端に位置す
る画素を開始点として輪郭追跡を行い、その輪郭情報を
輪郭2aとして抽出する。なお、輪郭抽出の方法はこれ
以外であってもよい。The contour extracting unit 2 obtains the character pattern 1b output from the pattern register 1 and outputs the character pattern 1b.
The process of extracting the contour at is performed. To extract the contour, a known method is used, for example, contour tracing is performed using a pixel located at the upper end of the character pattern 1b as a starting point, and the contour information is extracted as the contour 2a. Note that the contour extraction method may be other than this.
【0011】方向成分判断部3は、輪郭抽出部2にて抽
出した輪郭2aを得て、輪郭2aを構成する画素のうち
注目点に対する次の点の移動方向により線分を例えば4
つの方向成分に分解する。4つの方向成分とは、図1
(d)に示すように水平成分、垂直成分、+45°成
分、−45°成分である。4つの方向成分に分解する方
法としては、先ず(1)式を用いてdx、dyを算出
し、dx、dyが(2)式のいずれに該当するかによっ
て求める。The direction component determination unit 3 obtains the contour 2a extracted by the contour extraction unit 2, and a line segment is, for example, 4 by the moving direction of the next point with respect to the target point among the pixels forming the contour 2a.
Decompose into one direction component. The four direction components are shown in Fig. 1.
As shown in (d), there are a horizontal component, a vertical component, a + 45 ° component, and a −45 ° component. As a method of decomposing into four directional components, first, dx and dy are calculated using the equation (1), and it is determined depending on which of the equations (2) the dx and dy correspond.
【0012】[0012]
【数1】 [Equation 1]
【0013】[0013]
【数2】 [Equation 2]
【0014】なお、(1)式におけるxi,yi は注目点
の座標値、xi+1,yi+1 は次の点の座標値を示してい
る。これは以下の式においても同様である。In the equation (1), xi, yi are the coordinate values of the target point, and xi + 1, yi + 1 are the coordinate values of the next point. This also applies to the following equations.
【0015】方向成分判断部3では、このようにして輪
郭2aにおける線分を4つの方向成分に分解した後、こ
の4つの方向成分に対応した所定のコードを輪郭2aに
付加して方向成分付輪郭3aを出力する。In the direction component judging unit 3, the line segment in the contour 2a is decomposed in this way into four direction components, and then a predetermined code corresponding to the four direction components is added to the contour 2a to add the direction component. The contour 3a is output.
【0016】特徴量算出部4は、方向成分判断部3から
の出力である方向成分付輪郭3aを受け、付加されてい
る方向成分に応じた演算式による特徴量の算出処理を行
う。例えば、水平成分(dy=0)であった場合には、
(3)式に示すq0 、q1 、q8 、q9 についてのみ算
出する。The feature amount calculation unit 4 receives the contour 3a with a direction component output from the direction component determination unit 3, and performs a feature amount calculation process using an arithmetic expression according to the added direction component. For example, if the horizontal component (dy = 0),
Only q0, q1, q8 and q9 shown in the equation (3) are calculated.
【0017】[0017]
【数3】 (Equation 3)
【0018】なお、(3)式で示されるHX、HYは
x、y方向それぞれの文字パターン1aの文字幅を表し
ている。また、これは以下の式においても同様とする。Note that HX and HY shown in the equation (3) represent the character width of the character pattern 1a in the x and y directions, respectively. This also applies to the following equations.
【0019】ここで算出される特徴量q0 、q1 は、図
1(b)、(c)に示す外接長方形領域10(文字パタ
ーンに外接する長方形の領域)の左下を原点としたxy
座標系について演算した値であり、各々原点に近いほど
小さな値となる。なお、特徴量q0 は線分におけるx座
標値(xi +xi+1 )、特徴量q1 は線分におけるy座
標値(yi +yi+1 )について計算したものである。つ
まり、特徴量q0 は、文字パターン1aにおいて水平成
分(dy=0)が外接長方形領域10における右側に多
いほど大きな値となり、特徴量q1 は、水平成分(dy
=0)が外接長方形領域10における上側に多いほど大
きな値となるものである。The feature quantities q0 and q1 calculated here are xy with the lower left of the circumscribed rectangular area 10 (rectangular area circumscribing the character pattern) shown in FIGS. 1B and 1C as the origin.
It is a value calculated with respect to the coordinate system, and the closer to the origin, the smaller the value. The feature quantity q0 is calculated for the x coordinate value (xi + xi + 1) on the line segment, and the feature quantity q1 is calculated for the y coordinate value (yi + yi + 1) on the line segment. That is, the feature quantity q0 becomes larger as the horizontal component (dy = 0) in the character pattern 1a increases on the right side of the circumscribed rectangular area 10, and the feature quantity q1 becomes larger than the horizontal component (dy).
= 0), the larger the value in the upper side of the circumscribed rectangular area 10, the larger the value.
【0020】このため、特徴量q0 では外接長方形領域
10における左側に長い水平成分が存在する場合と、右
側に短い水平成分が存在する場合との区別をつけにく
い。そこで、外接長方形領域10の右上を原点として同
様に算出した特徴量q8 を用いることでその区別をつけ
るようにしている。すなわち、外接長方形領域10の左
側に長い水平成分が存在する場合は特徴量q0 は小、特
徴量q8 は大となり、外接長方形領域10の右側に短い
水平成分が存在する場合は特徴量q0 は小、特徴量q8
は小となることで区別をしている。なお、特徴量q9 に
おいても同様な考え方で算出するものであり、外接長方
形領域10の右上を原点として特徴量q1 と同様な計算
を行ったものである。Therefore, it is difficult to distinguish between the case where a long horizontal component exists on the left side and the case where a short horizontal component exists on the right side in the circumscribed rectangular area 10 in the feature quantity q0. Therefore, by using the feature quantity q8 similarly calculated with the upper right of the circumscribed rectangular area 10 as the origin, the distinction is made. That is, when there is a long horizontal component on the left side of the circumscribed rectangular area 10, the feature quantity q0 is small and the feature quantity q8 is large, and when there is a short horizontal component on the right side of the circumscribed rectangular area 10, the feature quantity q0 is small. , Feature quantity q8
Distinguishes by being small. Note that the feature quantity q9 is also calculated in the same way, and the same calculation as the feature quantity q1 is performed with the upper right corner of the circumscribed rectangular area 10 as the origin.
【0021】このような特徴量q0 、q1 、q8 、q9
を算出することにより、文字パターン1aにおいて水平
成分がどの位置に多く分布しているかを表すことが可能
となる。Such characteristic quantities q0, q1, q8, q9
By calculating, it is possible to represent at which position the horizontal component is distributed in the character pattern 1a.
【0022】また、方向成分判断部3からの方向成分付
輪郭3aが垂直成分を示している場合には、(4)式を
用いて特徴量q2 、q3 、q10、q11のみを算出する。
また、方向成分判断部3からの方向成分付輪郭3aが+
45°成分を示している場合には、(5)式を用いて特
徴量q4 、q5 、q12、q13のみを算出する。さらに、
方向成分判断部3からの方向成分付輪郭3aが−45°
成分を示している場合には、(6)式を用いて特徴量q
6 、q7 、q14、q15のみを算出する。Further, when the contour 3a with direction component from the direction component judgment unit 3 indicates a vertical component, only the feature quantities q2, q3, q10, q11 are calculated using the equation (4).
Further, the contour 3a with direction component from the direction component determination unit 3 is +
When the 45 ° component is indicated, only the feature quantities q4, q5, q12 and q13 are calculated using the equation (5). further,
The contour 3a with the direction component from the direction component determination unit 3 is -45 °.
When the component is shown, the feature quantity q is calculated using the equation (6).
Only 6, q7, q14 and q15 are calculated.
【0023】[0023]
【数4】 [Equation 4]
【0024】[0024]
【数5】 (Equation 5)
【0025】[0025]
【数6】 (Equation 6)
【0026】文字パターン1aに対して特徴量q0 〜q
15を算出する演算を行うことにより、輪郭を構成するデ
ータが外接長方形領域10内のどの位置に分布している
かを詳細に表すことができるようになる。しかも、方向
成分に区分けしてそれに応じた演算式のみを用いて算出
するため、無駄な特徴量の計算を行うことがなく、短時
間での処理を行うことが可能なるい。なお、識別対象の
文字に複数の輪郭が存在する場合には、その全輪郭につ
いて特徴量q0 〜q15の算出を行うようにする。Characteristic quantities q0 to q for the character pattern 1a
By performing the calculation for calculating 15, it becomes possible to represent in detail where in the circumscribed rectangular area 10 the data forming the contour is distributed. Moreover, since it is divided into the direction components and the calculation is performed using only the calculation formulas corresponding thereto, it is possible to perform the processing in a short time without performing the unnecessary calculation of the feature amount. When the character to be identified has a plurality of contours, the feature quantities q0 to q15 are calculated for all the contours.
【0027】次に、識別部5による文字の識別を行う。
この識別部5には、予め複数の文字についての基準特徴
量が各々格納されている。文字の識別を行うには、先
ず、これら格納されている基準特徴量と、輪郭2aから
導出した文字パターン1aの特徴量q0 〜q15とを逐次
比較することにより、両者間の差、すなわちマッチング
距離を各々導出する。そして、この導出したマッチング
距離のうちで最小値を示す基準特徴量に対応する文字を
識別すべき文字であるとし、これを判定結果5aとして
出力する。Next, the identifying section 5 identifies the character.
In the identification unit 5, reference feature amounts for a plurality of characters are stored in advance. In order to identify a character, first, these stored reference feature amounts and the feature amounts q0 to q15 of the character pattern 1a derived from the contour 2a are sequentially compared to determine the difference between them, that is, the matching distance. Are derived respectively. Then, among the derived matching distances, it is assumed that the character corresponding to the reference feature amount having the minimum value is the character to be identified, and this is output as the determination result 5a.
【0028】このように、第1実施例における文字識別
装置では、輪郭2aの注目点に対する次の点の移動方向
によって線分の方向成分を区分けし、その区分けに応じ
た特徴量を算出しているため、文字パターン1aにおけ
るより詳細な特徴を明確に表すことが可能となる。つま
り、例えば図1(b)に示すような「6」の文字パター
ンと図1(c)に示すような「0」の文字パターンのよ
うに、大局的な特徴が類似している場合であっても図中
破線枠内において異なる特徴(線分のわずかな方向性お
よび分布の差)を的確に識別することができ、認識率を
大幅に向上させることが可能となる。なお、第1実施例
においては、方向成分を4つに区分けする例を示した
が、これ以外の区分けを行ってもよい。As described above, in the character identifying apparatus according to the first embodiment, the direction component of the line segment is divided according to the moving direction of the next point with respect to the point of interest of the contour 2a, and the feature amount according to the division is calculated. Therefore, it is possible to clearly represent more detailed features in the character pattern 1a. That is, there is a case where the global features are similar, such as a character pattern of "6" as shown in FIG. 1B and a character pattern of "0" as shown in FIG. 1C. However, different features (slight directivity of line segments and difference in distribution) can be accurately identified within the broken line frame in the figure, and the recognition rate can be significantly improved. In the first embodiment, the example in which the directional component is divided into four has been shown, but other divisions may be performed.
【0029】次に、本発明の文字識別装置における第2
実施例を図2に基づいて説明する。図2は第2実施例に
おける文字識別装置を説明する図で、(a)はブロック
図、(b)は「6」の文字パターン、(c)は「0」の
文字パターンを示すものである。図2(a)に示すよう
に、第2実施例における文字識別装置においては、パタ
ーンレジスタ1、輪郭抽出部2、方向成分判断部3、特
徴量算出部4、識別部5を備える点で第1実施例に示す
文字識別装置と同様であるが、輪郭抽出部2から輪郭2
aを得て所定のエリアコード6aを特徴量算出部4に出
力するエリア判定部6を備える点で異なっている。Next, the second character recognition apparatus of the present invention
An embodiment will be described with reference to FIG. 2A and 2B are views for explaining a character identification device according to the second embodiment. FIG. 2A is a block diagram, FIG. 2B is a character pattern of "6", and FIG. 2C is a character pattern of "0". . As shown in FIG. 2A, the character identifying apparatus according to the second embodiment includes a pattern register 1, a contour extracting unit 2, a direction component determining unit 3, a feature amount calculating unit 4, and an identifying unit 5. Similar to the character recognition apparatus shown in the first embodiment, except that the contour extraction unit 2 outputs the contour 2
The difference is that an area determination unit 6 that obtains a and outputs a predetermined area code 6a to the feature amount calculation unit 4 is provided.
【0030】すなわち、パターンレジスタ1、輪郭抽出
部2、方向成分判断部3、特徴量算出部4、識別部5に
おける各構成の動作は第1実施例と同様であるため、以
下においては相違するエリア判定部6の動作を中心とし
て説明を行う。That is, the operation of each component of the pattern register 1, the contour extraction unit 2, the direction component determination unit 3, the feature amount calculation unit 4, and the identification unit 5 is the same as that of the first embodiment, and therefore the following is different. The operation of the area determination unit 6 will be mainly described.
【0031】エリア判定部6は、図2(b)、(c)に
示すように、外接長方形領域10を例えば4つのエリア
に分割し、座標((xi +xi+1 )/2,(yi +i+1
)/2)がどのエリアに存在しているかを特徴量算出
部4へ出力している。つまり、エリア判定部6は、先ず
輪郭抽出部2より輪郭2aを得て、図2(b)、(c)
に示すようにその外接長方形領域10をHX/2および
HY/2を境として4等分し、エリア〜エリアに分
ける処理を行う。そして、輪郭2aの座標((xi +x
i+1 )/2,(yi +i+1 )/2)を(x,y)とした
場合に、これが(7)式のどれに当てはまるかを判定し
て、対応するエリアコード6aを特徴量算出部4へ出力
している。As shown in FIGS. 2B and 2C, the area determination unit 6 divides the circumscribed rectangular area 10 into, for example, four areas, and coordinates ((xi + xi + 1) / 2, (yi + i). +1
) / 2) is output to the feature amount calculation unit 4 in which area. That is, the area determination unit 6 first obtains the contour 2a from the contour extraction unit 2, and then the area determination unit 6 in FIGS.
As shown in, the circumscribed rectangular area 10 is divided into four equal parts with HX / 2 and HY / 2 as boundaries, and the process is divided into areas. Then, the coordinates of the contour 2a ((xi + x
When (i + 1) / 2, (yi + i + 1) / 2) is set to (x, y), it is determined which of the expressions (7) is applicable, and the corresponding area code 6a is set as the feature quantity. It is output to the calculation unit 4.
【0032】[0032]
【数7】 (Equation 7)
【0033】特徴量算出部4では、第1実施例で説明し
たと同様、方向成分付輪郭3aを方向成分判断部3から
受けて特徴量q0 〜q15を計算するとともに、エリア判
定部6からの出力であるエリアコード6aにしたがって
該当するエリアに対する特徴量を各々算出して出力す
る。この場合、例えば第1実施例で説明したような全エ
リアでの特徴量をq0,0 〜q0,15とし、エリア、エリ
ア、エリア、エリアでの特徴量を各々q1,0 〜q
1,15、q2,0 〜q2,15、q3,0 〜q3,15、q4,0〜q4,1
5として表す。As in the first embodiment, the feature quantity calculation unit 4 receives the contour 3a with direction component from the direction component determination unit 3 to calculate the feature quantities q0 to q15, and the area determination unit 6 According to the output area code 6a, the feature amount for each corresponding area is calculated and output. In this case, for example, the feature amounts in all areas as described in the first embodiment are set to q0,0 to q0,15, and the feature amounts in the areas, areas, and areas are set to q1,0 to q, respectively.
1,15, q2,0 to q2,15, q3,0 to q3,15, q4,0 to q4,1
Expressed as 5.
【0034】識別部5は、特徴量算出部4から出力され
る特徴量4aを受け、(8)式を用いて予め登録されて
いる辞書の基準特徴量とのマッチングを行い、その距離
値dkの最小値と対応する文字を出力する。The identification unit 5 receives the feature amount 4a output from the feature amount calculation unit 4, performs matching with the reference feature amount of the dictionary registered in advance using the equation (8), and the distance value dk thereof. The character corresponding to the minimum value of is output.
【0035】[0035]
【数8】 (Equation 8)
【0036】なお、(8)式において、dkは文字kの
マッチング結果、wiはエリアiの重みづけ係数、q
i,jは入力文字の特徴量、q’k,i,jは辞書に格
納されている文字kの基準特徴量を示す。(重みづけ係
数wiは、例えばw0=1.0,w1=0.5,w2=0.5,w3
=0.5,w4=0.5 である。)In the equation (8), dk is the matching result of the character k, wi is the weighting coefficient of the area i, and q
i and j indicate the feature amount of the input character, and q′k, i, j indicate the reference feature amount of the character k stored in the dictionary. (Weighting factors wi are, for example, w0 = 1.0, w1 = 0.5, w2 = 0.5, w3
= 0.5, w4 = 0.5. )
【0037】例えば、図2(b)、(c)に示すよう
に、外接長方形領域10を4等分したときの右上となる
エリアにのみ注目すると、文字「0」ではエリアの
上部と右側とに分布となっているのに対し、文字「6」
ではエリアの上部と中央部とに分布していることがわ
かる。これによって、「6」の文字パターンと「0」の
文字パターンとにおいては、エリアにおける特徴量q
4,0 〜q4,15の値が明確に異なることになる。For example, as shown in FIGS. 2B and 2C, when attention is paid only to the upper right area when the circumscribed rectangular area 10 is divided into four equal parts, the character "0" indicates the upper and right sides of the area. Although it is distributed in the area, the character "6"
It can be seen that is distributed in the upper part and the central part of the area. As a result, in the character pattern of "6" and the character pattern of "0", the feature amount q in the area
The values of 4,0 to q4,15 are clearly different.
【0038】結果として、「6」の文字パターンと
「0」の文字パターンとでは、全体の特徴量q0,0 〜q
0,15およびエリアにおける特徴量q4,0 〜q4,15の値
に大きな差が生じ、これに基づいて、より信頼性の高い
文字識別を行うことが可能となる。なお、第2実施例に
おいては外接長方形領域10を4等分する例を示した
が、これは一例であり、他の数に等分しても同様であ
る。この分割数を多くすることでさらに高い認識率を得
ることができるようになる。As a result, for the character pattern of "6" and the character pattern of "0", the overall feature quantities q0,0 to q
There is a large difference in the values of the feature quantities q4,0 to q4,15 in 0, 15 and the area, and based on this, it is possible to perform more reliable character identification. In the second embodiment, the circumscribed rectangular region 10 is divided into four equal parts, but this is an example, and the same is true even if the number is divided into other parts. By increasing the number of divisions, a higher recognition rate can be obtained.
【0039】次に、本発明の文字識別装置における第3
実施例を図3に基づいて説明する。図3は第3実施例に
おける文字識別装置を説明する図で、(a)はブロック
図、(b)は「6」の文字パターン、(c)は「0」の
文字パターンを示すものである。図3(a)に示すよう
に、第3実施例における文字識別装置においては、パタ
ーンレジスタ1、輪郭抽出部2、方向成分判断部3、特
徴量算出部4、識別部5およびエリア判定部6を備える
点で第2実施例に示す文字識別装置と同様であるが、輪
郭抽出部2から輪郭2aを得て文字パターンの重心位置
7aをエリア判定部6に出力する重心算出部7を備える
点で異なっている。以下、この重心算出部7の動作から
第3実施例における文字識別装置の動作を順に説明す
る。Next, the third character recognition apparatus of the present invention will be described.
An embodiment will be described with reference to FIG. 3A and 3B are views for explaining a character identification device according to the third embodiment. FIG. 3A is a block diagram, FIG. 3B is a character pattern of "6", and FIG. 3C is a character pattern of "0". . As shown in FIG. 3A, in the character identifying apparatus according to the third embodiment, the pattern register 1, the contour extracting unit 2, the direction component determining unit 3, the feature amount calculating unit 4, the identifying unit 5, and the area determining unit 6 are included. It is similar to the character identifying apparatus according to the second embodiment in that it is provided with a barycenter calculation unit 7 that obtains the contour 2a from the contour extraction unit 2 and outputs the barycentric position 7a of the character pattern to the area determination unit 6. It's different. Hereinafter, the operation of the character center in the third embodiment will be sequentially described from the operation of the gravity center calculating unit 7.
【0040】重心算出部7では、輪郭抽出部2から輪郭
2aを受け、(9)式によってその文字パターンの重心
(CGX,CGY)を算出する。The center of gravity calculating unit 7 receives the outline 2a from the outline extracting unit 2, and calculates the center of gravity (CGX, CGY) of the character pattern by the equation (9).
【0041】[0041]
【数9】 [Equation 9]
【0042】次に、エリア判定部6は、輪郭抽出部2か
ら輪郭2aを受けるとともに重心算出部7から文字パタ
ーンの重心位置7aを受けて、図3(b)、(c)に示
すように外接長方形領域10を文字パターンの重心位置
を境にして4分割する。そして、輪郭がエリア〜エリ
アのうちのどのエリアに存在するかを(10)式を用
いて判定しそのエリアコード6aを特徴量算出部4へ出
力する。Next, the area determination unit 6 receives the contour 2a from the contour extraction unit 2 and the barycenter position 7a of the character pattern from the barycenter calculation unit 7, and as shown in FIGS. 3 (b) and 3 (c). The circumscribed rectangular area 10 is divided into four with the position of the center of gravity of the character pattern as a boundary. Then, which area of the area to the area the contour exists in is determined using the equation (10), and the area code 6a is output to the feature amount calculation unit 4.
【0043】[0043]
【数10】 [Equation 10]
【0044】特徴量算出部4では、第2実施例で説明し
たと同様、方向成分付輪郭3aを方向成分判断部3から
受けて特徴量q0 〜q15を計算するとともに、エリア判
定部6からの出力であるエリアコード6aにしたがって
該当するエリアに対する特徴量を各々算出して出力す
る。この場合、例えば第1実施例で説明した全エリアで
の特徴量をq0,0 〜q0,15とし、エリア、エリア、
エリア、エリアでの特徴量を各々q1,0 〜q1,15、
q2,0 〜q2,15、q3,0 〜q3,15、q4,0 〜q4,15とし
て表す。As in the second embodiment, the feature quantity calculation unit 4 receives the contour 3a with direction component from the direction component determination unit 3 to calculate the feature quantities q0 to q15, and the area determination unit 6 According to the output area code 6a, the feature amount for each corresponding area is calculated and output. In this case, for example, the feature amounts in all areas described in the first embodiment are set to q0,0 to q0,15, and the area, area,
Area and feature quantity in the area are q1,0 to q1,15,
Represented as q2,0 to q2,15, q3,0 to q3,15, q4,0 to q4,15.
【0045】その後は第2実施例と同様に、識別部5に
て特徴量算出部4から出力される特徴量4aを受け、
(8)式を用いて予め登録されている辞書の基準特徴量
とのマッチングを行い、その距離値dkの最小値と対応
する文字を出力する。このように、文字パターンの重心
位置を境にして外接長方形領域10を分割し、各エリア
毎に特徴量を算出することによって、単に等分した場合
よりも筆記された文字に影響を受けることなく安定した
特徴量算出を行うことができるようになる。これによっ
て、さらに信頼性の高い文字識別を行うことが可能とな
る。After that, as in the second embodiment, the identifying unit 5 receives the feature amount 4a output from the feature amount calculating unit 4,
The expression (8) is used to perform matching with the reference feature amount of the dictionary registered in advance, and the character corresponding to the minimum value of the distance value dk is output. In this way, the circumscribed rectangular area 10 is divided with the position of the center of gravity of the character pattern as a boundary, and the feature amount is calculated for each area, so that the written characters are less affected than in the case of simply dividing the area. It becomes possible to perform stable feature amount calculation. This makes it possible to perform character recognition with higher reliability.
【0046】次に、本発明の文字識別装置における第4
実施例を図4に基づいて説明する。図4は第2実施例に
おける文字識別装置を説明する図で、(a)はブロック
図、(b)は文字パターンの投影量、(c)は「6」の
文字パターン、(d)は「0」の文字パターンを示すも
のである。図4(a)に示すように、第4実施例におけ
る文字識別装置においては、パターンレジスタ1、輪郭
抽出部2、方向成分判断部3、特徴量算出部4、識別部
5、エリア判定部6を備える点で第2実施例に示す文字
識別装置と同様であるが、パターンレジスタ1から文字
パターン1aを得て得て文字パターンの投影量を算出
し、それに応じた外接長方形領域10の分割位置8aを
エリア判定部6に出力する分割位置算出部8を備える点
で異なっている。以下、この分割位置算出部8の動作を
中心として第4実施例における文字識別装置の動作を順
に説明する。Next, the fourth character recognition apparatus of the present invention
An embodiment will be described with reference to FIG. 4A and 4B are views for explaining a character identification device in the second embodiment. FIG. 4A is a block diagram, FIG. 4B is a projection amount of a character pattern, FIG. 4C is a character pattern “6”, and FIG. This shows a character pattern of "0". As shown in FIG. 4A, in the character identifying device according to the fourth embodiment, the pattern register 1, the contour extracting unit 2, the direction component determining unit 3, the feature amount calculating unit 4, the identifying unit 5, and the area determining unit 6 are included. The character identification device is similar to the character identification device according to the second embodiment in that the character pattern 1a is obtained from the pattern register 1 to calculate the projection amount of the character pattern, and the divided position of the circumscribed rectangular area 10 corresponding to the calculated projection amount. The difference is that a division position calculation unit 8 that outputs 8a to the area determination unit 6 is provided. Hereinafter, the operation of the character identification device in the fourth embodiment will be described in order centering on the operation of the division position calculation unit 8.
【0047】分割位置算出部8では、パターンレジスタ
1から文字パターン1aを受け、先ず、図4(b)に示
すように文字パターンの投影量を算出する。すなわち、
外接長方形領域10をx方向に走査して、その際の黒点
の数を計数しこれを投影量とする。なお、図示しないが
外接長方形領域10をy方向に走査した際の黒点の数も
計数しておく。The division position calculator 8 receives the character pattern 1a from the pattern register 1 and first calculates the projection amount of the character pattern as shown in FIG. 4 (b). That is,
The circumscribed rectangular area 10 is scanned in the x direction, the number of black dots at that time is counted, and this is set as the projection amount. Although not shown, the number of black dots when the circumscribed rectangular area 10 is scanned in the y direction is also counted.
【0048】次に、計数したx、y方向の投影量に基づ
き(11)式を用いて分割位置を決定し、例えば4つの
エリア〜エリアに分割できるようにする。Next, the division position is determined by using the equation (11) based on the counted projection amounts in the x and y directions so that the division position can be divided into, for example, four areas.
【0049】[0049]
【数11】 [Equation 11]
【0050】(11)式を用いて分割位置を決定するに
は、投影量がしきい値以上となるブロックのy座標値
(分割候補位置)を小さい順に求めてy1、y2…と
し、この中から分割位置を選定する。例えば、図4
(b)に示す例では、投影量がしきい値以上となるの
は、y1、y2、y3の3つであり、この場合には真ん
中のy2をx方向における分割位置とする。同様に、y
方向における分割位置も求め、分割位置8aをエリア判
定部6に出力する。In order to determine the division position using the equation (11), the y coordinate values (division candidate positions) of the block whose projection amount is equal to or larger than the threshold value are obtained in the ascending order, and they are set to y1, y2 ... Select the division position from. For example, in FIG.
In the example shown in (b), the projection amount is equal to or more than the threshold value in three of y1, y2, and y3. In this case, the middle y2 is the division position in the x direction. Similarly, y
The division position in the direction is also obtained, and the division position 8a is output to the area determination unit 6.
【0051】エリア判定部6は、分割位置算出部8から
分割位置8aを受けて外接長方形領域10を図4
(c)、(d)に示すように4分割するとともに、輪郭
抽出部2から輪郭2aを受け(12)式にて輪郭がエリ
ア〜エリアのうちのどのエリアに存在するかを判定
してそのエリアコード6aを特徴量算出部4へ出力す
る。The area determination unit 6 receives the division position 8a from the division position calculation unit 8 and determines the circumscribed rectangular area 10 as shown in FIG.
While dividing into four as shown in (c) and (d), the contour 2a is received from the contour extraction unit 2 and it is determined by the equation (12) which area among the areas the area exists. The area code 6a is output to the feature amount calculation unit 4.
【0052】[0052]
【数12】 (Equation 12)
【0053】特徴量算出部4では、第2実施例および第
3実施例で説明したと同様、方向成分付輪郭3aを方向
成分判断部3から受けて特徴量q0 〜q15を計算すると
ともに、エリア判定部6からの出力であるエリアコード
6aにしたがって該当するエリアに対する特徴量を各々
算出して出力する。この場合、例えば第1実施例で説明
した全エリアでの特徴量をq0,0 〜q0,15とし、エリア
、エリア、エリア、エリアでの特徴量を各々q
1,0 〜q1,15、q2,0 〜q2,15、q3,0 〜q3,15、q4,
0 〜q4,15として表す。As in the second and third embodiments, the feature quantity calculating unit 4 receives the contour 3a with direction component from the direction component determining unit 3 to calculate the feature quantities q0 to q15, and According to the area code 6a, which is the output from the determination unit 6, the feature amount for each corresponding area is calculated and output. In this case, for example, the feature amounts in all areas described in the first embodiment are set to q0,0 to q0,15, and the feature amounts in each area, area, and area are set to q.
1,0 to q1,15, q2,0 to q2,15, q3,0 to q3,15, q4,
Expressed as 0 to q4,15.
【0054】また、識別部5は、第2実施例および第3
実施例で説明したと同様に、特徴量算出部4から出力さ
れる特徴量4aを受け、(8)式を用いて予め登録され
ている辞書の基準特徴量とのマッチングを行い、その距
離値dkの最小値と対応する文字を出力する。このよう
に、外接長方形領域10を文字パターンの投影量に応じ
て分割し、各エリア毎に特徴量を算出することによっ
て、さらに細かい部分における文字パターンの特徴量差
を明確に生じさせることが可能となり、文字識別を的確
に行うことが可能となる。The identifying section 5 is the same as that of the second embodiment and the third embodiment.
As described in the embodiment, the feature amount 4a output from the feature amount calculation unit 4 is received, the reference feature amount of the dictionary registered in advance is matched using the formula (8), and the distance value thereof is calculated. The character corresponding to the minimum value of dk is output. In this way, by dividing the circumscribed rectangular area 10 according to the projection amount of the character pattern and calculating the feature amount for each area, it is possible to clearly cause the feature amount difference of the character pattern in a finer portion. Therefore, it is possible to accurately identify characters.
【0055】なお、第4実施例においては外接長方形領
域10を4分割する例を示したが、これは一例であり、
他の数にて分割してもよい。この分割数を多くすること
により、さらに高い認識率を得ることができるようにな
る。また、第1実施例〜第4実施例においては、「6」
の文字パターンと「0」の文字パターンとを例として説
明したが、本発明はこれに限定されず、他の類似する文
字パターンを識別する場合であっても同様である。Although the circumscribed rectangular area 10 is divided into four in the fourth embodiment, this is an example.
You may divide by another number. By increasing the number of divisions, a higher recognition rate can be obtained. Also, in the first to fourth examples, "6"
The character pattern of “0” and the character pattern of “0” have been described as an example, but the present invention is not limited to this, and the same applies when identifying other similar character patterns.
【0056】[0056]
【発明の効果】以上説明したように本発明の文字識別装
置によれば次のような効果がある。すなわち、文字の輪
郭を形成する線分の移動方向に着目して所定の方向成分
に区分けし、各々に応じた演算式によって特徴量を算出
しているため、大局的には似かよった文字であっても詳
細な部分での特徴差を明確に表すことができ、認識率の
高い文字識別を行うことが可能となる。As described above, the character identification device of the present invention has the following effects. In other words, since the line segments forming the outline of a character are focused on and divided into predetermined direction components, and the feature amount is calculated by an arithmetic expression according to each, the characters are generally similar. However, it is possible to clearly express the feature difference in the detailed portion, and it is possible to perform character recognition with a high recognition rate.
【図1】第1実施例を説明する図で、(a)はブロック
図、(b)は「6」の文字パターン、(c)は「0」の
文字パターン、(d)は方向成分を示している。FIG. 1 is a diagram illustrating a first embodiment, (a) is a block diagram, (b) is a character pattern of “6”, (c) is a character pattern of “0”, and (d) is a direction component. Shows.
【図2】第2実施例を説明する図で、(a)はブロック
図、(b)は「6」の文字パターン、(c)は「0」の
文字パターンを示している。2A and 2B are diagrams illustrating a second embodiment, FIG. 2A is a block diagram, FIG. 2B is a character pattern of “6”, and FIG. 2C is a character pattern of “0”.
【図3】第3実施例を説明する図で、(a)はブロック
図、(b)は「6」の文字パターン、(c)は「0」の
文字パターンを示している。3A and 3B are diagrams illustrating a third embodiment, FIG. 3A is a block diagram, FIG. 3B is a character pattern of “6”, and FIG. 3C is a character pattern of “0”.
【図4】第4実施例を説明する図で、(a)はブロック
図、(b)は文字パターンの投影量、(c)は「6」の
文字パターン、(d)は「0」の文字パターンを示して
いる。FIG. 4 is a diagram for explaining a fourth embodiment, (a) is a block diagram, (b) is a projection amount of a character pattern, (c) is a character pattern of “6”, and (d) is “0”. It shows the character pattern.
1 パターンレジスタ 2 輪郭抽出部 3 方向成分判断部 4 特徴量算出部 5 識別部 6 エリア判定部 7 重心算出部 8 分割位置算出部 10 外接長方形領域 1 pattern register 2 contour extraction unit 3 direction component determination unit 4 feature amount calculation unit 5 identification unit 6 area determination unit 7 center of gravity calculation unit 8 division position calculation unit 10 circumscribed rectangular area
───────────────────────────────────────────────────── フロントページの続き (72)発明者 永田 静男 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内 ─────────────────────────────────────────────────── ─── Continuation of front page (72) Inventor Shizuo Nagata 1-7-12 Toranomon, Minato-ku, Tokyo Oki Electric Industry Co., Ltd.
Claims (4)
ける二値化された文字パターンを得て、該文字パターン
から該文字の輪郭を抽出し、その特徴点から該文字の識
別を行う文字識別装置であって、 前記文字の輪郭を構成する画素のうちの注目点に対する
次の点の移動方向を所定の方向成分に区分けする方向成
分判断手段と、 前記方向成分判断手段から区分けした前記方向成分の情
報を得て、これに応じた演算式を用いて前記文字パター
ンの特徴を示す特徴量を算出する特徴量算出手段と、 前記特徴量算出手段により算出した前記特徴量と、複数
の文字に対して各々予め定められた基準特徴量との間で
比較を行い、その差が最小となる基準特徴量に対応する
文字を前記文字パターンにおける文字と認識する識別手
段とを備えていることを特徴とする文字識別装置。1. A character identification which reads a character to be identified, obtains a binarized character pattern in the character, extracts the contour of the character from the character pattern, and identifies the character from the feature points. A device, wherein the direction component judging means divides the moving direction of the next point with respect to the target point among the pixels forming the outline of the character into predetermined direction components, and the direction component divided from the direction component judging means. Information, and a feature amount calculation unit that calculates a feature amount indicating the feature of the character pattern using an arithmetic expression corresponding to the information, the feature amount calculated by the feature amount calculation unit, and a plurality of characters On the other hand, it is characterized in that it is provided with an identification means for performing a comparison with a predetermined reference feature amount and recognizing a character corresponding to the reference feature amount having the minimum difference as a character in the character pattern. Character recognition device for collection.
域を所定の小領域に分割し、該小領域単位での特徴量算
出を前記特徴量算出部に行わせるための分割エリア判定
手段を備えていることを特徴とする請求項1記載の文字
識別装置。2. A division area determination means for dividing a rectangular area circumscribing the character pattern into predetermined small areas and causing the characteristic amount calculation unit to calculate the characteristic amount in units of the small regions. The character identification device according to claim 1, wherein:
て、該重心位置を中心とした前記外接長方形領域の分割
を前記分割エリア判定手段に行わせるための重心位置算
出手段を備えていることを特徴とする請求項2記載の文
字識別装置。3. A center-of-gravity position calculation means for calculating the center-of-gravity position of the character pattern and causing the divided area determination means to divide the circumscribed rectangular area centered on the center-of-gravity position is provided. The character identification device according to claim 2, wherein the character identification device is a character identification device.
び横方向に沿った各々の文字パターンの画素数を加算し
た投影情報を得るとともに、該投影情報に基づいた前記
外接長方形領域の分割を前記分割エリア判定手段に行わ
せるための分割位置算出手段を備えていることを特徴と
する請求項2記載の文字識別装置。4. The projection information obtained by adding the number of pixels of each character pattern along the vertical and horizontal directions to the circumscribed rectangular area is obtained, and the circumscribed rectangular area is divided based on the projection information. 3. The character identification device according to claim 2, further comprising division position calculation means for causing the division area determination means.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6273250A JPH08137992A (en) | 1994-11-08 | 1994-11-08 | Character identification device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP6273250A JPH08137992A (en) | 1994-11-08 | 1994-11-08 | Character identification device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08137992A true JPH08137992A (en) | 1996-05-31 |
Family
ID=17525219
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP6273250A Pending JPH08137992A (en) | 1994-11-08 | 1994-11-08 | Character identification device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08137992A (en) |
-
1994
- 1994-11-08 JP JP6273250A patent/JPH08137992A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH06348896A (en) | Segmenting method for character and device therefor | |
| CN111292346B (en) | A detection method for casting box profile in noisy environment | |
| CN103971376A (en) | Application program execution method and device | |
| JP3370934B2 (en) | Optical character reading method and apparatus | |
| JPH08137992A (en) | Character identification device | |
| JP2658136B2 (en) | Character recognition method | |
| JP3344062B2 (en) | Katakana handwritten character extraction circuit | |
| JP3077929B2 (en) | Character extraction method | |
| JP2785438B2 (en) | Character recognition method | |
| JP3428504B2 (en) | Character recognition device | |
| JPH0528310A (en) | Form type document identification device | |
| JPH08147411A (en) | Character recognition device | |
| JP2930996B2 (en) | Image recognition method and image recognition device | |
| US5519788A (en) | Alphanumeric image segmentation scheme | |
| JP2974396B2 (en) | Image processing method and apparatus | |
| JPH09231314A (en) | On-line handwritten character recognizing device | |
| JPH1021332A (en) | Non-linear normalizing method | |
| JPS6334682A (en) | Character recognition system | |
| JP3009237B2 (en) | Feature extraction method | |
| JPH0656625B2 (en) | Feature extraction method | |
| JPH01231189A (en) | Character recognizing system | |
| JP2792063B2 (en) | Character recognition dictionary creation method | |
| JP2832035B2 (en) | Character recognition device | |
| JP3662967B2 (en) | Character loop candidate extraction device and character completion device | |
| JPH05258102A (en) | Character/graphic separation device |