JPH07160808A - Frame cutting method in character recognition - Google Patents
Frame cutting method in character recognitionInfo
- Publication number
- JPH07160808A JPH07160808A JP5303614A JP30361493A JPH07160808A JP H07160808 A JPH07160808 A JP H07160808A JP 5303614 A JP5303614 A JP 5303614A JP 30361493 A JP30361493 A JP 30361493A JP H07160808 A JPH07160808 A JP H07160808A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- character
- sensor
- characters
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】
【目的】 文字が書き込まれた枠の位置を探索し、枠の
傾きを求めて補正することにより、文字を正確に切り出
し、文字を書き込む枠の位置が特定されていない用紙に
記入された文字を高い認識率で認識すること。
【構成】 枠2に文字、数字、記号等が記入された用紙
1からイメージ情報を読み取り、イメージ情報の下(も
しくは上)の設定位置から同図矢印に示すように枠2を
探索する。枠2を発見すると、枠2をたどって枠2の角
4点, , ,を見つける。求めた角4点, ,
, から枠2の位置と傾きを求め、枠2の傾きを回転
補正する。ついで、回転補正された枠から文字、数字、
記号等のパターン3を切り出し、文字認識を行う。
(57) [Abstract] [Purpose] Paper that the position of the frame in which the character is written is not accurately specified by searching for the position of the frame in which the character is written, and determining and correcting the tilt of the frame. Recognize the characters written in with a high recognition rate. [Structure] Image information is read from a sheet 1 in which characters, numbers, symbols, etc. are written in a frame 2, and the frame 2 is searched from a set position below (or above) the image information as shown by an arrow in the figure. When the frame 2 is found, the frame 2 is traced and the four corners of the frame 2 are found. 4 corners obtained,
Then, the position and the inclination of the frame 2 are obtained from, and the inclination of the frame 2 is rotationally corrected. Then, from the rotation-corrected frame, letters, numbers,
Pattern 3 such as a symbol is cut out and character recognition is performed.
Description
【0001】[0001]
【産業上の利用分野】OCR用紙等の枠に書き込まれた
文字、数字、記号等(以下、これらをまとめて「文字」
と表現する)をイメージ情報として読み取り、読み取っ
たイメージ情報から文字パターンを切り出して文字認識
を行う文字認識処理が種々の分野で行われている。[Industrial application] Characters, numbers, symbols, etc. written on the frame of OCR paper etc. (Hereinafter, these are collectively referred to as "characters".
Character recognition processing is performed in various fields in which character recognition is performed by reading a character pattern from the read image information and extracting a character pattern from the read image information.
【0002】上記文字認識処理においては、文字を書き
込む枠の位置が特定されないと文字パターンを切り出す
ことができず、また、読み取った文字が傾いていると正
確な文字の切り出しができず文字認識率が低下する。本
発明は、文字を書き込む枠の位置が特定されていない用
紙に書き込まれた文字をスキャナー等で読み取り認識処
理を行う文字認識処理において、枠の位置を見つけ出
し、文字パターンの切り出しを行う枠切り処理方法に関
し、特に、本発明は、文字枠の角の4点を見つけ出し、
文字枠の傾き補正を行うことにより、正しい向きで文字
を切り出し、高い文字認識率を得ることができる文字認
識における枠切り処理方法に関するものである。In the above character recognition processing, the character pattern cannot be cut out unless the position of the frame for writing the character is specified, and if the read character is tilted, the character cannot be cut out accurately and the character recognition rate. Is reduced. INDUSTRIAL APPLICABILITY The present invention provides a frame cutting process for finding a position of a frame and cutting out a character pattern in a character recognition process in which a character written on a sheet in which the position of the frame for writing the character is not specified is read and recognized In particular, the present invention finds four points at the corners of a character frame,
The present invention relates to a frame cutting processing method in character recognition in which a character is cut out in a correct direction by correcting the inclination of the character frame and a high character recognition rate can be obtained.
【0003】[0003]
【従来の技術】OCR用紙には、通常、文字を記入する
ための文字記入枠が設けられ、また、用紙の周辺部に文
字記入枠の位置を識別するための位置情報マークが記録
されている。そして、文字は予め定められた上記文字記
入枠に書ま込れる。図13は上記したOCR用紙の一例
を示す図であり、同図に示すように、OCR用紙100
には文字を書き込む枠101と位置情報マーク102が
記録されている。2. Description of the Related Art OCR paper is usually provided with a character entry frame for entering characters, and a position information mark for identifying the position of the character entry frame is recorded on the periphery of the paper. . Then, the character is written in the predetermined character entry frame. FIG. 13 is a diagram showing an example of the above-mentioned OCR paper, and as shown in FIG.
A frame 101 for writing characters and a position information mark 102 are recorded on the.
【0004】そして、記入された文字を読み取る場合に
は、位置情報マーク102に基づき枠101の位置を算
定して枠101内の文字を切り出し、文字認識処理を行
っている。上記のような従来の方式においては、OCR
用紙のように文字を書く位置が特定された用紙を用いな
ければ文字を切り出すことができず、枠が特定の位置に
設けられていない通常の用紙に書き込まれた文字を切り
出し、認識することは困難であった。When reading the written characters, the position of the frame 101 is calculated based on the position information mark 102, the characters in the frame 101 are cut out, and the character recognition processing is performed. In the conventional method as described above, the OCR
Characters cannot be cut out without using paper such as paper that has a specified writing position. It is not possible to cut out and recognize characters written on ordinary paper that does not have a frame at a specific position. It was difficult.
【0005】特に位置情報マークが付せられていない通
常の用紙をスキャナー等で読み取る場合には、用紙の傾
きを判定することができないので、用紙が斜めに読み取
られ枠が傾いている場合には、文字が書き込まれた枠の
位置が用紙上で特定されていたとしても、正しい向きで
文字を切り出すことができず、文字の認識率が低下す
る。In particular, when reading a normal sheet without a position information mark with a scanner or the like, the inclination of the sheet cannot be determined. Therefore, when the sheet is read obliquely and the frame is inclined, Even if the position of the frame in which the character is written is specified on the paper, the character cannot be cut out in the correct direction, and the recognition rate of the character decreases.
【0006】[0006]
【発明が解決しようとする課題】本発明は上記した従来
技術の問題点を解決するためになされたものであって、
本発明の第1の目的は、文字を書き込む枠の位置が特定
されていない用紙に書き込まれた文字を高い認識率で認
識することができる文字認識における枠切り処理方法を
提供することである。SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems of the prior art.
A first object of the present invention is to provide a frame cutting processing method in character recognition which can recognize a character written on a sheet in which the position of the frame for writing the character is not specified with a high recognition rate.
【0007】本発明の第2の目的は、用紙の枠の位置を
探索して枠の傾きを求めて補正することにより、枠が傾
いて読み取られた場合であっても、文字を正しい向きで
切り出すことができる文字認識における枠切り処理方法
を提供することである。A second object of the present invention is to search for the position of the frame of the paper, find the inclination of the frame and correct it, so that even if the frame is read with an inclination, the characters are read in the correct direction. An object of the present invention is to provide a frame cutting processing method in character recognition that can be cut out.
【0008】[0008]
【課題を解決するための手段】図1は本発明の原理図で
あり、同図において、1は文字、数字、記号等を書き込
む枠を備えた用紙、2は用紙1に記録された枠、,
, , は探索して求めた枠2の角4点、3はイメー
ジ情報から切り出した文字、数字、記号等のパターンで
ある。FIG. 1 is a principle view of the present invention. In FIG. 1, 1 is a sheet having a frame for writing characters, numbers, symbols, etc., 2 is a frame recorded on the sheet 1, ,
,, are the four corners of the frame 2 obtained by searching, and 3 is a pattern of characters, numbers, symbols, etc. cut out from the image information.
【0009】上記課題を解決するため、図1に示すよう
に、本発明の請求項1の発明は、文字、数字、記号等を
書き込む枠2を備え、該枠2に文字、数字、記号等が記
入された用紙1からイメージ情報を読み取り、読み取っ
たイメージ情報から文字、数字、記号等のパターン3を
切り出して文字認識を行う、文字認識における枠切り処
理方法において、上記イメージ情報を探索して枠2の一
部を見つけ、見つけた枠2をたどって、枠の角4点,
, , を見つけ出し、枠の角4点, ,, の
情報に基づき用紙上の枠2の位置を求め、求めた枠2内
の文字、数字、記号等のパターン3を切り出すようにし
たものである。In order to solve the above problems, as shown in FIG. 1, the invention of claim 1 of the present invention comprises a frame 2 for writing characters, numbers, symbols, etc., and the frame 2 is provided with characters, numbers, symbols, etc. In the frame cutting processing method in character recognition, which reads the image information from the sheet 1 in which is written, cuts out the pattern 3 of characters, numbers, symbols, etc. from the read image information to perform character recognition, and searches for the image information. Find a part of the frame 2, trace the frame 2 you found, 4 corners of the frame,
,,, are found, the position of the frame 2 on the paper is obtained based on the information of the four corners of the frame ,,,, and the pattern 3 such as the characters, numbers, and symbols in the obtained frame 2 is cut out. .
【0010】本発明の請求項2の発明は請求項1の発明
において、見つけた枠の角4点,, , の情報か
ら枠2の傾きを求め、求めた傾きに基づき枠2を回転補
正し、上記回転補正された枠2から文字、数字、記号等
のパターン3を切り出すようにしたものである。According to a second aspect of the present invention, in the first aspect of the invention, the inclination of the frame 2 is obtained from the information of the found four corners of the frame, and the frame 2 is rotationally corrected based on the obtained inclination. A pattern 3 of characters, numbers, symbols, etc. is cut out from the frame 2 which has been subjected to the rotation correction.
【0011】[0011]
【作用】図1において、該枠2に文字、数字、記号等が
記入された用紙1からイメージ情報を読み取り、イメー
ジ情報の下(もしくは上)の設定位置から同図矢印に示
すように枠2を探索する。枠2を発見すると、枠2をた
どって枠2の角4点,, , を見つける。In FIG. 1, the image information is read from the sheet 1 in which characters, numbers, symbols, etc. are written in the frame 2, and the frame 2 is read from the setting position below (or above) the image information as shown by the arrow in the figure. To explore. When the frame 2 is found, the frame 2 is traced to find the four corners of the frame 2 ,.
【0012】求めた角4点, , , から枠2の位
置と傾きを求め、枠2の傾きを回転補正する。ついで、
回転補正された枠から文字、数字、記号等のパターンを
切り出し、文字認識を行う。本発明の請求項1の発明に
おいては、上記のように、イメージ情報を探索して枠2
の一部を見つけ、見つけた枠2をたどって、枠の角4点
, , , を見つけ出し、枠の角4点, , ,
の情報に基づき用紙上の枠2の位置を求めるようにし
たので、文字を書き込む枠の位置が特定されていない用
紙に書き込まれた文字であっても、文字パターンを正確
に切り出すことができ、高い認識率で文字を認識するこ
とができる。The position and the inclination of the frame 2 are obtained from the obtained four corners, and the inclination of the frame 2 is rotationally corrected. Then,
Characters are recognized by cutting out patterns such as letters, numbers, and symbols from the rotation-corrected frame. In the invention of claim 1 of the present invention, as described above, the image information is searched and the frame 2 is searched.
Find a part of the frame, trace the frame 2 you found, and then add the four corners of the frame
Find out ,,, and the four corners of the frame ,,,
Since the position of the frame 2 on the paper is obtained based on the information of, the character pattern can be accurately cut out even if the character is written on the paper in which the position of the frame for writing the character is not specified. Characters can be recognized with a high recognition rate.
【0013】本発明の請求項2の発明においては、請求
項1の発明において、見つけた枠の角4点, , ,
の情報から枠2の傾きを求め、求めた傾きに基づき枠
2を回転補正するようにしたので、枠が傾いて読み取ら
れた場合であっても、文字を正しい向きで切り出すこと
ができ、文字認識率を向上することができる。According to the second aspect of the present invention, the four corners of the frame found in the first aspect of the invention are ...
Since the inclination of the frame 2 is obtained from the information of the frame 2 and the rotation of the frame 2 is corrected based on the obtained inclination, the character can be cut out in the correct direction even when the frame is read with the inclination. The recognition rate can be improved.
【0014】[0014]
【実施例】図2は本発明の実施例のシステムの全体構成
を示す図であり、同図において、11はスキャナ、11
aは光学的に用紙に記録されたイメージ情報を読み取る
CCD等の光学センサ、12は光学センサ11aにより
読み取ったイメージ情報を量子化する量子化部、13は
量子化された情報をイメージ画像データとして記憶する
画像メモリ、14は後述する枠探索部であり、枠探索部
14は読み取ったイメージ情報における枠の位置を探索
し、その傾きを求める。FIG. 2 is a diagram showing the overall configuration of a system according to an embodiment of the present invention. In FIG. 2, 11 is a scanner and 11 is a scanner.
a is an optical sensor such as a CCD that optically reads image information recorded on a sheet, 12 is a quantizer that quantizes the image information read by the optical sensor 11a, and 13 is quantized information as image image data. An image memory 14 to be stored is a frame search unit described later, and the frame search unit 14 searches for the position of the frame in the read image information and obtains its inclination.
【0015】15は傾き補正部であり、枠探索部14に
より求めた枠の傾きに基づき枠の傾きを補正する。16
は枠から文字パターンの部分を切り出すための切り出し
処理部、17は切り出した各文字パターンについて文字
認識を行う文字認識部である。同図において、スキャナ
ー11の光学センサ11aは用紙の任意の位置に設けら
れた枠に記入された文字をイメージ情報として読み取
る。読み取られたイメージ情報は量子化部12でデジタ
ル信号に変換されイメージ画像データとして画像メモリ
13に蓄積される。A tilt correction unit 15 corrects the frame tilt based on the frame tilt obtained by the frame search unit 14. 16
Is a cutout processing unit for cutting out a character pattern portion from the frame, and 17 is a character recognition unit for performing character recognition on each cut-out character pattern. In the figure, the optical sensor 11a of the scanner 11 reads characters written in a frame provided at an arbitrary position on the paper as image information. The read image information is converted into a digital signal by the quantizer 12 and stored in the image memory 13 as image image data.
【0016】枠探索部14は、後述するセンサにより、
画像メモリに蓄積されたイメージ画像データにおける枠
の位置をサーチする。そして、枠の一部を発見すると、
枠をたどって枠の4角を見つけ枠の傾きを求める。傾き
補正部15は枠探索部14において求めた枠の傾きに基
づき枠の傾きを回転補正する。図3は上記した枠探索部
14と傾き補正部15における枠探索と傾き補正処理の
概念を示す図であり、枠探索部14は同図(a)に示す
ように、枠探索開始点Aから同図矢印に示すように枠探
索を開始し、同図ので枠の一部を発見すると、に示
すように枠をたどり、において枠の最初の角を見つけ
る。The frame search unit 14 uses a sensor described later to
The position of the frame in the image data stored in the image memory is searched. And when you discover a part of the frame,
Trace the frame, find the four corners of the frame, and find the tilt of the frame. The tilt correction unit 15 rotationally corrects the tilt of the frame based on the tilt of the frame obtained by the frame search unit 14. FIG. 3 is a diagram showing the concept of frame search and tilt correction processing in the frame search unit 14 and the tilt correction unit 15 described above. The frame search unit 14 starts from the frame search start point A as shown in FIG. When the frame search is started as shown by the arrow in the figure and a part of the frame is found at in the figure, the frame is traced as shown in and the first corner of the frame is found at.
【0017】以下同様にして、枠を→→→→
→の順序で枠をたどり4角を見つける。そして、求め
た角の位置から文字枠の位置と枠の傾きを求め、同図
(b)に示すように傾きを回転補正する。切り出し処理
部16は傾き補正部15において傾きが補正された枠か
ら文字パターンを切り出し、切り出した文字パターンか
らさらに一文字毎の文字パターンを切り出す。文字認識
部17は、切り出し処理部16により切り出した各文字
パターンについて文字認識を行う。Similarly, the frame is changed to →→→→
Follow the frame in the order of → to find the four corners. Then, the position of the character frame and the inclination of the frame are obtained from the obtained corner position, and the inclination is rotationally corrected as shown in FIG. The cutout processing unit 16 cuts out a character pattern from the frame whose tilt is corrected by the tilt correction unit 15, and further cuts out a character pattern for each character from the cut out character pattern. The character recognition unit 17 performs character recognition on each character pattern cut out by the cutout processing unit 16.
【0018】図4,図5は本実施例における文字認識処
理のフローチャートを示す図であり、同図により、本実
施例における文字認識処理を説明する。図4のステップ
S1,S2において、イメージ画像データ内の枠と同じ
データを探索し、枠の一部を発見した場合には、ステッ
プS3において、枠の傾き具合(たどり角という)によ
り枠線のある場所を推定し、たどり角を平均化しながら
枠をたどっていく。FIGS. 4 and 5 are flowcharts showing the character recognition processing in this embodiment. The character recognition processing in this embodiment will be described with reference to FIGS. In steps S1 and S2 of FIG. 4, when the same data as the frame in the image data is searched and a part of the frame is found, in step S3, the frame line is changed depending on the inclination of the frame (referred to as a tracing angle). Estimate a certain place and follow the frame while averaging the tracing angles.
【0019】ステップS4において、たどった方向に枠
と同じデータがなくなったら、一つめの角を発見したと
して、ステップS5において、垂直方向に方向変換して
再び枠をたどっていく。ステップS6において、たどっ
た方向に枠と同じデータがなくなったら、二つめの角を
発見したとして、ステップS7において、上記と同様、
垂直方向に方向変換して再び枠をたどっていく。If the same data as the frame in the traced direction disappears in step S4, it is assumed that the first corner is found, and in step S5, the direction is changed to the vertical direction and the frame is traced again. If the same data as the frame disappears in the traced direction in step S6, it is assumed that the second corner is found, and in step S7, the same as above.
The direction is changed to the vertical direction and the frame is traced again.
【0020】図5のステップS8において、上記と同
様、たどった方向に枠と同じデータがなくなったら、三
つめの角を発見したとして、ステップS9において、垂
直方向に方向変換して再び枠をたどっていく。ステップ
S10において、たどった方向に枠と同じデータがなく
なったら、ステップS11において、求めた4点が枠と
しての4角形の条件(辺の長さ、縦横比)を満たしてい
るか否かを判定し、満たしていない場合には、ステップ
S1に戻り上記処理を繰り返す。In step S8 of FIG. 5, if the same data as the frame in the traced direction disappears, the third corner is found, and in step S9, the direction is changed to the vertical direction and the frame is traced again. To go. If the same data as the frame in the traced direction disappears in step S10, it is determined in step S11 whether the obtained four points satisfy the conditions (side length, aspect ratio) of the rectangle as the frame. If not satisfied, the process returns to step S1 and the above process is repeated.
【0021】条件を満たしている場合には、ステップS
12に行き、枠の傾きを求めて、枠を回転補正するた
め、アフィン変換を行う。ついで、ステップS13にお
いて、回転補正した枠の角4点に基づき文字を切り出
し、ステップS14において切り出した文字パターンに
ついて文字認識処理を行う。If the conditions are met, step S
In step 12, the affine transformation is performed in order to find the tilt of the frame and correct the rotation of the frame. Next, in step S13, a character is cut out based on the four corners of the rotation-corrected frame, and character recognition processing is performed on the cut-out character pattern in step S14.
【0022】図6は枠を探索するセンサおよびセンサに
よる枠探索の様子を示す図、図7〜図8は枠の一部を発
見する処理(1) を示す図、図9〜図12は枠をたどる処
理(2) 、および、枠の角を発見する処理(3) を示す図で
あり、図7,図8、図10〜図12はイメージ画像デー
タをドットレベルに拡大した図である。次に上記枠探索
部14における枠探索処理の実施例について、図6〜図
12により説明する。 (1) 枠の一部を発見する処理 図6(a)は「枠の一部を発見するためのセンサ」を示
す図であり、センサにおけるセンサ・ビットはそれぞれ
イメージ画像データの1ドットに対応しており、本実施
例におけるセンサ・ビットの幅は同図に示すように1バ
イト幅である。FIG. 6 is a diagram showing a sensor for searching a frame and a state of the frame search by the sensor, FIGS. 7 to 8 are diagrams showing a process (1) for finding a part of the frame, and FIGS. 9 to 12 are the frames. FIG. 7 is a diagram showing a process (2) of tracing a frame and a process (3) of finding a corner of a frame, and FIGS. 7, 8, and 10 to 12 are diagrams in which image image data is enlarged to a dot level. Next, an example of the frame search processing in the frame search unit 14 will be described with reference to FIGS. (1) Processing for discovering part of frame FIG. 6A is a diagram showing "a sensor for discovering a part of a frame", and each sensor bit in the sensor corresponds to one dot of image image data. Therefore, the width of the sensor bit in this embodiment is 1 byte width as shown in FIG.
【0023】上記センサにより枠を探索するには、セン
サ・ビット位置におけるイメージ画像データのドットを
判定する。その際、センサ・ビットは、そのドットのデ
ータが枠と同じデータの場合に反応する。例えば、枠が
黒の場合には、センサ・ビット位置におけるイメージ画
像データのドットが同じ黒のとき、センサ・ビットは反
応する。In order to search the frame by the above sensor, the dot of the image image data at the sensor bit position is determined. At that time, the sensor bit responds when the data of the dot is the same data as the frame. For example, when the frame is black, the sensor bits respond when the dots of the image data at the sensor bit positions are the same black.
【0024】なお、センサ・ビットの幅は処理速度、ゴ
ミとの識別能力等に関係し、センサ・ビットの幅が1バ
イト幅という大きさは処理スピードに貢献するととも
に、小さなゴミを枠と勘違いしにくくするのに適当であ
るが、イメージ画像データ内の枠のサイズによってはセ
ンサビットの幅を変更することもできる。図6(b)は
センサによる枠発見処理を示す図であり、同図に示すよ
うに、センサをイメージ画像データの下(もしくは上)
の設定位置から一段づつ動かして枠をサーチしていく。The width of the sensor bit is related to the processing speed, the ability to discriminate from dust, etc. The width of the sensor bit being 1 byte wide contributes to the processing speed, and small dust is mistaken as a frame. Although it is suitable to make it difficult to do so, the width of the sensor bit can be changed depending on the size of the frame in the image data. FIG. 6B is a diagram showing a frame finding process by the sensor. As shown in FIG. 6B, the sensor is positioned below (or above) the image data.
The frame is searched by moving one step from the setting position of.
【0025】そして、左もしくは右のセンサ・ビットが
枠と同じデータになったら、反応したセンサ・ビットを
進行方向へ、枠と同じデータがなくなるまで動かしてい
き、その間のビット数を計算し、予め定められた線幅条
件範囲と比較する〔図7(a)参照〕。すなわち、枠の
線幅の許容差に入っているか否かを確認する。次に、反
応していない方のセンサ・ビット〔図7(a)において
は右側のビット〕を反応したセンサ・ビットの反応した
高さから進行方向に設定量分動かしてサーチし、センサ
・ビットに反応があれば、上記と同様にドット数を計算
して線幅条件範囲と比較する〔図7(b)参照〕。Then, when the left or right sensor bit has the same data as the frame, the reacted sensor bit is moved in the traveling direction until the same data as the frame disappears, and the number of bits between them is calculated, Comparison is made with a predetermined line width condition range [see FIG. 7 (a)]. That is, it is confirmed whether the line width of the frame is within the tolerance. Next, the sensor bit that is not responding (the bit on the right side in FIG. 7A) is moved by a set amount in the traveling direction from the height at which the responding sensor bit responded, and a search is performed. If there is a response to, the number of dots is calculated and compared with the line width condition range as described above (see FIG. 7B).
【0026】そして、さらに左と右のドット数(線幅)
の差を予め定められた左右線幅誤差条件範囲と比較す
る。計算したドット数が線幅条件範囲をクリアし、か
つ、その差が左右線幅誤差条件範囲をクリアすれば、左
右のセンサ・ビットの反応順により枠の傾きを予想し、
左と右のセンサ・ビットの反応点のドット差より傾き具
合(たどり角という)を得る〔図8参照〕。また、左右
の線幅の平均線幅を求めておく。Further, the number of dots on the left and right (line width)
Is compared with a predetermined left / right line width error condition range. If the calculated number of dots clears the line width condition range, and the difference clears the left and right line width error condition range, the frame tilt is predicted by the reaction order of the left and right sensor bits,
The inclination degree (referred to as a tracing angle) is obtained from the dot difference between the reaction points of the left and right sensor bits [see FIG. 8]. Also, the average line width of the left and right line widths is obtained.
【0027】そして、センサ・ビットが反応したデータ
が枠のデータの可能性有ということで、データをたどり
始める。上記処理を行うことにより、ゴミ(ノイズ)に
反応しにくく、比較的早い処理スピードで枠の一部を発
見することができ、その枠の特徴を予想することができ
る。 (2) 枠をたどる処理 枠の一部を発見したのち、枠の傾きによりたどる方向を
決定する。図9は枠の傾きとたどる方向との関係を示す
図であり、同図において、○は枠の一部を発見した点、
●は枠の角を発見した点である。Then, since the data to which the sensor bit has reacted is the possibility of being the data in the frame, it starts tracing the data. By performing the above processing, it is difficult to react to dust (noise), a part of the frame can be found at a relatively high processing speed, and the characteristics of the frame can be predicted. (2) Processing to trace the frame After discovering a part of the frame, the direction to trace is determined by the inclination of the frame. FIG. 9 is a diagram showing the relationship between the inclination of the frame and the tracing direction. In the figure, a circle indicates that a part of the frame is found,
● indicates that the corner of the frame was found.
【0028】図9に示すように枠の傾きが左下がりなら
反時計回り、右下がりなら時計回りで枠をたどらせる。
すなわち、枠の外側のゴミに影響を減らすためにたどる
方向を定める。次に、たどり角が上記(1) で用いたセン
サの大きさに対する値であることを考慮して、「枠をた
どるためのセンサ」の大きさを決める。なお、「枠をた
どるためのセンサ」の大きさは「枠の一部を発見するた
めのセンサ」と同じ大きさが好ましい。As shown in FIG. 9, when the inclination of the frame is downward leftward, the frame is traced counterclockwise, and when it is downward rightward, the frame is traced clockwise.
That is, the direction to follow is determined in order to reduce the influence of dust on the outside of the frame. Next, the size of the "sensor for tracing the frame" is determined in consideration of the fact that the tracing angle is a value for the size of the sensor used in (1) above. The size of the "sensor for tracing the frame" is preferably the same as that of the "sensor for finding a part of the frame".
【0029】図10は上記センサとイメージ画像データ
の関係を示す図であり、同図に示すように、「枠をたど
るためのセンサ」のセンサ・ビットはたどる方向の端に
設けられ、そのセンサ・ビットは、「枠の一部を発見す
るためのセンサ」のセンサ・ビットと同様、イメージ画
像データのドットが枠と同じデータであるときに反応す
る。FIG. 10 is a diagram showing the relationship between the sensor and the image image data. As shown in FIG. 10, the sensor bit of the "sensor for tracing the frame" is provided at the end in the tracing direction, and the sensor -The bit reacts when the dot of the image data is the same data as the frame, like the sensor bit of "Sensor for finding part of frame".
【0030】枠をたどる際、センサは、図11(a)に
示すように、たどる方向とたどり角により枠線のある場
所を推定し、その内側と外側を設定量だけ探索する。セ
ンサ・ビットが反応したら、前記(1) の場合と同様、線
幅を計算し、(1) で求めた平均線幅の許容誤差内であれ
ば〔図11(b)参照〕、枠線の一部と認めその線幅を
平均線幅にフィードバックさせる。さらに現在のセンサ
が反応した点とその一つ前の反応点のドット差をたどり
角にフィードバックし、次の探索に進む。 (3) 枠の角を発見する処理 枠線をたどり、センサを動かしていき推定した場所の探
索範囲に反応がなくなったら、角が存在範囲に入ったと
考え、現在のセンサ位置のセンサ・ビットの反対の方か
ら1ビットづつセンサ・ビットを動かして、たどり角、
線幅の条件を元に前記と同様に、枠線をたどる。そして
反応がなくなった位置を角とする〔図12参照〕。When tracing the frame, as shown in FIG. 11A, the sensor estimates the location of the frame line based on the tracing direction and the tracing angle, and searches inside and outside of the frame by a set amount. When the sensor bit reacts, the line width is calculated as in the case of (1) above, and if it is within the tolerance of the average line width obtained in (1) [see FIG. 11 (b)], It is recognized as a part and the line width is fed back to the average line width. Further, the dot difference between the point at which the current sensor has reacted and the reaction point immediately before it is fed back to the tracing angle, and the process proceeds to the next search. (3) Processing to find the corner of the frame When the sensor moves by tracing the frame line and there is no reaction to the estimated search range, it is considered that the corner has entered the existing range, and the sensor bit of the current sensor position Move the sensor bit one bit at a time from the opposite side,
Based on the condition of the line width, the frame line is traced in the same manner as above. Then, the position where there is no reaction is defined as a corner [see FIG. 12].
【0031】上記のようにして角を見つけ、角を見つけ
る度に探索の方向を直角に方向変換して、平均線幅、た
どり角をフィードバックさせながら(2) 、(3) に示した
処理をあと3回行う。そして、4つの角を見つけたら枠
の縦長さ、横長さを計算し、そのサイズ、比率等を予め
設定されている条件と比較し、満足していれば枠を認識
したとする。As described above, the angle is found, and each time the angle is found, the direction of the search is changed to a right angle, and the processing shown in (2) and (3) is performed while feeding back the average line width and the tracing angle. Do 3 more times. When the four corners are found, the vertical length and the horizontal length of the frame are calculated, and the size, ratio, etc. are compared with preset conditions, and if satisfied, the frame is recognized.
【0032】以上の(2) 、(3) の処理を行うことによ
り、外側のゴミの影響を比較的受けることなく、枠のた
どり角を発見して、安定に枠を認識することが可能とな
る。By performing the above-mentioned processes (2) and (3), it is possible to detect the tracing angle of the frame and to recognize the frame stably without being relatively affected by the dust on the outside. Become.
【0033】[0033]
【発明の効果】以上説明したように、本発明において
は、イメージ情報を探索して枠の一部を見つけ、見つけ
た枠をたどって、枠の角4点を見つけ出し、用紙上の枠
の位置を求めるようにしたので、文字を書き込む枠の位
置が特定されていない用紙に書き込まれた文字であって
も、文字パターンを正確に切り出すことができ、高い認
識率で文字を認識することができる。As described above, according to the present invention, the image information is searched to find a part of the frame, and the four corners of the frame are found by tracing the found frame to determine the position of the frame on the sheet. Therefore, even if the character is written on the paper in which the position of the frame for writing the character is not specified, the character pattern can be accurately cut out, and the character can be recognized with a high recognition rate. .
【0034】また、見つけた枠の角4点の情報から枠の
傾きを求め、求めた傾きに基づき枠を回転補正すること
により、枠が傾いて読み取られた場合であっても、文字
を正しい向きで切り出すことができ、文字認識率を向上
することができる。Further, by obtaining the tilt of the frame from the information of the four corners of the found frame and correcting the rotation of the frame based on the found tilt, the character is correct even if the frame is read with tilting. It can be cut out in the direction, and the character recognition rate can be improved.
【図1】本発明の原理図である。FIG. 1 is a principle diagram of the present invention.
【図2】本発明の実施例のシステムの全体構成を示す図
である。FIG. 2 is a diagram showing an overall configuration of a system according to an embodiment of the present invention.
【図3】実施例における枠探索と傾き補正処理の概念を
示す図である。FIG. 3 is a diagram illustrating a concept of frame search and inclination correction processing according to an embodiment.
【図4】本発明の実施例のフローチャートである。FIG. 4 is a flowchart of an embodiment of the present invention.
【図5】本発明の実施例のフローチャート(続き)であ
る。FIG. 5 is a flowchart (continuation) of the embodiment of the present invention.
【図6】枠を探索するセンサおよびセンサによる枠探索
の様子を示す図である。FIG. 6 is a diagram showing a sensor for searching a frame and a state of frame search by the sensor.
【図7】枠の一部を発見する処理を示す図である。FIG. 7 is a diagram showing a process of finding a part of a frame.
【図8】枠の一部を発見する処理を示す図(続き)であ
る。FIG. 8 is a diagram (continuation) showing a process of discovering a part of a frame.
【図9】枠をたどる処理を示す図である。FIG. 9 is a diagram showing a process of tracing a frame.
【図10】枠をたどる処理を示す図(続き)である。FIG. 10 is a diagram (continuation) showing a process of tracing a frame.
【図11】枠をたどる処理を示す図(続き)である。FIG. 11 is a diagram (continuation) showing a process of tracing a frame.
【図12】枠の角を発見する処理を示す図である。FIG. 12 is a diagram illustrating a process of finding a corner of a frame.
【図13】従来のOCR用紙の一例を示す図である。FIG. 13 is a diagram showing an example of conventional OCR paper.
1 用紙 2 枠 3 切り出した文字、数字、記号等のパ
ターン 11 スキャナ 11a 光学センサ 12 量子化部 13 画像メモリ 14 枠探索部 15 傾き補正部 16 切り出し処理部 17 文字認識部1 Paper 2 Frame 3 Patterns of Characters, Numbers, Symbols Cut Out 11 Scanner 11a Optical Sensor 12 Quantization Section 13 Image Memory 14 Frame Search Section 15 Tilt Correction Section 16 Cutout Processing Section 17 Character Recognition Section
Claims (2)
備え、該枠(2) に文字、数字、記号等が記入された用紙
(1) からイメージ情報を読み取り、読み取ったイメージ
情報から文字、数字、記号等のパターン(3) を切り出し
て文字認識を行う、文字認識における枠切り処理方法に
おいて、 上記イメージ情報を探索して枠(2) の一部を見つけ、見
つけた枠(2) をたどって、枠の角4点( , , ,
) を見つけ出し、 上記枠の角4点( , , , ) の情報に基づき用紙
上の枠(2) の位置を求め、求めた枠(2) 内の文字、数
字、記号等のパターン(3) を切り出すことを特徴とする
文字認識における枠切り処理方法。1. A sheet provided with a frame (2) for writing characters, numbers, symbols, etc., in which characters, numbers, symbols, etc. are written.
In the frame cutting processing method for character recognition, in which the image information is read from (1), and the pattern (3) of characters, numbers, symbols, etc. is cut out from the read image information and character recognition is performed, the above image information is searched to create a frame. Find a part of (2), trace the found frame (2), and select four corners (,,,
) Is found, the position of the frame (2) on the paper is obtained based on the information of the four corners (,,,) of the above frame, and the pattern (3) of letters, numbers, symbols, etc. in the obtained frame (2) A frame cutting processing method in character recognition, which is characterized by cutting out.
の情報から枠(2) の傾きを求め、求めた傾きに基づき枠
(2) を回転補正し、 上記回転補正された枠(2) から文字、数字、記号等のパ
ターン(3) を切り出すことを特徴とする請求項1の文字
認識における枠切り処理方法。2. The four corners of the found frame (,,,)
The slope of the frame (2) is calculated from the information of
2. The frame cutting processing method for character recognition according to claim 1, wherein the pattern (3) of characters, numbers, symbols and the like is cut out from the frame (2) which has been subjected to the rotation correction and which is subjected to the rotation correction.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5303614A JP2963321B2 (en) | 1993-12-03 | 1993-12-03 | Border cutting method in character recognition |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5303614A JP2963321B2 (en) | 1993-12-03 | 1993-12-03 | Border cutting method in character recognition |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH07160808A true JPH07160808A (en) | 1995-06-23 |
| JP2963321B2 JP2963321B2 (en) | 1999-10-18 |
Family
ID=17923115
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5303614A Expired - Fee Related JP2963321B2 (en) | 1993-12-03 | 1993-12-03 | Border cutting method in character recognition |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2963321B2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018190248A (en) * | 2017-05-09 | 2018-11-29 | 富士通株式会社 | Image processing program, image processing method and image processing device |
-
1993
- 1993-12-03 JP JP5303614A patent/JP2963321B2/en not_active Expired - Fee Related
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018190248A (en) * | 2017-05-09 | 2018-11-29 | 富士通株式会社 | Image processing program, image processing method and image processing device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2963321B2 (en) | 1999-10-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7636483B2 (en) | Code type determining method and code boundary detecting method | |
| EP0308673A2 (en) | Image inclination detecting method and apparatus | |
| EP1033864B1 (en) | Document-inclination detector | |
| US5982952A (en) | Optical character reader with tangent detection for detecting tilt of image data | |
| JPH07160808A (en) | Frame cutting method in character recognition | |
| JP2644041B2 (en) | Character recognition device | |
| JP2005051383A (en) | Image distortion correction apparatus, image reading apparatus, image forming apparatus, and program | |
| JP4507124B2 (en) | Image distortion correction apparatus, image reading apparatus, image forming apparatus, and program | |
| JP2004241827A (en) | Image processing apparatus, image processing method, image processing program, and storage medium | |
| JP4905767B2 (en) | Two-dimensional code detection system and two-dimensional code detection program | |
| JP2506142B2 (en) | Character reader | |
| JP3022655B2 (en) | Character recognition device | |
| JPH039506B2 (en) | ||
| JP3381803B2 (en) | Tilt angle detector | |
| JPH07192087A (en) | Optical character reader | |
| JP2542628B2 (en) | Mark reader | |
| JPH09293118A (en) | Mark sheet reader | |
| JPH11232380A (en) | Optical character reader | |
| JPS60254382A (en) | Detecting method of character line | |
| JPH0340430B2 (en) | ||
| JPH08129607A (en) | Optical character recognition method | |
| JPS5864575A (en) | Optical character reader | |
| JPH03189783A (en) | Character recognizing device for facsimile image | |
| JPH07282188A (en) | Facsimile OCR device | |
| JPH11328305A (en) | Facsimile transmission paper, facsimile character recognition method and apparatus, and recording medium storing the program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |