[go: up one dir, main page]

JP2000029982A - Character recognition device and character recognition result output method - Google Patents

Character recognition device and character recognition result output method

Info

Publication number
JP2000029982A
JP2000029982A JP10197036A JP19703698A JP2000029982A JP 2000029982 A JP2000029982 A JP 2000029982A JP 10197036 A JP10197036 A JP 10197036A JP 19703698 A JP19703698 A JP 19703698A JP 2000029982 A JP2000029982 A JP 2000029982A
Authority
JP
Japan
Prior art keywords
character
recognition result
recognition
image
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10197036A
Other languages
Japanese (ja)
Inventor
Hiroyasu Goshima
裕庸 五島
Shoichi Nakagami
昇一 中上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP10197036A priority Critical patent/JP2000029982A/en
Publication of JP2000029982A publication Critical patent/JP2000029982A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To make correcting efficient by extracting a character whose calculated conviction degree does not reach a specified value and outputting its recognition result and character image, side by side. SOLUTION: The character image is cut out of a binary image and stored in an image area of a RAM 5, and the sheet number of the sheet where the character image is present, the page number of the character in the same sheet, an image area, a start point, an end point, and an item are stored in a ROM 5. Character recognition is performed by referring to a dictionary in a storage device 6 and the result is stored as a recognition result. The feature quantity of the character image is extracted and compared with a standard feature quantity to calculate the degree of conviction, which is stored as a degree of conviction. The calculated conviction degree is compared with a threshold and in the case of 'conviction degree < threshold', a flag is set to '1' (ON). The input image and recognition result for which the flag is set ON are taken out of the RAM 5 by characters or items, sorted in the sorting order of the characters, and outputted to a display 8 or printer 9.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、入力された文字画
像について文字認識を行い、認識結果の怪しい文字を出
力する文字認識装置及び認識結果の出力方法に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device for performing character recognition on an input character image and outputting a character having a suspicious recognition result, and a method of outputting a recognition result.

【0002】[0002]

【従来の技術】文字認識の認識率は、必ずしも100%
ではない。近年様々な技術開発が行われ認識率が向上さ
れているが、様々な書体や文字種が増えていることか
ら、結果として認識率を100%にするのは不可能であ
る。よって誤認識した認識結果に対してどのようなアプ
ローチで修正するかが重要となる。修正作業は人が行う
ので人の負担をできる限り軽減する必要がある。修正を
容易にするための認識結果の出力方法として、得られた
認識結果とその元になる入力画像の両方を画面上に表示
する技術(例えば特公平7−72903号公報)や、文
字認識の結果の確信度を算出してその結果に応じて表示
を変えたり、その前後に特別な文字を挿入してその結果
の怪しさを目立たせたりする技術(例えば特開平5−1
28301号公報)がある。
2. Description of the Related Art The recognition rate of character recognition is not necessarily 100%.
is not. In recent years, various technologies have been developed and the recognition rate has been improved. However, since various types of fonts and character types have been increased, it is impossible to achieve a recognition rate of 100% as a result. Therefore, it is important how to correct the misrecognized recognition result. Since the correction work is performed by a person, it is necessary to reduce the burden on the person as much as possible. As a method of outputting a recognition result for facilitating the correction, a technique of displaying both the obtained recognition result and an input image as a source on a screen (for example, Japanese Patent Publication No. 7-72903), a method of character recognition, and the like. Techniques for calculating the degree of certainty of the result and changing the display according to the result, or inserting special characters before and after the result to make the result suspicious (for example, Japanese Patent Laid-Open No. 5-1).
No. 28301).

【0003】ここで確信度とは、ある結果がどの程度確
からしいかを表わす数値であり、0から100までの整
数値で表現され、数値が高いほど確からしいことを意味
する。各文字に対する認識結果の確信度は、例えば特開
平4−211883号公報に記載された方法により算出
することができる。
Here, the certainty factor is a numerical value indicating how likely a certain result is. It is expressed by an integer value from 0 to 100, and the higher the numerical value, the more certain. The certainty factor of the recognition result for each character can be calculated by, for example, a method described in Japanese Patent Application Laid-Open No. Hei 4-218883.

【0004】[0004]

【発明が解決しようとする課題】上記従来の文字認識装
置によれば、認識結果の出力方法において、正しく認識
された文字と認識結果の怪しい文字とが混在して表示さ
れるので、修正者はその中から認識できなかった文字を
探さねばならず、目の移動が多く効率的な修正が行い難
い。特に複数枚のシートに記載された文字をまとめて入
力し、連続的に認識処理し、認識結果をまとめて修正す
る場合には、修正者は大量の文字認識結果の中から認識
不能文字を探さねばならず、しかも認識結果の怪しい文
字がランダムに現われるので、非常に効率が悪い。
According to the above-described conventional character recognition apparatus, in a method of outputting a recognition result, characters that are correctly recognized and characters that are suspicious of the recognition result are displayed in a mixed manner. Unrecognized characters must be searched from among them, and the eyes move so much that it is difficult to perform efficient correction. In particular, when inputting characters written on multiple sheets at once, performing continuous recognition processing and correcting the recognition results collectively, the corrector searches for unrecognizable characters from a large amount of character recognition results. This is very inefficient, since suspicious characters with recognition results appear randomly at random.

【0005】本発明の目的は、認識結果の出力方法を改
良することによって、効率的な修正作業を可能とする文
字認識装置及び文字認識結果の出力方法を提供すること
にある。
SUMMARY OF THE INVENTION An object of the present invention is to provide a character recognition apparatus and a character recognition result output method which enable an efficient correction operation by improving the recognition result output method.

【0006】[0006]

【課題を解決するための手段】本発明は、文字画像を入
力し、文字画像の文字認識を行い、各文字について認識
結果の確信度を計算する文字認識装置において、計算さ
れた確信度が所定値に達しない文字を抽出する手段と、
抽出された各文字の認識結果をその文字画像と並列して
出力する手段とを有する文字認識装置を特徴とする。ま
た計算された確信度が所定値に達しない文字であってか
つあらかじめ指定された項目に属する文字を抽出する手
段と、抽出された各文字の認識結果をその文字画像を含
む指定された項目内のすべての文字画像と並列して出力
する手段とを有する文字認識装置を特徴とする。また計
算された確信度が所定値に達しない文字であってかつ他
の文字と互いに誤認識されやすい文字としてあらかじめ
指定された文字のグループに属する文字を抽出する手段
と、抽出された各文字の認識結果をその文字画像と並列
して出力する手段とを有する文字認識装置を特徴とす
る。またこのような手段をステップとして有する文字認
識結果の出力方法を特徴とする。さらにこのようなステ
ップを計算機の処理ステップとして有するプログラムの
記憶媒体を特徴とする。
According to the present invention, there is provided a character recognition apparatus for inputting a character image, performing character recognition of the character image, and calculating the certainty of the recognition result for each character. Means for extracting characters that do not reach the value,
Means for outputting a recognition result of each extracted character in parallel with the character image. Means for extracting a character whose calculated certainty does not reach a predetermined value and belonging to a predetermined item; and recognizing a result of recognition of each extracted character in a specified item including the character image. And a means for outputting all the character images in parallel with the character recognition device. Means for extracting a character whose calculated certainty does not reach a predetermined value and which belongs to a character group specified in advance as a character that is likely to be erroneously recognized as another character; and Means for outputting a recognition result in parallel with the character image. Also, the invention is characterized by a method of outputting a character recognition result having such means as steps. Furthermore, a storage medium of a program having such steps as processing steps of a computer is characterized.

【0007】[0007]

【発明の実施の形態】以下本発明の一実施形態について
図面を用いて説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below with reference to the drawings.

【0008】図1は、本実施形態の文字認識装置の構成
図である。図1に示すように、この文字認識装置は、入
力画像を光学的に読み取るスキャナ2と、認識された文
字を修正するためのキーボード等の入力装置1と、各部
を制御する中央演算処理装置3と、中央演算処理装置3
が実行する文字認識処理等の各種プログラムを格納する
ROM4と、入力画像及び後述のテーブルを記憶するR
AM5と、文字の標準的な特徴を登録する辞書が格納さ
れるROM、RAMなどの記憶装置6と、文字認識処理
中の各種データを一時的に記憶するワークエリアRAM
7と、確信度の低い認識文字を表示するディスプレイ8
及び印字装置9とを備え、これら各構成要素がバスによ
って接続されている。なお専用の文字認識装置の代わり
にパソコン等の汎用計算機を利用し、その主記憶装置に
格納される文字認識処理等を行うプログラムを実行する
ことによっても本発明を実施できる。このプログラムを
記憶媒体に格納し、図示しない駆動装置を介して計算機
の主記憶装置に読み込み、計算機によって実行できる。
FIG. 1 is a configuration diagram of the character recognition device of the present embodiment. As shown in FIG. 1, the character recognition device includes a scanner 2 for optically reading an input image, an input device 1 such as a keyboard for correcting a recognized character, and a central processing unit 3 for controlling each unit. And the central processing unit 3
And a ROM 4 for storing various programs such as a character recognition process to be executed by the CPU, and an R for storing an input image and a table described later.
AM5, a storage device 6 such as a ROM or a RAM for storing a dictionary for registering standard features of characters, and a work area RAM for temporarily storing various data during character recognition processing
7 and a display 8 for displaying recognition characters with low confidence.
And a printing device 9, and these components are connected by a bus. The present invention can also be implemented by using a general-purpose computer such as a personal computer instead of the dedicated character recognition device, and executing a program for performing character recognition processing and the like stored in the main storage device. This program is stored in a storage medium, read into a main storage device of a computer via a drive device (not shown), and can be executed by the computer.

【0009】図2は、RAM5上のテーブルのデータ形
式を示す図である。テーブルの各行は認識された各文字
に対応し、シート番号31は何枚目のシートかを表す番
号、項番32は同一シート内で一意な文字の番号、画像
領域33はRAM5上で入力された文字画像を格納する
領域の先頭アドレス、認識結果34は文字認識の結果、
始点35はシート上で文字が存在する領域の左上の座標
値、終点36は同領域の右下の座標値、項目37はその
文字が属するデータ項目の番号、確信度38はその文字
の認識結果の確からしさを示す数値、フラグ39は確信
度が閾値に満たないときに設定されるフラグである。
FIG. 2 is a diagram showing a data format of a table on the RAM 5. Each row of the table corresponds to each recognized character, the sheet number 31 is a number representing the number of the sheet, the item number 32 is a unique character number in the same sheet, and the image area 33 is input on the RAM 5. The start address of the area for storing the extracted character image, the recognition result 34 is the result of character recognition,
The starting point 35 is the upper left coordinate value of the area where the character exists on the sheet, the ending point 36 is the lower right coordinate value of the area, the item 37 is the number of the data item to which the character belongs, and the confidence 38 is the recognition result of the character. The flag 39 is a flag that is set when the certainty factor is less than the threshold value.

【0010】図3は、文字認識処理プログラムの処理の
流れを示すフローチャートである。プログラムは、スキ
ャナ2を介してシート上の入力データを読み取り、ステ
ップ21において2値画像化する。次にステップ22に
おいて2値画像から文字画像を切り出し、RAM5上の
画像領域に格納し、その文字画像が存在するシートのシ
ート番号31、同一シート内の文字の項番32、画像領
域33、始点35、終点36、項目37をRAM5に格
納する。次にステップ23において記憶装置6上の辞書
を参照して文字認識を行い、その結果を認識結果34に
格納する。次にステップ24において文字画像の特徴量
を抽出し、抽出した特徴量を辞書に登録されている標準
的な特徴量と比較して確信度を算出し、算出された確信
度を確信度38に格納する。次にあらかじめ設定された
閾値とステップ24で計算された確信度とが比較され、
「確信度<閾値」となった場合(ステップ25:Y)
は、ステップ26に進み、フラグ39に「1」を設定す
る(フラグをたてる)。逆に「確信度≧閾値」となった
場合(ステップ25:N)は、フラグをたてない。ステ
ップ21〜26がすべてのシート上の文字画像について
終了(ステップ27:Y)すると、ステップ28の処理
を行う。ステップ28では、ステップ26の処理でフラ
グのたった入力画像と認識結果34をRAM5から1文
字ずつ、あるいは1項目ずつ取り出し、文字のソート順
序に従ってソートしてディスプレイ8に出力するか、ま
たは印字装置9に出力する。
FIG. 3 is a flowchart showing the flow of processing of the character recognition processing program. The program reads the input data on the sheet via the scanner 2 and forms a binary image in step 21. Next, in step 22, a character image is cut out from the binary image and stored in the image area on the RAM 5, and the sheet number 31 of the sheet in which the character image exists, the item number 32 of the character in the same sheet, the image area 33, the starting point 35, an end point 36, and an item 37 are stored in the RAM 5. Next, in step 23, character recognition is performed with reference to the dictionary on the storage device 6, and the result is stored in the recognition result 34. Next, in step 24, the feature amount of the character image is extracted, and the extracted feature amount is compared with a standard feature amount registered in the dictionary to calculate a certainty factor. Store. Next, the predetermined threshold value is compared with the certainty factor calculated in step 24,
When "confidence <threshold" (Step 25: Y)
Proceeds to step 26, and sets "1" to the flag 39 (sets the flag). Conversely, if “confidence ≧ threshold” (step 25: N), no flag is set. When steps 21 to 26 are completed for the character images on all sheets (step 27: Y), the processing of step 28 is performed. In step 28, the input image with the flag set in step 26 and the recognition result 34 are taken out of the RAM 5 one character at a time or one item at a time, sorted according to the character sort order and output to the display 8, or Output to

【0011】図4は、ステップ28の処理を展開して示
すフローチャートであり、入力画像と認識結果の第1の
出力方法を示す。ステップ41では認識結果34を1文
字ずつRAM5から読み込む。読み込んだ認識結果34
にフラグ39がたっているか、ステップ42で判断す
る。フラグがたっていない場合(ステップ42:N)
は、ステップ41に戻り次の文字について認識結果34
のフラグ39を読み込む。フラグがたっている場合(ス
テップ42:Y)はその認識結果と入力画像をワークエ
リアRAM7に保存する(ステップ43)。ステップ4
1〜43の処理が全ての文字に対して終了(ステップ4
4:Y)すれば、ステップ45に進む。ステップ45で
は、認識結果34の文字を文字のソート順序に従ってソ
ートする。次にステップ46で入力画像と認識結果を1
文字ずつディスプレイ8上に表示するか、あるいは印字
装置9に出力する。
FIG. 4 is a flowchart showing the processing of step 28 in an expanded manner, showing a first method of outputting an input image and a recognition result. In step 41, the recognition result 34 is read from the RAM 5 character by character. Read recognition result 34
It is determined in step 42 whether the flag 39 is set. When the flag is not set (Step 42: N)
Returns to step 41 and recognizes the next character as the recognition result 34
Is read. If the flag is set (step 42: Y), the recognition result and the input image are stored in the work area RAM 7 (step 43). Step 4
Steps 1 to 43 are completed for all characters (step 4
4: Y) If so, the process proceeds to step 45. In step 45, the characters of the recognition result 34 are sorted according to the sort order of the characters. Next, in step 46, the input image and the recognition result are
The characters are displayed on the display 8 one by one or output to the printing device 9.

【0012】図5は、第1の出力方法について、入力画
像と認識結果の表示例を示す図である。入力画像51を
1文字ずつ表示させ、その文字に対する認識結果52を
表示する。これら入力画像と認識結果は並列して表示さ
れる(53)。表示する順序は、認識結果52に表示さ
れている文字が多い順である。図5では認識結果の
「1」がx個(54)、「5」がy個(55)、「7」
がz個(56)あった場合を示している(但し、x>y
>z)。さらに確信度が昇順になるように54、55、
56の中でそれぞれ並べ替えることも可能である。また
入力画像51をマウス等でクリックすることによつて、
プログラムはRAM5を参照し、指定された文字が属す
る項目内の一連の文字画像をディスプレイ8に表示す
る。それによりその文字とその文字の前後の位置に存在
する一連の文字の画像を知ることができる。入力装置1
を介して表示されているいずれかの認識結果52が修正
されると、装置はRAM5上の該当する認識結果34を
修正する。
FIG. 5 is a diagram showing a display example of an input image and a recognition result in the first output method. The input image 51 is displayed one character at a time, and the recognition result 52 for the character is displayed. The input image and the recognition result are displayed in parallel (53). The display order is the order in which the characters displayed in the recognition result 52 are the most. In FIG. 5, x (54) of recognition results “1”, y (55) of “5”, and “7” are recognized.
Are shown as z (56) (where x> y
> Z). 54, 55, so that the certainty is in ascending order.
It is also possible to rearrange them in 56. By clicking the input image 51 with a mouse or the like,
The program refers to the RAM 5 and displays a series of character images in the item to which the designated character belongs on the display 8. This makes it possible to know the image of the character and a series of characters existing before and after the character. Input device 1
When any of the recognition results 52 displayed via the is corrected, the apparatus corrects the corresponding recognition result 34 on the RAM 5.

【0013】図6は、ステップ28の処理を展開して示
すフローチャートであり、入力画像と認識結果の第2の
出力方法を示す。ステップ61では、確認し、修正した
い項目の番号を入力装置1を介して入力する。項目とは
図8に示すように、一連の文字列から構成されるデータ
項目を指す。これらの項目はあらかじめ一意の番号が設
定されている。そして入力される複数枚のシートは同一
の項目をもつ同一データ形式とする。ステップ62では
認識結果34をRAM5から1文字ずつ読み込む。読み
込んだ認識結果34にフラグ39がたっているか、ステ
ップ63で判断する。フラグがたっていない場合(ステ
ップ63:N)は、ステップ62に戻り次の文字につい
て認識結果34のフラグ39を読み込む。フラグがたっ
ている場合(ステップ63:Y)は、ステップ64でそ
の文字がステップ61で指定した項目内の文字かを判断
する。指定した項目外の文字なら(ステップ64:
N)、ステップ62に戻り次の文字について認識結果3
4のフラグ39を読み込む。指定した項目内の文字なら
(ステップ64:Y)、その認識結果と入力画像を項目
ごとワークエリアRAM7に保存する(ステップ6
5)。ステップ62〜65の処理が全ての文字に対して
終了(ステップ66:Y)すれば、ステップ67に進
む。ステップ67では、認識結果34の文字を文字のソ
ート順序に従ってソートする。次にステップ68で入力
画像と認識結果を項目ごとにディスプレイ8上に表示す
るか、あるいは印字装置9に出力する。
FIG. 6 is a flow chart showing the processing of step 28 in an expanded manner, showing a second output method of the input image and the recognition result. In step 61, the number of the item to be confirmed and to be corrected is input via the input device 1. The item refers to a data item composed of a series of character strings as shown in FIG. These items are set with unique numbers in advance. The plurality of input sheets have the same data format having the same items. In step 62, the recognition result 34 is read from the RAM 5 character by character. It is determined in step 63 whether the flag 39 is set on the read recognition result 34. If the flag is not set (step 63: N), the process returns to step 62 to read the flag 39 of the recognition result 34 for the next character. If the flag is set (step 63: Y), it is determined in step 64 whether the character is a character in the item designated in step 61. If the character is outside the specified item (step 64:
N), returning to step 62; recognition result 3 for the next character
4 is read. If the character is within the designated item (step 64: Y), the recognition result and the input image are stored in the work area RAM 7 for each item (step 6).
5). If the processing of steps 62 to 65 is completed for all the characters (step 66: Y), the process proceeds to step 67. In step 67, the characters of the recognition result 34 are sorted according to the sort order of the characters. Next, in step 68, the input image and the recognition result are displayed for each item on the display 8 or output to the printing device 9.

【0014】図7は、第2の出力方法について、入力画
像と認識結果の表示例を示す図である。指定された項目
について取り出した入力画像71を表示させ、その項目
に対する認識結果72を表示する。ここで項目内の認識
結果は全て表示するのではなく、フラグのたった認識結
果のみを表示する。これら入力画像と認識結果は並列し
て表示される(73)。表示する順序は、認識結果72
に表示されている文字が多い順に表示される。また現在
表示されている項目の番号74が表示される。別の項目
番号の認識結果を表示させたいときは、入力装置1より
その項目番号を指定する。入力装置1を介して表示され
ている認識結果72中いずれかの文字が修正されると、
装置はRAM5上の該当する認識結果34を修正する。
このように認識結果72に表示される文字が属する項目
中の一連の文字列の画像が入力画像71に表示されるの
で、この文字列が何らかの意味をもつ場合にこの方法は
有効である。
FIG. 7 is a diagram showing a display example of an input image and a recognition result in the second output method. The input image 71 extracted for the specified item is displayed, and the recognition result 72 for the item is displayed. Here, not all the recognition results in the item are displayed, but only the recognition result with the flag set. The input image and the recognition result are displayed in parallel (73). The display order is the recognition result 72.
Are displayed in descending order of the characters displayed in. Also, the number 74 of the currently displayed item is displayed. When it is desired to display a recognition result of another item number, the input device 1 designates the item number. If any character in the recognition result 72 displayed via the input device 1 is corrected,
The device corrects the corresponding recognition result 34 on the RAM 5.
As described above, since an image of a series of character strings in the item to which the character displayed in the recognition result 72 belongs is displayed on the input image 71, this method is effective when this character string has some meaning.

【0015】図9は、ステップ28の処理を展開して示
すフローチャートであり、入力画像と認識結果の第3の
出力方法を示す。ステップ91では、確認し、修正した
いパターンの項番を入力装置1を介して入力する。パタ
ーンとは、図11に示すように他の文字と互いに誤認識
されやすい文字のグループをいう。各パターンに対応し
て一意の項番及び閾値があらかじめワークエリアRAM
7に保存される。ステップ92では認識結果34をRA
M5から1文字ずつ読み込む。読み込んだ認識結果34
にフラグ39がたっているか、ステップ93で判断す
る。フラグがたっていない場合(ステップ93:N)
は、ステップ92に戻り次の文字について認識結果34
のフラグ39を読み込む。フラグがたっている場合(ス
テップ93:Y)は、ステップ94でその文字がステッ
プ91で指定したパターンに属する文字か判断する。指
定したパターン以外の文字なら(ステップ94:N)、
ステップ92に戻り次の文字について認識結果34のフ
ラグ39を読み込む。指定したパターンの文字なら(ス
テップ94:Y)、その認識結果と入力画像を1文字ご
とワークエリアRAM7に保存する(ステップ95)。
ステップ92〜95の処理がすべての文字に対して終了
(ステップ96:Y)すれば、ステップ97に進む。ス
テップ97では、認識結果34の文字を文字のソート順
序に従ってソートする。次にステップ98で入力画像と
認識結果を1文字ごとにディスプレイ上8に表示する
か、あるいは印字装置9に出力する。
FIG. 9 is a flowchart showing the processing of step 28 in an expanded manner, showing a third method of outputting an input image and a recognition result. In step 91, the item number of the pattern to be confirmed and corrected is input via the input device 1. A pattern refers to a group of characters that are likely to be erroneously recognized as other characters as shown in FIG. Unique item numbers and thresholds corresponding to each pattern are stored in the work area RAM in advance.
7 is stored. In step 92, the recognition result 34 is
Read one character at a time from M5. Read recognition result 34
It is determined in step 93 whether the flag 39 is set. When the flag is not set (Step 93: N)
Returns to step 92 and recognizes the next character as the recognition result 34
Is read. If the flag is set (step 93: Y), it is determined in step 94 whether the character belongs to the pattern specified in step 91. If it is a character other than the specified pattern (step 94: N),
Returning to step 92, the flag 39 of the recognition result 34 is read for the next character. If the character has the designated pattern (step 94: Y), the recognition result and the input image are stored in the work area RAM 7 for each character (step 95).
When the processing of steps 92 to 95 is completed for all the characters (step 96: Y), the process proceeds to step 97. In step 97, the characters of the recognition result 34 are sorted according to the sort order of the characters. Next, at step 98, the input image and the recognition result are displayed on the display 8 for each character, or output to the printing device 9.

【0016】図10は、第3の出力方法について、入力
画像と認識結果の表示例を示す図である。入力画像およ
び対応する認識結果は、図5の場合と同様に1文字ずつ
表示される。ステップ91で指定したパターン項番10
1が表示される。別のパターンの結果を表示させたいと
きは、入力装置1より別のパターン項番を指定する。図
10は、図11の項番1のパターンを指定したときの出
力例で、認識結果「1」がx個(102)、「7」がy
個(103)あった場合を示している(但し、x>
y)。入力装置1を介して表示されている認識結果中の
いずれかの文字が修正されると、装置はRAM5上の該
当する認識結果34を修正する。このように第1の出力
方法がすべての文字を抽出の対象とするのに対して、こ
の方法は対象を特定の誤認識されやすい文字に絞るた
め、修正者は対象の文字に集中して修正できる。
FIG. 10 is a diagram showing a display example of an input image and a recognition result in the third output method. The input image and the corresponding recognition result are displayed one by one as in the case of FIG. Pattern item number 10 specified in step 91
1 is displayed. To display a result of another pattern, another pattern item number is designated by the input device 1. FIG. 10 is an output example when the pattern of item No. 1 in FIG. 11 is designated, where x (102) recognition results “1” and y are “7” recognition results
(103) (where x>
y). When any character in the recognition result displayed via the input device 1 is corrected, the device corrects the corresponding recognition result 34 on the RAM 5. Thus, while the first output method targets all characters for extraction, this method narrows the target to specific characters that are easily misrecognized. it can.

【0017】図12は、ステップ28の処理を展開して
示すフローチャートであり、入力画像と認識結果の第4
の出力方法を示す。入力装置1を介して確認し、修正し
たいパターンの項番を入力し(ステップ121)、対象
とする項目の番号を入力する(ステップ122)。ステ
ップ123では認識結果34をRAM5から1文字ずつ
読み込む。読み込んだ認識結果34にフラグ39がたっ
ているか、ステップ124で判断する。フラグがたって
いない場合(ステップ124:N)は、ステップ123
に戻り次の文字について認識結果34のフラグ39を読
み込む。フラグがたっている場合(ステップ124:
Y)は、ステップ125でその文字がステップ121で
指定したパターンに属する文字か判断する。指定したパ
ターン以外の文字なら(ステップ125:N)、ステッ
プ123に戻り次の文字について認識結果34を読み込
む。指定したパターンの文字なら(ステップ125:
Y)、ステップ126でステップ122で指定した項目
の文字か判断する。指定した項目以外の文字なら(ステ
ップ126:N)、ステップ123に戻り次の認識結果
文字を読み込む。指定した項目の文字なら(ステップ1
26:Y)、その認識結果と入力画像を項目ごとワーク
エリアRAM7に保存する(ステップ127)。ステッ
プ123〜127の処理が全ての文字に対して終了(ス
テップ128:Y)すれば、ステップ129に進む。ス
テップ129では、認識結果の文字を文字のソート順序
に従ってソートする。次にステップ130で入力画像と
認識結果を項目ごとにディスプレイ8に表示するか、あ
るいは印字装置9に出力する。
FIG. 12 is a flowchart showing the processing of step 28 in an expanded manner.
The output method of is shown. The user confirms via the input device 1, inputs the item number of the pattern to be corrected (step 121), and inputs the number of the target item (step 122). In step 123, the recognition result 34 is read from the RAM 5 character by character. It is determined in step 124 whether the read recognition result 34 has the flag 39 set. If the flag is not set (Step 124: N), Step 123
And the flag 39 of the recognition result 34 is read for the next character. If the flag is on (step 124:
Y) determines whether the character belongs to the pattern specified in step 121 in step 125. If it is a character other than the designated pattern (step 125: N), the process returns to step 123 to read the recognition result 34 for the next character. If the character has the specified pattern (step 125:
Y) In step 126, it is determined whether the character is the character of the item designated in step 122. If it is a character other than the designated item (N in step 126), the process returns to step 123 to read the next recognition result character. If the character of the specified item (step 1
26: Y), the recognition result and the input image are stored for each item in the work area RAM 7 (step 127). If the processing of steps 123 to 127 is completed for all characters (step 128: Y), the process proceeds to step 129. In step 129, the characters of the recognition result are sorted according to the sort order of the characters. Next, in step 130, the input image and the recognition result are displayed for each item on the display 8 or output to the printing device 9.

【0018】図13は、第4の出力方法について、入力
画像と認識結果の表示例を示す図である。入力画像およ
び対応する認識結果は、図7の場合と同様に指定された
項目について表示される。ただし表示される認識結果は
指定されたパターンに属する文字に限られる。指定され
た項目番号が131に、指定したパターンの項番が13
2に表示される。この場合も認識結果中の文字を修正す
ることによってRAM5上の該当する認識結果34を修
正することができる。第4の出力方法によつて第2及び
第3の出力方法の効果を併せて得ることができる。
FIG. 13 is a diagram showing a display example of an input image and a recognition result in the fourth output method. The input image and the corresponding recognition result are displayed for the specified item as in the case of FIG. However, the displayed recognition result is limited to characters belonging to the specified pattern. The designated item number is 131 and the designated pattern item number is 13.
2 is displayed. Also in this case, the corresponding recognition result 34 on the RAM 5 can be corrected by correcting the character in the recognition result. According to the fourth output method, the effects of the second and third output methods can be obtained together.

【0019】[0019]

【発明の効果】以上述べたように本発明によれば、確信
度の低い文字の認識結果のみが1文字ごとにあるいは特
定の項目について出力されるので、大量の文字認識結果
の中から認識不能文字を探す必要がなく効率的な修正作
業を達成できる。また互いに誤認識しやすい文字のグル
ープを指定することにより、修正の対象とする文字を絞
ることができ、効率的な修正作業を行える。
As described above, according to the present invention, only the recognition result of a character having a low degree of certainty is output for each character or for a specific item. Efficient correction work can be achieved without having to search for characters. In addition, by specifying a group of characters that are likely to be erroneously recognized, the characters to be corrected can be narrowed down, and an efficient correction operation can be performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】実施形態の文字認識装置の構成図である。FIG. 1 is a configuration diagram of a character recognition device according to an embodiment.

【図2】実施形態のテーブルのデータ形式を示す図であ
る。
FIG. 2 is a diagram illustrating a data format of a table according to the embodiment.

【図3】実施形態の文字認識の処理プログラムの処理の
流れを示すフローチャートである。
FIG. 3 is a flowchart illustrating a processing flow of a character recognition processing program according to the embodiment;

【図4】入力画像と認識結果の第1の出力処理の流れを
示すフローチャートである。
FIG. 4 is a flowchart illustrating a flow of a first output process of an input image and a recognition result.

【図5】第1の出力処理の表示例を示す図である。FIG. 5 is a diagram illustrating a display example of a first output process.

【図6】入力画像と認識結果の第2の出力処理の流れを
示すフローチャートである。
FIG. 6 is a flowchart illustrating a flow of a second output process of an input image and a recognition result.

【図7】第2の出力処理の表示例を示す図である。FIG. 7 is a diagram illustrating a display example of a second output process.

【図8】項目の例を示す図である。FIG. 8 is a diagram showing an example of an item.

【図9】入力画像と認識結果の第3の出力処理の流れを
示すフローチャートである。
FIG. 9 is a flowchart illustrating a flow of a third output process of an input image and a recognition result.

【図10】第3の出力処理の表示例を示す図である。FIG. 10 is a diagram illustrating a display example of a third output process.

【図11】誤認識しやすいパターンとその閾値の一例を
示す図である。
FIG. 11 is a diagram illustrating an example of a pattern that is easily recognized erroneously and a threshold value thereof.

【図12】入力画像と認識結果の第4の出力処理の流れ
を示すフローチャートである。
FIG. 12 is a flowchart illustrating a flow of a fourth output process of an input image and a recognition result.

【図13】第4の出力処理の表示例を示す図である。FIG. 13 is a diagram illustrating a display example of a fourth output process.

【符号の説明】[Explanation of symbols]

34:認識結果、37:項目、38:確信度、39:フ
ラグ、51:入力画像、52:認識結果
34: recognition result, 37: item, 38: certainty factor, 39: flag, 51: input image, 52: recognition result

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】文字画像を入力し、該文字画像の文字認識
を行い、各文字について認識結果の確信度を計算する文
字認識装置において、計算された確信度が所定値に達し
ない文字を抽出する手段と、抽出された各文字の認識結
果をその文字画像と並列して出力する手段とを有するこ
とを特徴とする文字認識装置。
1. A character recognition apparatus for inputting a character image, performing character recognition on the character image, and calculating a certainty factor of a recognition result for each character, wherein a character whose calculated certainty factor does not reach a predetermined value is extracted. And a means for outputting the recognition result of each extracted character in parallel with the character image.
【請求項2】文字画像を入力し、該文字画像の文字認識
を行い、各文字について認識結果の確信度を計算する文
字認識装置において、計算された確信度が所定値に達し
ない文字であってかつあらかじめ指定された項目に属す
る文字を抽出する手段と、抽出された各文字の認識結果
をその文字画像を含む指定された項目内のすべての文字
画像と並列して出力する手段とを有することを特徴とす
る文字認識装置。
2. A character recognition apparatus for inputting a character image, performing character recognition on the character image, and calculating certainty of a recognition result for each character, wherein the calculated certainty does not reach a predetermined value. Means for extracting a character belonging to a pre-designated item, and means for outputting a recognition result of each extracted character in parallel with all the character images in the designated item including the character image A character recognition device characterized in that:
【請求項3】文字画像を入力し、該文字画像の文字認識
を行い、各文字について認識結果の確信度を計算する文
字認識装置において、計算された確信度が所定値に達し
ない文字であってかつ他の文字と互いに誤認識されやす
い文字としてあらかじめ指定された文字のグループに属
する文字を抽出する手段と、抽出された各文字の認識結
果をその文字画像と並列して出力する手段とを有するこ
とを特徴とする文字認識装置。
3. A character recognition apparatus for inputting a character image, performing character recognition on the character image, and calculating the certainty of the recognition result for each character, wherein the calculated certainty does not reach a predetermined value. Means for extracting characters belonging to a group of characters designated in advance as characters that are easily misrecognized with other characters, and means for outputting a recognition result of each extracted character in parallel with the character image. A character recognition device comprising:
【請求項4】文字画像を入力し、該文字画像の文字認識
を行い、各文字について認識結果の確信度を計算する文
字認識方法において、計算された確信度が所定値に達し
ない文字を抽出し、抽出された各文字の認識結果をその
文字画像と並列して出力することを特徴とする文字認識
結果の出力方法。
4. A character recognition method for inputting a character image, performing character recognition on the character image, and calculating certainty of a recognition result for each character, wherein characters whose calculated certainty does not reach a predetermined value are extracted. And outputting the recognition result of each extracted character in parallel with the character image.
【請求項5】コンピュータ読み取り可能な記憶媒体上に
実体化されたプログラムであり、該プログラムは、文字
画像を入力し、該文字画像の文字認識を行い、各文字に
ついて認識結果の確信度を計算するプログラムであって
下記ステップを含む: (a)計算された確信度が所定値に達しない文字を抽出
し、(b)抽出された各文字の認識結果をその文字画像
と並列して出力する。
5. A program embodied on a computer-readable storage medium, wherein the program inputs a character image, performs character recognition on the character image, and calculates certainty of a recognition result for each character. The program includes the following steps: (a) extracting a character whose calculated certainty factor does not reach a predetermined value; and (b) outputting a recognition result of each extracted character in parallel with the character image. .
JP10197036A 1998-07-13 1998-07-13 Character recognition device and character recognition result output method Pending JP2000029982A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10197036A JP2000029982A (en) 1998-07-13 1998-07-13 Character recognition device and character recognition result output method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10197036A JP2000029982A (en) 1998-07-13 1998-07-13 Character recognition device and character recognition result output method

Publications (1)

Publication Number Publication Date
JP2000029982A true JP2000029982A (en) 2000-01-28

Family

ID=16367673

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10197036A Pending JP2000029982A (en) 1998-07-13 1998-07-13 Character recognition device and character recognition result output method

Country Status (1)

Country Link
JP (1) JP2000029982A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110942075A (en) * 2018-09-25 2020-03-31 富士施乐株式会社 Information processing apparatus, storage medium, and information processing method
CN114827373A (en) * 2017-11-30 2022-07-29 佳能株式会社 Transmission apparatus, control method thereof, and storage medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114827373A (en) * 2017-11-30 2022-07-29 佳能株式会社 Transmission apparatus, control method thereof, and storage medium
CN110942075A (en) * 2018-09-25 2020-03-31 富士施乐株式会社 Information processing apparatus, storage medium, and information processing method
JP2020052570A (en) * 2018-09-25 2020-04-02 富士ゼロックス株式会社 Information processing apparatus and program
JP7263720B2 (en) 2018-09-25 2023-04-25 富士フイルムビジネスイノベーション株式会社 Information processing device and program

Similar Documents

Publication Publication Date Title
EP1312038B1 (en) Orthogonal technology for multi-line character recognition
JP2713622B2 (en) Tabular document reader
US20020041713A1 (en) Document search and retrieval apparatus, recording medium and program
JPH11120293A (en) Character recognition / correction method
JP6000992B2 (en) Document file generation apparatus and document file generation method
JP6432179B2 (en) Document file generation apparatus and document file generation method
CN100390815C (en) Template-optimized character recognition method and system
JPH1166238A (en) Handwritten character recognition method
JP2000029982A (en) Character recognition device and character recognition result output method
JP2002063548A (en) Handwritten character recognizing method
JP3792759B2 (en) Character recognition method and apparatus
CN1084503C (en) Method and device for automatic correction of word cutting errors in document recognition
JPH07271921A (en) Character recognition device and character recognition method
JP4633271B2 (en) Dictionary learning method and dictionary learning program
JP3157530B2 (en) Character extraction method
JP2002063547A (en) Handwritten character recognizing method
JPH0850631A (en) Character recognition device
JPH11232381A (en) Character reader
JPH0816719A (en) Character cutout method and character recognition method and device using the same
JP2972443B2 (en) Character recognition device
JPH053631B2 (en)
JP3595081B2 (en) Character recognition method
JP2851865B2 (en) Character recognition device
JP2931485B2 (en) Character extraction device and method
JPH04315278A (en) character recognition device