JPH11203411A - Document reader - Google Patents
Document readerInfo
- Publication number
- JPH11203411A JPH11203411A JP10008270A JP827098A JPH11203411A JP H11203411 A JPH11203411 A JP H11203411A JP 10008270 A JP10008270 A JP 10008270A JP 827098 A JP827098 A JP 827098A JP H11203411 A JPH11203411 A JP H11203411A
- Authority
- JP
- Japan
- Prior art keywords
- document
- image
- reading
- unit
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 claims abstract description 44
- 238000012545 processing Methods 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 16
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 238000013441 quality evaluation Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Facsimiles In General (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、文書イメージを取
り込んで文字認識を行い、文書テキストデータを生成す
る文書読み取り装置に関し、特に、文字認識の結果とし
て得られるテキストデータの品質の確保に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document reading apparatus which captures a document image and performs character recognition to generate document text data, and more particularly to ensuring the quality of text data obtained as a result of character recognition.
【0002】[0002]
【従来の技術】例えば紙等に印刷、又は手書きされた文
書を、スキャナから読み込んで文書画像データとし、例
えばパーソナルコンピュータ等の汎用計算機で動作する
文字認識ソフトウェアにより文書画像データを処理し
て、元々の文書に記されていた各文字を認識し文書テキ
ストデータを生成するという文書読み取りシステムは、
近年においては珍しいものではなくなった。2. Description of the Related Art For example, a document printed or handwritten on paper or the like is read from a scanner as document image data, and the document image data is processed by character recognition software operating on a general-purpose computer such as a personal computer. A document reading system that recognizes each character written in the document and generates document text data,
In recent years it is no longer unusual.
【0003】しかし、特に日本語文書においては漢字等
の日本語の文字の他、英字、記号等も用いられ、使用さ
れる文字が多種類である。また複雑な文字イメージを有
するものや互いに類似した画像イメージを有するものが
多く存在する。そのため、如何に文字認識を精度よく行
うかが研究されてきた。[0003] However, in Japanese documents in particular, in addition to Japanese characters such as kanji, English characters and symbols are used, and there are many types of characters used. In addition, there are many objects having a complicated character image and images having image images similar to each other. Therefore, research has been conducted on how to accurately perform character recognition.
【0004】例えば、特開平6−187487号公報に
記載される「認識結果評価方法」では、認識結果として
複数の候補文字を得る文字認識方式において文字認識の
確度を評価するために、得られた複数の候補文字の画数
又は構成線素数を用いる。画数と構成線素数は文字毎に
決まる数値であるので、認識結果は文字認識方式や原稿
画像品質、フォント等の違いの影響を受けにくい。当該
方法は、これにより文字認識確度の向上、安定を図るも
のである。For example, the "recognition result evaluation method" described in Japanese Patent Application Laid-Open No. Hei 6-187487 is used to evaluate the accuracy of character recognition in a character recognition system that obtains a plurality of candidate characters as recognition results. The number of strokes or the number of constituent line primes of a plurality of candidate characters is used. Since the number of strokes and the number of constituent line elements are numerical values determined for each character, the recognition result is hardly affected by differences in the character recognition method, document image quality, font, and the like. According to the method, the accuracy of character recognition is improved and stabilized.
【0005】また、特開平5−189620号公報に記
載される「文字認識装置」に述べられているように、誤
認識された文字を見出すために知識処理が利用されてい
る。知識処理は、認識結果の文字認識候補によって生成
される文字列に対して、辞書との照合を行う。文字認識
候補が複数ある文字については、それらを入れ替えて照
合が行われ、照合に成功した場合は、その文字認識候補
の優先順位を上げるといった処理を行う。[0005] As described in "Character Recognition Apparatus" described in Japanese Patent Application Laid-Open No. 5-189620, knowledge processing is used to find misrecognized characters. In the knowledge processing, a character string generated by a character recognition candidate as a recognition result is compared with a dictionary. For a character having a plurality of character recognition candidates, the characters are replaced and collation is performed. If the collation is successful, a process of increasing the priority of the character recognition candidate is performed.
【0006】上述のように、従来技術では、文字単位で
の評価を行って、認識により得られた文字候補が正しい
ものである確からしさである文字認識確度を得ること、
そしてそれを向上したり、それにより定まる優先順位を
調整して誤認識を低減するといったことが行われてい
た。As described above, in the prior art, character-by-character evaluation is performed to obtain a character recognition accuracy that is a certainty that a character candidate obtained by recognition is correct.
In addition, such techniques have been improved, and priorities determined thereby have been adjusted to reduce erroneous recognition.
【0007】[0007]
【発明が解決しようとする課題】しかし、文書をスキャ
ナから読み込み、その画像ファイルに対し文字認識処理
を施して文書テキストデータを取得する作業において、
従来の文字単位での評価方法では、文書テキストデータ
の品質を定量的に評価することができないという問題が
あった。However, in the operation of reading a document from a scanner and performing character recognition processing on the image file to obtain document text data,
The conventional evaluation method in units of characters has a problem that the quality of document text data cannot be quantitatively evaluated.
【0008】そのため、従来は、一般にユーザ自身が、
認識された結果の文書テキストを画面上や印刷出力にて
目視して、その品質を評価し、満足できる品質が得られ
るまで、スキャナの解像度を上げるなどして文書を読み
込み直し、文字認識処理を行うという作業を繰り返す必
要があった。このような文書読み取り作業は、ユーザに
とって大変手間のかかる作業であり、効率が非常に悪い
という問題があった。For this reason, conventionally, generally, the user himself has
The recognized document text is visually inspected on the screen or in a printed output, and its quality is evaluated.Until satisfactory quality is obtained, the document is read again by increasing the resolution of the scanner, and character recognition processing is performed. It was necessary to repeat the work of doing. Such a document reading operation is a troublesome operation for the user, and has a problem that the efficiency is very low.
【0009】また、初めから、スキャナの解像度を上げ
て文書画像データを取得するという方法では、読み取り
に時間がかかるという問題や、画像ファイルサイズが大
きくなることにより画像ファイルを保管する場合に、大
きな領域が必要になるといった問題が生じ、これらの問
題は特に大量の文書を読み取る場合に深刻である。Further, in the method of acquiring document image data by increasing the resolution of the scanner from the beginning, it takes a long time to read the document, and when storing an image file due to an increase in the size of the image file, a large size is required. Problems arise, such as the need for space, and these problems are particularly acute when reading large volumes of documents.
【0010】さらに、ユーザによる目視評価では評価基
準が、ユーザ毎によって、また場合毎にばらつくため、
文書読み取り結果に対して安定した客観的な評価を行う
ことが難しく、得られた文書テキストデータの信頼性が
安定しないおそれがあるという問題があった。[0010] Further, in the visual evaluation by the user, since the evaluation criterion varies from user to user and from case to case,
There is a problem that it is difficult to perform a stable objective evaluation of the document reading result, and the reliability of the obtained document text data may not be stable.
【0011】本発明は上記問題点を解消するためになさ
れたもので、生成された文書テキストデータの品質を客
観的に評価し、それによりユーザに負担を強いることな
く、信頼性の確保された文書テキストデータを迅速に得
ることができ、文書読み取り作業効率が向上した文書読
み取り装置を提供することを目的とする。SUMMARY OF THE INVENTION The present invention has been made to solve the above problems, and objectively evaluates the quality of generated document text data, thereby ensuring reliability without imposing a burden on a user. An object of the present invention is to provide a document reading apparatus capable of quickly obtaining document text data and improving document reading work efficiency.
【0012】[0012]
【課題を解決するための手段】第一の本発明に係る文書
読み取り装置は、文字認識部が文字ごとに評価し出力す
る文字認識確度に基づいて、文書テキストデータの読み
取り品質を評価し、その評価結果が所定の適格条件を満
たすか否かを判定する認識結果評価部と、前記適格条件
が満たされない場合、画像入力部における画像読み取り
パラメータを変更するパラメータ変更部とを有すること
を特徴とする。According to a first aspect of the present invention, there is provided a document reading apparatus which evaluates the reading quality of document text data based on the character recognition accuracy evaluated and output for each character by a character recognition unit. A recognition result evaluating unit that determines whether an evaluation result satisfies a predetermined eligibility condition; and a parameter changing unit that changes an image reading parameter in an image input unit when the eligibility condition is not satisfied. .
【0013】本発明によれば、認識結果評価部が、文字
単位の文字認識確度を利用して、生成されたテキストデ
ータの品質をより大きな単位である文書単位で評価す
る。ここで文書の単位は、一枚の帳票であってもよい
し、複数の帳票からなる論理的にひとまとまりのもので
あってもよい。パラメータ変更部は、認識結果評価部が
出力する読み取り品質の評価結果に基づいて、画像入力
部の画像読み取りパラメータを変更する。すなわち、読
み取り品質の評価結果が画像入力部へフィードバックさ
れ、これにより読み取り品質を適格条件を満たすように
向上させるフィードバック制御が行われる。According to the present invention, the recognition result evaluating unit evaluates the quality of the generated text data on a document basis, which is a larger unit, using the character recognition accuracy on a character basis. Here, the unit of the document may be a single form, or may be a logical group of a plurality of forms. The parameter changing unit changes the image reading parameters of the image input unit based on the reading quality evaluation result output by the recognition result evaluating unit. That is, the evaluation result of the reading quality is fed back to the image input unit, and thereby the feedback control for improving the reading quality to satisfy the qualifying condition is performed.
【0014】第二の本発明に係る文書読み取り装置にお
いては、前記画像入力部が、変更された前記画像読み取
りパラメータに基づいて再度、同一の文書に対して文書
画像データを生成し、前記文字認識部へ出力することを
特徴とする。In the document reading apparatus according to a second aspect of the present invention, the image input unit generates document image data for the same document again based on the changed image reading parameters, and performs the character recognition. Output to the unit.
【0015】本発明によれば、同一の文書に対して、所
定の適格条件が満たされるまで、画像読み取りパラメー
タの変更、文書画像データの生成、及び文字認識処理に
よる文書テキストデータの生成という一連の処理が繰り
返される。これにより、各文書について所定水準以上の
文書テキストデータの品質が安定して確保される。ここ
で、処理の繰り返しは、一枚の帳票毎に行ってもよい
し、複数の帳票からなる論理的にひとまとまりのものを
単位として行ってもよい。According to the present invention, a series of steps of changing image reading parameters, generating document image data, and generating document text data by character recognition processing are performed on the same document until a predetermined eligibility condition is satisfied. The process is repeated. Thereby, the quality of the document text data of a predetermined level or more for each document is stably ensured. Here, the repetition of the processing may be performed for each single form, or may be performed in units of a logical group of a plurality of forms.
【0016】本発明の好適な態様は、前記画像読み取り
パラメータに、前記文書イメージの読み取りの解像度を
含むものである。また他の好適な態様は、前記画像読み
取りパラメータに、前記文書イメージの読み取りにおけ
る濃度閾値を含むものである。In a preferred aspect of the present invention, the image reading parameter includes a resolution for reading the document image. In another preferred aspect, the image reading parameter includes a density threshold in reading the document image.
【0017】第三の本発明に係る文書読み取り装置は上
記発明において、前記画像読み取りパラメータが前記文
書イメージの読み取りの解像度を含み、前記パラメータ
変更部が前記解像度を増加させることを特徴とする。According to a third aspect of the present invention, in the above-mentioned invention, the image reading parameter includes a resolution for reading the document image, and the parameter changing unit increases the resolution.
【0018】本発明によれば、画像入力部は複数種類の
読み取り解像度を有し、ある解像度で適格条件が満たさ
れない場合には、それよりも解像度を上げて文書読み取
りを行う。一般に解像度を上げることにより各文字の認
識精度は向上し、文書単位での読み取り品質も向上す
る。そこで、例えば、適格条件を満たす読み取り品質を
実現した解像度を保持して、新たに適格条件が満たされ
ないと判断されるまで、以降の文書の読み取りに継続し
て用いるようにしてもよい。According to the present invention, the image input unit has a plurality of types of reading resolutions, and when a certain resolution does not satisfy the qualifying condition, the image is read at a higher resolution. Generally, by increasing the resolution, the recognition accuracy of each character is improved, and the reading quality of each document is also improved. Therefore, for example, the resolution that achieves the read quality that satisfies the qualifying condition may be retained and used continuously for reading the subsequent documents until it is newly determined that the qualifying condition is not satisfied.
【0019】本発明の一層の好適な態様は、前記文書の
初回の読み取りにおける前記画像読み取りパラメータと
して所定の初期値を設定するパラメータ初期化部を有
し、前記パラメータ初期化部が、前記解像度の初期値と
して、所定の粗解像度を設定するものである。この態様
では、文書毎に、解像度が粗解像度にリセットされる。
粗解像度は、画像入力部が有する複数解像度のうちのい
ずれかの低い値であり、例えば、最低の解像度に設定す
ることができる。一般に高解像度で画像入力部を動作さ
せると文書画像データの生成に時間がかかる。これに対
し、文書毎に解像度を初期値として低解像度に設定し、
必要に応じて、すなわち適格条件を満たされない場合に
おいてのみ、解像度を上げることにより、文書読み取り
処理のスループットの向上を図ることができる。[0019] In a further preferred aspect of the present invention, there is provided a parameter initializing section for setting a predetermined initial value as the image reading parameter in the first reading of the document, wherein the parameter initializing section sets the resolution of the resolution. A predetermined coarse resolution is set as an initial value. In this aspect, the resolution is reset to the coarse resolution for each document.
The coarse resolution is a lower value of any of the multiple resolutions of the image input unit, and can be set to, for example, the lowest resolution. Generally, when the image input unit is operated at a high resolution, it takes time to generate document image data. On the other hand, for each document, the resolution is set to a low value as the initial value,
By increasing the resolution as needed, that is, only when the eligibility condition is not satisfied, the throughput of the document reading process can be improved.
【0020】第四の本発明に係る文書読み取り装置にお
いては、前記認識結果評価部が、前記文字認識確度を文
書の全領域又は所定部分領域に含まれる各文字について
平均した文字認識確度平均値を求め、当該文字認識確度
平均値と所定基準値との比較に基づいて前記評価結果の
適格不適格を判定する。In the document reading apparatus according to a fourth aspect of the present invention, the recognition result evaluating section calculates a character recognition accuracy average value obtained by averaging the character recognition accuracy for each character included in the entire region or a predetermined partial region of the document. Then, the eligibility of the evaluation result is determined based on a comparison between the average value of the character recognition accuracy and a predetermined reference value.
【0021】第五の本発明に係る文書読み取り装置にお
いては、前記認識結果評価部が、文書の全領域又は所定
部分領域に含まれる文字のうち、所定範囲の前記文字認
識確度を有するものの割合を求め、当該割合と所定基準
割合との比較に基づいて前記評価結果の適格不適格を判
定する。In the document reading apparatus according to a fifth aspect of the present invention, the recognition result evaluating unit may determine a ratio of a character having the character recognition accuracy in a predetermined range among characters included in the entire area or the predetermined partial area of the document. Then, the eligibility of the evaluation result is determined based on the comparison between the ratio and a predetermined reference ratio.
【0022】本発明によれば、文書の所定対象領域にお
いて、文字認識確度が所定範囲内の値である文字の数と
当該領域に含まれる全文字数との比が求められる。この
比が所定基準割合と比較され、読み取り品質の評価結果
の適格不適格が判定される。文字認識確度の所定範囲
は、上限下限の組による指定、閾値による指定のいずれ
も可能である。例えば、所定の閾値以上の文字認識確度
を有する文字の割合が所定の基準割合以上であるときに
は評価結果が適格であるといった判定が行われる。According to the present invention, in a predetermined target area of a document, a ratio between the number of characters whose character recognition accuracy is a value within a predetermined range and the total number of characters included in the area is obtained. This ratio is compared with a predetermined reference ratio to determine whether the read quality evaluation result is qualified or not. The predetermined range of the character recognition accuracy can be specified by a set of upper and lower limits or specified by a threshold. For example, when the ratio of characters having a character recognition accuracy equal to or higher than a predetermined threshold is equal to or higher than a predetermined reference ratio, it is determined that the evaluation result is qualified.
【0023】[0023]
【発明の実施の形態】次に、本発明の実施形態について
図面を参照して説明する。Next, embodiments of the present invention will be described with reference to the drawings.
【0024】図1は、本発明の実施形態である文書読み
取り装置の概略のブロック構成図である。本装置は、画
像入力部2、文字認識部4、認識結果評価部6、パラメ
ータ変更部8、画像入力制御部10、品質条件入力部1
2、認識結果出力部14を含んで構成され、文書20を
読み取り、文書テキストデータを生成する。FIG. 1 is a schematic block diagram of a document reading apparatus according to an embodiment of the present invention. This apparatus includes an image input unit 2, a character recognition unit 4, a recognition result evaluation unit 6, a parameter change unit 8, an image input control unit 10, a quality condition input unit 1,
2. It is configured to include the recognition result output unit 14, reads the document 20, and generates document text data.
【0025】画像入力部2は、文書20のイメージを読
み取り文書画像データを生成する。画像入力部2として
は、例えば光学的スキャナが用いられる。例えば、画像
入力部2は自動給紙機構を備え、文書20である帳票を
自動的に順次、読み取るように構成することもできる。The image input unit 2 reads an image of the document 20 and generates document image data. As the image input unit 2, for example, an optical scanner is used. For example, the image input unit 2 may be provided with an automatic paper feed mechanism, and may be configured to automatically and sequentially read a form as the document 20.
【0026】文字認識部4は、画像入力部2で生成され
た文書画像データに含まれる文字のイメージを認識し
て、それを対応する文字コードに変換することにより、
文書テキストデータを生成する。The character recognizing section 4 recognizes a character image included in the document image data generated by the image input section 2 and converts the image into a corresponding character code.
Generate document text data.
【0027】図2は、文字認識部4が行う文字認識処理
の一例を示す模式図である。この例の文字認識部4では
各文字イメージについて複数の文字候補が得られ、各文
字候補はそれぞれ認識の確からしさを示す指標として文
字認識確度を付与される。文字認識確度は、その文字候
補が文書に記載されていた文字である蓋然性を表すもの
であり、当該確度が大きい文字候補が、小さいものより
必ず正しい文字であるということを意味しない。複数の
文字候補が得られた場合には、それらには優先順位が付
けられる。この優先順位は、単純には文字認識確度の大
小に従って定めることができるし、さらには上記従来技
術のように、知識処理に基づいてそれを調整することも
できる。FIG. 2 is a schematic diagram showing an example of a character recognition process performed by the character recognition section 4. In the character recognition unit 4 of this example, a plurality of character candidates are obtained for each character image, and each character candidate is given character recognition accuracy as an index indicating the probability of recognition. The character recognition accuracy indicates the probability that the character candidate is a character described in the document, and does not mean that a character candidate with a higher accuracy is always a correct character than a character with a lower accuracy. If a plurality of character candidates are obtained, they are prioritized. This priority can be simply determined according to the degree of the character recognition accuracy, and can be adjusted based on knowledge processing as in the above-described prior art.
【0028】図に示す例では、画像30は、画像入力部
2により生成されたものを示している。画像30は、例
えば、実際の文書20上において「ベクトル」である文
字列のイメージが、例えば文書上のゴミ等により文字列
の第二文字「ク」にノイズを含んで取り込まれた例を示
している。この文書画像データが文字認識部4に入力さ
れると、文字認識部4は文字認識処理によって、画像デ
ータを認識結果40として示されるように認識する。認
識結果40は、例えば、文字列の第一文字に対して、第
一から第五の文字候補として、それぞれ「ベ」(カタカ
ナ)、「べ」(ひらがな)、「ペ」(カタカナ)、
「ぺ」(ひらがな)、「ヨ」という認識結果を得、第一
候補の文字認識確度として“0.788184”という値を得た
ことを示している。また認識結果40は、文字列の第二
文字に対しては、第一から第五の文字候補として、それ
ぞれ「タ」(カタカナ)、「ク」(カタカナ)、「グ」
(カタカナ)、「夕」(漢字)、「ダ」(カタカナ)と
いう認識結果を得、第一候補の文字認識確度として“0.
698382”という値を得たことを示している。すなわち第
二文字は、ノイズのため、正しい文字「ク」ではなく誤
った文字「タ」として認識されている。ノイズを含んで
生成される文字イメージ(上記例では「ク」にノイズが
付加されたイメージ)は本来の正しい文字の完全な形を
有さないし、一般に、誤って認識された文字(上記例で
は「タ」)の完全な形をもなさない。そのため、一般に
誤って第一候補として認識された文字の認識確度は低く
なる。In the example shown in the figure, the image 30 is generated by the image input unit 2. The image 30 shows an example in which, for example, an image of a character string that is a “vector” on the actual document 20 is captured with noise included in the second character “ku” of the character string due to dust on the document, for example. ing. When the document image data is input to the character recognizing unit 4, the character recognizing unit 4 recognizes the image data by a character recognizing process as shown as a recognition result 40. The recognition result 40 is, for example, "be" (Katakana), "Be" (Hiragana), "Pe" (Katakana), as the first to fifth character candidates for the first character of the character string.
Recognition results of “ぺ” (Hiragana) and “Yo” were obtained, indicating that a value of “0.788184” was obtained as the character recognition accuracy of the first candidate. In addition, the recognition result 40 indicates that for the second character of the character string, “ta” (Katakana), “C” (Katakana), and “G”
(Katakana), "evening" (Kanji), and "Da" (Katakana) are obtained, and the character recognition accuracy of the first candidate is "0.
698382 ". That is, the second character is recognized as an incorrect character" ta "instead of the correct character" ku "due to noise. A character image generated with noise (in the above example, an image in which noise is added to “ク”) does not have the perfect shape of the original correct character, and generally, a character that is incorrectly recognized (in the above example, Neither does it have the perfect form of "ta"). Therefore, generally, the recognition accuracy of a character erroneously recognized as the first candidate is low.
【0029】認識結果評価部6は、このような性質を有
する文字認識確度を含んだ認識結果を文字認識部4から
入力される。認識結果評価部6は、文字認識部4から得
られた文字認識確度に基づいて、文書20に対する認識
結果全体の品質を評価する。The recognition result evaluation unit 6 receives from the character recognition unit 4 a recognition result including the character recognition accuracy having such a property. The recognition result evaluation unit 6 evaluates the quality of the entire recognition result of the document 20 based on the character recognition accuracy obtained from the character recognition unit 4.
【0030】品質が適格なものであることを判断する基
準となる条件(適格条件)は、品質条件入力部12から
認識結果評価部6へ設定される。例えば、ユーザが適格
条件を品質条件入力部12へ入力し、品質条件入力部1
2がこれを文字認識部4へ設定するように構成すること
もできる。A condition (qualifying condition) serving as a criterion for judging that the quality is qualified is set from the quality condition input unit 12 to the recognition result evaluating unit 6. For example, the user inputs the eligibility condition to the quality condition input unit 12 and the quality condition input unit 1
2 can set this to the character recognition unit 4.
【0031】認識結果評価部6は、適格条件を満たす評
価結果が得られた場合には、得られた文書テキストデー
タを認識結果出力部14へ出力する。一方、所望の適格
条件を満たす評価結果が得られなかった場合には、認識
結果評価部6はこれをパラメータ変更部8に通知する。When an evaluation result satisfying the eligibility condition is obtained, the recognition result evaluation unit 6 outputs the obtained document text data to the recognition result output unit 14. On the other hand, when the evaluation result satisfying the desired eligibility condition is not obtained, the recognition result evaluating unit 6 notifies the parameter changing unit 8 of the result.
【0032】パラメータ変更部8は、画像入力部2が文
書画像を読み取る際のパラメータの変更を行う。本構成
では、画像読み取りパラメータは直接には、画像入力制
御部10によって画像入力部2へ設定されるものであ
る。この構成において、パラメータ変更部8は、画像入
力制御部10に対し、新たなパラメータ値を生成して渡
すようにも、または現在の値との差分量を生成してこれ
を渡すようにも構成されうる。画像読み取りパラメータ
は、例えば、画像入力部2における文書イメージの読み
取り解像度や、その他、文書上の各点を白と判定するか
黒と判定するかの基準に用いられる濃度閾値である。The parameter changing section 8 changes parameters when the image input section 2 reads a document image. In this configuration, the image reading parameters are directly set in the image input unit 2 by the image input control unit 10. In this configuration, the parameter changing unit 8 is configured to generate and pass a new parameter value to the image input control unit 10 or to generate and pass a difference amount from the current value. Can be done. The image reading parameters are, for example, the reading resolution of the document image in the image input unit 2 and other density thresholds used as criteria for determining whether each point on the document is determined to be white or black.
【0033】画像入力制御部10は、画像入力部2の動
作を制御する。例えば、既に述べたように、画像入力部
2への画像読み取りパラメータの設定を行ったり、読み
取り動作の開始/停止を制御したり、その他、画像入力
部2が自動給紙機構を有する場合には、その制御をも行
うように構成される。The image input control unit 10 controls the operation of the image input unit 2. For example, as described above, when image reading parameters are set in the image input unit 2, start / stop of a reading operation is controlled, and when the image input unit 2 has an automatic paper feed mechanism, , Are also controlled.
【0034】認識結果出力部14は、生成された文書テ
キストデータを表示したり、記録したりする働きを有す
る。例えば、認識結果出力部14は、画面表示を行うデ
ィスプレイや、電子的な文書テキストデータをファイル
形式で格納しうる磁気ディスク装置等の記憶装置、紙等
に出力するプリンタ等を用いて構成することができる。The recognition result output unit 14 has a function of displaying and recording the generated document text data. For example, the recognition result output unit 14 may be configured using a display for displaying a screen, a storage device such as a magnetic disk device capable of storing electronic document text data in a file format, a printer for outputting to paper or the like, or the like. Can be.
【0035】このように、本装置は、画像入力部2、文
字認識部4、認識結果評価部6、パラメータ変更部8及
び画像入力制御部10がフィードバックループを構成す
る。As described above, in the present apparatus, the image input unit 2, the character recognition unit 4, the recognition result evaluation unit 6, the parameter change unit 8, and the image input control unit 10 form a feedback loop.
【0036】なお、文書20は例えば、帳票、すなわち
シート状の文書の集合であり、特に画像入力部2が自動
給紙機構を有する場合には、その複数の帳票がスタック
として装置にセットされるのが一般的であろう。The document 20 is, for example, a form, that is, a set of sheet-shaped documents. In particular, when the image input unit 2 has an automatic paper feed mechanism, the plurality of forms are set in the apparatus as a stack. Would be common.
【0037】文字認識部4、認識結果評価部6、パラメ
ータ変更部8、画像入力制御部10及び品質条件入力部
12は、例えば、中央処理装置(CPU:Central Proc
essing Unit)上で実行されるソフトウェアにより実現
されうる。すなわち、本装置の一例は、パーソナルコン
ピュータ等の汎用コンピュータにスキャナ装置を接続す
ることにより構成することができる。The character recognition unit 4, the recognition result evaluation unit 6, the parameter change unit 8, the image input control unit 10, and the quality condition input unit 12 are, for example, a central processing unit (CPU: Central Proc).
essing unit). That is, an example of the present apparatus can be configured by connecting the scanner apparatus to a general-purpose computer such as a personal computer.
【0038】図3は、本装置における処理を説明する処
理フロー図である。ここでは、適格条件として、「第一
候補の文字認識確度が0.9以上である文字の数が、認
識された文書テキストの90%以上を占める。」を設定
して処理を行う場合を例に説明する。また、画像読み取
りパラメータのうち読み取り解像度のみを考慮するもの
とする。また、画像入力部2は自動給紙機構を有し、ス
タック状にセットされた帳票を1枚ずつ順次読み込むこ
とができるものとする。FIG. 3 is a processing flowchart for explaining the processing in the present apparatus. Here, an example is given in which the eligibility condition is set as “the number of characters whose character recognition accuracy of the first candidate is 0.9 or more occupies 90% or more of the recognized document text.” Will be described. It is assumed that only the reading resolution among the image reading parameters is considered. Further, it is assumed that the image input unit 2 has an automatic paper feeding mechanism and can sequentially read the sheets set in a stack one by one.
【0039】まず、ユーザは、品質条件入力部12へ適
格条件の設定を行う。この適格条件の設定は、例えば、
文字認識確度の閾値“0.9”、文字認識確度がその閾
値を超えた文字の比率に関する閾値である基準割合“9
0%”を入力することにより行われる。入力された適格
条件は、認識結果評価部6へ渡され、格納される(S5
0)。しかる後、装置の文書読み取り動作が起動され
る。First, the user sets eligibility conditions in the quality condition input section 12. The setting of this eligibility condition is, for example,
A threshold “0.9” of the character recognition accuracy, and a reference ratio “9” which is a threshold relating to a ratio of characters whose character recognition accuracy exceeds the threshold.
0% ". The input eligibility condition is transferred to the recognition result evaluation unit 6 and stored (S5).
0). Thereafter, the document reading operation of the apparatus is started.
【0040】画像入力制御部10は、自動給紙機構を制
御して、帳票を画像入力部2に新たにセットする度に、
画像入力部2に画像読み取りパラメータの初期値を設定
する(S55)。この初期値は、画像入力制御部10に
予め格納されているものである。例えば画像入力制御部
10は、画像入力部2に対し解像度の初期値として20
0dpiを設定する。そして、画像入力制御部10は画
像入力部2に対し、自動給紙機構からセットされた帳票
を読み取るように指示する。The image input control unit 10 controls the automatic sheet feeding mechanism, and every time a form is newly set in the image input unit 2,
The initial values of the image reading parameters are set in the image input unit 2 (S55). This initial value is stored in the image input control unit 10 in advance. For example, the image input control unit 10 sends a 20
Set 0 dpi. Then, the image input control unit 10 instructs the image input unit 2 to read the form set from the automatic sheet feeding mechanism.
【0041】画像入力部2は、設定された解像度で帳票
のイメージを光学的に読み取り文書画像データを出力す
る(S60)。この文書画像データは、画像データファ
イルとして文字認識部4に渡される。文書画像データを
ファイルにまとめる処理は、画像入力部2自身が行って
もよいが、画像入力部2がコンピュータに接続されたス
キャナである場合には、通常は、コンピュータ上の図示
しない処理部がスキャナから入力されるデータをファイ
ル化して、文字認識部4に渡すように構成されるであろ
う。The image input section 2 optically reads the image of the form at the set resolution and outputs document image data (S60). This document image data is passed to the character recognition unit 4 as an image data file. The process of combining the document image data into a file may be performed by the image input unit 2 itself. However, when the image input unit 2 is a scanner connected to a computer, a processing unit (not shown) on the computer is generally used. The input data from the scanner will be filed and passed to the character recognition unit 4.
【0042】文字認識部4は、入力された画像ファイル
に対して文字認識処理を行う(S65)。すなわち、文
字認識部4は、画像ファイルに含まれる文字画像を表す
データ部分を検出し、各文字画像に対して文字認識を行
う。その結果、1つの文字画像に対して、複数の文字候
補を検出した場合は、文字認識部4はそれら候補間での
優先順位を定め、少なくとも第一候補の文字認識確度を
求める。The character recognition section 4 performs a character recognition process on the input image file (S65). That is, the character recognition unit 4 detects a data portion representing a character image included in the image file, and performs character recognition on each character image. As a result, when a plurality of character candidates are detected for one character image, the character recognition unit 4 determines a priority order among the candidates and obtains at least the character recognition accuracy of the first candidate.
【0043】文字認識部4による各文字画像についての
認識結果は、認識結果評価部6に入力される。認識結果
評価部6は、まず認識結果の評価を行う(S70)。こ
の評価は、ここで説明する例では、各文字の文字認識確
度と、品質条件入力部12により設定されたその閾値
“0.9”との大小が判定され、閾値を超える文字数と
帳票内の全文字数との比が算定される。この比が品質条
件入力部12で設定された基準割合“90%”と比較さ
れる。The recognition result of each character image by the character recognition unit 4 is input to the recognition result evaluation unit 6. The recognition result evaluation unit 6 first evaluates the recognition result (S70). In this evaluation, in the example described here, the magnitude of the character recognition accuracy of each character and the threshold “0.9” set by the quality condition input unit 12 are determined, and the number of characters exceeding the threshold and the number of characters in the form are determined. The ratio to the total number of characters is calculated. This ratio is compared with a reference ratio “90%” set in the quality condition input unit 12.
【0044】検知された比が基準割合以上であれば(S
75)、読み取られた帳票の文字認識品質は適格である
と判断され、文字認識部4から認識結果評価部6へ入力
された文書テキストデータが、認識結果出力部14へ出
力される(S80)。認識結果出力部14はその機能に
応じて、入力された文書テキストデータを表示したり、
記憶したり、印刷したりする。If the detected ratio is equal to or higher than the reference ratio (S
75) The character recognition quality of the read form is determined to be qualified, and the document text data input from the character recognition unit 4 to the recognition result evaluation unit 6 is output to the recognition result output unit 14 (S80). . The recognition result output unit 14 displays input document text data according to the function,
Memorize and print.
【0045】一方、検知された比が基準割合を下回る場
合には、品質は不適格であると判断される(S75)。
この場合には、認識結果評価部6はパラメータ変更部8
に対して、読み取り解像度を変更するように指示する。
一般に、文字の誤認識は読み取り解像度が不十分である
場合に起こる。よって、パラメータ変更部8は指示を受
けると、現在の解像度の値に予め設定されている変更幅
を加算し、この増加された解像度の値を画像入力制御部
10へ出力する(S85)。変更幅は、例えば、100
dpiに設定することができる。この場合、一回目の読
み取りで不適格と判断されると、解像度の初期値200
dpiに当該変更幅を加算した300dpiが画像入力
制御部10へ出力される。On the other hand, if the detected ratio is lower than the reference ratio, it is determined that the quality is inappropriate (S75).
In this case, the recognition result evaluator 6 includes the parameter changer 8
Is instructed to change the reading resolution.
Generally, erroneous character recognition occurs when the reading resolution is insufficient. Therefore, upon receiving the instruction, the parameter changing unit 8 adds a preset change width to the current resolution value, and outputs the increased resolution value to the image input control unit 10 (S85). The change width is, for example, 100
It can be set to dpi. In this case, if it is determined that the first reading is inappropriate, the initial value of the resolution 200
300 dpi obtained by adding the change width to the dpi is output to the image input control unit 10.
【0046】画像入力制御部10は、パラメータ変更部
8から変更された解像度を入力されると、これを画像入
力部2に設定し、現在、画像入力部2にセットされてい
る帳票を再度、読み取るよう指示する。画像入力部2
は、新たな解像度で読み取った文書画像データを、前回
同様、文字認識部4へ出力する。以降は、上述した処理
が繰り返される。すなわち、今回も認識結果評価部6に
て品質が不適格と判定されると、パラメータ変更部8に
て解像度がさらに100dpi加算され、400dpi
での読み取りが行われる。When the changed resolution is input from the parameter changing unit 8, the image input control unit 10 sets the changed resolution in the image input unit 2, and re-reads the form currently set in the image input unit 2 again. Instruct to read. Image input unit 2
Outputs the document image data read at the new resolution to the character recognition unit 4 as in the previous case. Thereafter, the above-described processing is repeated. That is, if the recognition result evaluation unit 6 determines that the quality is inappropriate again, the parameter changing unit 8 further increases the resolution by 100 dpi, and increases the resolution by 400 dpi.
Is read.
【0047】つまり、本装置では、認識結果評価部6に
て品質が適格であると判定されるか(S75)、解像度
が画像入力部2の性能の上限に達するまで(S90)、
解像度をインクリメントして文書読み取りが繰り返され
る。That is, in the present apparatus, the recognition result evaluation unit 6 determines that the quality is appropriate (S75), or until the resolution reaches the upper limit of the performance of the image input unit 2 (S90).
The document reading is repeated with the resolution incremented.
【0048】認識結果評価部6にて品質が適格であると
判断された場合には、上述したように、文書テキストデ
ータが認識結果出力部14へ出力されると同時に、画像
入力制御部10への通知も行われる。画像入力制御部1
0はこの通知を受けると、画像入力部2に、自動給紙機
構を制御して次の帳票をセットするとともに、解像度を
初期値にリセットして、新たな帳票を読み取らせる。If the recognition result evaluation section 6 determines that the quality is appropriate, the document text data is output to the recognition result output section 14 and simultaneously to the image input control section 10 as described above. Is also notified. Image input control unit 1
When 0 receives this notification, it controls the automatic paper feed mechanism to set the next form, resets the resolution to the initial value, and reads a new form.
【0049】また、画像入力制御部10は、パラメータ
変更部8から渡された解像度の値が、画像入力部2の性
能上限を超える場合にも、同様に解像度のリセットを行
って新たな帳票の読み取り処理を実行する。例えば、こ
の場合には、画像入力制御部10は渡された解像度が上
限を超えることを認識結果評価部6へ通知し、認識結果
評価部6はその通知に基づいて、直近に得られた文書テ
キストデータを認識結果出力部14へ出力する。ここで
出力される文書テキストデータは、品質は適格と判定さ
れたものではないが、本装置で得られる最善の品質のデ
ータであり、よって本装置ではこれを出力することとし
ている。なお、この場合、品質が不適格であることや品
質に関するデータを併せて出力するのが望ましいであろ
う。Also, when the resolution value passed from the parameter changing unit 8 exceeds the upper limit of the performance of the image input unit 2, the image input control unit 10 similarly resets the resolution and creates a new form. Execute the reading process. For example, in this case, the image input control unit 10 notifies the recognition result evaluation unit 6 that the passed resolution exceeds the upper limit, and the recognition result evaluation unit 6 performs the most recently obtained document based on the notification. The text data is output to the recognition result output unit 14. Although the document text data output here is not data whose quality has been determined to be qualified, it is the data of the best quality that can be obtained by this apparatus, and therefore this apparatus outputs this data. In this case, it may be desirable to output data indicating that the quality is ineligible and the quality.
【0050】なお、読み取り解像度の初期値、及びパラ
メータ変更における1回当たりの読み取り解像度の変更
幅は、上述の説明では、それぞれ画像入力制御部10、
パラメータ変更部8に予め設定されているものとした
が、これらをユーザが品質条件入力部12から入力でき
るように構成してもよい。In the above description, the initial value of the reading resolution and the change width of the reading resolution per change in the parameter change are described in the above description, respectively.
Although the parameters are set in the parameter changing unit 8 in advance, they may be configured so that the user can input them from the quality condition input unit 12.
【0051】また、上述の例では、認識結果評価部6
は、一枚の帳票全体の文字の文字認識確度を用いて評価
を行ったが、帳票上の所定領域の、または例えば品質条
件入力部12等から設定した領域の文字を対象として同
様の評価を行ってもよい。また、上述の適格条件とは逆
に、「認識された文書テキストの全文字、または所定部
分に含まれる文字のうち、第一候補の文字認識確度が所
定閾値以下である文字の数が、所定基準割合以下であ
る。」という条件を用いることもできる。In the above example, the recognition result evaluation unit 6
Was evaluated using the character recognition accuracy of the characters of the entire form, but the same evaluation was performed for characters in a predetermined area on the form or in an area set from the quality condition input unit 12 or the like. May go. Also, contrary to the above eligibility condition, "the number of characters whose character recognition accuracy of the first candidate is equal to or less than a predetermined threshold among all characters of the recognized document text or characters included in a predetermined portion is equal to or smaller than a predetermined Below the reference ratio. "
【0052】また、認識された文書テキストの全文字、
または所定部分領域に含まれる文字についての第一候補
の文字認識確度の平均値を求め、適格条件を当該平均値
と所定基準値との大小比較に基づくものとすることもで
きる。Also, all the characters of the recognized document text,
Alternatively, the average value of the character recognition accuracy of the first candidate for the characters included in the predetermined partial area may be determined, and the eligibility condition may be based on the magnitude comparison between the average value and the predetermined reference value.
【0053】上述の例では、フィードバックループは、
品質が適格となるまで、または画像読み取りパラメータ
の制限を受けるまで繰り返されたが、これらの条件に加
えて、または、これら条件のうち後者の代わりに、認識
結果評価部6における評価回数が所定の上限値に達する
ことによりループを停止し、その時点での文書テキスト
データを認識結果出力部14へ出力するように構成する
ことも可能である。もともとの文書イメージが粗悪なも
のである場合等には、画像読み取りパラメータを如何に
調整しても品質の向上が見られない場合もある。そのよ
うな場合には上述のように、評価回数に上限を設けるこ
とにより、品質が改善されない無駄なループ処理を回避
することが、処理時間を短縮し、スループットを向上さ
せるといった観点から有効である。In the above example, the feedback loop is
The repetition was performed until the quality was qualified or the image reading parameters were restricted. In addition to these conditions, or instead of the latter among these conditions, the number of evaluations in the recognition result evaluation unit 6 is a predetermined number. It is also possible to configure so that the loop is stopped by reaching the upper limit value, and the document text data at that time is output to the recognition result output unit 14. If the original document image is poor, the quality may not improve even if the image reading parameters are adjusted. In such a case, as described above, by setting an upper limit on the number of evaluations, avoiding useless loop processing in which quality is not improved is effective from the viewpoint of reducing processing time and improving throughput. .
【0054】パラメータ変更部8は、複数の画像読み取
りパラメータを調整するものであってもよい。例えば、
解像度と濃度閾値との組み合わせを適当に変更して、画
像入力制御部10へ指示するように構成することができ
る。その際、パラメータ間での変更順序に優先順位を設
けることができる。例えば、ある解像度にて、濃度閾値
を所定幅で何段階かに変更させて品質を評価し、それで
品質が向上しなければ解像度を1段階上げるといったパ
ラメータ変更の方法を採用することができる。The parameter changing section 8 may adjust a plurality of image reading parameters. For example,
The combination of the resolution and the density threshold value may be changed appropriately and the image input control unit 10 may be instructed. At that time, the order of change between the parameters can be given a priority. For example, at a certain resolution, the quality can be evaluated by changing the density threshold in several steps within a predetermined width, and if the quality does not improve, a parameter changing method of increasing the resolution by one step can be adopted.
【0055】画像入力部2は、縮小した画像を生成する
スケーリング機能を備えていてもよい。この場合には、
画像読み取りパラメータとして、スキャナの読み取り倍
率を用いることができる。例えば、初回には、倍率を小
さめに設定して(例えば60%に縮小して)文書イメー
ジの読み取りを行う。そして、この倍率で十分な品質が
得られなかった場合においてのみ、倍率を上げて、再
度、文書画像データを生成し、文字認識、評価を行う。
このように、必要時にのみ倍率を上げることにより、平
均的な文書画像データのサイズが抑制され、文字認識処
理の迅速化を図ることができる。The image input unit 2 may have a scaling function for generating a reduced image. In this case,
The reading magnification of the scanner can be used as the image reading parameter. For example, in the first time, the document image is read with the magnification set to a small value (for example, reduced to 60%). Then, only when sufficient quality cannot be obtained at this magnification, the magnification is increased and the document image data is generated again, and the character recognition and evaluation are performed.
As described above, by increasing the magnification only when necessary, the average size of the document image data is suppressed, and the character recognition processing can be speeded up.
【0056】また、上述の例では、各帳票毎にフィード
バック制御による画像読み取りパラメータの調整を行っ
たが、最初の1枚または数枚の帳票についてのみ品質の
評価やパラメータ調整を行い、それにより所望の品質を
達成するパラメータ値が見出された場合、パラメータ値
を当該値で固定し、以降の帳票においては、品質評価、
パラメータ調整のフィードバック制御は行わない構成が
可能である。なぜなら、ひとまとまりの文書に含まれる
複数の帳票間では、それが印刷物である場合にはフォン
トサイズ等の条件やノイズの多寡といった条件が、また
手書き文字である場合には認識しやすい文字であるかど
うかのレベルが、多くの場合ほぼ同一であるからであ
る。これにより、大量の帳票からなる文書の読み取り処
理を迅速に完了することが可能となる。In the above-described example, the image reading parameters are adjusted by feedback control for each form. However, quality evaluation and parameter adjustment are performed only on the first one or a few sheets, thereby making it possible to obtain desired values. If a parameter value that achieves the quality of is found, the parameter value is fixed at that value, and in subsequent forms, quality evaluation,
A configuration in which feedback control for parameter adjustment is not performed is possible. This is because, among a plurality of forms included in a set of documents, conditions such as font size and noise level are easy to recognize when the form is a printed matter, and when handwritten characters are used. This is because the level of whether or not is almost the same in many cases. This makes it possible to quickly complete the process of reading a document composed of a large number of forms.
【0057】なお、上述の装置は自動給紙機構を有する
ものを例にとって説明したが、本発明はそれを前提とす
るものではなく、本発明の本質的な特徴は、単一の帳票
における読み取り品質の確保においても発揮される。Although the above-described apparatus has been described by way of example having an automatic paper feed mechanism, the present invention is not premised on that. An essential feature of the present invention is that a single form is read. It is also demonstrated in ensuring quality.
【0058】[0058]
【発明の効果】本発明の文書読み取り装置によれば、文
字認識部が出力する文字認識確度に基づいて、認識結果
評価部が文書テキストデータの読み取り品質を評価し、
その品質が所定の適格条件を満足しない場合には、パラ
メータ変更部が画像読み取りパラメータを変更する。つ
まり、読み取られた文書テキストデータが客観的・定量
的に評価され、さらにその評価結果が画像入力部へフィ
ードバックされることにより、読み取り品質の向上が図
られるという効果が得られる。このフィードバックに
は、ユーザは介在しないので、文書読み込みにおけるユ
ーザ作業の負担軽減、効率化が図られるという効果が得
られるとともに、生成された文書テキストデータの信頼
性が確保されるという効果が実現される。According to the document reading apparatus of the present invention, the recognition result evaluation unit evaluates the reading quality of the document text data based on the character recognition accuracy output by the character recognition unit.
If the quality does not satisfy the predetermined eligibility condition, the parameter changing unit changes the image reading parameters. That is, the read document text data is objectively and quantitatively evaluated, and the evaluation result is fed back to the image input unit, whereby the effect of improving the reading quality is obtained. Since this feedback does not involve the user, the effect of reducing the burden on the user in reading the document and improving the efficiency is obtained, and the effect of ensuring the reliability of the generated document text data is realized. You.
【0059】また、画像読み取りパラメータとして読み
取り解像度を用いる場合には、初期値を所定の粗解像度
に設定し、所望の品質が得られない場合においてのみ、
より高い解像度が設定されるので、読み取りにかかる時
間が平均として短縮されるという効果や、また画像ファ
イルサイズが平均として抑制されることにより例えば画
像ファイルを保管する場合に、その領域が縮少されると
いう効果が得られ、特に大量の文書を読み取る場合に便
利である。When the reading resolution is used as the image reading parameter, the initial value is set to a predetermined coarse resolution, and only when the desired quality cannot be obtained,
A higher resolution is set, so that the time required for reading is reduced on average, and the area is reduced when, for example, storing image files by suppressing the image file size on average. This is particularly convenient when reading a large number of documents.
【図1】 本発明の実施形態である文書読み取り装置の
概略のブロック構成図である。FIG. 1 is a schematic block diagram of a document reading apparatus according to an embodiment of the present invention.
【図2】 文字認識部が行う文字認識処理の一例を示す
模式図である。FIG. 2 is a schematic diagram illustrating an example of a character recognition process performed by a character recognition unit.
【図3】 本装置における処理を説明する処理フロー図
である。FIG. 3 is a processing flowchart illustrating processing in the present apparatus.
2 画像入力部、4 文字認識部、6 認識結果評価
部、8 パラメータ変更部、10 画像入力制御部、1
2 品質条件入力部、14 認識結果出力部、20 文
書。2 image input unit, 4 character recognition unit, 6 recognition result evaluation unit, 8 parameter change unit, 10 image input control unit, 1
2 Quality condition input unit, 14 recognition result output unit, 20 documents.
Claims (8)
タを生成する画像入力部と、前記文書画像データに対し
て文字認識処理を行い文書テキストデータを生成する文
字認識部とを備えた文書読み取り装置において、 前記文字認識部が文字ごとに評価し出力する文字認識確
度に基づいて、前記文書テキストデータの読み取り品質
を評価し、その評価結果が所定の適格条件を満たすか否
かを判定する認識結果評価部と、 前記適格条件が満たされない場合、前記画像入力部にお
ける画像読み取りパラメータを変更するパラメータ変更
部と、 を有することを特徴とする文書読み取り装置。1. A document reading apparatus comprising: an image input unit that reads a document image and generates document image data; and a character recognition unit that performs character recognition processing on the document image data and generates document text data. A recognition result evaluation unit that evaluates the reading quality of the document text data based on the character recognition accuracy that the character recognition unit evaluates and outputs for each character, and determines whether the evaluation result satisfies a predetermined eligibility condition. And a parameter changing unit that changes an image reading parameter in the image input unit when the eligibility condition is not satisfied.
読み取りパラメータに基づいて再度、同一の文書に対し
て前記文書画像データを生成し、前記文字認識部へ出力
することを特徴とする請求項1記載の文書読み取り装
置。2. The method according to claim 1, wherein the image input unit generates the document image data for the same document again based on the changed image reading parameters, and outputs the generated document image data to the character recognition unit. Item 1. The document reading device according to Item 1.
書イメージの読み取りの解像度を含むことを特徴とする
請求項1記載の文書読み取り装置。3. The document reading apparatus according to claim 1, wherein the image reading parameter includes a resolution for reading the document image.
書イメージの読み取りにおける濃度閾値を含むことを特
徴とする請求項1記載の文書読み取り装置。4. The document reading apparatus according to claim 1, wherein the image reading parameter includes a density threshold in reading the document image.
書イメージの読み取りの解像度を含み、 前記パラメータ変更部は、前記解像度を増加させるこ
と、 を特徴とする請求項1又は請求項2記載の文書読み取り
装置。5. The document reading apparatus according to claim 1, wherein the image reading parameter includes a resolution for reading the document image, and the parameter changing unit increases the resolution. .
画像読み取りパラメータとして所定の初期値を設定する
パラメータ初期化部を有し、 前記パラメータ初期化部は、前記解像度の初期値とし
て、所定の粗解像度を設定すること、 を特徴とする請求項5記載の文書読み取り装置。6. A parameter initializing unit that sets a predetermined initial value as the image reading parameter in the first reading of the document, wherein the parameter initializing unit sets a predetermined coarse resolution as an initial value of the resolution. 6. The document reading device according to claim 5, wherein:
度を文書の全領域又は所定部分領域に含まれる各文字に
ついて平均した文字認識確度平均値を求め、当該文字認
識確度平均値と所定基準値との比較に基づいて前記評価
結果の適格不適格を判定すること、を特徴とする請求項
1記載の文書読み取り装置。7. The recognition result evaluating unit calculates a character recognition accuracy average value obtained by averaging the character recognition accuracy for each character included in an entire region or a predetermined partial region of a document, and calculates the character recognition accuracy average value and a predetermined reference value. 2. The document reading apparatus according to claim 1, wherein the eligibility of the evaluation result is determined based on a comparison with a value.
は所定部分領域に含まれる文字のうち、所定範囲の前記
文字認識確度を有するものの割合を求め、当該割合と所
定基準割合との比較に基づいて前記評価結果の適格不適
格を判定すること、を特徴とする請求項1記載の文書読
み取り装置。8. The recognition result evaluating unit obtains a ratio of characters having the character recognition accuracy within a predetermined range among characters included in an entire region or a predetermined partial region of a document, and compares the ratio with a predetermined reference ratio. 2. The document reading apparatus according to claim 1, wherein the eligibility of the evaluation result is determined based on the evaluation result.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10008270A JPH11203411A (en) | 1998-01-20 | 1998-01-20 | Document reader |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10008270A JPH11203411A (en) | 1998-01-20 | 1998-01-20 | Document reader |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH11203411A true JPH11203411A (en) | 1999-07-30 |
Family
ID=11688485
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10008270A Pending JPH11203411A (en) | 1998-01-20 | 1998-01-20 | Document reader |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH11203411A (en) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007020122A (en) * | 2005-07-11 | 2007-01-25 | Canon Inc | Image processing apparatus, image processing apparatus control method, and program |
| CN100409654C (en) * | 2004-04-22 | 2008-08-06 | 富士施乐株式会社 | image reading device |
| JP2009181594A (en) * | 2009-05-18 | 2009-08-13 | Fuji Xerox Co Ltd | Image reader |
| US7949155B2 (en) | 2005-03-08 | 2011-05-24 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method, and storage medium |
| CN102189080A (en) * | 2010-03-17 | 2011-09-21 | 株式会社东芝 | Centralized information processing apparatus and centralized information processing system |
| JP2016541049A (en) * | 2013-11-15 | 2016-12-28 | グーグル インコーポレイテッド | Client-side filtering of card OCR images |
| JP2017157940A (en) * | 2016-02-29 | 2017-09-07 | ブラザー工業株式会社 | Output device and computer program |
| CN113537192A (en) * | 2021-06-30 | 2021-10-22 | 北京百度网讯科技有限公司 | Image detection method, image detection device, electronic equipment and storage medium |
-
1998
- 1998-01-20 JP JP10008270A patent/JPH11203411A/en active Pending
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7768676B2 (en) | 2004-04-22 | 2010-08-03 | Fuji Xerox Co., Ltd. | Image reading apparatus |
| CN100409654C (en) * | 2004-04-22 | 2008-08-06 | 富士施乐株式会社 | image reading device |
| US7949155B2 (en) | 2005-03-08 | 2011-05-24 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method, and storage medium |
| US8368942B2 (en) | 2005-07-11 | 2013-02-05 | Canon Kabushiki Kaisha | Image processing apparatus and its program and control method |
| JP2007020122A (en) * | 2005-07-11 | 2007-01-25 | Canon Inc | Image processing apparatus, image processing apparatus control method, and program |
| JP2009181594A (en) * | 2009-05-18 | 2009-08-13 | Fuji Xerox Co Ltd | Image reader |
| CN102189080A (en) * | 2010-03-17 | 2011-09-21 | 株式会社东芝 | Centralized information processing apparatus and centralized information processing system |
| JP2016541049A (en) * | 2013-11-15 | 2016-12-28 | グーグル インコーポレイテッド | Client-side filtering of card OCR images |
| US9626556B2 (en) | 2013-11-15 | 2017-04-18 | Google Inc. | Client side filtering of card OCR images |
| US9740929B2 (en) | 2013-11-15 | 2017-08-22 | Google Inc. | Client side filtering of card OCR images |
| JP2017157940A (en) * | 2016-02-29 | 2017-09-07 | ブラザー工業株式会社 | Output device and computer program |
| CN113537192A (en) * | 2021-06-30 | 2021-10-22 | 北京百度网讯科技有限公司 | Image detection method, image detection device, electronic equipment and storage medium |
| CN113537192B (en) * | 2021-06-30 | 2024-03-26 | 北京百度网讯科技有限公司 | Image detection method, device, electronic equipment and storage medium |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7805022B2 (en) | Image processing apparatus, image processing method and computer program | |
| CN102782702B (en) | Paragraph recognition in an optical character recognition (OCR) process | |
| US7519226B2 (en) | Form search apparatus and method | |
| JP4963809B2 (en) | Outlier detection during scanning | |
| US11521365B2 (en) | Image processing system, image processing apparatus, image processing method, and storage medium | |
| US7305619B2 (en) | Image processing method, device and storage medium therefor | |
| EP1826720B1 (en) | Image processing apparatus and method, computer program, and storage medium | |
| JPH1139428A (en) | How to correct the orientation of document video | |
| US7873239B2 (en) | Image processing apparatus, image direction determining method, and computer program product | |
| JPH11203411A (en) | Document reader | |
| US20100238474A1 (en) | Document image processing apparatus, document image processing method, and computer-readable recording medium having recorded document image processing program | |
| US20010043742A1 (en) | Communication document detector | |
| US9888147B2 (en) | Image processing apparatus, electronic file generating method, and recording medium | |
| JPH11338973A (en) | Document image correction apparatus and document image correction method | |
| JPH11272798A (en) | Method and device for distinguishing bold character | |
| EP3940628A1 (en) | Image processing device, image reading device, image processing method, and program | |
| US7738737B2 (en) | Image processing apparatus and image processing method | |
| US10706337B2 (en) | Character recognition device, character recognition method, and recording medium | |
| US12288407B2 (en) | Image processing apparatus, image processing method, and non-transitory recording medium | |
| US11288536B2 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
| JPH11184976A (en) | Dictionary learning system and character recognition device | |
| US20210019554A1 (en) | Information processing device and information processing method | |
| US20250029414A1 (en) | Image reading apparatus for dividing read document images into documents | |
| Mai et al. | An independent character recognizer for distantly acquired mobile phone text images | |
| JP2747136B2 (en) | Character recognition device |