JP2010061471A - 文字認識装置およびプログラム - Google Patents
文字認識装置およびプログラム Download PDFInfo
- Publication number
- JP2010061471A JP2010061471A JP2008227492A JP2008227492A JP2010061471A JP 2010061471 A JP2010061471 A JP 2010061471A JP 2008227492 A JP2008227492 A JP 2008227492A JP 2008227492 A JP2008227492 A JP 2008227492A JP 2010061471 A JP2010061471 A JP 2010061471A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image
- recognition
- character image
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000000034 method Methods 0.000 description 17
- 238000012937 correction Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012958 reprocessing Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008602 contraction Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
【課題】作業者による、文字認識結果の正誤判定作業量を低減する。
【解決手段】スキャンした原稿画像を文字画像切出部12および文字認識部13を用いて文字認識処理し、文字コードを生成する。つぎに文字画像生成部14が文字コードに基づいて文字画像を生成する。つぎに文字画像比較部15が、文字コードに基づいて生成された文字画像と、原稿画像から切り出したオリジナルの文字画像とを比較して類似度を出力する。正誤判定部16は類似度に基づいて認識結果の正誤を判定する。認識結果出力部17は、典型的には誤認識のある文字の部分を含む原稿画像を取り出し、当該誤認識のある文字画像の座標データを基づいて、誤認識のある文字画像をハイライトさせた出力画像データを生成してユーザに表示する。
【選択図】図1
【解決手段】スキャンした原稿画像を文字画像切出部12および文字認識部13を用いて文字認識処理し、文字コードを生成する。つぎに文字画像生成部14が文字コードに基づいて文字画像を生成する。つぎに文字画像比較部15が、文字コードに基づいて生成された文字画像と、原稿画像から切り出したオリジナルの文字画像とを比較して類似度を出力する。正誤判定部16は類似度に基づいて認識結果の正誤を判定する。認識結果出力部17は、典型的には誤認識のある文字の部分を含む原稿画像を取り出し、当該誤認識のある文字画像の座標データを基づいて、誤認識のある文字画像をハイライトさせた出力画像データを生成してユーザに表示する。
【選択図】図1
Description
この発明は、文字認識装置およびプログラムに関する。
紙文書から情報を抽出するために文字認識(以下OCRともいう)装置が使われ、大変便利である。しかし、OCR結果の精度は完璧ではない。入力画像の画質、文字切り取り条件、認識処理過程での画像変換、OCR辞書など、さまざまな要因でOCR結果が変化する。現状、OCR結果が正しいかどうか判断する決定的な手段はなく、最終的には人間(オペレータ:正誤判定者)が元文書や元画像と照会・比較して判断せざるを得ない。そのため、オペレータは入力された文書(画像)とOCR結果とをすべてチェックする必要があり、オペレータにとって大変な負荷となっている。
なお、この発明と関連する特許文献としては以下のものがある。
特許文献1は、全ページのサムネイル表示の中で認識できなかった手書き文字を含むファイルを別の色で表示し、どこに(どこのフォルダに)認識不可能な文字があるのかをわかりやすくすることを提案している。ただし、文字認識(OCR)は、たとえ何らかの文字コードが得られてもその文字コードが正しいとは限らない。そのため、正確性を求めると、結局はオペレータがすべて確認するという必要があった。
特許文献2は、文字画像を符号化する際に、文字コードと文字画像との組をインデックスの下で登録辞書に登録し、符号化対象の文字画像を文字認識し、認識結果の文字コードに対応して登録辞書に登録されている文字画像を読み出し、その後、符号化対象の文字画像と突き合わせて、一致度合いを判定し、一致度合いが基準以上であれば該当するインデックスを用いて符号化対象の文字画像を符号化し、一致度合いが基準未満であれば、当該符号化対象の文字画像を新たなインデックスの下で登録辞書に登録した後、当該インデックスで符号化することを提案している。インデックスのストリームおよび登録辞書は復号側に送られて復号に用いられる。
引用文献3および引用文献4は、文字認識処理を経て文字画像と文字コードとの対応付けが完了したリストを用い、リスト中の文字画像と画像参照することによって文字認識することを提案している。
これらの提案は、文字認識結果の正誤を判定するものではない。
特開2006−106905号公報
特開2005−301662号公報
特開平5−20500号公報
特開2000−90200号公報
この発明は、作業者による、文字認識結果の正誤判定作業量を低減する文字認識技術を提供することを目的としている。
請求項1の発明によれば、文字認識装置に:認識対象の文字画像に対して文字認識処理を実行して文字コードを生成する文字認識手段と;上記文字認識手段が生成した文字コードから文字画像を生成する文字画像生成手段と;上記認識対象の文字画像と上記文字画像生成手段が生成した文字画像とを比較する画像比較手段と;上記文字画像比較手段の比較出力に基づいて上記文字認識手段の認識結果の正誤を判定する判定手段とを設けるようにしている。
請求項2の発明によれば、請求項1の文字認識装置において、上記判定手段が、認識結果に誤りがあると判定した上記認識対象の文字画像を、上記認識対象の文字画像が含まれるページ画像において、他と区別して表示する表示手段をさらに有するようにしている。
請求項3の発明によれば、請求項1または2記載の文字認識装置において、上記画像比較手段は、上記文字認識手段が文字認識に採用する特徴量と異なる種類の特徴量を採用して上記認識対象の文字画像と上記文字画像生成手段が生成した文字画像とを比較するようにしている。
請求項4の発明によれば、請求項1〜3のいずれかに記載の文字認識装置において、上記文字画像生成手段は、異なる種類の文字フォントの文字画像を生成し、上記画像比較手段は上記認識対象の文字画像と上記異なる種類の文字フォントの文字画像とを比較するようにしている。
請求項5によれば、請求項4記載の文字認識装置において、上記画像比較手段が採用する上記文字フォントの種類を学習により絞り込むようにしている。
請求項6の発明によれば、請求項5記載の文字認識装置において、上記画像比較手段は上記認識対象の文字画像との相関が低い文字フォントの種類から除外して絞り込みを行うようにしている。
請求項7の発明によれば、請求項5または6記載の文字認識装置において、上記画像比較手段が採用する上記文字フォントの種類は文字のオブジェクト種別ごとに異なるようにしている。
請求項8の発明によれば、請求項5〜7のいずれかに記載の文字認識装置において、上記学習は、出現頻度に基づいて選択した文字の文字画像に対して行われるようにしている。
請求項9の発明によれば、請求項5〜7のいずれかに記載の文字認識装置上記学習は、上記文字認識手段の尤度に基づいて選択した文字の文字画像に対して行われるようにしている。
請求項10の発明によれば、コンピュータを:認識対象の文字画像に対して文字認識処理を実行して文字コードを生成する文字認識手段;上記文字認識手段が生成した文字コードから文字画像を生成する文字画像生成手段;上記認識対象の文字画像と上記文字画像生成手段が生成した文字画像とを比較する画像比較手段;上記文字画像比較手段の比較出力に基づいて上記文字認識手段の認識結果の正誤を判定する判定手段として機能させるための文字認識用プログラムを実現するようにしている。
この発明の上述の側面および他の側面は特許請求の範囲に記載され以下実施例を用いて詳述される。
請求項1の発明によれば、文字認識結果の正誤判定作業量を低減することができる。
請求項2の発明によれば、原稿画像中の認識誤りに関連する文字画像を即座に把握できる。
請求項3の発明によれば、認識の正誤判定において、文字認識と同様の原因で誤りが混入することを阻止できる。
請求項4の発明によれば、原稿中の文字のフォント種類に左右されて文字認識の正誤判定が不正確になることを阻止できる。
請求項5の発明によれば、原稿中の文字のフォント種類に左右されて文字認識の正誤判定が不正確になることを阻止できるうえに、文字画像の突き合わせ工数を減少させることができる。
請求項6の発明によれば、原稿中の文字のフォント種類に左右されて文字認識の正誤判定が不正確になることを阻止できるうえに、文字画像の突き合わせ工数を減少させることができ、しかも、急激なフォント種類数の絞り込みによる誤判定を阻止できる。
請求項7の発明によれば、原稿の領域ごとの文字のフォント種類に左右されて文字認識の正誤判定が不正確になることを阻止できる。
請求項8の発明によれば、フォント種類の最適化の工数を低減できる。
請求項9の発明によれば、フォント種類の最適化の工数を低減できる。
請求項10の発明によれば、文字認識結果の正誤判定作業量を低減することができる。
以下、この発明の実施例について説明する。
まず、この発明の実施例1について説明する。
図1は、この発明の実施例1の文字認識システム400を全体として示している。1つのコンピュータシステム、典型的にはパーソナルコンピュータ200を用いて文字認識システム400を実装しているけれども、通信ネットワークを介して接続された複数のコンピュータシステムを用いて文字認識システム400を実現してもよい。また、種々の情報機器を用いて文字認識システム400を実現してもよい。
図1において、画像読取装置100およびパーソナルコンピュータ200が通信ネットワーク300に接続されている。画像読取装置100は、原稿を光学的に走査(以下ではスキャンともいう)して原稿画像を取得し、典型的には自動原稿送り機構を具備する。記録媒体201や通信媒体を用いて、パーソナルコンピュータ200に文字認識用のプログラムをインストールして文字認識システム400を実現する。パーソナルコンピュータ200は、周知のCPU、主メモリ、バス、入出力装置等を含み、そのハードウェア資源およびプログラムを協働させて文字認識システム400の各種機能を実現する。各種機能は図において機能ブロックとして示す。
文字認識システム400は、画像入力部10、画像記憶部11、文字画像切出部12、文字認識部13、文字画像生成部14、文字画像比較部15、正誤判定部16、認識結果出力部17、表示部18等を含んで構成される。
画像入力部10は、画像読取装置100から通信ネットワーク300を介して受け取った原稿画像を画像記憶部11に記憶する。原稿画像は例えばページ単位に管理される。画像入力部10は、ページ単位またはページ部分単位の画像データを文字画像切出部12に供給する。文字画像切出部12は、画像データから各文字画像を切り出し、文字画像のデータおよび座標データを文字認識部13に供給する。文字認識部13は、任意の手法で文字画像を分析して文字コード(文字識別子)を生成するものであり、標準テンプレートとのパターンマッチング、種々の特徴量、典型的には方向寄与度、ストローク特徴量等を用いて文字認識を行う。文字認識結果(文字コード)は、切り出し位置の座標データとともに認識結果出力部17に供給される。文字認識部13からの文字認識結果(文字コード)は文字画像生成部14にも供給される。文字画像生成部14はフォントデータを保持し、文字コードに対応するフォントデータ(輪郭データまたは画素データ等)から文字画像データを生成して出力する。フォントデータから生成された文字画像データは、文字画像比較部15に送られる。文字画像比較部15は、原稿画像から切り出された文字画像と、認識結果の文字コードから生成された文字画像とを比較する。文字画像比較部15の比較手法は文字認識部13の文字認識手法と異なる手法で比較を行う。比較手法は、これに限定されないが、画素の分布、黒画素の接点の位置関係、線分等の特徴量に基づく。例えば、手書き数字の文字認識で、図3に示すような黒画素の分布(所定領域に黒画素がない)により文字認識を行う場合には、図4に示すようなテンプレートマッチングで比較を行う。文字画像比較部15の比較結果出力は類似度(相関度または一致度ともいう)として出力される。
正誤判定部16は、文字画像比較部15からの相関度または一致度が、予め定めた閾値を超える場合には文字認識が正しいと判別し、そうでない場合には誤りであると判別する。
認識結果出力部17は、認識が間違った文字画像の位置画像およびページ単位またはその一部の原稿画像を受け取って、認識が間違った文字画像の部分をハイライトした原稿画像を生成して表示部18に供給する。表示部18は、認識が間違った文字画像の部分をハイライトした原稿画像をユーザに提示する。認識結果出力部17は、典型的には、文字コード、座標位置、認識の正誤のフラグを含むレコードを文字画像ごとに保持して、これに基づいて、認識が間違った文字画像の部分をハイライトした原稿画像を生成するが、これに限定されない。
図2は、図1の実施例の動作例を説明するものである。
主に図2を参照する。まずスキャンした原稿画像(文書画像ともいう)を文字画像切出部12および文字認識部13を用いて文字認識処理し、文字コードを生成する(S10)。つぎに文字画像生成部14が文字コードに基づいて文字画像を生成する(S11)。つぎに文字画像比較部15が、文字コードに基づいて生成された文字画像と、原稿画像から切り出したオリジナルの文字画像とを比較して類似度を出力する(S12)。正誤判定部16は類似度に基づいて認識結果の正誤を判定する(S13)。認識結果出力部17は、典型的には誤認識のある文字の部分を含む原稿画像を取り出し、当該誤認識のある文字画像の座標データを基づいて、誤認識のある文字画像をハイライトさせた出力画像データを生成してユーザに表示する(S15)。なお、この例では、誤りのある文書、ページ、ページ部分のみを表示して訂正作業に不必要な原稿画像部分が表示されないようにして訂正作業量を低減しているけれども、認識の誤りが判定されないページ等も表示されてもよい。
図3および図4は、簡略化して事例を示す。
図3では、予め定められた領域に画素があるかどうかで手書き数字の文字画像を文字認識する。図3(a)に梨地で示す部分に黒画素がない場合には「6」と文字認識するようになっている。図3(b)は「6」を正しく「6」と認識する例を示す。ただし、図3(c)に示す「5」の文字画像の場合、梨地部分に黒画素がないので、「6」と誤認識される。
図4は文字画像の比較手法を示す。この例ではテンプレートマッチングを行って類似度(相関度)を求める。「6」の切出文字画像は「6」のテンプレートと相関が大きいので、認識結果は正しいと判定される。これに対して、「5」の切出文字画像は「6」のテンプレートと相関が小さいので認識結果は誤りと判定される。そして、図5に示すように認識の誤りがある「5」の文字画像部分が他の部分と別の表示属性でハイライト表示される。
なお、認識結果の文字コードが、座標位置データを伴っていれば、原稿画像の各文字画像と認識結果の各文字コードとを対応させることができ、例えば、ハイライト表示された部分をポインティングデバイスで指定するとその座標データに基づいて認識結果のテキスト表示において該当部分が同様にハイライト表示され、作業者がテキスト表示において訂正を行うことができる。
また、認識結果の文字コードが正誤のフラグを伴っていれば、認識結果を表示したときに認識誤りのある部分をハイライトさせることができ、この部分を例えばポインティングすることにより、原稿画像において該当部分を同様にハイライトさせることができる。
この実施例においては、複写機など画像入力機能を持つ機器を用いて紙文書をスキャンする。スキャンした文書画像に対し文字認識機能を持つ装置を使ってOCR処理をすることで、文字コードを得る。得られた文字コードから文字画像を生成する。一方、スキャンした文書画像から文字画像を切り出す。こうして得られた2種類の文字画像(OCR結果の文字コードから生成した文字画像・スキャンした文書画像から切り出した文字画像)とを比較する。比較した結果、両者の類似度が高ければ、OCR装置の文字認識結果は正しいと判定される。逆に、類似度が低ければ、OCR装置の文字認識結果は誤りの可能性ありと判定される。オペレータ(正誤判定者)への提示は、典型的には、誤りの可能性ありと判定された文字を含む文書のみとし、同時に、誤りの可能性ありと判定された文字を明示する。従来、オペレータは、すべての文書においてすべての領域で文字認識結果の正誤を確認する必要があったが、この実施例の処理では、オペレータは、明示された文字のみを確認するだけでよい。
つぎにこの発明の実施例2の文字認識システム401について説明する。
実施例2は、図1の実施例1の文字認識システム400の構成に加えて、文字画像生成部14により生成される文字画像を調整する生成制御部19と、原稿画像から切り出した文字画像を種々のオペレーションを施す文字画像変形部20を設けている。
図6は実施例2の文字認識システム401を全体として示しており、この図において図1と対応する箇所には対応する符号を付した。
この実施例では、複数種類のフォントデータを用意し、切り出した文字画像を各種のフォントセットの各文字種の文字画像と突き合わせるようにして原稿の文字フォントに左右されることなく精度よく文字認識結果の正誤を判定できるようにしている。また、文字認識の当初では幅広く各種のフォント種類の文字画像と突き合わせる一方で、その過程で一致する尤度が大きいフォント種類を絞り込み、徐々に突き合わせの作業量を低減するようにしている。
また、切り出した文字画像に対して2値化閾値処理、細線化、膨張/収縮処理等を行って、適正な文字画像の比較を行えるようにしている。
以下、詳細に説明する。
図6において、生成制御部19は、文字画像生成部14が生成する文字画像のフォント種類を指示する。生成制御部19は、認識結果の正誤およびどのフォント種別での比較による正誤かを示す正誤データを正誤判定部16から受け取り、生成するフォント種類の適合化(学習)を行う。この点については図7〜図9を参照して後に詳述する。生成するフォント種類の適合化により文字画像の比較に使用するフォント種類の数を絞り込んで突き合わせ処理量を低減させる。
文字画像変形部20は、正誤判定部16から認識結果の正誤を表す正誤データを受け取って、切り出した文字画像に変形を加えて比較の最適化を行う。例えば、切り出した文字画像が太字の場合には通常では一致度が小さくなる恐れがあるが、これを細線化することにより十分の一致度を維持できるようにし、間違って認識が誤りであると判定しないようにできる。また、原稿のスキュー等を考慮して文字画像を回転処理させてもよい。
つぎに図7を参照してフォントの最適化全般について説明する。
図7は複数のフォント種類のフォントデータから生成した文字画像を用いて比較を行う例を示す。この例では、最初は、すべてのフォントの文字画像を生成して順次に文字画像の比較を行う。図の例では、切り出した文字画像を文字認識して「あ」の文字コードを得て、これに対する各種フォントの「あ」の文字画像を出力して順次に突き合わせる。
文字認識の進捗に合わせて、1文字の認識ごと、あるいは所定数の文字の認識ごとに(認識ステージともいう)、使用するフォント数を漸次に低減させてよい。例えば、所望フォント数、典型的には1になるまで認識ステージごとにフォント数を半分に減らしてゆく。その際、類似度が大きな順にフォントを残す。
出現頻度の大きな文字のみを基準にしてフォントの最適化を行うようにしてもよい。
図8は、レイアウトを解析してオブジェクトを判定して文字画像が本文、小節見出し、タイトル等のいずれに該当するかを判別してそのオブジェクト種類ごとにフォントの最適化を行う例を示す。この例でも、出現頻度の大きな文字のみを基準にしてフォントの最適化を行うようにしてもよい。
図9は、文字認識の確信度(尤度)が大きな文字画像を基準にしてフォントの最適化を行う例を示す。この例では、確信度が大きな文字とその座標位置を記憶しておき、これを基準にしてフォント種類の最適化(絞り込み)を行う。
図10は文字画像の比較例を示す。この例では、「あ」という文字画像を切り出し、これに対して文字認識結果が、それぞれ「あ」、「め」、「お」である場合を示しており、切り出した文字画像と「あ」、「め」、または「お」の文字コードから生成した文字画像とを比較する。この比較は、文字認識で採用した手法と異なる手法で類似度を算出する。典型的な算出手法は上述のとおり画素の分布、接点の位置関係、線分等に基づく。ところで、認識結果が正しい「あ」の場合でも、切り出した文字画像の体裁によっては類似度が小さくなり、誤って誤認識と判定することもありえる。このため、切り出した文字画像を文字画像変形部20により前処理して類似度が誤って小さくならないようにする。前処理は、例えば、2値化処理、細線化、膨張/収縮処理、回転等であるがこれに限定されない。
なお、この発明は特許請求の範囲の記載に基づいて決定されるものであり、実施例の具体的な構成、課題、および効果には限定されない。この発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。以下、この発明の技術的特徴の一部を列挙しておく。もちろん、この発明は以下の技術的特徴に限定されない。
文字画像の比較処理で用いる画像特徴量は、典型的には、OCR処理で用いた特徴量と異なるものを用いるが、同一であってもよい。
文字認識結果が正しいと判断された入力文字画像(スキャン画像から切り出した文字画像)を順次重ね合わせていき、その後の比較・判定は、この重ね合わせた文字画像を用いてもよい。
OCR後の文字コードから画像を生成するとき、装置内(PCなど)にあるすべてのフォントに対して文字画像を作成し、比較文字数を増やしていきながら、類似度の低いフォントから順に候補として落としていき、最終的に1種類のフォントに絞る。
文字認識をしたとき、出現文字頻度情報を取得し、出現頻度の高い文字を使ってフォントを決定する。出現頻度の高い文字を重なるとノイズの少ない文字画像が得られるので、文字コードから生成した文字画像との類似度算出の精度が高い。
文字認識をしたとき、認識確信度の高い文字を使ってフォントを決定する。認識確信度が最も高かった文字コードを使ってフォントが決定できない場合、認識確信度2番目、3番目、…の文字コードを使ってフォントを絞り込む。
スキャンした文書に対してオブジェクト解析を行い、タイトル・章節・本文など、オブジェクト種別ごとに候補となるフォントを切り替えて判定する。同じ文字コードでもタイトルのときはボールドフォント、本文のときは明朝フォントのように、各オブジェクトで最適と推察されるフォントを用いて比較判定を行う。
出現頻度の低い文字コードについては、対応する入力文字画像(スキャンした文書から切り出した文字画像)も少ない。そこで、切り出した文字画像を複数枚複製し、複製した文字画像に対し異なる画像処理を施してから文字認識を行う。複数の処理を経ても文字認識結果として出力される文字コードが同一であれば(ロバストであれば)、文字認識結果は正しいと判断する。
出現頻度の低い文字コードについては、1つの文字コードから故意に画像歪みを付加した文字画像を複数枚作成する。それぞれの作成文字画像と入力文字画像とを参照し、いずれの作成文字画像においても類似度が低い場合は、文字認識結果が誤りであると判断する。
画像比較・正誤判定を一度実施後、誤りと判定された場合、文字コードから生成した文字画像あるいは入力画像から切り出した文字画像、あるいは両者に対し、ノイズ除去や二値化閾値変更、細線化、膨張・収縮など異なる画像処理方法・画像処理パラメータを施し、再度画像比較・正誤判定を行う。いずれにおいても類似度が低い場合、文字認識結果は誤りであると判断される。
スキャン時に、標準解像度と高解像度のように、複数の解像度の画像を用意する。画像比較・正誤判定を一度実施後、誤りと判定された場合、高解像度のスキャン画像から文字を切り出して、再度、画像比較・正誤判定を実施する。(OCR処理は省略できる)。フォント画像からはノイズの少ない文字画像を任意の大きさで作成できるので、高解像度の方が類似度算出に有利である。
上記処理は1枚(1ページ)の文書単位で処理していき、次(ページ)の文書に対して処理を始めるときは、前文書で用いた方法・パラメータを優先的に用いて実行する。
1枚の文書内に誤りの可能性ありと判定された文字が全くない場合、その文書は表示しない。すなわち誤りの可能性のある文書だけを表示する。
1枚の文書内に誤りの可能性ありと判定された文字の割合が多い場合、その1枚の文書だけを元にして再処理を試みる。再処理実行時、文字コードの出現頻度情報や入力文字画像の重ね合わせ、オブジェクト種別ごとのフォント指定などを変更する。元処理の結果と再処理の結果と、文字認識が正しいと判定された文字の割合が高い方の結果を表示する。
再処理しても文字認識が正しいと判定されることが同程度の場合、元処理・再処理いずれでも正しいと認識された文字のみを文字認識結果が正しいものを判断し、それ以外の文字を誤りの可能性ありとして表示する。
1枚の文書内に誤りの可能性ありと判定された文字の割合が多い場合、過去、異なる判定条件がある場合、その異なる条件を用いて再処理を試みる。再処理の結果、状況が好転しなければ、異なるパラメータを探索しなおす。
10 画像入力部
11 画像記憶部
12 文字画像切出部
13 文字認識部
14 文字画像生成部
15 文字画像比較部
16 正誤判定部
17 認識結果出力部
18 表示部
19 生成制御部
20 文字画像変形部
100 画像読取装置
200 パーソナルコンピュータ
201 記録媒体
300 通信ネットワーク
400 文字認識システム
401 文字認識システム
11 画像記憶部
12 文字画像切出部
13 文字認識部
14 文字画像生成部
15 文字画像比較部
16 正誤判定部
17 認識結果出力部
18 表示部
19 生成制御部
20 文字画像変形部
100 画像読取装置
200 パーソナルコンピュータ
201 記録媒体
300 通信ネットワーク
400 文字認識システム
401 文字認識システム
Claims (10)
- 認識対象の文字画像に対して文字認識処理を実行して文字コードを生成する文字認識手段と、
上記文字認識手段が生成した文字コードから文字画像を生成する文字画像生成手段と、
上記認識対象の文字画像と上記文字画像生成手段が生成した文字画像とを比較する画像比較手段と、
上記文字画像比較手段の比較出力に基づいて上記文字認識手段の認識結果の正誤を判定する判定手段とを有する文字認識装置。 - 上記判定手段が、認識結果に誤りがあると判定した上記認識対象の文字画像を、上記認識対象の文字画像が含まれるページ画像において、他と区別して表示する表示手段をさらに有する請求項1記載の文字認識装置。
- 上記画像比較手段は、上記文字認識手段が文字認識に採用する特徴量と異なる種類の特徴量を採用して上記認識対象の文字画像と上記文字画像生成手段が生成した文字画像とを比較する請求項1または2記載の文字認識装置。
- 上記文字画像生成手段は、異なる種類の文字フォントの文字画像を生成し、上記画像比較手段は上記認識対象の文字画像と上記異なる種類の文字フォントの文字画像とを比較する請求項1〜3のいずれかに記載の文字認識装置。
- 上記画像比較手段が採用する上記文字フォントの種類を学習により絞り込む請求項4記載の文字認識装置。
- 上記画像比較手段は上記認識対象の文字画像との相関が低い文字フォントの種類から除外して絞り込みを行う請求項5記載の文字認識装置。
- 上記画像比較手段が採用する上記文字フォントの種類は文字のオブジェクト種別ごとに異なる請求項5または6記載の文字認識装置。
- 上記学習は、出現頻度に基づいて選択した文字の文字画像に対して行われる請求項5〜7のいずれかに記載の文字認識装置。
- 上記学習は、上記文字認識手段の尤度に基づいて選択した文字の文字画像に対して行われる請求項5〜7のいずれかに記載の文字認識装置。
- コンピュータを、
認識対象の文字画像に対して文字認識処理を実行して文字コードを生成する文字認識手段、
上記文字認識手段が生成した文字コードから文字画像を生成する文字画像生成手段、
上記認識対象の文字画像と上記文字画像生成手段が生成した文字画像とを比較する画像比較手段、
上記文字画像比較手段の比較出力に基づいて上記文字認識手段の認識結果の正誤を判定する判定手段
として機能させるための文字認識用プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008227492A JP2010061471A (ja) | 2008-09-04 | 2008-09-04 | 文字認識装置およびプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008227492A JP2010061471A (ja) | 2008-09-04 | 2008-09-04 | 文字認識装置およびプログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2010061471A true JP2010061471A (ja) | 2010-03-18 |
Family
ID=42188189
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008227492A Withdrawn JP2010061471A (ja) | 2008-09-04 | 2008-09-04 | 文字認識装置およびプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2010061471A (ja) |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010231440A (ja) * | 2009-03-26 | 2010-10-14 | Fuji Xerox Co Ltd | 情報処理装置およびプログラム |
| CN107766826A (zh) * | 2017-10-30 | 2018-03-06 | 广东小天才科技有限公司 | 一种查找单词释义的方法及电子设备 |
| KR20190107331A (ko) * | 2018-03-12 | 2019-09-20 | 주식회사 한글과컴퓨터 | 폰트 결정 장치 및 이의 동작 방법 |
| JP2019212209A (ja) * | 2018-06-08 | 2019-12-12 | 大日本印刷株式会社 | 文字認識装置、文字認識方法、及びプログラム |
| KR20200063605A (ko) * | 2018-11-28 | 2020-06-05 | 안희철 | 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는, 필체를 통해 생성한 폰트를 이용하는 드로잉 방법, 상기 방법을 실행하기 위해 컴퓨터 판독가능 저장매체에 저장된 컴퓨터 프로그램 및 필체를 통해 생성한 폰트를 이용하는 드로잉 시스템 |
| WO2020149720A1 (ko) * | 2019-01-18 | 2020-07-23 | 주식회사 우아한형제들 | 한글 폰트 파일을 포함하는 컴퓨터 프로그램, 상기 한글 폰트 파일의 생성방법, 및 활용방법 |
| CN115019322A (zh) * | 2022-05-31 | 2022-09-06 | 阿里巴巴(中国)有限公司 | 字体检测方法、装置、设备及介质 |
| CN116071554A (zh) * | 2023-02-21 | 2023-05-05 | 北京英飞智药科技有限公司 | 一种化学结构识别方法和系统 |
| CN116206311A (zh) * | 2023-03-27 | 2023-06-02 | 可之(宁波)人工智能科技有限公司 | 一种快速标注ocr错误的方法 |
-
2008
- 2008-09-04 JP JP2008227492A patent/JP2010061471A/ja not_active Withdrawn
Cited By (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010231440A (ja) * | 2009-03-26 | 2010-10-14 | Fuji Xerox Co Ltd | 情報処理装置およびプログラム |
| CN107766826A (zh) * | 2017-10-30 | 2018-03-06 | 广东小天才科技有限公司 | 一种查找单词释义的方法及电子设备 |
| CN107766826B (zh) * | 2017-10-30 | 2020-11-03 | 广东小天才科技有限公司 | 一种查找单词释义的方法及电子设备 |
| KR102053067B1 (ko) * | 2018-03-12 | 2019-12-06 | 주식회사 한글과컴퓨터 | 폰트 결정 장치 및 이의 동작 방법 |
| KR20190107331A (ko) * | 2018-03-12 | 2019-09-20 | 주식회사 한글과컴퓨터 | 폰트 결정 장치 및 이의 동작 방법 |
| JP2019212209A (ja) * | 2018-06-08 | 2019-12-12 | 大日本印刷株式会社 | 文字認識装置、文字認識方法、及びプログラム |
| KR20200063605A (ko) * | 2018-11-28 | 2020-06-05 | 안희철 | 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는, 필체를 통해 생성한 폰트를 이용하는 드로잉 방법, 상기 방법을 실행하기 위해 컴퓨터 판독가능 저장매체에 저장된 컴퓨터 프로그램 및 필체를 통해 생성한 폰트를 이용하는 드로잉 시스템 |
| KR102151780B1 (ko) | 2018-11-28 | 2020-09-03 | 안희철 | 컴퓨팅 장치의 하나 이상의 프로세서에서 수행되는, 필체를 통해 생성한 폰트를 이용하는 드로잉 방법, 상기 방법을 실행하기 위해 컴퓨터 판독가능 저장매체에 저장된 컴퓨터 프로그램 및 필체를 통해 생성한 폰트를 이용하는 드로잉 시스템 |
| WO2020149720A1 (ko) * | 2019-01-18 | 2020-07-23 | 주식회사 우아한형제들 | 한글 폰트 파일을 포함하는 컴퓨터 프로그램, 상기 한글 폰트 파일의 생성방법, 및 활용방법 |
| KR20200089901A (ko) * | 2019-01-18 | 2020-07-28 | 주식회사 우아한형제들 | 한글 폰트 파일을 포함하는 컴퓨터 프로그램, 상기 한글 폰트 파일의 생성방법, 및 활용방법 |
| KR102257323B1 (ko) | 2019-01-18 | 2021-06-07 | 주식회사 우아한형제들 | 한글 폰트 파일을 포함하는 컴퓨터 프로그램, 상기 한글 폰트 파일의 생성방법, 및 활용방법 |
| CN115019322A (zh) * | 2022-05-31 | 2022-09-06 | 阿里巴巴(中国)有限公司 | 字体检测方法、装置、设备及介质 |
| CN116071554A (zh) * | 2023-02-21 | 2023-05-05 | 北京英飞智药科技有限公司 | 一种化学结构识别方法和系统 |
| CN116206311A (zh) * | 2023-03-27 | 2023-06-02 | 可之(宁波)人工智能科技有限公司 | 一种快速标注ocr错误的方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5410611A (en) | Method for identifying word bounding boxes in text | |
| CN102289667B (zh) | 对经历光学字符识别(ocr)过程的文本文档中出现的错误的用户纠正 | |
| CN101542504B (zh) | 后光学字符识别处理中的形状聚类 | |
| US7668372B2 (en) | Method and system for collecting data from a plurality of machine readable documents | |
| US8340425B2 (en) | Optical character recognition with two-pass zoning | |
| US9613299B2 (en) | Method of identifying pattern training need during verification of recognized text | |
| JP2010061471A (ja) | 文字認識装置およびプログラム | |
| JP4661921B2 (ja) | 文書処理装置およびプログラム | |
| WO2011112573A2 (en) | Paragraph recognition in an optical character recognition (ocr) process | |
| JPH1139428A (ja) | 文書映像の方向修正方法 | |
| US10706581B2 (en) | Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor | |
| JPH04195692A (ja) | 文書読取装置 | |
| US9519404B2 (en) | Image segmentation for data verification | |
| CN102637256B (zh) | 后光学字符识别处理中的形状聚类 | |
| CN113378839A (zh) | 信息处理装置、信息处理方法及计算机可读介质 | |
| RU2597163C2 (ru) | Сравнение документов с использованием достоверного источника | |
| JP4982587B2 (ja) | データエントリシステムおよびデータエントリ方法 | |
| JP5353325B2 (ja) | 文書データ生成装置と文書データ生成方法 | |
| US11657632B2 (en) | Image processing device, image reading device, image processing method, and non-transitory computer readable medium, using two pieces of image data | |
| JP2020087112A (ja) | 帳票処理装置および帳票処理方法 | |
| US8125691B2 (en) | Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information | |
| JP2003030654A (ja) | パターン識別装置、パターン識別方法及びパターン識別用プログラム | |
| JP4087191B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
| JPH10171920A (ja) | 文字認識装置、その文字認識方法およびその記録媒体 | |
| JP2023046687A (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20111206 |