JP2014078168A - 文字認識装置及びプログラム - Google Patents
文字認識装置及びプログラム Download PDFInfo
- Publication number
- JP2014078168A JP2014078168A JP2012226176A JP2012226176A JP2014078168A JP 2014078168 A JP2014078168 A JP 2014078168A JP 2012226176 A JP2012226176 A JP 2012226176A JP 2012226176 A JP2012226176 A JP 2012226176A JP 2014078168 A JP2014078168 A JP 2014078168A
- Authority
- JP
- Japan
- Prior art keywords
- numerical value
- character recognition
- character
- recognition
- numerical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
【課題】数値の認識率が高い文字認識装置及びプログラムを提供する。
【解決手段】文字認識の対象となる画像から数字の文字列である数値を読み取る数値読取り領域を抽出する抽出手段と、数値読取り領域に対し文字認識を行い、数値毎に複数の認識候補を取得する文字認識手段と、数値読取り領域毎に設定された数値範囲に基づいて前記複数の認識候補から確からしい候補を選択する選択手段と、を有する文字認識装置とする。
【選択図】図4
【解決手段】文字認識の対象となる画像から数字の文字列である数値を読み取る数値読取り領域を抽出する抽出手段と、数値読取り領域に対し文字認識を行い、数値毎に複数の認識候補を取得する文字認識手段と、数値読取り領域毎に設定された数値範囲に基づいて前記複数の認識候補から確からしい候補を選択する選択手段と、を有する文字認識装置とする。
【選択図】図4
Description
本発明は、文字認識装置及びプログラムに関する。
特許文献1には、数値が記入される複数の数値記入欄および各数値記入欄に記入された数値の合計値が記入される合計値記入欄を有する帳票から、前記複数の数値記入欄および前記合計値記入欄に記入された手書き文字を読み取って文字認識を行い、当該文字認識の結果とその基になったイメージデータとを表示出力して前記文字認識の結果の修正を行い得るようにした文字認識方法であって、前記複数の数値記入欄のそれぞれに対する文字認識の結果の合計値と、前記合計値記入欄に対する文字認識の結果とに相違があると、その旨のメッセージと共に双方の差の値を表示出力することを特徴とする文字認識方法が開示されている。
特許文献2には、診療報酬請求明細書の少なくとも画像入力、蓄積、検索、及び内容点検を行なう伝票文書情報システムにおいて、当該明細書の様式の種類を識別する手段と、当該様式の種類に応じて読み取り領域を抽出する手段と、読み取り領域を設定し文字認識を行なう手段と、当該認識結果のデータを基に記載内容の妥当性を検定する手段とを有することを特徴とする伝票文書情報システムが開示されている。
特許文献3には、郵便物からその上に記載されている宛名を読取る読取手段と、この読取手段による読取内容に応じて文字を認識する文字認識手段と、この文字認識手段で認識された文字から町名を認識する町名認識手段と、上記文字認識手段で認識された文字から数字を認識する数字認識手段と、この数字認識手段で認識された数字と上記町名認識手段で認識された町名とから宛名を作成する作成手段と、上記郵便物に記載される宛名における数字部の確からしさの足切値を個々の宛名に対応して予め記憶している記憶手段と、上記数字認識手段で認識された数字の確からしさを評価値として算出する算出手段と、この算出手段で算出された評価値と、上記作成手段で作成された宛名に対応する上記記憶手段に記憶されている足切値とを比較する比較手段と、この比較手段の結果に応じて上記作成手段で作成された宛名の採用、不採用を判定する判定手段と、を具備したことを特徴とする宛名読取装置が開示されている。
本発明の目的は、本発明の構成を備えない場合に比べて、数値の認識率が高い文字認識装置及びプログラムを提供することにある。
請求項1に記載の発明は、文字認識の対象となる画像から数字の文字列である数値を読み取る数値読取り領域を抽出する抽出手段と、数値読取り領域に対し文字認識を行い、数値毎に複数の認識候補を取得する文字認識手段と、数値読取り領域毎に設定された数値範囲に基づいて前記複数の認識候補から確からしい候補を選択する選択手段と、を有する文字認識装置である。
請求項2に記載の発明は、前記選択手段が、設定された数値範囲内にある認識候補の中から確からしい候補を選択する請求項1に記載の文字認識装置である。
請求項3に記載の発明は、前記選択手段が、文字認識と数値認識とにより確からしい候補を選択する請求項1または請求項2に記載の文字認識装置である。
請求項4に記載の発明は、前記数値範囲が、数値の下限値及び上限値により設定される請求項1から請求項3までのいずれか1項に記載の文字認識装置である。
請求項5に記載の発明は、前記数値範囲が、数値の桁数により設定される請求項1から請求項3までのいずれか1項に記載の文字認識装置である。
請求項6に記載の発明は、前記数値範囲が、有効桁数により設定される請求項1から請求項3までのいずれか1項に記載の文字認識装置である。
請求項7に記載の発明は、コンピュータを、文字認識の対象となる画像から数字の文字列である数値を読み取る数値読取り領域を抽出する抽出手段と、数値読取り領域に対し文字認識を行い、数値毎に複数の認識候補を取得する文字認識手段と、数値読取り領域毎に設定された数値範囲に基づいて前記複数の認識候補から確からしいい候補を選択する選択手段と、して機能させるプログラムである。
請求項1、7に記載の発明によれば、本発明の構成を備えない場合に比べて、数値の認識率が向上する。
請求項2に記載の発明によれば、複数の認識候補が数値範囲内に絞り込まれる。
請求項3に記載の発明によれば、本発明の構成を備えない場合に比べて、更に数値の認識率が向上する。
請求項4、5、6に記載の発明によれば、桁数や正負を表す記号を含む数値についても認識率が向上する。
以下、図面を参照して本発明の実施の形態の一例を詳細に説明する。
<手書き入力システム>
まず、本実施の形態に係る文字認識装置を含むシステムの一例について説明する。
図1は本発明の実施の形態に係る文字認識装置を含む手書き入力システムの一例を示す概略図である。図1に示すように、手書き入力システム10は、文字認識装置12と電子ペン14とを備えている。電子ペン14は、有線又は無線の通信回線(図示せず)を介して、文字認識装置12と通信を行う。文字認識装置12は、ユーザが使用するコンピュータ等の情報処理装置及び周辺装置である。電子ペン14は、インクを用いて記録媒体16上に筆記する筆記具である。同時に、電子ペン14は、筆記時のペン先周辺の記録媒体16の画像を撮影して、撮影画像から筆跡情報を取得するペン型の画像読取装置である。
まず、本実施の形態に係る文字認識装置を含むシステムの一例について説明する。
図1は本発明の実施の形態に係る文字認識装置を含む手書き入力システムの一例を示す概略図である。図1に示すように、手書き入力システム10は、文字認識装置12と電子ペン14とを備えている。電子ペン14は、有線又は無線の通信回線(図示せず)を介して、文字認識装置12と通信を行う。文字認識装置12は、ユーザが使用するコンピュータ等の情報処理装置及び周辺装置である。電子ペン14は、インクを用いて記録媒体16上に筆記する筆記具である。同時に、電子ペン14は、筆記時のペン先周辺の記録媒体16の画像を撮影して、撮影画像から筆跡情報を取得するペン型の画像読取装置である。
上記の手書き入力システム10では、利用者が電子ペン14を用いて記録媒体16上に筆記する。電子ペン14は、筆記時のペン先周辺の記録媒体16上の画像を撮影し、撮影された画像からペン先の移動軌跡を表す筆跡情報を取得する。取得された筆跡情報は文字認識装置12に送信される。文字認識装置12は、受信した筆跡情報に基づいて筆跡画像を生成し、筆跡画像に対して文字認識処理を行って文書情報を取得する。即ち、手書き画像に係る画像情報を、文書情報(テキストデータ)に変換する。
数値(数字の文字列)は、カンマや小数点等の桁数を表す記号、プラスやマイナス等の正負を表す記号を含む場合が多く、認識率が低いのが通常である。特に、図6(A)に示すように、手書き入力された数値は一見して読み取り難く、手書き入力された数値の認識率は更に低下する。本実施の形態では、数値読み取り領域について数値範囲を設定して再度文字認識を行う「数値認識処理」を実行することにより、文字認識処理における数値の認識率を向上させる。
なお、図1に示す手書き入力システム10は、文字認識装置12が手書き画像に係る画像情報を取得するための構成の一例である。本実施の形態では、文字認識装置12により数値を含む文書画像に係る画像情報が取得されればよい。文書画像に係る画像情報は、電子ペンから取得した画像情報に限定される訳ではなく、手書き画像に係る画像情報に限定される訳でもない。文字認識装置12は、電子ペン以外の外部装置から、文書画像に係る画像情報を取得してもよい。ここで外部装置としては、スキャナ等の画像読取装置、他の情報処理装置等が挙げられる。
<文字認識装置>
(文字認識装置の構成)
次に、文字認識装置12の構成について説明する。
図2は本発明の実施の形態に係る文字認識装置の制御系の構成の一例を示すブロック図である。図2に示すように、文字認識装置12は、制御部20、情報取得部22、情報出力部24、通信部26、及び記憶部28を備えている。なお、文字認識装置12の構成は一例であり、不要な機能部を削除したり、新たな機能部を追加したり、各部の構成、配置を変更してもよい。
(文字認識装置の構成)
次に、文字認識装置12の構成について説明する。
図2は本発明の実施の形態に係る文字認識装置の制御系の構成の一例を示すブロック図である。図2に示すように、文字認識装置12は、制御部20、情報取得部22、情報出力部24、通信部26、及び記憶部28を備えている。なお、文字認識装置12の構成は一例であり、不要な機能部を削除したり、新たな機能部を追加したり、各部の構成、配置を変更してもよい。
制御部20は、装置全体の制御及び各種演算を行うコンピュータとして構成されている。即ち、制御部20は、CPU20A、各種プログラムを記憶したROM20B、プログラムの実行時にワークエリアとして使用されるRAM20C、各種情報を記憶する不揮発性メモリ20D、及びI/O20Eを備えている。CPU20A、ROM20B、RAM20C、不揮発性メモリ20D、及びI/O20Eの各々は、バス20Fを介して接続されている。
情報取得部22、情報出力部24、通信部26、及び記憶部28の各部は、制御部20のI/O20Eに接続されている。制御部20は、情報取得部22、情報出力部24、通信部26、及び記憶部28の各部との間で情報の授受を行い、各部を制御する。
情報取得部22は、利用者に操作に応じて情報を取得する情報取得手段である。情報出力部24は、利用者に操作に応じて情報を出力する情報出力手段である。取得される情報及び出力される情報には、電子情報、文書情報、画像情報、音声情報等の各種情報が含まれる。
情報取得部22としては、マウス、キーボード、スキャナ、マイク、カメラ、各種ドライブ等が挙げられる。情報出力部24としては、ディスプレイ等の画像表示部、プリンタ等の画像出力部、スピーカ等の音声出力部が挙げられる。本実施の形態では、情報取得部22としてマウス及びキーボード等の操作部を備え、情報出力部24としてディスプレイ等の画像表示部を備える例について説明する。
通信部26は、有線又は無線の通信回線を介して外部装置と通信を行うためのインターフェースである。記憶部28は、ハードディスク等の記憶装置である。記憶部28には、各種プログラムや各種データが記憶されている。本実施の形態では、後述する「文字認識処理」を実行する文字認識プログラム30、文字認識処理用の文字辞書32、数字辞書33等が記憶されている。
なお、本実施の形態では、文字認識プログラム30等の制御プログラムが、記憶部28に予め記憶されている場合について説明するが、制御プログラムは、ROM20B、不揮発性メモリ20D等、他の記憶装置に記憶されていてもよい。また、制御プログラムを、情報取得部22や通信部26を介して外部から取得してもよい。例えば、情報取得部22を構成する各種ドライブを介して、CD−ROM等の情報記録媒体から取得してもよい。
また、本実施の形態では、文字認識の対象となる文書画像に係る画像情報についても、予め取得されて記憶装置に記憶されていてもよく、情報取得部22や通信部26を介して外部から取得してもよい。例えば、図1に示すシステムでは、通信部26を介して電子ペンから取得した筆跡情報に基づいて筆跡画像が生成され、筆跡画像が文字認識の対象とされる。
(文字認識処理)
次に、文字認識装置12で実行される「文字認識処理」について説明する。
図3は「文字認識処理」の処理ルーチンの一例を示すフローチャートである。「文字認識処理」は、制御部20のCPU20Aにより実行される。「文字認識処理」は、情報取得部22を構成する操作部を介して、利用者により文字認識の対象となる文書画像が特定されると共に文字認識処理の実行が指示されると開始される。
次に、文字認識装置12で実行される「文字認識処理」について説明する。
図3は「文字認識処理」の処理ルーチンの一例を示すフローチャートである。「文字認識処理」は、制御部20のCPU20Aにより実行される。「文字認識処理」は、情報取得部22を構成する操作部を介して、利用者により文字認識の対象となる文書画像が特定されると共に文字認識処理の実行が指示されると開始される。
まず、ステップ100で、文字認識の対象となる文書画像に係る画像情報を取得する。次に、ステップ102で、文字認識の対象となる文書画像からテキスト領域を抽出して、読取り領域を設定する。次に、ステップ104で、設定された読取り領域に対して文字辞書及び数字辞書を用いて文字認識処理を実行する。次に、ステップ106で、数値読み取り領域について数値範囲を設定して再度文字認識を行う「数値認識処理」を実行する。数値認識処理については次に詳細に説明する。最後に、ステップ108で、数値認識処理の結果が反映された文字認識の最終結果を記憶して、ルーチンを終了する。
(数値認識処理)
ここで「数値認識処理」について説明する。
図4は数値認識処理の処理ルーチンの一例を示すフローチャートである。図5(A)は表示される文書画像の一例を示す模式図であり、図5(B)は数値範囲の設定方法の一例を示す模式図である。図6(A)〜(C)は数値を表す文字列が文字認識される手順を示す模式図である。図7(A)は数値認識処理前の認識候補の順位を示す図であり、図7(B)は数値認識処理後の認識候補の順位を示す図である。
ここで「数値認識処理」について説明する。
図4は数値認識処理の処理ルーチンの一例を示すフローチャートである。図5(A)は表示される文書画像の一例を示す模式図であり、図5(B)は数値範囲の設定方法の一例を示す模式図である。図6(A)〜(C)は数値を表す文字列が文字認識される手順を示す模式図である。図7(A)は数値認識処理前の認識候補の順位を示す図であり、図7(B)は数値認識処理後の認識候補の順位を示す図である。
図4に示すように、まず、ステップ200で、文字認識の対象となる文書画像から数値を読み取る数値読み取り領域を抽出する。次に、ステップ202で、画像表示部に数値読み取り領域を表示させる。次に、ステップ204で、数値読み取り領域毎に数値範囲を設定するための設定画面を表示して、利用者からの設定を受け付ける。
例えば、図5(A)に示すように、画像表示部には文書画像18が表示される。文書画像18は、実線で表示されたテキスト領域40と、網掛けで表示されたグラフィック領域42とを含んで構成されている。テキスト領域40は、文字列(数字、記号を含む)で構成された領域である。グラフィック領域42は、図形、写真等、文字列以外のオブジェクトで構成された領域である。
テキスト領域40は、複数の数値読み取り領域50を含んでいる。図5(A)に示す例では、6個の数値読み取り領域501から506が、矩形状の領域として図示されている。各領域を区別する必要が無い場合には、数値読み取り領域50と総称する。利用者が操作部を操作することにより、数値読み取り領域50が特定される。図5(A)に示す例では、カーソル等の特定手段60により数値読み取り領域505が特定されて、他の数値読み取り領域50とは異なる色で表示されている。
数値読み取り領域50が特定されると、例えば、図5(B)に示すように、特定された領域について数値範囲を設定するための設定画面70が表示される。図5(B)に示す例では、設定画面70は、数値範囲の下限値を設定するためのボックス72と、数値範囲の上限値を設定するためのボックス74とを含んでいる。例えば、下限値を「1.00」とし、上限値を「5.00」とすることで、数値範囲は1.00以上5.00以下の範囲に設定される。
図4に戻って、次に、ステップ206で、全部の数値読み取り領域50について数値範囲の設定が完了したか否かを判定する。数値範囲の設定が完了している場合には、ステップ208に進む。数値範囲の設定が完了するまでは、ステップ206の判定を繰り返し行う。
次に、ステップ208で、1つの数値読み取り領域50を選択する。次に、ステップ210で、選択された数値読み取り領域50の数値に対し1文字毎に文字認識を行う。次に、ステップ212で、数字の文字列である数値について複数の認識候補を取得する。次に、ステップ214で、複数の認識候補から設定された数値範囲外の認識候補を除外して、認識候補を絞り込む。次に、ステップ216で、絞り込んだ認識候補の中から最も確からしい認識候補を選択する。
例えば、図6(A)に示すように、数値読み取り領域50は、数値52の画像を含んでいる。図6(A)に示す例では、数値52は「4.67」であり、「4」、「.」、「6」及び「7」の4文字からなる文字列である。文字認識の際には、数値読み取り領域50が1文字に対応した文字領域に分割されて、1文字毎に文字認識が行われる。
図6(C)に示すように、小数点に対応した文字領域を狭くする等して精度を高めた文字認識では、数値読み取り領域50が、数字に対応した文字領域541〜543と小数点に対応した文字領域544とに分割される。文字領域541では文字521(数字「4」)が認識され、文字領域542では文字522(数字「6」)が認識され、文字領域543では文字523(数字「7」)が認識される。文字領域544では文字524(小数点「.」)が認識される。これらの組合せとして「4.67」という数値が認識される。
しかしながら、数値が小数点等の記号を含む場合には、数値読み取り領域50を1文字に対応した文字領域に分割することが難しくなる。また、手書き入力された数値では、癖字等により認識が困難になる場合もある。図6(A)に示す例でも、小数点が小さくて認識され難く、「6」と「8」の区別が難しい。例えば、図6(B)に示すように、数値読み取り領域50が、数字に対応した文字領域541〜543に分割されてしまうと、「467」と認識されることになる。従って、文字認識によれば「4.67」以外に複数の認識候補が取得される。
図7(A)に示すように、数値認識処理を実施する前の文字認識処理では、数値52の認識候補として、「467」、「4.67」、「487」、「4.87」、「46.7」等が取得される。これらの数値は、記載された順序で確からしいと判断されている。即ち、数値認識処理を実施する前の文字認識の結果では、数値52は「467」と認識されている。なお、文字認識での「確からしさ」の判断は、特徴量を用いて画像としての類似度を算出する等により行われている。類似度が高いほど確からしさは大きくなる。
図5(B)に示すように、本実施の形態では、数値52の数値範囲が1.00以上5.00以下の範囲に設定されている。従って、図7(B)に示すように、数値認識処理を実施した後の文字認識処理では、「467」、「487」、「46.7」が認識候補から除外されて、認識候補は「4.67」及び「4.87」に絞り込まれる。これらの数値は、記載された順序で確からしいと判断されている。即ち、数値認識処理を実施後の文字認識の結果では、数値52は「4.67」と認識されている。以上の通り、本実施の形態では、文字認識と数値認識とにより認識候補が選択される。
図4に戻って、次に、ステップ218で、全部の数値読み取り領域50について数値認識処理が終了したか否かを判定する。全部の数値読み取り領域50について数値認識処理が終了している場合には、ステップ220に進む。数値認識処理が終了していない数値読み取り領域50がある場合には、ステップ208に戻り、ステップ208からステップ218の手順を繰り返し行う。
次に、ステップ220で、数値認識処理を実施後の文字認識の結果を反映させて、文字認識の最終結果を取得してルーチンを終了する。本実施の形態では、数値認識処理を実施することで、複数の認識候補が数値範囲内に絞り込まれて、数値の認識率が向上する。
上記の処理では、数値を含む文書画像から数値読み取り領域を抽出し、抽出された領域毎に数値範囲を設定する例について説明したが、例えば帳票の数値記入欄のように、数値が書き込まれる前の数値読み取り領域に対して数値範囲を設定してもよい。この場合は、数値読み取り領域を含む文書画像が、画像表示部にフォーマットとして表示される。数値が書き込まれる前に、数値読み取り領域の各々に対して数値範囲が設定される。
そして、数値が書き込まれた後の文書画像が取得される。例えば、数値記入欄を有する文書画像が印刷された用紙が利用者に配布され、利用者によって数値記入欄に数値が書き込まれる。数値が書き込まれた用紙が光学的に読み取られて、数値を含む文書画像が取得される。数値を含む文書画像に対しては、図4のステップ208〜ステップ220と同様にして「数値認識処理」が実行される。
なお、上記各実施の形態で説明した文字認識装置及びプログラムの構成は一例であり、本発明の主旨を逸脱しない範囲内においてその構成を変更してもよいことは言うまでもない。
例えば、上記の実施の形態では、数値範囲を下限値と上限値とで設定する例について説明したが、数値範囲の設定方法はこれに限定される訳ではない。4桁、5桁等のように、数値の桁数により数値範囲を設定してもよい。例えば、4桁とした場合は、1000から9999までが数値範囲となる。また、有効数字を小数点4桁、小数点5桁等のように、有効桁数により数値範囲を設定してもよい。例えば、有効数字を小数点4桁とした場合は、0.1320×106等、桁数や正負を表す記号を含む数値についても認識率が向上する。
10 手書き入力システム
12 文字認識装置
14 電子ペン
16 記録媒体
18 文書画像
20 制御部
22 情報取得部
24 情報出力部
26 通信部
28 記憶部
30 文字認識プログラム
32 文字辞書
33 数字辞書
40 テキスト領域
42 グラフィック領域
50 数値読取り領域
52 数値
54 文字領域
60 特定手段
70 設定画面
72 ボックス
74 ボックス
12 文字認識装置
14 電子ペン
16 記録媒体
18 文書画像
20 制御部
22 情報取得部
24 情報出力部
26 通信部
28 記憶部
30 文字認識プログラム
32 文字辞書
33 数字辞書
40 テキスト領域
42 グラフィック領域
50 数値読取り領域
52 数値
54 文字領域
60 特定手段
70 設定画面
72 ボックス
74 ボックス
Claims (7)
- 文字認識の対象となる画像から数字の文字列である数値を読み取る数値読取り領域を抽出する抽出手段と、
数値読取り領域に対し文字認識を行い、数値毎に複数の認識候補を取得する文字認識手段と、
数値読取り領域毎に設定された数値範囲に基づいて前記複数の認識候補から確からしい候補を選択する選択手段と、
を有する文字認識装置。 - 前記選択手段が、設定された数値範囲内にある認識候補の中から確からしい候補を選択する請求項1に記載の文字認識装置。
- 前記選択手段が、文字認識と数値認識とにより確からしい候補を選択する請求項1または請求項2に記載の文字認識装置。
- 前記数値範囲が、数値の下限値及び上限値により設定される請求項1から請求項3までのいずれか1項に記載の文字認識装置。
- 前記数値範囲が、数値の桁数により設定される請求項1から請求項3までのいずれか1項に記載の文字認識装置。
- 前記数値範囲が、有効桁数により設定される請求項1から請求項3までのいずれか1項に記載の文字認識装置。
- コンピュータを、
文字認識の対象となる画像から数字の文字列である数値を読み取る数値読取り領域を抽出する抽出手段と、
数値読取り領域に対し文字認識を行い、数値毎に複数の認識候補を取得する文字認識手段と、
数値読取り領域毎に設定された数値範囲に基づいて前記複数の認識候補から確からしいい候補を選択する選択手段と、
して機能させるプログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012226176A JP2014078168A (ja) | 2012-10-11 | 2012-10-11 | 文字認識装置及びプログラム |
| US13/901,048 US9342739B2 (en) | 2012-10-11 | 2013-05-23 | Character recognition apparatus, non-transitory computer readable medium, and character recognition method |
| CN201310283873.3A CN103729634A (zh) | 2012-10-11 | 2013-07-08 | 字符识别装置和字符识别方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012226176A JP2014078168A (ja) | 2012-10-11 | 2012-10-11 | 文字認識装置及びプログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2014078168A true JP2014078168A (ja) | 2014-05-01 |
Family
ID=50453700
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012226176A Pending JP2014078168A (ja) | 2012-10-11 | 2012-10-11 | 文字認識装置及びプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US9342739B2 (ja) |
| JP (1) | JP2014078168A (ja) |
| CN (1) | CN103729634A (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10650072B2 (en) * | 2017-10-30 | 2020-05-12 | Facebook, Inc. | System and method for determination of a digital destination based on a multi-part identifier |
| JP7401344B2 (ja) * | 2020-01-21 | 2023-12-19 | キヤノン株式会社 | 文書を電子化する画像処理システム、その制御方法及びプログラム |
| CN113569858A (zh) * | 2021-07-21 | 2021-10-29 | 上海明略人工智能(集团)有限公司 | 商品价签内容识别方法、系统、电子设备及存储介质 |
| JP2023140051A (ja) * | 2022-03-22 | 2023-10-04 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
| CN116758555A (zh) * | 2023-06-08 | 2023-09-15 | 爱铭建筑(国际)有限公司 | 图像文件识别方法、装置、设备以及存储介质 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06124366A (ja) * | 1992-10-14 | 1994-05-06 | Toshiba Corp | 住所読取装置 |
| JPH0981653A (ja) * | 1995-09-19 | 1997-03-28 | Toho Business Kanri Center:Kk | 窓口管理システムおよび窓口管理方法 |
| US6055327A (en) * | 1997-07-17 | 2000-04-25 | Aragon; David Bradburn | Method of detecting data entry errors by sorting amounts and verifying amount order |
| JP2001222679A (ja) * | 2000-02-08 | 2001-08-17 | Oki Electric Ind Co Ltd | 文字読取システム |
Family Cites Families (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3078002B2 (ja) * | 1990-08-31 | 2000-08-21 | 株式会社東芝 | 画像情報処理装置 |
| JPH0739816A (ja) | 1993-07-30 | 1995-02-10 | Toshiba Corp | 宛名読取装置 |
| JP3483919B2 (ja) | 1993-10-20 | 2004-01-06 | 株式会社日立製作所 | 伝票文書情報システム |
| US5812697A (en) * | 1994-06-10 | 1998-09-22 | Nippon Steel Corporation | Method and apparatus for recognizing hand-written characters using a weighting dictionary |
| US5852676A (en) * | 1995-04-11 | 1998-12-22 | Teraform Inc. | Method and apparatus for locating and identifying fields within a document |
| US5850480A (en) * | 1996-05-30 | 1998-12-15 | Scan-Optics, Inc. | OCR error correction methods and apparatus utilizing contextual comparison |
| CN1208484A (zh) * | 1996-11-15 | 1999-02-17 | 东邦商务管理中心株式会社 | 业务管理系统 |
| JP3427692B2 (ja) * | 1996-11-20 | 2003-07-22 | 松下電器産業株式会社 | 文字認識方法および文字認識装置 |
| US6766069B1 (en) * | 1999-12-21 | 2004-07-20 | Xerox Corporation | Text selection from images of documents using auto-completion |
| JP4078009B2 (ja) * | 2000-02-28 | 2008-04-23 | 東芝ソリューション株式会社 | 帳票における文字記録領域の検出装置、帳票における文字記録領域の検出方法、記憶媒体及び帳票フォーマット作成装置 |
| US6950553B1 (en) * | 2000-03-23 | 2005-09-27 | Cardiff Software, Inc. | Method and system for searching form features for form identification |
| JP2002092546A (ja) | 2000-09-20 | 2002-03-29 | Oki Software Kk | 文字認識方法 |
| CA2375355A1 (en) * | 2002-03-11 | 2003-09-11 | Neo Systems Inc. | Character recognition system and method |
| JP2007004584A (ja) * | 2005-06-24 | 2007-01-11 | Toshiba Corp | 情報処理装置 |
| JP2007233913A (ja) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
| US8050500B1 (en) * | 2006-07-06 | 2011-11-01 | Senapps, LLC | Recognition method and system |
| JP2010277168A (ja) * | 2009-05-26 | 2010-12-09 | Fuji Xerox Co Ltd | データ入力システム、データ入力受付装置及びプログラム |
| NZ589039A (en) * | 2009-09-24 | 2013-04-26 | Nec Corp | Recognition of a word image with a plurality of characters by way of comparing two possible candidates based on an evaluation value |
| JP2011070558A (ja) * | 2009-09-28 | 2011-04-07 | Konica Minolta Business Technologies Inc | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム |
| JP5434586B2 (ja) * | 2009-12-29 | 2014-03-05 | オムロン株式会社 | 単語認識方法および単語認識用のプログラムならびに情報処理装置 |
| JP5259876B2 (ja) * | 2010-02-26 | 2013-08-07 | 楽天株式会社 | 情報処理装置、情報処理方法、情報処理プログラムを記録した記録媒体 |
| JP2012174132A (ja) * | 2011-02-23 | 2012-09-10 | Glory Ltd | 紙葉類管理方法及び紙葉類管理システム |
| CN102622202B (zh) * | 2012-02-22 | 2016-07-06 | 浙江工业大学 | 一种有效数字运算结果的有效位数智能选取及表示方法 |
-
2012
- 2012-10-11 JP JP2012226176A patent/JP2014078168A/ja active Pending
-
2013
- 2013-05-23 US US13/901,048 patent/US9342739B2/en not_active Expired - Fee Related
- 2013-07-08 CN CN201310283873.3A patent/CN103729634A/zh active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06124366A (ja) * | 1992-10-14 | 1994-05-06 | Toshiba Corp | 住所読取装置 |
| JPH0981653A (ja) * | 1995-09-19 | 1997-03-28 | Toho Business Kanri Center:Kk | 窓口管理システムおよび窓口管理方法 |
| US6055327A (en) * | 1997-07-17 | 2000-04-25 | Aragon; David Bradburn | Method of detecting data entry errors by sorting amounts and verifying amount order |
| JP2001222679A (ja) * | 2000-02-08 | 2001-08-17 | Oki Electric Ind Co Ltd | 文字読取システム |
Also Published As
| Publication number | Publication date |
|---|---|
| US20140105501A1 (en) | 2014-04-17 |
| US9342739B2 (en) | 2016-05-17 |
| CN103729634A (zh) | 2014-04-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6507472B2 (ja) | 処理方法、処理システム及びコンピュータプログラム | |
| US11508139B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
| CN108319578B (zh) | 一种用于数据记录的介质的生成方法 | |
| JP2004152040A (ja) | 手書き入力装置、プログラムおよび手書き入力方法システム | |
| JP6055065B1 (ja) | 文字認識プログラム、文字認識装置 | |
| JP6136967B2 (ja) | 情報処理システム、情報処理方法、及びプログラム | |
| US12511034B2 (en) | Ink data generation apparatus, method, and program | |
| JP2014078168A (ja) | 文字認識装置及びプログラム | |
| CN114730241A (zh) | 触摸式用户界面输入中的手势笔画识别 | |
| JP7383882B2 (ja) | 情報処理装置、及び情報処理プログラム | |
| CN111027533B (zh) | 一种点读坐标的变换方法、系统、终端设备及存储介质 | |
| CN111414728B (zh) | 数值数据展示方法、装置、计算机设备和存储介质 | |
| CN112163400A (zh) | 信息处理方法及装置 | |
| JP7430219B2 (ja) | 文書情報構造化装置、文書情報構造化方法およびプログラム | |
| CN111476090A (zh) | 水印识别方法和装置 | |
| JP2011237993A (ja) | 情報入力装置及び情報入力プログラム | |
| JP6575116B2 (ja) | 文字認識装置、文字認識処理システム、およびプログラム | |
| JP2015055891A (ja) | 文字認識結果検証装置及び文字読取システム | |
| CN112487774A (zh) | 书写表单电子化方法、装置及电子设备 | |
| CN115965002B (zh) | 数据处理方法、装置、电子设备、存储介质及程序产品 | |
| JP5277750B2 (ja) | 画像処理プログラム、画像処理装置及び画像処理システム | |
| JP2014044555A (ja) | 画像処理装置、画像処理システム及びプログラム | |
| CN111104886A (zh) | 手势识别方法、装置、设备和存储介质 | |
| JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
| US12366930B2 (en) | Input support apparatus, method, computer-readable medium, and input system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150306 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151127 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160105 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160517 |