JP2010231541A - 情報処理装置、文字認識方法、およびプログラム - Google Patents
情報処理装置、文字認識方法、およびプログラム Download PDFInfo
- Publication number
- JP2010231541A JP2010231541A JP2009078915A JP2009078915A JP2010231541A JP 2010231541 A JP2010231541 A JP 2010231541A JP 2009078915 A JP2009078915 A JP 2009078915A JP 2009078915 A JP2009078915 A JP 2009078915A JP 2010231541 A JP2010231541 A JP 2010231541A
- Authority
- JP
- Japan
- Prior art keywords
- recognition target
- information
- processing apparatus
- area
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000012545 processing Methods 0.000 claims abstract description 225
- 230000010365 information processing Effects 0.000 claims description 238
- 230000008569 process Effects 0.000 description 52
- 238000013459 approach Methods 0.000 description 29
- 238000004891 communication Methods 0.000 description 23
- 238000004458 analytical method Methods 0.000 description 22
- 238000001514 detection method Methods 0.000 description 17
- 230000006872 improvement Effects 0.000 description 16
- 230000005484 gravity Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000015654 memory Effects 0.000 description 8
- 238000007639 printing Methods 0.000 description 8
- 238000012015 optical character recognition Methods 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
【解決手段】文字認識対象における処理対象の領域の位置に関する情報が処理される順番と対応付けて記録された認識対象基準情報を文字認識対象ごとに記憶する記憶部と、文字認識対象を表す画像データと画像データに対応する認識対象基準情報とに基づいて処理される順番に応じた順序で処理対象となる認識対象領域を設定する認識対象領域設定部と、設定された認識対象領域に含まれる文字を認識する文字認識部とを備え、認識対象領域設定部は、1番目に処理される第1の領域に対応する認識対象領域を画像データの所定の位置を示す第1基準位置を基準として相対的に設定し、他の領域に対応する認識対象領域を設定済みの認識対象領域に対応する第2基準位置を基準として相対的に設定する情報処理装置が提供される。
【選択図】図13
Description
本発明の実施形態に係る情報処理装置の構成について説明する前に、本発明の実施形態に係る文字認識の精度向上アプローチについて説明する。以下では、本発明の実施形態に係る情報処理装置(以下、「情報処理装置100」とよぶ場合がある。)が処理する文字認識対象として、帳票を例に挙げて説明する。なお、本発明の実施形態に係る文字認識対象が、帳票に限られないことは、言うまでもない。
上述したように、従来の情報処理装置は、図2に示すように印刷ずれが発生している画像データに対しても、理想的な処理領域間の相対的な位置関係(例えば、図1に示す処理領域A〜Cの相対的な位置関係)に基づいて処理領域を特定する。よって、従来の情報処理装置が図2に示す画像データを処理した場合には、処理領域A、Bについては“¥1234”という正しい文字データを取得することができるが、処理領域C’については“¥123”という誤った文字データが取得される可能性がある。よって、従来の情報処理装置では、図2に示すように印刷ずれが発生している画像データを処理する場合には、文字の誤認識が発生するので、文字認識の精度の向上は望めない。
また、図2に示すような位置ずれ等が発生している画像データを処理するための一の方法としては、例えば、下記のような方法が挙げられる。
・位置ずれが生じていない帳票(文字認識対象)に対応する各処理領域の位置に関する情報を記憶する
・処理を行う帳票に対応する画像データから所定の位置(例えば、帳票端のうち、左上の帳票端を示す座標)を検出する
・処理領域の位置に関する情報を用い、上記所定の位置を基準として各処理領域に対応する相対座標を導出する
・導出された各処理領域に対応する相対座標に基づいて、各処理領域の位置を補正し、文字認識を行う認識対象領域を設定する
・設定された認識対象領域に対して文字認識を行う
次に、本発明の実施形態に係る文字認識の精度向上アプローチについて、情報処理装置100が図2に示す水平方向に印刷ずれが生じている画像データを処理する場合を例に挙げて説明する。図4A〜図4Gそれぞれは、本発明の実施形態に係る文字認識の精度向上アプローチの概要を説明するための説明図である。
〔1−1〕第1基準位置の設定
情報処理装置100は、処理を行う画像データに基づいて、画像データが示す画像における所定の位置を示す第1基準位置を設定する。ここで、情報処理装置100は、原点に対応する座標を第1基準位置として設定することができるが、上記に限られない。以下では、情報処理装置100が、原点を第1基準位置に設定する場合を例に挙げて説明する。また、図4Aは、情報処理装置100が左上の帳票端を示す点Pを第1基準位置として設定した例を示している。なお、情報処理装置100が設定する第1基準位置が、左上の帳票端に限られないことは、言うまでもない。
情報処理装置100は、第1基準位置(点P)を基準として、処理領域Aに対応する相対座標G1’を導出する。情報処理装置100は、例えば、第1基準位置の座標と、記憶部(後述する)に記憶された認識対象基準情報に記録された情報に基づいて、相対座標G1’を導出する。
処理領域Aに対応する相対座標G1’が導出されると、情報処理装置100は、設定された認証対象領域候補を補正し、文字認識処理の対象(処理対象)となる認証対象領域を設定する。
〔2−1〕認証対象領域候補の設定
処理領域A(第1の領域)における認識対象領域が設定されると、情報処理装置100は、認識対象領域が設定された処理領域Aに対応する第2基準位置を基準として、処理領域Bに対応する認証対象領域候補を設定する。
(i)1つ前に処理した認識対象領域
(ii)相対距離が近い処理領域に対応する認識対象領域
(iii)関連付情報により予め対応付けられた処理領域に対応する認識対象領域
処理領域Bに対応する相対座標G2’が導出されると、情報処理装置100は、上記〔1−3〕の処理と同様に、設定された認証対象領域候補を補正して認証対象領域を設定する。ここで、図4Cでは、処理領域Bに位置ずれ等が発生していないので、相対座標G2’と新たに導出された重心の座標G2とが一致することとなる。
〔3−1〕認証対象領域候補の設定
処理領域B(他の領域)における認識対象領域が設定されると、情報処理装置100は、上記〔2−1〕の処理と同様に、認識対象領域が設定された処理領域Bに対応する第2基準位置を基準として、処理領域C’に対応する認証対象領域候補を設定する(図4Dの座標G3’の導出)。
処理領域C’に対応する座標G3’が導出されると、情報処理装置100は、上記〔1−3〕の処理と同様に、検出領域を設定し、検出領域内に含まれる罫線を検出する(図4E)。また、情報処理装置100は、検出された罫線に基づいて当該罫線により囲まれた領域の重心を導出する。そして、情報処理装置100は、例えば、認証対象領域候補の重心の座標を相対座標G3’から新たに導出された重心の座標G3とすることによって認証対象領域候補を補正し、認証対象領域を設定する(図4F)。ここで、図4Fでは処理領域C’に水平方向の位置ずれ(図1に示す処理領域Cからの位置ずれ)が発生している。よって、情報処理装置100は、相対座標G3’と座標G3との距離に相当する分、認証対象領域候補を補正して認証対象領域を設定する。
次に、情報処理装置100における本発明の実施形態に係る文字認識の精度向上アプローチに係る処理について、より具体的に説明する。
まず、情報処理装置100における情報の記録に係る処理について説明する。以下では、情報処理装置100における情報の記録に係る処理として、認識対象基準情報の記録に係る処理(第1の例)と、認識対象基準情報および関連情報の記録に係る処理(第2の例)とについて、それぞれ説明する。
図7は、本発明の実施形態に係る情報の記録に係る処理の第1の例を示す流れ図である。ここで、図7は、一の文字認識対象に対応する認識対象基準情報の記録に係る処理の一例を示している。図7に示す処理が文字認識対象ごと(文字認識対象を表す画像データごと)に行われることによって、情報処理装置100は、複数の文字認識対象に対応する認識対象基準情報を記憶することができる。
図8は、本発明の実施形態に係る情報の記録に係る処理の第2の例を示す流れ図である。ここで、図8は、一の文字認識対象に対応する認識対象基準情報および関連付情報の記録に係る処理の一例を示している。図8に示す処理が文字認識対象ごと(文字認識対象を表す画像データごと)に行われることによって、情報処理装置100は、複数の文字認識対象に対応する認識対象基準情報および関連付情報を記憶することができる。
図9は、本発明の実施形態に係る関連付情報の一例を説明するための説明図である。ここで、図9は、例えば図5に示すように画像データ内に6つの処理領域が存在する場合における関連付情報の一例を示している。また、図9は、関連付情報が配列で表される場合の一例を示しており、説明の便宜上、関連付情報を表形式で表している。
次に、情報処理装置100における文字認識に係る処理について説明する。以下では、情報処理装置100における文字認識に係る処理として、上記(i)の条件を満たす認識対象領域に対応する第2基準位置を基準とする場合(第1の例)、上記(ii)の条件を満たす認識対象領域に対応する第2基準位置を基準とする場合(第2の例)、そして、上記(iii)の条件を満たす認識対象領域に対応する第2基準位置を基準とする場合(第3の例)について、それぞれ説明する。
図10は、本発明の実施形態に係る文字認識に係る処理の第1の例を示す流れ図である。ここで、図10は、上記(i)の条件(1つ前に処理した認識対象領域)を満たす認識対象領域に対応する第2基準位置を基準とする場合における文字認識に係る処理の一例を示している。
図11は、本発明の実施形態に係る文字認識に係る処理の第2の例を示す流れ図である。ここで、図11は、上記(ii)の条件(相対距離が近い処理領域に対応する認識対象領域)を満たす認識対象領域に対応する第2基準位置を基準とする場合における文字認識に係る処理の一例を示している。
図12は、本発明の実施形態に係る文字認識に係る処理の第3の例を示す流れ図である。ここで、図12は、上記(iii)の条件(関連付情報により予め対応付けられた処理領域に対応する認識対象領域)を満たす認識対象領域に対応する第2基準位置を基準とする場合における文字認識に係る処理の一例を示している。
次に、上述した本発明の実施形態に係る文字認識の精度向上アプローチに係る処理を実現することが可能な、本発明の実施形態に係る情報処理装置100の構成例について説明する。
図14は、本発明の実施形態に係る情報装置100のハードウェア構成の一例を示す説明図である。図14を参照すると、情報処理装置100は、例えば、CPU150と、ROM152と、RAM154と、記録媒体156と、通信インタフェース158と、操作デバイス160と、表示デバイス162と、スキャナ164とを備える。また、情報処理装置100は、例えば、データの伝送路としてのバス166で各構成要素間を接続する。
図15は、本発明の実施形態に係る情報処理装置100が備える解析部120の他の観点による構成の一例を示す説明図である。
コンピュータを、本発明の実施形態に係る情報処理装置として機能させるためのプログラムによって、文字認識を行う処理対象の領域を特定し、文字認識の精度の向上を図ることができる。
102 読取部
104 記憶部
106 制御部
108 操作部
110 表示部
120 解析部
122 文字認識部
124 出力情報生成部
126 情報記録部
128 認識対象領域設定部
190 帳票
Claims (9)
- 文字認識対象における処理対象の領域の位置に関する情報が処理される順番と対応付けて記録された認識対象基準情報を文字認識対象ごとに記憶する記憶部と;
文字認識対象を表す画像データと、前記画像データに対応する前記認識対象基準情報とに基づいて、前記処理される順番に応じた順序で処理対象となる認識対象領域を設定する認識対象領域設定部と;
前記認識対象領域設定部において設定された前記認識対象領域に含まれる文字を認識する文字認識部と;
を備え、
前記認識対象領域設定部は、
1番目に処理される第1の領域に対応する認識対象領域を、前記画像データの所定の位置を示す第1基準位置を基準として相対的に設定し、
前記第1の領域以外の他の領域に対応する認識対象領域を、設定済みの認識対象領域に対応する第2基準位置を基準として相対的に設定することを特徴とする、情報処理装置。 - 前記認識対象領域設定部は、前記他の領域に対応する認識対象領域を、設定済みの認識対象領域のうち、前記他の領域と相対的な距離が近い認識対象領域に対応する第2基準位置に基づいて設定することを特徴とする、請求項1に記載の情報処理装置。
- 前記認識対象領域設定部は、前記他の領域に対応する認識対象領域を、設定済みの認識対象領域のうち、前記他の領域の1つ前に設定された認識対象領域に対応する第2基準位置に基づいて設定することを特徴とする、請求項1に記載の情報処理装置。
- 前記画像データに基づいて、前記認識対象基準情報を前記記憶部に記録する情報記録部をさらに備えることを特徴とする、請求項1〜3に記載の情報処理装置。
- 前記記憶部は、前記第2基準位置を導出するための基準となる領域が前記処理対象の領域ごとに設定された関連付情報を文字認識対象ごとに記憶し、
前記認識対象領域設定部は、前記画像データに対応する関連付情報に基づいて、前記他の領域に対応する認識対象領域を、前記関連付情報において関連付けられた領域に対して設定された認識対象領域に対応する第2基準位置に基づいて設定することを特徴とする、請求項1に記載の情報処理装置。 - 前記画像データに基づいて、前記認識対象基準情報と前記関連付情報とを前記記憶部に記録する情報記録部をさらに備えることを特徴とする、請求項5に記載の情報処理装置。
- 文字認識対象を読み取り、前記画像データを生成する読取部をさらに備えることを特徴とする、請求項1に記載の情報処理装置。
- 文字認識対象における処理対象の領域の位置に関する情報が処理される順番と対応付けて記録された認識対象基準情報を文字認識対象ごとに記憶する記憶部を備える情報処理装置に用いることが可能な文字認識方法であって:
文字認識対象を表す画像データに対応する前記認識対象基準情報を前記記憶部から読み出すステップと;
前記画像データに基づいて前記画像データの所定の位置を示す第1基準位置を設定するステップと;
前記認識対象基準情報と前記第1基準位置とに基づいて、1番目に処理される第1の領域に対応する認識対象領域を、前記第1基準位置を基準として相対的に設定するステップと;
前記認識対象基準情報と設定済みの認識対象領域に対応する第2基準位置とに基づいて、前記第1の領域以外の他の領域に対応する認識対象領域を、前記第2基準位置を基準として相対的に設定するステップと;
設定された各認識対象領域に含まれる文字を認識するステップと;
を有することを特徴とする、文字認識方法。 - 文字認識対象における処理対象の領域の位置に関する情報が処理される順番と対応付けて記録された認識対象基準情報を文字認識対象ごとに記憶する記憶部を備える情報処理装置に用いることが可能なプログラムであって:
文字認識対象を表す画像データに対応する前記認識対象基準情報を前記記憶部から読み出すステップ;
前記画像データに基づいて前記画像データの所定の位置を示す第1基準位置を設定するステップ;
前記認識対象基準情報と前記第1基準位置とに基づいて、1番目に処理される第1の領域に対応する認識対象領域を、前記第1基準位置を基準として相対的に設定するステップ;
前記認識対象基準情報と設定済みの認識対象領域に対応する第2基準位置とに基づいて、前記第1の領域以外の他の領域に対応する認識対象領域を、前記第2基準位置を基準として相対的に設定するステップ;
設定された各認識対象領域に含まれる文字を認識するステップ;
をコンピュータに実行させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009078915A JP2010231541A (ja) | 2009-03-27 | 2009-03-27 | 情報処理装置、文字認識方法、およびプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009078915A JP2010231541A (ja) | 2009-03-27 | 2009-03-27 | 情報処理装置、文字認識方法、およびプログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2010231541A true JP2010231541A (ja) | 2010-10-14 |
Family
ID=43047284
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009078915A Pending JP2010231541A (ja) | 2009-03-27 | 2009-03-27 | 情報処理装置、文字認識方法、およびプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2010231541A (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015041371A (ja) * | 2013-08-23 | 2015-03-02 | 株式会社ダイフク | 物品情報認識装置 |
| JP2017091419A (ja) * | 2015-11-16 | 2017-05-25 | 富士ゼロックス株式会社 | 情報処理装置、画像読み取り装置及びプログラム |
| JP2018500704A (ja) * | 2015-10-30 | 2018-01-11 | 小米科技有限責任公司Xiaomi Inc. | 領域抽出方法及び装置 |
| CN107665346A (zh) * | 2016-07-28 | 2018-02-06 | 京瓷办公信息系统株式会社 | 信息提取装置、具有信息提取装置的图像形成装置、信息提取装置的控制方法 |
| CN115298707A (zh) * | 2020-03-24 | 2022-11-04 | 株式会社东芝 | 信息处理装置、信息处理方法、程序及顺序信息 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08129607A (ja) * | 1994-10-31 | 1996-05-21 | Hitachi Ltd | 光学式文字認識方法 |
| JP2000306030A (ja) * | 1999-04-26 | 2000-11-02 | Fujitsu Ltd | 帳票照合装置 |
| JP2001084254A (ja) * | 1999-09-10 | 2001-03-30 | Toshiba Corp | 電子ファイリングシステムおよびファイリング方法 |
| JP2007011529A (ja) * | 2005-06-29 | 2007-01-18 | Njk:Kk | Ocr処理における文字認識位置の決定方法 |
-
2009
- 2009-03-27 JP JP2009078915A patent/JP2010231541A/ja active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08129607A (ja) * | 1994-10-31 | 1996-05-21 | Hitachi Ltd | 光学式文字認識方法 |
| JP2000306030A (ja) * | 1999-04-26 | 2000-11-02 | Fujitsu Ltd | 帳票照合装置 |
| JP2001084254A (ja) * | 1999-09-10 | 2001-03-30 | Toshiba Corp | 電子ファイリングシステムおよびファイリング方法 |
| JP2007011529A (ja) * | 2005-06-29 | 2007-01-18 | Njk:Kk | Ocr処理における文字認識位置の決定方法 |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015041371A (ja) * | 2013-08-23 | 2015-03-02 | 株式会社ダイフク | 物品情報認識装置 |
| JP2018500704A (ja) * | 2015-10-30 | 2018-01-11 | 小米科技有限責任公司Xiaomi Inc. | 領域抽出方法及び装置 |
| US10127471B2 (en) | 2015-10-30 | 2018-11-13 | Xiaomi Inc. | Method, device, and computer-readable storage medium for area extraction |
| JP2017091419A (ja) * | 2015-11-16 | 2017-05-25 | 富士ゼロックス株式会社 | 情報処理装置、画像読み取り装置及びプログラム |
| CN107665346A (zh) * | 2016-07-28 | 2018-02-06 | 京瓷办公信息系统株式会社 | 信息提取装置、具有信息提取装置的图像形成装置、信息提取装置的控制方法 |
| CN115298707A (zh) * | 2020-03-24 | 2022-11-04 | 株式会社东芝 | 信息处理装置、信息处理方法、程序及顺序信息 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7813553B2 (en) | Image region detection method, recording medium, and device therefor | |
| CN107003994B (zh) | 用于修正手写字符的方法和设备 | |
| US10183517B2 (en) | Correction method and device of laser marking | |
| US20070277150A1 (en) | Program, information storage medium, two-dimensional code generation system, image generation system and printed material | |
| US20100158375A1 (en) | Signal processing apparatus, signal processing method, computer-readable medium and computer data signal | |
| CN104268512B (zh) | 基于光学字符识别的图像中字符识别方法及装置 | |
| CN110431563B (zh) | 图像校正的方法和装置 | |
| JP2010231541A (ja) | 情報処理装置、文字認識方法、およびプログラム | |
| CN110213456B (zh) | 扫描文档校正方法、电子装置及计算机可读存储介质 | |
| US10810743B2 (en) | Image processing device, image processing method, and computer program product | |
| US20130321328A1 (en) | Method and apparatus for correcting pen input in terminal | |
| JP5606635B1 (ja) | 電子機器、補正方法、及びプログラム | |
| US20160155250A1 (en) | Map obtaining method | |
| CN113723136A (zh) | 条码矫正方法、装置、设备及存储介质 | |
| JP2018124918A (ja) | 画像処理装置、画像処理方法及びプログラム | |
| TWI621971B (zh) | 書寫姿勢提醒方法與使用其之電子系統 | |
| JP2007241356A (ja) | 画像処理装置および画像処理プログラム | |
| JP2009250739A (ja) | 画像処理方法およびプログラム | |
| JP5901680B2 (ja) | 携帯端末装置および表示装置 | |
| JP6225096B2 (ja) | 帳票読取プログラム、帳票読取方法、および情報処理装置 | |
| JP2005322061A (ja) | 2次元コード読取装置 | |
| TW201541358A (zh) | 用以於電子裝置動態顯示之組合二維條碼 | |
| US9122922B2 (en) | Information processing apparatus, program, and information processing method | |
| KR20160008407A (ko) | 문자 인식 장치 및 방법 | |
| CN102968611A (zh) | 信息处理器和信息处理方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111115 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120413 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120424 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120614 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120904 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121024 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130305 |