JP2004280530A - 帳票処理システム及び帳票処理方法 - Google Patents
帳票処理システム及び帳票処理方法 Download PDFInfo
- Publication number
- JP2004280530A JP2004280530A JP2003071943A JP2003071943A JP2004280530A JP 2004280530 A JP2004280530 A JP 2004280530A JP 2003071943 A JP2003071943 A JP 2003071943A JP 2003071943 A JP2003071943 A JP 2003071943A JP 2004280530 A JP2004280530 A JP 2004280530A
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- imprint
- removal
- seal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012545 processing Methods 0.000 title claims abstract description 286
- 238000000034 method Methods 0.000 title claims description 49
- 238000012790 confirmation Methods 0.000 claims description 29
- 238000003672 processing method Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 5
- 230000008676 import Effects 0.000 claims 1
- 238000003384 imaging method Methods 0.000 abstract 2
- 238000012015 optical character recognition Methods 0.000 description 22
- 238000013500 data storage Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 239000003086 colorant Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Image Input (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
【課題】帳票の読取対象領域に相当する画像領域に、捺印による印影の印影画像を有する帳票画像を用いて文字認識を行う。
【解決手段】帳票画像取り込み部110と、印影画像探索/除去部112と、文字認識部114と、画像処理データ出力部116とを具える。帳票画像取り込み部によって帳票処理システムへ取り込まれた、帳票の帳票画像に対して、印影画像探索/除去部が捺印の印影を探索し、かつ該印影を除去する。その後、文字認識部が印影除去帳票画像に対して文字認識処理を行って認識結果を出力し、続いて、画像処理データ出力部が、帳票画像もしくは印影除去帳票画像と、認識結果とをを出力する。
【選択図】 図1
【解決手段】帳票画像取り込み部110と、印影画像探索/除去部112と、文字認識部114と、画像処理データ出力部116とを具える。帳票画像取り込み部によって帳票処理システムへ取り込まれた、帳票の帳票画像に対して、印影画像探索/除去部が捺印の印影を探索し、かつ該印影を除去する。その後、文字認識部が印影除去帳票画像に対して文字認識処理を行って認識結果を出力し、続いて、画像処理データ出力部が、帳票画像もしくは印影除去帳票画像と、認識結果とをを出力する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
この発明は、光学式文字読み取り装置(Optical CharactorReader(オプティカル・キャラクター・リーダー)(以下、OCRと略す))を用いる帳票処理システム及び帳票処理方法に関する。
【0002】
【従来の技術】
従来公知の帳票処理システムでは、帳票が有する読取対象領域に対して、OCRを用いて文字認識が行われる。この文字認識では、OCRには、帳票が有する情報が帳票画像として入力される。この帳票画像には、読取対象領域の情報が含まれている。そして、OCRでは、入力された帳票画像における読取対象領域に相当する画像領域に対して、文字認識が行われる。
【0003】
【特許文献1】
特開2002−123794号公報
【特許文献2】
特開2002−269547号公報
【特許文献3】
特開2002−304631号公報
【0004】
【発明が解決しようとする課題】
ここで、帳票の読取対象領域に捺印による印影が存在する場合、この帳票の帳票画像中には、読取対象領域に成された印影の印影画像が存在する。この帳票の読取対象領域に対して、上述したように、OCRにおいて文字認識を行うと、当該OCRによって印影は文字と誤って認識されてしまう。その結果、帳票の読取対象領域に対する文字認識が正確に行われないという問題が生じる。
【0005】
よって、従来は、例えば、帳票に予め以下のような処理をし、しかる後OCRで文字認識を行っていた。すなわち、帳票の読取対象領域に含まれる印影の印影画像を、前述した帳票画像中に存在させないようにするため、予め、帳票に印影の色と同一の色をドロップアウトする処理を行い、この処理後に、帳票の帳票画像をOCRに入力していた。
【0006】
しかし、前述したドロップアウト処理を行った場合、帳票画像には、読取対象領域に含まれた印影の印影画像は存在しない。よって、上述した文字認識を行う他、例えば、何らかの確認手段を用いて、帳票画像が有する、帳票の読取対象領域の印影について、確認を行うことができなくなってしまう。帳票における読取対象領域の印影の確認は、通常、広く行われていることから、上述したような従来の帳票処理システムは、利便性の高いシステムということはできない。
【0007】
この発明は、以上説明したような問題点に鑑み成されたものであり、従ってこの発明の目的は、帳票の読取対象領域に相当する画像領域に、印影画像を有する帳票画像に対して文字認識を行う帳票処理システム及び帳票処理方法を提供することにある。
【0008】
【発明を解決するための手段】
この目的を達成するため、この発明の帳票処理システムによれば、帳票画像取り込み部と、印影画像探索/除去部と、画像格納部と、文字認識部と、画像処理データ出力部との各処理部を具えている。この発明の帳票処理システムの各処理部は、以下の処理動作を行う。
【0009】
まず、(a)帳票画像取り込み部は、捺印された印影を含む読取対象領域を有する帳票から帳票処理システムに帳票画像を入力させて、入力されたこの帳票画像を画像格納部へ格納することによって、帳票画像の取り込みを行う。
【0010】
次に、(b)印影画像探索/除去部は、帳票処理システムに取り込まれた帳票画像中の、帳票の読取対象領域に相当する画像領域に存在する、印影の印影画像を探索し、かつこの印影画像を除去する。印影画像探索/除去部によって、帳票画像から印影画像が除去されている印影除去帳票画像は、画像格納部に格納される。
【0011】
その後、(c)文字認識部は、画像格納部から印影除去帳票画像を読み出し、かつ読み出した印影除去帳票画像中の、帳票の読取対象領域に相当する画像領域に対して文字認識処理を行って認識結果を出力する。
【0012】
しかる後、(d)画像処理データ出力部は、文字認識処理後に、帳票画像及び印影除去帳票画像のいずれか一方もしくは双方を画像格納部から取り出して出力するとともに、文字認識部から入力される認識結果を出力する。
【0013】
この発明の帳票処理システムにOCRを用いた場合、OCRでは、上述した(b)の処理において、印影画像探索/除去部が、帳票画像中の、帳票の読取対象領域に相当する画像領域に存在する、印影の印影画像を探索し、かつ除去した後、上述した(c)の処理によって、印影除去帳票画像を用いて文字認識部で文字認識が行われる。その結果、OCRでは、帳票の読取対象領域の印影が文字と誤って認識される事態が生じないため、文字認識を正しく行うことができる。
【0014】
また、この場合、OCRでは、上述した(d)の処理で、画像処理データ出力部から、認識結果及び印影除去帳票画像とともに、帳票画像を得ることが可能である。従って、この発明の帳票処理システムによれば、帳票の読取対象領域の印影の確認を、画像処理データ出力部から、当該帳票に対応する帳票画像を得ることによって行うことも可能である。
【0015】
すなわち、この発明の帳票処理システムは、読取対象領域に印影を有する帳票の帳票画像に対して文字認識を行うことができ、かつ帳票の読取対象領域の印影の確認も可能な利便性の高いシステムということができる。
【0016】
【発明の実施の形態】
以下、図を参照して、この発明の実施の形態について説明する。また、以下の説明に用いる各図において、同様な構成要素については、同一の符号を付して示し、重複する説明を省略することもある。
【0017】
[第1の実施の形態]
この発明の帳票処理システムに係る第1の実施の形態について説明する。
【0018】
1.第1の実施の形態の帳票処理システムの構成
まず、この実施の形態の帳票処理システムの構成について説明する。図1を参照して、この実施の形態の帳票処理システム100の構成について説明する。図1には、帳票処理システム100の構成例を示してある。この実施の形態の帳票処理システム100は、帳票画像入力装置102と、帳票画像処理装置104とを有している。
【0019】
図1に示すように、帳票画像入力装置102は画像入力部118を有している。この画像入力部118は、好ましくは、帳票画像入力装置102の機能である。また、この実施の形態では、帳票画像入力装置102として、スキャナ等の画像入力手段を用いて構成するのが好適である。
【0020】
帳票画像処理装置104は、帳票画像入力装置102と接続されており、かつ画像取得部120と、印影画像探索/除去部112と、文字認識部114と、画像処理データ出力部116とを含む中央処理部106、及び画像格納部108を有している。
【0021】
帳票画像処理装置104は、パソコン等のコンピュータを用いて構成されるのが好ましい。また、中央処理部106として、帳票画像処理装置104が有するCPUを用いるのが好適である。中央処理部106が有する、画像取得部120と、印影画像探索/除去部112と、文字認識部114と、画像処理データ出力部116のそれぞれは、当該中央処理部106における機能手段であり、各機能は、プログラムで実行される。尚、このプログラムは、図1には図示しない帳票画像処理装置104のメモリ(ROM等)に格納されているのが好ましい。
【0022】
また、帳票画像処理装置104の有する画像格納部108は、所望の格納手段を用いて構成される。この格納手段はROM又はRAM等のメモリとするのが望ましい。
【0023】
ここで、この実施の形態によれば、図1に示すように、帳票画像取り込み部110は、帳票画像入力装置102の画像入力部118と、帳票画像処理装置104の画像取得部120とを有している。また、図1を参照して説明したこの実施の形態の帳票処理システム100を実施するにあたり、帳票画像入力装置102と、帳票画像処理装置104とを含むOCRを用いるのが好ましい。
【0024】
2.第1の実施の形態の帳票処理システムの動作
次に、この実施の形態の帳票処理システム100の動作について説明するが、まず、この実施の形態の帳票の構成例について、図3を参照して説明する。図3には、この実施の形態の帳票300の構成例を示してある。図3に示すように、帳票300は書面であり、この書面は、銀行の小切手などのように、文字が記載された紙面等を有している。尚、この実施の形態の帳票の構成は、図3に示す帳票300の構成に限定されず、所望の書面を帳票として用いることができる。
【0025】
図3に示す帳票300のフォームは、点線枠302及び320で囲まれる領域に記載されている複数の文字と、7つの実線枠のそれぞれによって囲まれる領域304、306、308、310、312、314、及び318とによって構成されている。図3において、これら7つの実線枠のそれぞれによって囲まれる領域304、306、308、310、312、314、及び318を、それぞれ、第1の領域304、第2の領域306、第3の領域308、第4の領域310、第5の領域312、第6の領域314、第7の領域318として示してある。図3に示すように、帳票300の、第1〜第7の領域304、306、308、310、312、314、及び318のそれぞれには複数の文字が記載される。
【0026】
図1を参照して説明した帳票画像入力装置102及び帳票画像処理装置104を含むOCRを用いて帳票300に対して文字認識を行う場合、この文字認識の対象となる領域、すなわち読取対象領域が帳票300には存在する。図3に示す第1〜第7の領域304、306、308、310、312、314、及び318のそれぞれが読取対象領域と成り得るが、ここでは、第6の領域314を読取対象領域とする例について説明する。第6の領域314は、図3に示すように捺印により得られた印影316を有している。
【0027】
次に、この実施の形態の帳票処理システム100の動作について、図2を参照して説明する。図2には、この実施の形態の帳票処理システム100の動作を説明するためのフローチャートを示してある。尚、図2に示すフローチャートにおいて、各処理のステップを記号Sに番号を添えて示してある。
【0028】
ここで、この実施の形態の帳票処理システム100における帳票300に対する処理、すなわち文字認識は、帳票画像入力装置102及び帳票画像処理装置104によって行われる。以下に説明する、帳票処理システム100の動作では、帳票画像入力装置102及び帳票画像処理装置104を含むOCRを用いて帳票300に対する文字認識が行われるとする。
【0029】
(S201)まず、帳票画像入力装置102によって、帳票処理システム100への帳票300の帳票画像の入力が行われる。具体的に、この帳票画像の入力は、帳票画像入力装置102の画像入力部118が、帳票画像処理装置104に帳票300の帳票画像を入力することによって行われる。
【0030】
ここで、帳票画像は、帳票に記載された文字等の画像情報である。よって、帳票300の帳票画像には、帳票300のフォーム画像、すなわち図3に示す点線枠302及び320で囲まれる領域に記載されている複数の文字の文字画像と、同図における7つの実線枠のそれぞれによって囲まれる領域304、306、308、310、312、314、及び318の画像とが含まれている。従って、帳票300の帳票画像は、第6の領域314に捺印された印影316の画像すなわち印影画像を有している。
【0031】
また、帳票画像には、帳票300に記載された文字の色、この帳票300の第6の領域314が有する印影316の色、及び帳票300における文字や印影316の記載面そのものの色等の色情報も含まれている。
【0032】
(S202)次に、帳票画像処理装置104に入力された帳票画像は、画像取得部120が、この帳票画像を画像格納部108に格納することによって取得する。また、取得した帳票画像に対して、帳票300の読取対象領域314に相当する画像領域の指定が行われる。この指定は、以下の手順によって行われるのが好ましい。
【0033】
この実施の形態の帳票画像処理装置104には、図1に示すように、表示手段122及び入力手段124が接続されているのが好ましい。画像取得部120は、取得した帳票画像を中央処理部106から表示手段122に出力する。表示手段122は、中央処理部106から入力された帳票画像を、従来公知の手段によって表示する。表示手段122によって表示された帳票画像に対して、入力手段124が、帳票300の読取対象領域314に相当する画像領域を選択する。
【0034】
入力手段124としては、従来既知のポインティングデバイス(例えばマウス等)を用いるのが好ましく、表示手段122によって表示された帳票画像をオペレータ(人)が見ながら、入力手段124を操作するのが望ましい。前述した画像領域の選択は、従来よりよく知られているように、入力手段124が、この画像領域の位置情報を座標として、中央処理部106に出力することによって行われるのが好適である。
【0035】
入力手段124より中央処理部106に入力される、帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報は、画像取得部120が受け取って、当該帳票画像と対応させて画像格納部108に格納する。
【0036】
(S203)その後、印影画像探索/除去部112は、画像格納部108から帳票300の帳票画像を読み出して、この帳票画像に対して印影316の印影画像を探索する。このとき、印影画像探索/除去部112は、帳票300の帳票画像、及びこの帳票画像における、帳票300の読取対象領域314に相当する画像領域の位置情報を読み出す。そして、印影画像探索/除去部112は、この位置情報によって指定される帳票300の帳票画像中の画像領域を印影画像探索領域とし、この領域に対して印影316の印影画像を探索する。
【0037】
ここで、この実施の形態によれば、好ましくは、この印影画像の探索は、従来公知の印影画像探索技術のうち所望の技術を用いて行われる。従来よりよく知られている印影画像探索技術として、例えば、上記特許文献1(特開2002−123794号公報)、特許文献2(特開2002−269547号公報)、及び特許文献3(特開2002−304631号公報)にそれぞれ開示された技術がある。
【0038】
従来既知の印影画像探索技術には、印影の色彩に関する情報及び印影の形状に関する情報のいずれか一方の情報に基づいて、捺印による印影の印影画像の探索を行う技術がある。特許文献1に開示された印影画像探索技術は、印影の色彩に関する情報に基づいて捺印による印影の印影画像の探索を行う。ここで、既に説明したように、帳票画像には色情報が含まれている。特許文献1に開示された印影画像探索技術では、帳票画像の色情報、すなわち、帳票の文字の色及び印影の色のそれぞれの色情報の違いに基づいて、印影画像を探索する。
【0039】
特許文献2及び特許文献3に開示されたそれぞれの印影画像探索技術は、印影の形状に関する情報に基づいて捺印による印影の印影画像の探索を行う。特許文献2に開示の技術によれば、印影探索領域の形状と、印影の形状のそれぞれの情報に基づいて印影画像を探索する。また、特許文献3に開示の技術では、帳票上の印影探索領域に存在する印影の形状に基づいて印影画像の探索が行われる。
【0040】
この実施の形態では、好ましくは、上述した、印影の色彩に関する情報もしくは印影の形状に関する情報に基づいて行われる従来既知の印影画像探索技術を用いて、印影画像探索/除去部112によって、印影316の印影画像を探索する。印影画像の探索の結果、印影画像探索/除去部112が印影画像を検出した後、後述するステップS204の処理が行われる。
【0041】
ところで、この実施の形態の帳票処理システム100によれば、図3に示すように、捺印による印影316が形成された読取対象領域314を有する帳票300のほか、印影が無い読取対象領域を有する帳票を用いることも可能である。この読取対象領域を印影探索領域とすれば、当該帳票の帳票画像には、この印影探索領域に対応する印影画像探索領域が含まれている。この印影画像探索領域に対して、印影画像探索/除去部112が、上述したような手順に従って印影画像を探索する場合、印影画像は検出されない。このような場合、続いて、後述するステップS205の処理が行われる。
【0042】
(S204)続いて、印影画像探索/除去部112によって、帳票300の帳票画像から印影316の印影画像が除去される。印影画像探索/除去部112は、印影画像の除去を、以下に述べる従来公知の方法によって行うのが好ましい。印影画像探索/除去部112は、好ましくは、帳票300の帳票画像が有する色情報に基づいて、捺印による印影316を形成する画素のそれぞれの色を、当該帳票300における文字及び印影316の記載面(すなわち背景)の色と同一の色とすることによって行う。尚、前述した手順に従って、印影画像が除去された、帳票300の帳票画像が印影除去帳票画像である。この印影除去帳票画像は、印影316と背景が区別できない状態にされた帳票300の入力画像に相当する。この印影除去帳票画像は、印影画像探索/除去部112によって画像格納部108に格納される。
【0043】
ここで、図4に、帳票300の印影除去帳票画像400の構成例を示す。この印影除去帳票画像400は、帳票300の帳票画像と同様の構成を有する。よって、図4に示す印影除去帳票画像400について、帳票300の帳票画像と同様の構成について、重複する説明は省略する。図4に示すように、印影除去帳票画像400において、帳票300の読取対象領域314に相当する画像領域である印影画像探索領域402から印影316の印影画像は除去されており、この印影画像探索領域402には、文字認識の対象となる文字の画像が存在している。
【0044】
(S205)その後、図4を参照して説明した印影除去帳票画像400における、印影画像探索領域402と同一の領域に対して、文字認識部114によって文字認識処理が行われる。文字認識部114は、画像格納部108から印影除去帳票画像400を読み出し、この読み出した印影除去帳票画像400に対して文字認識処理を行う。
【0045】
文字認識部114による文字認識処理は、従来公知の方法に従って行われるのが好ましい。従来よりよく知られている文字認識処理は、例えば、上記特許文献1に開示されている。尚、文字認識部114は、図1には図示しないメモリに照合データを有しており、前述した文字認識処理を、この照合データと、印影画像探索領域402に含まれる文字画像の情報とを照合することによって行うのが望ましい。
【0046】
文字認識処理の結果、文字認識部114から認識結果が出力される。図4に示すように、印影除去帳票画像400の印影画像探索領域402には、次の3種類の文字画像、「金額」、「12000」、及び「円」が存在する。これらの文字画像のうち「12000」は、印影画像探索領域402において、枠画像404で囲まれる画像領域に存在する。図4に示すように、この画像領域は4つの領域404a、404b、404c、及び404dを有しており、文字画像「12000」は、領域404c中に存在する文字画像「12」、及びこの領域404cに隣接する領域404d中に存在する「000」によって構成される。
【0047】
ここでは、印影画像探索領域402において、枠画像404で囲まれる画像領域に存在する文字画像「12000」を、文字認識部114における文字認識の対象とする。このとき、文字認識部114からは、認識結果として「12000」がデータとして出力される。
【0048】
(S206)続いて、文字認識部114から出力された認識結果「12000」は、画像処理データ出力部116に入力される。画像処理データ出力部116は、入力された認識結果「12000」を出力するとともに、帳票300の帳票画像及び印影除去帳票画像400のいずれか一方もしくは双方を、画像格納部108から取り出して出力する。その後、この実施の形態における帳票処理システム100において、帳票300の読取対象領域314に対する文字認識が終了される。
【0049】
よって、この実施の形態によれば、(イ)画像処理データ出力部116から、認識結果「12000」及び帳票300の帳票画像が出力される場合、(ロ)画像処理データ出力部116から、認識結果「12000」及び印影除去帳票画像400が出力される場合、及び(ハ)画像処理データ出力部116から、認識結果「12000」と、帳票300の帳票画像及び印影除去帳票画像400が出力される場合の3つの場合がある。これら(イ)〜(ハ)の3つの場合のうち、いずれの場合を選択するかは、当業者が成し得る設計事項である。
【0050】
この実施の形態の帳票処理システム100によれば、上述したように、印影画像探索/除去部112が、帳票300の帳票画像中の印影画像を探索し、かつ除去した後、印影除去帳票画像400を用いて文字認識部114で文字認識が行われる。その結果、帳票画像入力装置102及び帳票画像処理装置104を含むOCRでは、帳票300の読取対象領域314における捺印による印影316が文字と誤って認識される事態が生じないため、文字認識を正しく行うことができる。
【0051】
また、この実施の形態によれば、帳票画像入力装置102及び帳票画像処理装置104を含むOCRでは、既に説明したように、画像処理データ出力部116から、認識結果及び印影除去帳票画像400とともに、帳票画像を得ることが可能である。従って、この実施の形態の帳票処理システム100によれば、帳票300の読取対象領域314の印影316の確認を、画像処理データ出力部116から、当該帳票300の帳票画像を得ることによって行うことも可能である。
【0052】
すなわち、この実施の形態の帳票処理システム100は、読取対象領域314に印影316を有する帳票300の帳票画像に対して文字認識を行うことができ、かつ帳票300の読取対象領域314の印影316の確認も可能な利便性の高いシステムということができる。
【0053】
[第2の実施の形態]
この発明の帳票処理システムに係る第2の実施の形態について説明する。この実施の形態では、第1の実施の形態の帳票処理システム100において、図2を参照して説明したステップS202の処理で、画像取得部120によって以下の処理が行われる。ステップS202の処理において、画像取得部120は、帳票画像処理装置104に入力された帳票画像に対して2値化処理を行った後、2値化処理がされている帳票画像である2値化帳票画像を画像格納部108に格納する。この実施の形態によれば、画像取得部120が行う2値化処理は、以下に説明する従来公知の方法であるのが好ましい。
【0054】
既に説明したように、帳票画像には色情報が含まれている。第1の実施の形態によれば、この色情報には、帳票300が有する全ての色の情報、すなわち、帳票300の文字及び印影316等の色の情報と、これら文字及び印影316等の記載面すなわち背景の色の情報が含まれている。従来よりよく知られているように、2値化処理では、帳票の記載面の色を第1の色とし、この記載面に記載されている文字及び印影等の色を第2の色として、第1の色に関する情報、及び第2の色に関する情報を帳票画像の色情報とする。
【0055】
2値化処理後、2値化帳票画像において、帳票300の文字の色と印影316の色は、同一の第2の色としてある。従って、この実施の形態によれば、図2を参照して説明したステップS203では、好ましくは、印影画像探索/除去部112は、帳票画像に対する、捺印による印影316の印影画像の探索を、この印影の形状に関する情報に基づいて行う。
【0056】
この実施の形態の帳票処理システムでは、第1の実施の形態と同様の作用及び効果を得ることができる。また、この実施の形態の帳票処理システムによれば、2値化処理を行うことによって、2値化帳票画像が有する色情報を第1及び第2の色の情報を含む情報とするため、第1の実施の形態の帳票画像と比較して、2値化帳票画像のデータ量は少なくすることができる。よって、この実施の形態の帳票処理システムでは、第1の実施の形態と比較して、画像格納部108により多くの帳票画像、及びこの帳票画像に対応する印影除去帳票画像を格納することができる。すなわち、この実施の形態の帳票処理システムは、第1の実施の形態と比較して、より多くの帳票の処理を行うことができる。従って、この実施の形態によれば、第1の実施の形態と比較して、帳票処理システムにおける帳票の処理をより効率的に行うことができる。
【0057】
[第3の実施の形態]
この発明の帳票処理システムに係る第3の実施の形態について説明する。この実施の形態によれば、第1及び第2の実施の形態の帳票処理システムにおいて、画像処理データ確認部を、帳票画像処理装置104に接続して設けてある。図5には、この実施の形態の帳票処理システム500について、帳票画像処理装置104に画像処理データ確認部126を接続してある構成を示してある。
【0058】
この画像処理データ確認部126は、画像処理データ出力部116から出力される帳票画像または印影除去帳票画像と、画像処理データ出力部116から出力される認識結果とを照合し、この認識結果の正誤について確認して確認結果を出力する。この実施の形態によれば、画像処理データ確認部126は、帳票画像処理装置104にネットワークを介して接続されるサーバを用いて構成されているのが好ましい。
【0059】
よって、この実施の形態では、第1及び第2の実施の形態と同様の作用及び効果を得ることが出来る。また、この実施の形態によれば、帳票画像処理装置104から出力される認識結果の正誤について、画像処理データ確認部126が確認する。従って、この実施の形態の帳票処理システム500では、第1及び第2の実施の形態と比較して、より正確に帳票に対する文字認識を行うことができる。
【0060】
ここで、既に説明したように、第2の実施の形態において、帳票画像処理装置104から出力される帳票画像及び印影除去帳票画像は、2値化処理された画像データであるため、第1の実施の形態と比較してデータ量が少なくなる。よって、この実施の形態の帳票処理システム500の構成が、第2の実施の形態の帳票処理システムに画像処理データ確認部126が設けられている構成である場合、第1の実施の形態の帳票処理システム100に画像処理データ確認部126が設けられている構成と比較して、帳票画像処理装置104と画像処理データ確認部126との間の、帳票画像及び印影除去帳票画像の転送速度を大きくすることができる。従って、この場合、帳票処理システム500における、帳票画像処理装置104と画像処理データ確認部126との間の、帳票画像及び印影除去帳票画像の転送を、第1の実施の形態の帳票処理システムに画像処理データ確認部126が設けられている場合と比較して、より効率的に行うことができる。
【0061】
[第4の実施の形態]
次に、この実施の形態の帳票処理システムに係る第4の実施の形態について説明する。
【0062】
1.第4の実施の形態の帳票処理システムの構成
まず、この実施の形態の帳票処理システムの構成について説明する。この実施の形態の帳票処理システムは、第1の実施の形態の帳票処理システム100と同様の構成を有している。よって、以下に説明する、この実施の形態の帳票処理システムの構成について、第1の実施の形態の帳票処理システム100と同様の構成について、重複する説明を省略することもある。
【0063】
また、この実施の形態の帳票の構成は、第1の実施の形態において、図3を参照して説明した帳票300の構成と同様の構成を有している。よって、この実施の形態の帳票の構成について、第1の実施の形態と重複する説明は省略する。
【0064】
図6を参照して、この実施の形態の帳票処理システム600の構成について説明する。図6には、帳票処理システム600の構成例を示してある。
【0065】
この実施の形態の帳票処理システム600において、図6に示すように、帳票画像入力装置202は、画像入力部218及び画像取得部220を含む帳票画像取り込み部210と、取得画像データ格納部226とを有している。帳票画像取り込み部210において、画像入力部218は、好ましくは、スキャナ等の画像入力手段を用いて構成するのが好適である。また、帳票画像取り込み部210の画像取得部220は、パソコン等のコンピュータにおける中央処理装置(CPU)が果たす機能手段である。取得画像データ格納部226は、画像取得部220をCPUの機能として有するコンピュータに設けられているメモリ(ROM又はRAM等)によって構成されるか、もしくは、それ自体が独立した格納手段(例えばROM又はRAM等で構成されるメモリ)として構成されるのが望ましい。ここで、この実施の形態の帳票画像入力装置202の構成について、以下の説明では、便宜上、画像取得部220を機能手段として動作するCPUと、取得画像データ格納部226とは、同一のコンピュータに設けられているとする。
【0066】
また、帳票画像処理装置204は、帳票画像入力装置202と、例えばネットワーク等を介して接続されており、かつ印影画像探索/除去部212と、文字認識部114と、画像処理データ出力部116とを含む中央処理部206と、画像格納部208とを有している。
【0067】
帳票画像処理装置204は、パソコン等のコンピュータを用いて構成されるのが好ましい。また、中央処理部206として、帳票画像処理装置204が有するCPUを用いるのが好適であり、中央処理部206が有する、印影画像探索/除去部212と、文字認識部114と、画像処理データ出力部116のそれぞれは、当該中央処理部206における機能手段であり、各機能は、プログラムで実行される。尚、このプログラムは、図6には図示しない帳票画像処理装置204のメモリ(ROM等)に格納されているのが好ましい。
【0068】
また、画像格納部208は、第1の実施の形態の画像格納部108と同様、所望の格納手段を用いて構成される。この格納手段はROM又はRAM等のメモリとするのが望ましい。さらに、この実施の形態の帳票処理システム600を実施するにあたり、第1の実施の形態と同様、帳票画像入力装置202と、帳票画像処理装置204とを含む構成をOCRとするのが好ましい。
【0069】
2.第4の実施の形態の帳票処理システムの動作
次に、この実施の形態の帳票処理システム600の動作について説明する。この実施の形態では、図3に示す帳票300に対して、帳票画像入力装置202及び帳票画像処理装置204を有するOCRによって、文字認識が行われるとする。よって、図3を参照して説明した帳票300の構成について、重複する説明は省略する。
【0070】
また、この実施の形態の帳票300に対する文字認識では、図2を参照して説明した、第1の実施の形態の処理と同様の処理が行われるのが好ましい。よって、この実施の形態における帳票300に対する文字認識についても、図2に示すフローチャートを参照して説明する。尚、この実施の形態の帳票300に対する文字認識の処理について、第1の実施の形態における処理と重複する説明は省略する。
【0071】
(S201)まず、この実施の形態によれば、帳票画像入力装置202において、帳票処理システム600への帳票300の帳票画像の入力が、画像入力部218によって行われる。画像入力部218は、好ましくは、帳票300の帳票画像を、画像取得部220を機能手段として有するCPUが設けられたコンピュータに入力する。尚、帳票300の帳票画像について、第1の実施の形態と重複する説明は省略する。
【0072】
(S202)次に、画像取得部220は、画像入力部218から入力される帳票300の帳票画像を取得画像データ格納部226に格納することによって取得する。
【0073】
ここで、この実施の形態の帳票画像入力装置202には、図6に示すように、表示手段222及び入力手段224が接続されているのが好ましい。これら表示手段222及び入力手段224は、第1の実施の形態において、図1を参照して説明した表示手段122及び入力手段124と同様の構成及び動作を有するのが望ましい。尚、表示手段222及び入力手段224の、帳票画像入力装置202への接続は、これら表示手段222及び入力手段224を、画像取得部220を機能手段として有するCPUが設けられたコンピュータに接続することによって行われるのが好適である。
【0074】
そして、この実施の形態によれば、取得した帳票画像に対して、帳票300の読取対象領域314に相当する画像領域の指定が、表示手段222、入力手段224、及び画像取得部220のそれぞれによって、第1の実施の形態と同様の手順で行われるのが好ましい。この実施の形態では、入力手段224から、画像取得部220を機能手段として有するCPUが設けられたコンピュータに、帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報が入力される。この位置情報は、画像取得部220が、当該帳票画像と対応させて取得画像データ格納部226に格納する。
【0075】
しかる後、画像取得部220は、帳票300の帳票画像と、この帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報とを、取得画像データ格納部226から取り出す。そして、画像取得部220は、これら帳票画像及び位置情報を、帳票画像処理装置204に出力する。
【0076】
(S203)その後、帳票画像処理装置204に入力された、帳票300の帳票画像と、この帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報は、中央処理部206を介して画像格納部208に格納される。続いて、印影画像探索/除去部212によって、第1の実施の形態と同様の手順によって、印影画像探索領域に対する印影316の印影画像の探索が行われる。
【0077】
そして、第1の実施の形態と同様、印影画像の探索の結果、印影画像探索/除去部212が印影画像を検出した後、後述するステップS204の処理が行われる。
【0078】
また、この実施の形態の帳票処理システム600においても、図3に示すように、捺印による印影316が存在する読取対象領域314を有する帳票300のほか、捺印による印影が無い読取対象領域を有する帳票を用いることも可能である。この場合、第1の実施の形態において既に説明したように、上述した印影画像の探索では印影画像は検出されず、従って、後述するステップS205の処理が続いて行われる。
【0079】
(S204)その後、印影画像探索/除去部212によって、第1の実施の形態と同様の手順によって、印影316の印影画像の除去が行われる。第1の実施の形態と同様、印影除去帳票画像400は、印影画像探索/除去部212によって画像格納部208に格納される。尚、印影除去帳票画像400について、第1の実施の形態と重複する説明は省略する。
【0080】
(S205)続いて、文字認識部114によって、第1の実施の形態と同様の手順によって、図4に示す印影画像探索領域402に対する文字認識処理が行われ、当該文字認識部114から認識結果が出力される。
【0081】
(S206)しかる後、画像処理データ出力部116は、第1の実施の形態と同様の手順によって、帳票画像及び印影除去帳票画像のいずれか一方もしくは双方を画像格納部208から取り出して出力するとともに、文字認識部114から入力される認識結果を出力する。その後、この実施の形態における帳票処理システムにおいて、帳票300の読取対象領域314に対する文字認識が終了される。尚、この実施の形態によれば、画像処理データ出力部116におけるデータの出力について、第1の実施の形態と同様、既に説明した(イ)〜(ロ)の3つの場合があり得るが、これら(イ)〜(ロ)の3つの場合のいずれを選択するかは、当業者が成し得る設計事項である。
【0082】
従って、以上説明したこの実施の形態の帳票処理システムによれば、第1の実施の形態の帳票処理システムと同様の作用により、同様の効果を得ることができる。
【0083】
[第5の実施の形態]
この発明の帳票処理システムに係る第5の実施の形態について説明する。この実施の形態では、第4の実施の形態の帳票処理システム600において、図2を参照して説明したステップS202の処理で、画像取得部220によって2値化処理が行われる。画像取得部220は、この2値化処理を、第2の実施の形態で説明した手順と同様の手順によって行うのが好ましい。尚、この実施の形態における2値化処理について、第2の実施の形態と同様の説明は省略する。
【0084】
この実施の形態によれば、2値化処理は、画像入力部218から入力される帳票画像に対して行われ、2値化帳票画像は、画像取得部220によって取得画像データ格納部226に格納される。その後、ステップS202の処理において、画像取得部220は、2値化帳票画像と、この2値化帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報とを、取得画像データ格納部226から取り出して、これら帳票画像と位置情報とを帳票画像処理装置204に出力する。
【0085】
また、この実施の形態では、図2を参照して説明したステップS203の処理において、帳票画像処理装置204に入力された、2値化帳票画像と、この2値化帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報は、中央処理部206を介して画像格納部208に格納される。そして、印影画像探索/除去部212は、画像格納部208から、2値化帳票画像、及びこの2値化帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報を読みだして、2値化帳票画像に対する印影316の印影画像の探索を、印影の形状に関する情報に基づいて行う。
【0086】
従って、この実施の形態の帳票処理システムでは、第4の実施の形態と同様の作用及び効果を得ることができる。また、既に説明したように、2値化帳票画像のデータ量は、2値化処理が成されていない帳票画像のデータ量、すなわち第4の実施の形態の帳票画像のデータ量と比較して少なくなる。よって、既に説明した第2の実施の形態と同様、第4の実施の形態と比較して、画像格納部208により多くの帳票画像及び印影除去帳票画像を格納することができ、その結果、この実施の形態の帳票処理システムは、第4の実施の形態よりも多くの帳票の処理を行うことができる。従って、この実施の形態によれば、第4の実施の形態と比較して、帳票処理システムにおける帳票の処理をより効率的に行うことができる。
【0087】
[第6の実施の形態]
この発明の帳票処理システムに係る第6の実施の形態について説明する。この実施の形態によれば、第4及び第5の実施の形態の帳票処理システムにおいて、画像処理データ確認部を、帳票画像処理装置204に接続して設けてある。図7には、この実施の形態の帳票処理システム700について、帳票画像処理装置204に画像処理データ確認部260を接続してある構成を示してある。この画像処理データ確認部260は、図5を参照して説明した、第3の実施の形態の画像処理データ確認部126と同様の構成及び動作を有するのが好ましい。よって、この実施の形態の画像処理データ確認部260について、第3の実施の形態と重複する説明は省略する。
【0088】
従って、この実施の形態では、第4及び第5の実施の形態と同様の作用及び効果を得ることができる。また、この実施の形態では、帳票画像処理装置204から出力される認識結果の正誤について、画像処理データ確認部260が確認するため、第4及び第5の実施の形態と比較して、より正確に帳票に対する文字認識を行うことができる。
【0089】
また、上述したように、2値化帳票画像のデータ量は、2値化処理が成されていない帳票画像のデータ量と比較して少なくなる。よって、この実施の形態の帳票処理システムの構成が、第5の実施の形態の帳票処理システムに画像処理データ確認部260が設けられている構成である場合、第4の実施の形態の帳票処理システム600に画像処理データ確認部260が設けられている構成と比較して、帳票画像処理装置204と画像処理データ確認部260との間の、帳票画像及び印影除去帳票画像の転送速度を大きくすることができる。従って、この場合、帳票処理システム700における、帳票画像処理装置204と画像処理データ確認部260との間の、帳票画像及び印影除去帳票画像の転送を、第4の実施の形態の帳票処理システム600に画像処理データ確認部260が設けられている場合と比較して、より効率的に行うことができる。
【0090】
[第7の実施の形態]
次に、この発明の帳票処理システムに係る第7の実施の形態について説明する。この実施の形態によれば、第4〜第6の実施の形態の帳票処理システムにおいて、帳票画像入力装置202にも、印影画像探索/除去部と、文字認識部と、画像処理データ出力部と、画像格納部が設けられている。これら印影画像探索/除去部と、文字認識部と、画像処理データ出力部と、画像格納部のそれぞれは、図6及び図7を参照して説明した、印影探索/除去部212と、文字認識部114と、画像処理データ出力部116と、画像格納部208のそれぞれと同様の構成及び機能を有する。
【0091】
この実施の形態によれば、帳票画像入力装置において、好ましくは、印影画像探索/除去部と、文字認識部と、画像処理データ出力部は、画像取得部220とともに、コンピュータのCPUの機能手段として設けられている。そして、このコンピュータのメモリ(ROM又はRAM等)として、画像格納部が、帳票画像入力装置に設けられているのが望ましい。この場合、画像格納部と取得画像データ格納部226とは同一のメモリを用いて構成されてもよいし、それぞれが独立した格納手段(例えばROM又はRAM等で構成されるメモリ)として構成されてもよい。
【0092】
上述したように、同一のコンピュータに、画像取得部220と、印影画像探索/除去部と、文字認識部と、画像処理データ出力部とを含むCPUと、画像格納部とが設けられる場合、このコンピュータは、図1を参照して説明した帳票画像処理装置104と同様の構成となり、かつ同様の機能を有することとなる。
【0093】
従って、この実施の形態によれば、第4〜第6の実施の形態と同様の作用及び効果を得ることができる。さらに、上述したように、この実施の形態の帳票処理システムでは、帳票画像入力装置を、第1の実施の形態の帳票画像処理装置104と同様の構成及び機能を有するコンピュータを含む構成とすることができる。また、既に説明したように、この帳票画像入力装置は、帳票画像処理装置204に接続されている。よって、この実施の形態によれば、帳票画像入力装置及び帳票画像処理装置204のそれぞれにおいて、既に説明したような帳票処理を行うことができる。その結果、この実施の形態の帳票処理システムでは、第4〜第6の実施の形態と比較して、帳票処理の効率をさらに向上させることができる。
【0094】
【発明の効果】
上述したこの発明の帳票処理システムでは、印影画像探索/除去部が、帳票画像中の、帳票の読取対象領域に相当する画像領域に存在する、捺印による印影の印影画像を探索し、かつ除去した後、印影除去帳票画像を用いて文字認識部で文字認識が行われる。その結果、以上説明したこの発明の帳票処理システムにおいて、OCRを用いて文字認識を行う場合も、帳票の読取対象領域の捺印による印影が文字と誤って認識される事態が生じないため、文字認識を正しく行うことができる。
【0095】
また、この発明の帳票処理システムでは、画像処理データ出力部から、認識結果及び印影除去帳票画像とともに、帳票画像を得ることが可能である。従って、この発明の帳票処理システムによれば、帳票の読取対象領域の捺印による印影の確認を、画像処理データ出力部から、当該帳票に対応する帳票画像を得ることによって行うことも可能である。すなわち、この発明の帳票処理システムは、読取対象領域に捺印による印影を有する帳票の帳票画像に対して文字認識を行うことができ、かつ帳票の読取対象領域の捺印による印影の確認も可能な利便性の高いシステムということができる。
【図面の簡単な説明】
【図1】第1の実施の形態の帳票処理システムの構成例を説明するための図である。
【図2】この発明の帳票処理システムにおける帳票処理を説明するためのフローチャートを示す図である。
【図3】この発明の帳票処理システムにおける帳票の構成例を説明するための図である。
【図4】この発明の帳票処理システムにおける印影除去帳票画像の構成例を説明するための図である。
【図5】第3の実施の形態の帳票処理システムの構成例を説明するための図である。
【図6】第4の実施の形態の帳票処理システムの構成例を説明するための図である。
【図7】第6の実施の形態の帳票処理システムの構成例を説明するための図である。
【符号の説明】
100、500、600、700:帳票処理システム
102、202:帳票画像入力装置
104、204:帳票画像処理装置
106、206:中央処理部
108、208:画像格納部
110、210:帳票画像取り込み部
112、212:印影画像探索/除去部
114:文字認識部
116:画像処理データ出力部
118、218:画像入力部
120、220:画像取得部
122、222:表示手段
124、224:入力手段
126、260:画像処理データ確認部
226:取得画像データ格納部
300:帳票
304:第1の領域
306:第2の領域
308:第3の領域
310:第4の領域
312:第5の領域
314:第6の領域
316:印影
318:第7の領域
400:印影除去帳票画像
402:印影画像探索領域
404:枠画像
【発明の属する技術分野】
この発明は、光学式文字読み取り装置(Optical CharactorReader(オプティカル・キャラクター・リーダー)(以下、OCRと略す))を用いる帳票処理システム及び帳票処理方法に関する。
【0002】
【従来の技術】
従来公知の帳票処理システムでは、帳票が有する読取対象領域に対して、OCRを用いて文字認識が行われる。この文字認識では、OCRには、帳票が有する情報が帳票画像として入力される。この帳票画像には、読取対象領域の情報が含まれている。そして、OCRでは、入力された帳票画像における読取対象領域に相当する画像領域に対して、文字認識が行われる。
【0003】
【特許文献1】
特開2002−123794号公報
【特許文献2】
特開2002−269547号公報
【特許文献3】
特開2002−304631号公報
【0004】
【発明が解決しようとする課題】
ここで、帳票の読取対象領域に捺印による印影が存在する場合、この帳票の帳票画像中には、読取対象領域に成された印影の印影画像が存在する。この帳票の読取対象領域に対して、上述したように、OCRにおいて文字認識を行うと、当該OCRによって印影は文字と誤って認識されてしまう。その結果、帳票の読取対象領域に対する文字認識が正確に行われないという問題が生じる。
【0005】
よって、従来は、例えば、帳票に予め以下のような処理をし、しかる後OCRで文字認識を行っていた。すなわち、帳票の読取対象領域に含まれる印影の印影画像を、前述した帳票画像中に存在させないようにするため、予め、帳票に印影の色と同一の色をドロップアウトする処理を行い、この処理後に、帳票の帳票画像をOCRに入力していた。
【0006】
しかし、前述したドロップアウト処理を行った場合、帳票画像には、読取対象領域に含まれた印影の印影画像は存在しない。よって、上述した文字認識を行う他、例えば、何らかの確認手段を用いて、帳票画像が有する、帳票の読取対象領域の印影について、確認を行うことができなくなってしまう。帳票における読取対象領域の印影の確認は、通常、広く行われていることから、上述したような従来の帳票処理システムは、利便性の高いシステムということはできない。
【0007】
この発明は、以上説明したような問題点に鑑み成されたものであり、従ってこの発明の目的は、帳票の読取対象領域に相当する画像領域に、印影画像を有する帳票画像に対して文字認識を行う帳票処理システム及び帳票処理方法を提供することにある。
【0008】
【発明を解決するための手段】
この目的を達成するため、この発明の帳票処理システムによれば、帳票画像取り込み部と、印影画像探索/除去部と、画像格納部と、文字認識部と、画像処理データ出力部との各処理部を具えている。この発明の帳票処理システムの各処理部は、以下の処理動作を行う。
【0009】
まず、(a)帳票画像取り込み部は、捺印された印影を含む読取対象領域を有する帳票から帳票処理システムに帳票画像を入力させて、入力されたこの帳票画像を画像格納部へ格納することによって、帳票画像の取り込みを行う。
【0010】
次に、(b)印影画像探索/除去部は、帳票処理システムに取り込まれた帳票画像中の、帳票の読取対象領域に相当する画像領域に存在する、印影の印影画像を探索し、かつこの印影画像を除去する。印影画像探索/除去部によって、帳票画像から印影画像が除去されている印影除去帳票画像は、画像格納部に格納される。
【0011】
その後、(c)文字認識部は、画像格納部から印影除去帳票画像を読み出し、かつ読み出した印影除去帳票画像中の、帳票の読取対象領域に相当する画像領域に対して文字認識処理を行って認識結果を出力する。
【0012】
しかる後、(d)画像処理データ出力部は、文字認識処理後に、帳票画像及び印影除去帳票画像のいずれか一方もしくは双方を画像格納部から取り出して出力するとともに、文字認識部から入力される認識結果を出力する。
【0013】
この発明の帳票処理システムにOCRを用いた場合、OCRでは、上述した(b)の処理において、印影画像探索/除去部が、帳票画像中の、帳票の読取対象領域に相当する画像領域に存在する、印影の印影画像を探索し、かつ除去した後、上述した(c)の処理によって、印影除去帳票画像を用いて文字認識部で文字認識が行われる。その結果、OCRでは、帳票の読取対象領域の印影が文字と誤って認識される事態が生じないため、文字認識を正しく行うことができる。
【0014】
また、この場合、OCRでは、上述した(d)の処理で、画像処理データ出力部から、認識結果及び印影除去帳票画像とともに、帳票画像を得ることが可能である。従って、この発明の帳票処理システムによれば、帳票の読取対象領域の印影の確認を、画像処理データ出力部から、当該帳票に対応する帳票画像を得ることによって行うことも可能である。
【0015】
すなわち、この発明の帳票処理システムは、読取対象領域に印影を有する帳票の帳票画像に対して文字認識を行うことができ、かつ帳票の読取対象領域の印影の確認も可能な利便性の高いシステムということができる。
【0016】
【発明の実施の形態】
以下、図を参照して、この発明の実施の形態について説明する。また、以下の説明に用いる各図において、同様な構成要素については、同一の符号を付して示し、重複する説明を省略することもある。
【0017】
[第1の実施の形態]
この発明の帳票処理システムに係る第1の実施の形態について説明する。
【0018】
1.第1の実施の形態の帳票処理システムの構成
まず、この実施の形態の帳票処理システムの構成について説明する。図1を参照して、この実施の形態の帳票処理システム100の構成について説明する。図1には、帳票処理システム100の構成例を示してある。この実施の形態の帳票処理システム100は、帳票画像入力装置102と、帳票画像処理装置104とを有している。
【0019】
図1に示すように、帳票画像入力装置102は画像入力部118を有している。この画像入力部118は、好ましくは、帳票画像入力装置102の機能である。また、この実施の形態では、帳票画像入力装置102として、スキャナ等の画像入力手段を用いて構成するのが好適である。
【0020】
帳票画像処理装置104は、帳票画像入力装置102と接続されており、かつ画像取得部120と、印影画像探索/除去部112と、文字認識部114と、画像処理データ出力部116とを含む中央処理部106、及び画像格納部108を有している。
【0021】
帳票画像処理装置104は、パソコン等のコンピュータを用いて構成されるのが好ましい。また、中央処理部106として、帳票画像処理装置104が有するCPUを用いるのが好適である。中央処理部106が有する、画像取得部120と、印影画像探索/除去部112と、文字認識部114と、画像処理データ出力部116のそれぞれは、当該中央処理部106における機能手段であり、各機能は、プログラムで実行される。尚、このプログラムは、図1には図示しない帳票画像処理装置104のメモリ(ROM等)に格納されているのが好ましい。
【0022】
また、帳票画像処理装置104の有する画像格納部108は、所望の格納手段を用いて構成される。この格納手段はROM又はRAM等のメモリとするのが望ましい。
【0023】
ここで、この実施の形態によれば、図1に示すように、帳票画像取り込み部110は、帳票画像入力装置102の画像入力部118と、帳票画像処理装置104の画像取得部120とを有している。また、図1を参照して説明したこの実施の形態の帳票処理システム100を実施するにあたり、帳票画像入力装置102と、帳票画像処理装置104とを含むOCRを用いるのが好ましい。
【0024】
2.第1の実施の形態の帳票処理システムの動作
次に、この実施の形態の帳票処理システム100の動作について説明するが、まず、この実施の形態の帳票の構成例について、図3を参照して説明する。図3には、この実施の形態の帳票300の構成例を示してある。図3に示すように、帳票300は書面であり、この書面は、銀行の小切手などのように、文字が記載された紙面等を有している。尚、この実施の形態の帳票の構成は、図3に示す帳票300の構成に限定されず、所望の書面を帳票として用いることができる。
【0025】
図3に示す帳票300のフォームは、点線枠302及び320で囲まれる領域に記載されている複数の文字と、7つの実線枠のそれぞれによって囲まれる領域304、306、308、310、312、314、及び318とによって構成されている。図3において、これら7つの実線枠のそれぞれによって囲まれる領域304、306、308、310、312、314、及び318を、それぞれ、第1の領域304、第2の領域306、第3の領域308、第4の領域310、第5の領域312、第6の領域314、第7の領域318として示してある。図3に示すように、帳票300の、第1〜第7の領域304、306、308、310、312、314、及び318のそれぞれには複数の文字が記載される。
【0026】
図1を参照して説明した帳票画像入力装置102及び帳票画像処理装置104を含むOCRを用いて帳票300に対して文字認識を行う場合、この文字認識の対象となる領域、すなわち読取対象領域が帳票300には存在する。図3に示す第1〜第7の領域304、306、308、310、312、314、及び318のそれぞれが読取対象領域と成り得るが、ここでは、第6の領域314を読取対象領域とする例について説明する。第6の領域314は、図3に示すように捺印により得られた印影316を有している。
【0027】
次に、この実施の形態の帳票処理システム100の動作について、図2を参照して説明する。図2には、この実施の形態の帳票処理システム100の動作を説明するためのフローチャートを示してある。尚、図2に示すフローチャートにおいて、各処理のステップを記号Sに番号を添えて示してある。
【0028】
ここで、この実施の形態の帳票処理システム100における帳票300に対する処理、すなわち文字認識は、帳票画像入力装置102及び帳票画像処理装置104によって行われる。以下に説明する、帳票処理システム100の動作では、帳票画像入力装置102及び帳票画像処理装置104を含むOCRを用いて帳票300に対する文字認識が行われるとする。
【0029】
(S201)まず、帳票画像入力装置102によって、帳票処理システム100への帳票300の帳票画像の入力が行われる。具体的に、この帳票画像の入力は、帳票画像入力装置102の画像入力部118が、帳票画像処理装置104に帳票300の帳票画像を入力することによって行われる。
【0030】
ここで、帳票画像は、帳票に記載された文字等の画像情報である。よって、帳票300の帳票画像には、帳票300のフォーム画像、すなわち図3に示す点線枠302及び320で囲まれる領域に記載されている複数の文字の文字画像と、同図における7つの実線枠のそれぞれによって囲まれる領域304、306、308、310、312、314、及び318の画像とが含まれている。従って、帳票300の帳票画像は、第6の領域314に捺印された印影316の画像すなわち印影画像を有している。
【0031】
また、帳票画像には、帳票300に記載された文字の色、この帳票300の第6の領域314が有する印影316の色、及び帳票300における文字や印影316の記載面そのものの色等の色情報も含まれている。
【0032】
(S202)次に、帳票画像処理装置104に入力された帳票画像は、画像取得部120が、この帳票画像を画像格納部108に格納することによって取得する。また、取得した帳票画像に対して、帳票300の読取対象領域314に相当する画像領域の指定が行われる。この指定は、以下の手順によって行われるのが好ましい。
【0033】
この実施の形態の帳票画像処理装置104には、図1に示すように、表示手段122及び入力手段124が接続されているのが好ましい。画像取得部120は、取得した帳票画像を中央処理部106から表示手段122に出力する。表示手段122は、中央処理部106から入力された帳票画像を、従来公知の手段によって表示する。表示手段122によって表示された帳票画像に対して、入力手段124が、帳票300の読取対象領域314に相当する画像領域を選択する。
【0034】
入力手段124としては、従来既知のポインティングデバイス(例えばマウス等)を用いるのが好ましく、表示手段122によって表示された帳票画像をオペレータ(人)が見ながら、入力手段124を操作するのが望ましい。前述した画像領域の選択は、従来よりよく知られているように、入力手段124が、この画像領域の位置情報を座標として、中央処理部106に出力することによって行われるのが好適である。
【0035】
入力手段124より中央処理部106に入力される、帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報は、画像取得部120が受け取って、当該帳票画像と対応させて画像格納部108に格納する。
【0036】
(S203)その後、印影画像探索/除去部112は、画像格納部108から帳票300の帳票画像を読み出して、この帳票画像に対して印影316の印影画像を探索する。このとき、印影画像探索/除去部112は、帳票300の帳票画像、及びこの帳票画像における、帳票300の読取対象領域314に相当する画像領域の位置情報を読み出す。そして、印影画像探索/除去部112は、この位置情報によって指定される帳票300の帳票画像中の画像領域を印影画像探索領域とし、この領域に対して印影316の印影画像を探索する。
【0037】
ここで、この実施の形態によれば、好ましくは、この印影画像の探索は、従来公知の印影画像探索技術のうち所望の技術を用いて行われる。従来よりよく知られている印影画像探索技術として、例えば、上記特許文献1(特開2002−123794号公報)、特許文献2(特開2002−269547号公報)、及び特許文献3(特開2002−304631号公報)にそれぞれ開示された技術がある。
【0038】
従来既知の印影画像探索技術には、印影の色彩に関する情報及び印影の形状に関する情報のいずれか一方の情報に基づいて、捺印による印影の印影画像の探索を行う技術がある。特許文献1に開示された印影画像探索技術は、印影の色彩に関する情報に基づいて捺印による印影の印影画像の探索を行う。ここで、既に説明したように、帳票画像には色情報が含まれている。特許文献1に開示された印影画像探索技術では、帳票画像の色情報、すなわち、帳票の文字の色及び印影の色のそれぞれの色情報の違いに基づいて、印影画像を探索する。
【0039】
特許文献2及び特許文献3に開示されたそれぞれの印影画像探索技術は、印影の形状に関する情報に基づいて捺印による印影の印影画像の探索を行う。特許文献2に開示の技術によれば、印影探索領域の形状と、印影の形状のそれぞれの情報に基づいて印影画像を探索する。また、特許文献3に開示の技術では、帳票上の印影探索領域に存在する印影の形状に基づいて印影画像の探索が行われる。
【0040】
この実施の形態では、好ましくは、上述した、印影の色彩に関する情報もしくは印影の形状に関する情報に基づいて行われる従来既知の印影画像探索技術を用いて、印影画像探索/除去部112によって、印影316の印影画像を探索する。印影画像の探索の結果、印影画像探索/除去部112が印影画像を検出した後、後述するステップS204の処理が行われる。
【0041】
ところで、この実施の形態の帳票処理システム100によれば、図3に示すように、捺印による印影316が形成された読取対象領域314を有する帳票300のほか、印影が無い読取対象領域を有する帳票を用いることも可能である。この読取対象領域を印影探索領域とすれば、当該帳票の帳票画像には、この印影探索領域に対応する印影画像探索領域が含まれている。この印影画像探索領域に対して、印影画像探索/除去部112が、上述したような手順に従って印影画像を探索する場合、印影画像は検出されない。このような場合、続いて、後述するステップS205の処理が行われる。
【0042】
(S204)続いて、印影画像探索/除去部112によって、帳票300の帳票画像から印影316の印影画像が除去される。印影画像探索/除去部112は、印影画像の除去を、以下に述べる従来公知の方法によって行うのが好ましい。印影画像探索/除去部112は、好ましくは、帳票300の帳票画像が有する色情報に基づいて、捺印による印影316を形成する画素のそれぞれの色を、当該帳票300における文字及び印影316の記載面(すなわち背景)の色と同一の色とすることによって行う。尚、前述した手順に従って、印影画像が除去された、帳票300の帳票画像が印影除去帳票画像である。この印影除去帳票画像は、印影316と背景が区別できない状態にされた帳票300の入力画像に相当する。この印影除去帳票画像は、印影画像探索/除去部112によって画像格納部108に格納される。
【0043】
ここで、図4に、帳票300の印影除去帳票画像400の構成例を示す。この印影除去帳票画像400は、帳票300の帳票画像と同様の構成を有する。よって、図4に示す印影除去帳票画像400について、帳票300の帳票画像と同様の構成について、重複する説明は省略する。図4に示すように、印影除去帳票画像400において、帳票300の読取対象領域314に相当する画像領域である印影画像探索領域402から印影316の印影画像は除去されており、この印影画像探索領域402には、文字認識の対象となる文字の画像が存在している。
【0044】
(S205)その後、図4を参照して説明した印影除去帳票画像400における、印影画像探索領域402と同一の領域に対して、文字認識部114によって文字認識処理が行われる。文字認識部114は、画像格納部108から印影除去帳票画像400を読み出し、この読み出した印影除去帳票画像400に対して文字認識処理を行う。
【0045】
文字認識部114による文字認識処理は、従来公知の方法に従って行われるのが好ましい。従来よりよく知られている文字認識処理は、例えば、上記特許文献1に開示されている。尚、文字認識部114は、図1には図示しないメモリに照合データを有しており、前述した文字認識処理を、この照合データと、印影画像探索領域402に含まれる文字画像の情報とを照合することによって行うのが望ましい。
【0046】
文字認識処理の結果、文字認識部114から認識結果が出力される。図4に示すように、印影除去帳票画像400の印影画像探索領域402には、次の3種類の文字画像、「金額」、「12000」、及び「円」が存在する。これらの文字画像のうち「12000」は、印影画像探索領域402において、枠画像404で囲まれる画像領域に存在する。図4に示すように、この画像領域は4つの領域404a、404b、404c、及び404dを有しており、文字画像「12000」は、領域404c中に存在する文字画像「12」、及びこの領域404cに隣接する領域404d中に存在する「000」によって構成される。
【0047】
ここでは、印影画像探索領域402において、枠画像404で囲まれる画像領域に存在する文字画像「12000」を、文字認識部114における文字認識の対象とする。このとき、文字認識部114からは、認識結果として「12000」がデータとして出力される。
【0048】
(S206)続いて、文字認識部114から出力された認識結果「12000」は、画像処理データ出力部116に入力される。画像処理データ出力部116は、入力された認識結果「12000」を出力するとともに、帳票300の帳票画像及び印影除去帳票画像400のいずれか一方もしくは双方を、画像格納部108から取り出して出力する。その後、この実施の形態における帳票処理システム100において、帳票300の読取対象領域314に対する文字認識が終了される。
【0049】
よって、この実施の形態によれば、(イ)画像処理データ出力部116から、認識結果「12000」及び帳票300の帳票画像が出力される場合、(ロ)画像処理データ出力部116から、認識結果「12000」及び印影除去帳票画像400が出力される場合、及び(ハ)画像処理データ出力部116から、認識結果「12000」と、帳票300の帳票画像及び印影除去帳票画像400が出力される場合の3つの場合がある。これら(イ)〜(ハ)の3つの場合のうち、いずれの場合を選択するかは、当業者が成し得る設計事項である。
【0050】
この実施の形態の帳票処理システム100によれば、上述したように、印影画像探索/除去部112が、帳票300の帳票画像中の印影画像を探索し、かつ除去した後、印影除去帳票画像400を用いて文字認識部114で文字認識が行われる。その結果、帳票画像入力装置102及び帳票画像処理装置104を含むOCRでは、帳票300の読取対象領域314における捺印による印影316が文字と誤って認識される事態が生じないため、文字認識を正しく行うことができる。
【0051】
また、この実施の形態によれば、帳票画像入力装置102及び帳票画像処理装置104を含むOCRでは、既に説明したように、画像処理データ出力部116から、認識結果及び印影除去帳票画像400とともに、帳票画像を得ることが可能である。従って、この実施の形態の帳票処理システム100によれば、帳票300の読取対象領域314の印影316の確認を、画像処理データ出力部116から、当該帳票300の帳票画像を得ることによって行うことも可能である。
【0052】
すなわち、この実施の形態の帳票処理システム100は、読取対象領域314に印影316を有する帳票300の帳票画像に対して文字認識を行うことができ、かつ帳票300の読取対象領域314の印影316の確認も可能な利便性の高いシステムということができる。
【0053】
[第2の実施の形態]
この発明の帳票処理システムに係る第2の実施の形態について説明する。この実施の形態では、第1の実施の形態の帳票処理システム100において、図2を参照して説明したステップS202の処理で、画像取得部120によって以下の処理が行われる。ステップS202の処理において、画像取得部120は、帳票画像処理装置104に入力された帳票画像に対して2値化処理を行った後、2値化処理がされている帳票画像である2値化帳票画像を画像格納部108に格納する。この実施の形態によれば、画像取得部120が行う2値化処理は、以下に説明する従来公知の方法であるのが好ましい。
【0054】
既に説明したように、帳票画像には色情報が含まれている。第1の実施の形態によれば、この色情報には、帳票300が有する全ての色の情報、すなわち、帳票300の文字及び印影316等の色の情報と、これら文字及び印影316等の記載面すなわち背景の色の情報が含まれている。従来よりよく知られているように、2値化処理では、帳票の記載面の色を第1の色とし、この記載面に記載されている文字及び印影等の色を第2の色として、第1の色に関する情報、及び第2の色に関する情報を帳票画像の色情報とする。
【0055】
2値化処理後、2値化帳票画像において、帳票300の文字の色と印影316の色は、同一の第2の色としてある。従って、この実施の形態によれば、図2を参照して説明したステップS203では、好ましくは、印影画像探索/除去部112は、帳票画像に対する、捺印による印影316の印影画像の探索を、この印影の形状に関する情報に基づいて行う。
【0056】
この実施の形態の帳票処理システムでは、第1の実施の形態と同様の作用及び効果を得ることができる。また、この実施の形態の帳票処理システムによれば、2値化処理を行うことによって、2値化帳票画像が有する色情報を第1及び第2の色の情報を含む情報とするため、第1の実施の形態の帳票画像と比較して、2値化帳票画像のデータ量は少なくすることができる。よって、この実施の形態の帳票処理システムでは、第1の実施の形態と比較して、画像格納部108により多くの帳票画像、及びこの帳票画像に対応する印影除去帳票画像を格納することができる。すなわち、この実施の形態の帳票処理システムは、第1の実施の形態と比較して、より多くの帳票の処理を行うことができる。従って、この実施の形態によれば、第1の実施の形態と比較して、帳票処理システムにおける帳票の処理をより効率的に行うことができる。
【0057】
[第3の実施の形態]
この発明の帳票処理システムに係る第3の実施の形態について説明する。この実施の形態によれば、第1及び第2の実施の形態の帳票処理システムにおいて、画像処理データ確認部を、帳票画像処理装置104に接続して設けてある。図5には、この実施の形態の帳票処理システム500について、帳票画像処理装置104に画像処理データ確認部126を接続してある構成を示してある。
【0058】
この画像処理データ確認部126は、画像処理データ出力部116から出力される帳票画像または印影除去帳票画像と、画像処理データ出力部116から出力される認識結果とを照合し、この認識結果の正誤について確認して確認結果を出力する。この実施の形態によれば、画像処理データ確認部126は、帳票画像処理装置104にネットワークを介して接続されるサーバを用いて構成されているのが好ましい。
【0059】
よって、この実施の形態では、第1及び第2の実施の形態と同様の作用及び効果を得ることが出来る。また、この実施の形態によれば、帳票画像処理装置104から出力される認識結果の正誤について、画像処理データ確認部126が確認する。従って、この実施の形態の帳票処理システム500では、第1及び第2の実施の形態と比較して、より正確に帳票に対する文字認識を行うことができる。
【0060】
ここで、既に説明したように、第2の実施の形態において、帳票画像処理装置104から出力される帳票画像及び印影除去帳票画像は、2値化処理された画像データであるため、第1の実施の形態と比較してデータ量が少なくなる。よって、この実施の形態の帳票処理システム500の構成が、第2の実施の形態の帳票処理システムに画像処理データ確認部126が設けられている構成である場合、第1の実施の形態の帳票処理システム100に画像処理データ確認部126が設けられている構成と比較して、帳票画像処理装置104と画像処理データ確認部126との間の、帳票画像及び印影除去帳票画像の転送速度を大きくすることができる。従って、この場合、帳票処理システム500における、帳票画像処理装置104と画像処理データ確認部126との間の、帳票画像及び印影除去帳票画像の転送を、第1の実施の形態の帳票処理システムに画像処理データ確認部126が設けられている場合と比較して、より効率的に行うことができる。
【0061】
[第4の実施の形態]
次に、この実施の形態の帳票処理システムに係る第4の実施の形態について説明する。
【0062】
1.第4の実施の形態の帳票処理システムの構成
まず、この実施の形態の帳票処理システムの構成について説明する。この実施の形態の帳票処理システムは、第1の実施の形態の帳票処理システム100と同様の構成を有している。よって、以下に説明する、この実施の形態の帳票処理システムの構成について、第1の実施の形態の帳票処理システム100と同様の構成について、重複する説明を省略することもある。
【0063】
また、この実施の形態の帳票の構成は、第1の実施の形態において、図3を参照して説明した帳票300の構成と同様の構成を有している。よって、この実施の形態の帳票の構成について、第1の実施の形態と重複する説明は省略する。
【0064】
図6を参照して、この実施の形態の帳票処理システム600の構成について説明する。図6には、帳票処理システム600の構成例を示してある。
【0065】
この実施の形態の帳票処理システム600において、図6に示すように、帳票画像入力装置202は、画像入力部218及び画像取得部220を含む帳票画像取り込み部210と、取得画像データ格納部226とを有している。帳票画像取り込み部210において、画像入力部218は、好ましくは、スキャナ等の画像入力手段を用いて構成するのが好適である。また、帳票画像取り込み部210の画像取得部220は、パソコン等のコンピュータにおける中央処理装置(CPU)が果たす機能手段である。取得画像データ格納部226は、画像取得部220をCPUの機能として有するコンピュータに設けられているメモリ(ROM又はRAM等)によって構成されるか、もしくは、それ自体が独立した格納手段(例えばROM又はRAM等で構成されるメモリ)として構成されるのが望ましい。ここで、この実施の形態の帳票画像入力装置202の構成について、以下の説明では、便宜上、画像取得部220を機能手段として動作するCPUと、取得画像データ格納部226とは、同一のコンピュータに設けられているとする。
【0066】
また、帳票画像処理装置204は、帳票画像入力装置202と、例えばネットワーク等を介して接続されており、かつ印影画像探索/除去部212と、文字認識部114と、画像処理データ出力部116とを含む中央処理部206と、画像格納部208とを有している。
【0067】
帳票画像処理装置204は、パソコン等のコンピュータを用いて構成されるのが好ましい。また、中央処理部206として、帳票画像処理装置204が有するCPUを用いるのが好適であり、中央処理部206が有する、印影画像探索/除去部212と、文字認識部114と、画像処理データ出力部116のそれぞれは、当該中央処理部206における機能手段であり、各機能は、プログラムで実行される。尚、このプログラムは、図6には図示しない帳票画像処理装置204のメモリ(ROM等)に格納されているのが好ましい。
【0068】
また、画像格納部208は、第1の実施の形態の画像格納部108と同様、所望の格納手段を用いて構成される。この格納手段はROM又はRAM等のメモリとするのが望ましい。さらに、この実施の形態の帳票処理システム600を実施するにあたり、第1の実施の形態と同様、帳票画像入力装置202と、帳票画像処理装置204とを含む構成をOCRとするのが好ましい。
【0069】
2.第4の実施の形態の帳票処理システムの動作
次に、この実施の形態の帳票処理システム600の動作について説明する。この実施の形態では、図3に示す帳票300に対して、帳票画像入力装置202及び帳票画像処理装置204を有するOCRによって、文字認識が行われるとする。よって、図3を参照して説明した帳票300の構成について、重複する説明は省略する。
【0070】
また、この実施の形態の帳票300に対する文字認識では、図2を参照して説明した、第1の実施の形態の処理と同様の処理が行われるのが好ましい。よって、この実施の形態における帳票300に対する文字認識についても、図2に示すフローチャートを参照して説明する。尚、この実施の形態の帳票300に対する文字認識の処理について、第1の実施の形態における処理と重複する説明は省略する。
【0071】
(S201)まず、この実施の形態によれば、帳票画像入力装置202において、帳票処理システム600への帳票300の帳票画像の入力が、画像入力部218によって行われる。画像入力部218は、好ましくは、帳票300の帳票画像を、画像取得部220を機能手段として有するCPUが設けられたコンピュータに入力する。尚、帳票300の帳票画像について、第1の実施の形態と重複する説明は省略する。
【0072】
(S202)次に、画像取得部220は、画像入力部218から入力される帳票300の帳票画像を取得画像データ格納部226に格納することによって取得する。
【0073】
ここで、この実施の形態の帳票画像入力装置202には、図6に示すように、表示手段222及び入力手段224が接続されているのが好ましい。これら表示手段222及び入力手段224は、第1の実施の形態において、図1を参照して説明した表示手段122及び入力手段124と同様の構成及び動作を有するのが望ましい。尚、表示手段222及び入力手段224の、帳票画像入力装置202への接続は、これら表示手段222及び入力手段224を、画像取得部220を機能手段として有するCPUが設けられたコンピュータに接続することによって行われるのが好適である。
【0074】
そして、この実施の形態によれば、取得した帳票画像に対して、帳票300の読取対象領域314に相当する画像領域の指定が、表示手段222、入力手段224、及び画像取得部220のそれぞれによって、第1の実施の形態と同様の手順で行われるのが好ましい。この実施の形態では、入力手段224から、画像取得部220を機能手段として有するCPUが設けられたコンピュータに、帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報が入力される。この位置情報は、画像取得部220が、当該帳票画像と対応させて取得画像データ格納部226に格納する。
【0075】
しかる後、画像取得部220は、帳票300の帳票画像と、この帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報とを、取得画像データ格納部226から取り出す。そして、画像取得部220は、これら帳票画像及び位置情報を、帳票画像処理装置204に出力する。
【0076】
(S203)その後、帳票画像処理装置204に入力された、帳票300の帳票画像と、この帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報は、中央処理部206を介して画像格納部208に格納される。続いて、印影画像探索/除去部212によって、第1の実施の形態と同様の手順によって、印影画像探索領域に対する印影316の印影画像の探索が行われる。
【0077】
そして、第1の実施の形態と同様、印影画像の探索の結果、印影画像探索/除去部212が印影画像を検出した後、後述するステップS204の処理が行われる。
【0078】
また、この実施の形態の帳票処理システム600においても、図3に示すように、捺印による印影316が存在する読取対象領域314を有する帳票300のほか、捺印による印影が無い読取対象領域を有する帳票を用いることも可能である。この場合、第1の実施の形態において既に説明したように、上述した印影画像の探索では印影画像は検出されず、従って、後述するステップS205の処理が続いて行われる。
【0079】
(S204)その後、印影画像探索/除去部212によって、第1の実施の形態と同様の手順によって、印影316の印影画像の除去が行われる。第1の実施の形態と同様、印影除去帳票画像400は、印影画像探索/除去部212によって画像格納部208に格納される。尚、印影除去帳票画像400について、第1の実施の形態と重複する説明は省略する。
【0080】
(S205)続いて、文字認識部114によって、第1の実施の形態と同様の手順によって、図4に示す印影画像探索領域402に対する文字認識処理が行われ、当該文字認識部114から認識結果が出力される。
【0081】
(S206)しかる後、画像処理データ出力部116は、第1の実施の形態と同様の手順によって、帳票画像及び印影除去帳票画像のいずれか一方もしくは双方を画像格納部208から取り出して出力するとともに、文字認識部114から入力される認識結果を出力する。その後、この実施の形態における帳票処理システムにおいて、帳票300の読取対象領域314に対する文字認識が終了される。尚、この実施の形態によれば、画像処理データ出力部116におけるデータの出力について、第1の実施の形態と同様、既に説明した(イ)〜(ロ)の3つの場合があり得るが、これら(イ)〜(ロ)の3つの場合のいずれを選択するかは、当業者が成し得る設計事項である。
【0082】
従って、以上説明したこの実施の形態の帳票処理システムによれば、第1の実施の形態の帳票処理システムと同様の作用により、同様の効果を得ることができる。
【0083】
[第5の実施の形態]
この発明の帳票処理システムに係る第5の実施の形態について説明する。この実施の形態では、第4の実施の形態の帳票処理システム600において、図2を参照して説明したステップS202の処理で、画像取得部220によって2値化処理が行われる。画像取得部220は、この2値化処理を、第2の実施の形態で説明した手順と同様の手順によって行うのが好ましい。尚、この実施の形態における2値化処理について、第2の実施の形態と同様の説明は省略する。
【0084】
この実施の形態によれば、2値化処理は、画像入力部218から入力される帳票画像に対して行われ、2値化帳票画像は、画像取得部220によって取得画像データ格納部226に格納される。その後、ステップS202の処理において、画像取得部220は、2値化帳票画像と、この2値化帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報とを、取得画像データ格納部226から取り出して、これら帳票画像と位置情報とを帳票画像処理装置204に出力する。
【0085】
また、この実施の形態では、図2を参照して説明したステップS203の処理において、帳票画像処理装置204に入力された、2値化帳票画像と、この2値化帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報は、中央処理部206を介して画像格納部208に格納される。そして、印影画像探索/除去部212は、画像格納部208から、2値化帳票画像、及びこの2値化帳票画像の、帳票300の読取対象領域314に相当する画像領域の位置情報を読みだして、2値化帳票画像に対する印影316の印影画像の探索を、印影の形状に関する情報に基づいて行う。
【0086】
従って、この実施の形態の帳票処理システムでは、第4の実施の形態と同様の作用及び効果を得ることができる。また、既に説明したように、2値化帳票画像のデータ量は、2値化処理が成されていない帳票画像のデータ量、すなわち第4の実施の形態の帳票画像のデータ量と比較して少なくなる。よって、既に説明した第2の実施の形態と同様、第4の実施の形態と比較して、画像格納部208により多くの帳票画像及び印影除去帳票画像を格納することができ、その結果、この実施の形態の帳票処理システムは、第4の実施の形態よりも多くの帳票の処理を行うことができる。従って、この実施の形態によれば、第4の実施の形態と比較して、帳票処理システムにおける帳票の処理をより効率的に行うことができる。
【0087】
[第6の実施の形態]
この発明の帳票処理システムに係る第6の実施の形態について説明する。この実施の形態によれば、第4及び第5の実施の形態の帳票処理システムにおいて、画像処理データ確認部を、帳票画像処理装置204に接続して設けてある。図7には、この実施の形態の帳票処理システム700について、帳票画像処理装置204に画像処理データ確認部260を接続してある構成を示してある。この画像処理データ確認部260は、図5を参照して説明した、第3の実施の形態の画像処理データ確認部126と同様の構成及び動作を有するのが好ましい。よって、この実施の形態の画像処理データ確認部260について、第3の実施の形態と重複する説明は省略する。
【0088】
従って、この実施の形態では、第4及び第5の実施の形態と同様の作用及び効果を得ることができる。また、この実施の形態では、帳票画像処理装置204から出力される認識結果の正誤について、画像処理データ確認部260が確認するため、第4及び第5の実施の形態と比較して、より正確に帳票に対する文字認識を行うことができる。
【0089】
また、上述したように、2値化帳票画像のデータ量は、2値化処理が成されていない帳票画像のデータ量と比較して少なくなる。よって、この実施の形態の帳票処理システムの構成が、第5の実施の形態の帳票処理システムに画像処理データ確認部260が設けられている構成である場合、第4の実施の形態の帳票処理システム600に画像処理データ確認部260が設けられている構成と比較して、帳票画像処理装置204と画像処理データ確認部260との間の、帳票画像及び印影除去帳票画像の転送速度を大きくすることができる。従って、この場合、帳票処理システム700における、帳票画像処理装置204と画像処理データ確認部260との間の、帳票画像及び印影除去帳票画像の転送を、第4の実施の形態の帳票処理システム600に画像処理データ確認部260が設けられている場合と比較して、より効率的に行うことができる。
【0090】
[第7の実施の形態]
次に、この発明の帳票処理システムに係る第7の実施の形態について説明する。この実施の形態によれば、第4〜第6の実施の形態の帳票処理システムにおいて、帳票画像入力装置202にも、印影画像探索/除去部と、文字認識部と、画像処理データ出力部と、画像格納部が設けられている。これら印影画像探索/除去部と、文字認識部と、画像処理データ出力部と、画像格納部のそれぞれは、図6及び図7を参照して説明した、印影探索/除去部212と、文字認識部114と、画像処理データ出力部116と、画像格納部208のそれぞれと同様の構成及び機能を有する。
【0091】
この実施の形態によれば、帳票画像入力装置において、好ましくは、印影画像探索/除去部と、文字認識部と、画像処理データ出力部は、画像取得部220とともに、コンピュータのCPUの機能手段として設けられている。そして、このコンピュータのメモリ(ROM又はRAM等)として、画像格納部が、帳票画像入力装置に設けられているのが望ましい。この場合、画像格納部と取得画像データ格納部226とは同一のメモリを用いて構成されてもよいし、それぞれが独立した格納手段(例えばROM又はRAM等で構成されるメモリ)として構成されてもよい。
【0092】
上述したように、同一のコンピュータに、画像取得部220と、印影画像探索/除去部と、文字認識部と、画像処理データ出力部とを含むCPUと、画像格納部とが設けられる場合、このコンピュータは、図1を参照して説明した帳票画像処理装置104と同様の構成となり、かつ同様の機能を有することとなる。
【0093】
従って、この実施の形態によれば、第4〜第6の実施の形態と同様の作用及び効果を得ることができる。さらに、上述したように、この実施の形態の帳票処理システムでは、帳票画像入力装置を、第1の実施の形態の帳票画像処理装置104と同様の構成及び機能を有するコンピュータを含む構成とすることができる。また、既に説明したように、この帳票画像入力装置は、帳票画像処理装置204に接続されている。よって、この実施の形態によれば、帳票画像入力装置及び帳票画像処理装置204のそれぞれにおいて、既に説明したような帳票処理を行うことができる。その結果、この実施の形態の帳票処理システムでは、第4〜第6の実施の形態と比較して、帳票処理の効率をさらに向上させることができる。
【0094】
【発明の効果】
上述したこの発明の帳票処理システムでは、印影画像探索/除去部が、帳票画像中の、帳票の読取対象領域に相当する画像領域に存在する、捺印による印影の印影画像を探索し、かつ除去した後、印影除去帳票画像を用いて文字認識部で文字認識が行われる。その結果、以上説明したこの発明の帳票処理システムにおいて、OCRを用いて文字認識を行う場合も、帳票の読取対象領域の捺印による印影が文字と誤って認識される事態が生じないため、文字認識を正しく行うことができる。
【0095】
また、この発明の帳票処理システムでは、画像処理データ出力部から、認識結果及び印影除去帳票画像とともに、帳票画像を得ることが可能である。従って、この発明の帳票処理システムによれば、帳票の読取対象領域の捺印による印影の確認を、画像処理データ出力部から、当該帳票に対応する帳票画像を得ることによって行うことも可能である。すなわち、この発明の帳票処理システムは、読取対象領域に捺印による印影を有する帳票の帳票画像に対して文字認識を行うことができ、かつ帳票の読取対象領域の捺印による印影の確認も可能な利便性の高いシステムということができる。
【図面の簡単な説明】
【図1】第1の実施の形態の帳票処理システムの構成例を説明するための図である。
【図2】この発明の帳票処理システムにおける帳票処理を説明するためのフローチャートを示す図である。
【図3】この発明の帳票処理システムにおける帳票の構成例を説明するための図である。
【図4】この発明の帳票処理システムにおける印影除去帳票画像の構成例を説明するための図である。
【図5】第3の実施の形態の帳票処理システムの構成例を説明するための図である。
【図6】第4の実施の形態の帳票処理システムの構成例を説明するための図である。
【図7】第6の実施の形態の帳票処理システムの構成例を説明するための図である。
【符号の説明】
100、500、600、700:帳票処理システム
102、202:帳票画像入力装置
104、204:帳票画像処理装置
106、206:中央処理部
108、208:画像格納部
110、210:帳票画像取り込み部
112、212:印影画像探索/除去部
114:文字認識部
116:画像処理データ出力部
118、218:画像入力部
120、220:画像取得部
122、222:表示手段
124、224:入力手段
126、260:画像処理データ確認部
226:取得画像データ格納部
300:帳票
304:第1の領域
306:第2の領域
308:第3の領域
310:第4の領域
312:第5の領域
314:第6の領域
316:印影
318:第7の領域
400:印影除去帳票画像
402:印影画像探索領域
404:枠画像
Claims (14)
- 捺印された印影を含む読取対象領域を有する帳票から帳票画像の取り込みを行う帳票画像取り込み部と、
取り込まれた前記帳票画像中に存在する、前記印影の印影画像を探索し、かつ該印影画像の除去を行う印影画像探索/除去部と、
前記帳票画像取り込み部から前記帳票画像が格納されるとともに、前記帳票画像から前記印影画像が除去されている印影除去帳票画像が、前記印影画像探索/除去部より格納される画像格納部と、
該画像格納部から読み出した前記印影除去帳票画像中の、前記帳票の読取対象領域に相当する画像領域に対して文字認識処理を行って認識結果を出力する文字認識部と、
前記帳票画像及び前記印影除去帳票画像のいずれか一方もしくは双方を前記画像格納部から取り出して出力するとともに前記文字認識部から入力される認識結果を出力する画像処理データ出力部と
を具えることを特徴とする帳票処理システム。 - 請求項1に記載の帳票処理システムにおいて、
前記帳票画像取り込み部は、画像入力部と画像取得部とを有していて、
前記画像入力部から入力される前記帳票画像を、前記画像取得部を介して前記画像格納部に格納することによって、前記帳票画像の取り込みを行う構成としてあるとともに、
前記印影画像探索/除去部は、前記画像格納部から前記帳票画像を読み出して、前記印影画像の探索及び除去を行うこと
を特徴とする帳票処理システム。 - 請求項2に記載の帳票処理システムにおいて、
前記印影画像探索/除去部は、前記印影画像の探索及び除去を、前記印影の形状に関する情報もしくは前記印影の色彩に関する情報に基づいて行うこと
を特徴とする帳票処理システム。 - 請求項2に記載の帳票処理システムにおいて、
前記画像取得部は、前記画像入力部から入力される前記帳票画像に対して2値化処理を行って2値化帳票画像を出力し、
及び前記印影画像探索/除去部は、前記2値化帳票画像に対して、前記印影画像の探索及び除去を、前記印影の形状に関する情報に基づいて行うこと
を特徴とする帳票処理システム。 - 請求項1〜4のいずれか一項に記載の帳票処理システムにおいて、
前記画像処理データ出力部から出力される、前記帳票画像または前記印影除去帳票画像と、前記画像処理データ出力部から出力される前記認識結果とを照合し、該認識結果の正誤について確認して確認結果を出力する画像処理データ確認部が設けられていること
を特徴とする帳票処理システム。 - 請求項2〜4のいずれか一項に記載の帳票処理システムにおいて、
前記画像入力部を含む帳票画像入力装置と、
該帳票画像入力装置に接続される帳票画像処理装置とを具え、
該帳票画像処理装置は、
前記画像取得部と、前記印影画像探索/除去部と、前記文字認識部と、前記画像処理データ出力部とを含む中央処理部、及び前記画像格納部を有すること
を特徴とする帳票処理システム。 - 請求項1〜4のいずれか一項に記載の帳票処理システムにおいて、
前記帳票画像取り込み部を含む帳票画像入力装置と、
該帳票画像入力装置に接続される帳票画像処理装置とを具え、
該帳票画像処理装置は、
前記印影画像探索/除去部と、前記文字認識部と、前記画像処理データ出力部とを含む中央処理部、及び前記画像格納部を有すること
を特徴とする帳票処理システム。 - 請求項7に記載の帳票処理システムにおいて、
前記帳票画像入力装置に、さらに、
前記印影画像探索/除去部と構成及び機能が同一の他の印影画像探索/除去部、
前記文字認識部と構成及び機能が同一の他の文字認識部、
前記画像処理データ出力部と構成及び機能が同一の他の画像処理データ出力部、
及び前記画像格納部と構成及び機能が同一の他の画像格納部
を設けてあることを特徴とする帳票処理システム。 - 請求項6〜8のいずれか一項に記載の帳票処理システムにおいて、
前記画像処理データ出力部から出力される、前記帳票画像または前記印影除去帳票画像と、前期画像処理データ出力部から出力される前記認識結果とを照合し、該認識結果の正誤について確認して確認結果を出力する画像処理データ確認部が、前記帳票画像処理装置に接続して設けられていること
を特徴とする帳票処理システム。 - 帳票画像取り込み部と、印影画像探索/除去部と、画像格納部と、文字認識部と、画像処理データ出力部とを具える帳票処理システムにおいて帳票処理を行うにあたり、
(a)前記帳票画像取り込み部によって、捺印された印影を含む読取対象領域を有する帳票から帳票画像を入力させて、入力された該帳票画像を前記画像格納部へ格納することによって、帳票画像の取り込みを行い、
(b)前記印影画像探索/除去部によって、取り込まれた前記帳票画像中に存在する、前記印影の印影画像を探索し、かつ該印影画像を除去するとともに、前記帳票画像から前記印影画像が除去されている印影除去帳票画像を前記画像格納部に格納し、
(c)前記文字認識部によって、前記画像格納部から前記印影除去帳票画像を読み出し、かつ該読み出した前記印影除去帳票画像中の、前記帳票の読取対象領域に相当する画像領域に対して文字認識処理を行って認識結果を出力し、
(d)前記画像処理データ出力部によって、前記帳票画像及び前記印影除去帳票画像のいずれか一方もしくは双方を前記画像格納部から取り出して出力するとともに、前記文字認識部から入力される認識結果を出力すること
を特徴とする帳票処理方法。 - 請求項10に記載の帳票処理方法において、
前記帳票画像取り込み部に、画像入力部と画像取得部とを設けておいて、
前記帳票画像の取り込みを、前記画像入力部から前記帳票処理システムに前記帳票画像を入力し及び該入力された前記帳票画像を前記画像取得部を介して前記画像格納部に格納することによって行い、及び
前記印影画像の探索及び除去を、前記画像格納部から読み出された前記帳票画像について行うこと
を特徴とする帳票処理方法。 - 請求項11に記載の帳票処理方法において、
前記印影画像の探索及び除去を、前記印影の形状に関する情報もしくは前記印影の色彩に関する情報に基づいて行うこと
を特徴とする帳票処理方法。 - 請求項11に記載の帳票処理方法において、
前記画像取得部によって、前記画像入力部から入力される前記帳票画像に対して2値化処理を行って2値化帳票画像を前記画像格納部に格納し、及び
前記印影画像の探索及び除去を、前記2値化帳票画像に対して、前記印影の形状に関する情報に基づいて、行うこと
を特徴とする帳票処理方法。 - 請求項10〜13のいずれか一項に記載の帳票処理方法において、
予め、前記帳票処理システムに画像処理データ確認部を設けておいて、
該画像処理データ確認部において、前記(d)の処理の後、前記画像処理データ出力部から出力される、前記帳票画像または前記印影除去帳票画像と、前記画像処理データ出力部から出力される前記認識結果とを照合し、該認識結果の正誤について確認して確認結果を出力すること
を特徴とする帳票処理方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003071943A JP2004280530A (ja) | 2003-03-17 | 2003-03-17 | 帳票処理システム及び帳票処理方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003071943A JP2004280530A (ja) | 2003-03-17 | 2003-03-17 | 帳票処理システム及び帳票処理方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004280530A true JP2004280530A (ja) | 2004-10-07 |
Family
ID=33288259
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003071943A Withdrawn JP2004280530A (ja) | 2003-03-17 | 2003-03-17 | 帳票処理システム及び帳票処理方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2004280530A (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2010073540A1 (en) * | 2008-12-26 | 2010-07-01 | Hitachi Software Engineering Co., Ltd. | Business document processor |
| JP2019149073A (ja) * | 2018-02-28 | 2019-09-05 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置 |
| JP2021099752A (ja) * | 2019-12-23 | 2021-07-01 | キヤノン株式会社 | 画像を処理するための装置、プログラム、画像処理方法 |
| CN114782968A (zh) * | 2022-03-31 | 2022-07-22 | 上海云从企业发展有限公司 | 表格识别方法、装置及电子设备 |
-
2003
- 2003-03-17 JP JP2003071943A patent/JP2004280530A/ja not_active Withdrawn
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2010073540A1 (en) * | 2008-12-26 | 2010-07-01 | Hitachi Software Engineering Co., Ltd. | Business document processor |
| JP2010157107A (ja) * | 2008-12-26 | 2010-07-15 | Hitachi Software Eng Co Ltd | 業務文書処理装置 |
| CN102171708A (zh) * | 2008-12-26 | 2011-08-31 | 日立系统解决方案有限公司 | 商业文档处理器 |
| JP2019149073A (ja) * | 2018-02-28 | 2019-09-05 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置 |
| JP2021099752A (ja) * | 2019-12-23 | 2021-07-01 | キヤノン株式会社 | 画像を処理するための装置、プログラム、画像処理方法 |
| JP7433887B2 (ja) | 2019-12-23 | 2024-02-20 | キヤノン株式会社 | 画像を処理するための装置、プログラム、画像処理方法 |
| CN114782968A (zh) * | 2022-03-31 | 2022-07-22 | 上海云从企业发展有限公司 | 表格识别方法、装置及电子设备 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI606406B (zh) | 從成像檔案擷取正文之方法、設備以及有形電腦可讀儲存媒體 | |
| AU2017410934B2 (en) | Detecting orientation of textual documents on a live camera feed | |
| US9916499B2 (en) | Method and system for linking printed objects with electronic content | |
| CN112070649B (zh) | 一种去除特定字符串水印的方法及系统 | |
| JP3602596B2 (ja) | ドキュメントファイリング装置および方法 | |
| CN110807454B (zh) | 基于图像分割的文字定位方法、装置、设备及存储介质 | |
| TWI751426B (zh) | 影像處理系統、影像處理方法及程式產品 | |
| CN112749606A (zh) | 一种文本定位方法和装置 | |
| US20060285748A1 (en) | Document processing device | |
| JP2004280530A (ja) | 帳票処理システム及び帳票処理方法 | |
| JP4936250B2 (ja) | 書込み抽出方法、書込み抽出装置および書込み抽出プログラム | |
| JP2000029983A (ja) | 文書読取装置 | |
| CN115376139B (zh) | 基于ocr高速图像识别的标签采集分析系统 | |
| TW202117589A (zh) | 表單內容辨識系統及其方法 | |
| JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
| JP3090070B2 (ja) | 帳票識別方法及び装置 | |
| JPH10222587A (ja) | 帳票類の自動判別方法及び装置 | |
| JPH11184965A (ja) | 帳票識別登録装置 | |
| CN105809161A (zh) | 医用胶片数字id的光学识读方法 | |
| JP2006330873A (ja) | 指紋照合装置、方法およびプログラム | |
| JP4188344B2 (ja) | 指紋照合装置、方法およびプログラム | |
| Chazalon et al. | Improving document matching performance by local descriptor filtering | |
| JP3756660B2 (ja) | 画像認識方法、装置および記録媒体 | |
| CN116189182A (zh) | 一种车辆识别码的识别方法、系统、电子设备及存储介质 | |
| CN117636362A (zh) | 一种多模态信息标注的方法、装置、设备和存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060606 |