[go: up one dir, main page]

JP2010009410A - ビデオコーディングシステム、区分システム、コーディング方法、および、区分方法 - Google Patents

ビデオコーディングシステム、区分システム、コーディング方法、および、区分方法 Download PDF

Info

Publication number
JP2010009410A
JP2010009410A JP2008169314A JP2008169314A JP2010009410A JP 2010009410 A JP2010009410 A JP 2010009410A JP 2008169314 A JP2008169314 A JP 2008169314A JP 2008169314 A JP2008169314 A JP 2008169314A JP 2010009410 A JP2010009410 A JP 2010009410A
Authority
JP
Japan
Prior art keywords
information
image
recognition
paper sheet
classification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008169314A
Other languages
English (en)
Inventor
Toshiyuki Tanaka
利之 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008169314A priority Critical patent/JP2010009410A/ja
Priority to EP09005124A priority patent/EP2138952A3/en
Priority to KR1020090034086A priority patent/KR20100002091A/ko
Priority to US12/465,363 priority patent/US20090324105A1/en
Publication of JP2010009410A publication Critical patent/JP2010009410A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】オペレータが打鍵入力した打鍵情報あるいはオンラインOCRによる認識結果が正しいか否かを実際に当該紙葉類に記載されている区分情報に基づいて判定でき、単純にデータベースと比較するだけでは発見できない誤打鍵あるいは誤認識などが判定可能となり、誤打鍵あるいは誤認識の低減を図れるビデオコーディングシステム、区分システム、ビデオコーディング方法および区分方法を提供する。
【解決手段】オフラインOCR3は、分配装置21から紙葉類の画像とともに、オペレータがVCD22で打鍵入力した打鍵情報あるいはオンラインOCR11による認識結果などの情報が与えられた場合、それらの外部から与えられた情報が認識結果であるとして想定して当該紙葉類の画像に対する認識処理を行うことにより、外部から与えられた情報が当該紙葉類の画像に対する区分情報の認識処理結果として認められるか否かを判定するベリファイ処理を行う。
【選択図】 図1

Description

本発明は、たとえば、紙葉類に記載されている住所情報などの区分情報を文字認識処理により認識する文字認識装置とオペレータが区分情報を打鍵入力する端末装置とを具備するビデオコーディングシステム、および、上記ビデオコーディングシステムにより特定される区分情報に基づいて紙葉類を区分する区分システムなどに関する。
従来、紙葉類に記載されている住所情報をコーディングするビデオコーディングシステムには、オペレータのキーボード等により打鍵した結果が住所データベースの情報と一致するか否かを判定するものがある(たとえば、特許文献1)。この特許文献1には、オペレータが打鍵した結果に基づいて、文字認識処理(オフラインOCRによる認識処理)の認識階層を絞り込み、絞り込んだ認識階層に対応して限定した辞書データを作成し、文字認識処理の認識性能の向上を図るものである。
しかしながら、特許文献1では、オペレータが打鍵した情報が正しいかどうかは、打鍵結果と住所データベースの情報とのマッチングでのみ判定される。つまり、特許文献1では、打鍵結果と実際に紙葉類の画像に存在している住所情報との比較はされていない。言い換えれば、特許文献1では、打鍵結果が住所データベースの情報と一致すれば、当該打鍵結果が実際に紙葉類に記載されている情報と異なっている場合であっても、打鍵結果を正しい住所情報として採用してしむことがある。
また、特許文献1では、打鍵結果と住所データベースの情報とが不一致となった場合、オフラインOCRによる認識処理を行う点が記載されている。しかしながら、特許文献1では、オペレータの打鍵結果の大部分が正しいという前提に立っている。このため、特許文献1に記載のオフラインOCRによる認識処理では、打鍵結果における誤打鍵を発見することが難しいと考えられる。
さらに、ビデオコーディングシステムでは、オペレータによるキーボードの打鍵を効率させる目的で、住所情報に用いられる単語のうち特定の単語を特殊キーに割り当てているようなこともある。たとえば、予め都市名あるいは町名などが特殊キーに割り当てているような形態が考えられる。このような形態では、特殊キーに割り当てられている町名などの単語自体は正しく入力されても、特殊キーの選択そのものが間違っている場合がありうる。このような場合、オペレータによる打鍵結果と住所データベースの情報とが完全に一致してしまうため、当該打鍵結果が実際に当該紙葉類に記載されている住所情報とは異なっていても、その打鍵結果が住所情報として採用されてしまう。
特開2000−99633号公報
この発明の一形態としては、画像に含まれる区分情報を確実に特定することができるビデオコーディングシステム、区分システム、ビデオコーディング方法および区分方法を提供することを目的とする。
この発明の一形態としてのビデオコーディングシステムは、画像に含まれている区分情報を特定するものにおいて、文字で表現されている区分情報が含まれている画像を蓄積する蓄積部と、前記蓄積部に蓄積されている画像に含まれている区分情報らしい情報が外部から与えられた場合、前記外部から与えられた区分情報らしい情報が認識結果であると想定して当該画像に対して文字認識処理を行うにより、前記打鍵情報が当該画像に含まれる区分情報として正しいか否かを確認する認識部とを有する。
この発明の一形態としての区分システムは、紙葉類に付与されている区分情報に基づいて紙葉類を区分するものにおいて、区分情報が付与されている紙葉類の画像を読取るスキャナと、前記スキャナにより読取った紙葉類の画像に対して区分情報の認識処理を行う第1の認識部と、前記第1の認識部により区分情報が認識できなかった紙葉類の画像を蓄積する蓄積部と、前記蓄積部に蓄積された紙葉類の画像に基づいて当該紙葉類の区分情報を打鍵入力させるための端末部と、前記端末部により打鍵入力された打鍵情報が認識結果であると想定して前記紙葉類の画像に対して区分情報の認識処理を行うにより、前記打鍵情報が当該紙葉類に付与されている区分情報として正しいか否かを確認する第2の認識部とを有する。
この発明の一形態としてのビデオコーディング方法は、画像に含まれている区分情報を特定するビデオコーディングシステムに用いられる方法であって、文字で表現されている区分情報が含まれている画像を蓄積し、前記蓄積されている画像に含まれている区分情報らしい情報が外部から与えられた場合、前記外部から与えられた区分情報らしい情報が認識結果であると想定して当該画像に対して文字認識処理を行うにより、前記打鍵情報が当該画像に含まれる区分情報として正しいか否かを確認する。
この発明の一形態としての区分方法は、紙葉類に付与されている区分情報に基づいて紙葉類を区分する区分システムに用いられる方法であって、区分情報が付与されている紙葉類の画像を読取り、前記読取った紙葉類の画像に対して区分情報の認識処理を行い、前記区分情報が認識できなかった紙葉類の画像を蓄積し、前記蓄積された紙葉類の画像に基づいて当該紙葉類の区分情報を打鍵入力させ、前記打鍵入力された打鍵情報が認識結果であると想定して前記紙葉類の画像に対して区分情報の認識処理を行うにより、前記打鍵情報が当該紙葉類に付与されている区分情報として正しいか否かを確認する。
この発明の一形態によれば、紙葉類に付与されている区分情報を確実に特定することができるビデオコーディングシステム、区分システム、ビデオコーディング方法および区分方法を提供できる。
以下、この発明を実施するための最良の形態について図面を参照して説明する。
図1は、この発明の実施の形態に係わる区分システムの概略構成を示す図である。
この区分システムは、図1に示すように、区分機1、VCS(ビデオコーディングシステム)2およびオフラインOCR(第2の認識部)3などにより構成されている。なお、図1に示す区分システムの例では、第1面に区分先を示す情報(区分情報)としての数字あるいは文字などが付与されている紙葉類を区分するシステムであるものとする。たとえば、上記区分システムの適用例としては、住所および宛名などが記載された郵便物を住所情報に基づいて区分するシステムなどが想定される。
上記区分機1は、紙葉類に付与されている区分先を示す情報(区分情報、宛先情報)に基づいて紙葉類を区分処理するものである。上記区分機1は、紙葉類に付与されている区分情報を認識するためのオンラインOCR(第1の認識部)11を有している。上記区分機1は、オンラインOCR11により区分情報が認識できた紙葉類を当該区分情報に基づいて区分する。
また、上記VCS2は、上記区分機1において区分情報が特定できなかった紙葉類の区分情報のコーディング処理を行うシステムである。上記VCS2は、分配装置(画像蓄積分配装置)21および複数のビデオコーディングディスク(VCD)22を有している。上記分配装置21は、区分情報が特定できなかった紙葉類の画像などの情報を蓄積する機能、蓄積している紙葉類の画像などの情報を各VCD22あるいはオフラインOCR3に分配する機能、各VCD22あるいはオフラインOCR3から供給される区分情報などの情報を区分機1へ送信する機能などを有している。また、上記各VCD22は、オペレータがキーボードにより紙葉類の区分情報を打鍵入力するための装置である。上記各VCD22は、分配装置21から与えられた紙葉類の画像を表示部に表示した状態において、オペレータによる区分情報の打鍵入力を受け付ける。
上記オフラインOCR3は、第2の認識部あるいは認識部として機能するものである。上記オフラインOCR3は、上記区分機1に設けられているオンラインOCR11とは異なる認識アルゴリズムにより紙葉類の画像から区分情報を認識する処理を行うものである。上記オフラインOCR3は、上記VCS2の分配装置21などに接続されている。上記オフラインOCR3は、上記VCS2の分配装置21から与えられる紙葉類の画像に対して区分情報の認識処理を実行し、その認識処理の結果を上記分配装置21へ返すようになっている。
まず、上記区分機1内の構成について説明する。
図1に示す構成例では、区分機1は、オンラインOCR11、供給部12、スキャナ13、バーコードリーダ(BCR)14、バーコードライタ(BCW)15、区分部16、辞書データベース(DB)17および制御部18などを有している。また、上記区分機1には、オペレータが種々の操作指示を入力するための図示しないオペレーションパネルなども設けられている。
上記オンラインOCR11は、第1の認識部として機能するものである。上記オンラインOCR11は、供給された紙葉類の画像から紙葉類の区分情報を認識するものである。上記辞書データベース17は、区分情報としての住所情報などの辞書データを格納しているものである。上記制御部18は、本区分機1全体の制御を司るものである。上記制御部18は、CPU、メモリ及び各種インターフェースにより構成される。上記制御部18は、メモリに記憶されているプログラムをCPUが実行することにより、当該区分機1における種々の制御を実現している。たとえば、上記制御部18は、上記各部を制御することにより紙葉類に記載されている区分情報に基づいて紙葉類を区分する制御を行う。以下、各部について詳細に説明する。
上記オンラインOCR11には、スキャナ13が紙葉類から読み取った画像(紙葉類の画像、書状画像)が供給される。紙葉類の画像が供給されると、上記オンラインOCR11は、紙葉類の画像から宛先領域を検出し、その宛先領域から区分情報となる文字を切り出して文字認識を行い、辞書データベース17に記憶されている辞書データと比較してマッチング法などによって区分情報の認識を行う。また、上記オンラインOCR11では、区分機1内を搬送される紙葉類が区分可能な所定時間(つまり、スキャナ13からバーコードライタ15へ搬送される時間)内に認識処理を行うようになっている。上記オンラインOCR11での認識処理では、処理時間の制約が厳しい。このため、上記オンラインOCR11では、高速に認識結果が得られる認識アルゴリズムによる認識方法が採用されている。
また、上記オンラインOCR11は、紙葉類の画像から区分情報が認識できなかった場合、あるいは、後述するベリファイ処理が必要な認識結果が得られた場合、当該紙葉類の画像、当該紙葉類の識別情報、および、付帯情報などを1つのセットの情報(以下、VC情報とも称する)として、VCS2へ転送する。なお、付帯情報としては、オンラインOCR11による認識結果(認識できた部分の情報)などが含まれるようにしても良い。上記付帯情報に含まれるオンラインOCR11による認識結果としては、たとえば、紙葉類の大きさ、文字の大きさ、文字の向き、区分情報の表記方向、文字種、認識深度、VCS2による処理が必要な箇所を示す情報などの情報が考えられる。上記のような付帯情報は、VCD22でのコーディング作業あるいはオフラインOCR3による認識処理を補助する情報として利用される。
上記供給部12には、区分処理の対象とする複数の紙葉類がセットされる。上記供給部12は、セットされた紙葉類を一定の間隔で1通づつ取り出して、図示しない搬送路へ供給する。紙葉類を搬送するための搬送路には、スキャナ(読取手段)13、バーコードリーダ14、バーコードライタ15、区分部16などが設けられている。上記スキャナ13は、搬送されている紙葉類の区分情報が記載されている面の画像を読取り、その読取画像をオンラインOCR11へ送信するものである。
上記バーコードリーダ14は、搬送路上を搬送されている紙葉類に付与されているバーコードを読取るものである。上記バーコードライタ15は、搬送路上を搬送されている紙葉類にバーコードを付与(プリント)するものである。たとえば、既に1回以上区分機1で処理されている紙葉類などの紙葉類には、バーコードが付与されている。このようなバーコードが既にプリントされている紙葉類については、上記バーコードリーダ14によるバーコードの読取結果により区分情報が判定される。また、バーコードが付与されていない紙葉類については、上記スキャナ13で読取った画像に対する区分情報の認識処理が上記オンラインOCR11により実行される。この場合、上記バーコードライタ15は、オンラインOCR11による区分情報の認識結果に応じたバーコードを当該紙葉類に付与する。
たとえば、紙葉類に付与するバーコードとしては、IDコードおよび区分コードが想定される。IDコードは、当該紙葉類の識別情報をコード化したものであり、区分コードは当該紙葉類の区分情報をコード化したものであるとする。このような運用形態の区分機1では、上記オンラインOCR11により区分情報が認識できた紙葉類には、区分情報を示す区分コードがプリントされ、上記オンラインOCR11により区分情報が認識できなかった紙葉類には、当該紙葉類を識別するためのIDコードがプリントされる。ただし、区分機1内で紙葉類がバーコードライタ15に到達する前に、VCS2による処理(VCD22によるコーディング処理あるいはオフラインOCRによる認識処理)が完了するような運用形態の区分機1では、オンラインOCR11による認識が失敗した紙葉類には、VCS2により得られた区分情報をコード化したバーコードが付与される。
また、バーコードライタ15は、上記スキャナ13による画像の読取位置と上記バーコードライタ15によるプリント位置との間における紙葉類の搬送時間が、少なくとも上記オンラインOCR11による区分情報の認識処理に要する時間以上となるように設置される。また、運用形態によっては、区分機1内の紙葉類がバーコードライタ15に到達するまでに、第1の認識部としてのオンラインOCR11による区分情報の認識処理だけでなく、第2の認識部としてのオフラインOCR(外部OCR)3あるいはコーディング処理部としてのVCD22による処理結果を区分機1が得られるようにしても良い。この場合、区分機1には、紙葉類が上記スキャナ13と上記バーコードライタ15との間を搬送されている間に、オフラインOCR3による処理結果あるいはVCD22による処理結果が得られるように、スキャナ13とバーコードライタ15との間に遅延搬送路が設けられるようにしても良い。
紙葉類の搬送方向における上記バーコードライタ15の下流側には、紙葉類を区分するための区分部16が設けられている。この区分部16は、たとえば、複数の段、かつ、複数の列に区画された複数の区分ポケット(図示しない)を有している。各ポケットは、区分情報に対応づけられている。また、区分部16には、区分先が認識できなかった紙葉類が集積されるVCS排除ポケット(図示しない)が設けられている。このVCS排除ポケットに集積された紙葉類は、区分情報がVCS2にて確定した後に、上記供給部12に再供給され、当該紙葉類のIDコードと上記VCS2にて入力された区分情報とに基づいて再区分されるようになっている。
次に、VCS2およびオフラインOCR3について説明する。
上記VCS2は、図1に示すように、分配装置(画像蓄積分配装置)21および複数のビデオコーディングディスク(VCD)22(22a、22b、…22n、…)により構成される。また、上記分配装置21は、各VCD22に接続されている。上記分配装置21と各VCD22とは、画像を含む情報の送受信が可能となっている。さらに、上記分配装置21には、区分機1のオンラインOCR11およびオフラインOCR3などが接続されている。
上記分配装置21は、上記区分機1で認識できなかった紙葉類の画像などをVCD22あるいはオフラインOCR3へ供給し、上記VCD22あるいは上記オフラインOCR3による処理結果を上記区分機1へ返す制御を行うものである。上記分配装置21は、たとえば、コンピュータにより構成される。上記分配装置21は、制御部25および記憶部26などを有する。
上記制御部25は、たとえば、CPU、メモリ、各種インターフェースなどにより構成される。上記制御部25は、メモリに記憶されているプログラムをCPUが実行することにより種々の処理機能を実現している。
上記記憶部26は、蓄積部として機能するものである。上記記憶部26は、紙葉類の画像を含む情報を記憶するものである。たとえば、上記記憶部26は、上記区分機1から供給される紙葉類の画像を含むVC情報を記憶したり、上記VCD22から供給される情報(オペレータが打鍵入力した情報)を記憶したり、上記オフラインOCR3からの認識結果あるいはベリファイ処理の結果を示す情報を記憶したりする。
上記VCD22は、端末部として機能するものである。上記VCD22は、たとえば、ディスプレイおよびキーボードなどが接続されたコンピュータなどにより構成される。上記VCD22は、上記分配装置21から配信されるVC情報に対する区分情報をオペレータが打鍵入力する作業を行うものである。つまり、上記VCD22は、上記分配装置21から配信されるVC情報に含まれる紙葉類の画像および付帯情報などをディスプレイなどに表示する。この状態において、上記VCD22は、オペレータに区分情報を打鍵入力させる。オペレータがキーボードなどにより区分情報を打鍵入力すると、上記VCD22は、打鍵入力された情報を分配装置21へ返すようになっている。
なお、本実施の形態では、上記VCD22によるコーディング処理は、主として、オフライン時に実行される形態を想定するものとする。ただし、上記VCD22によるコーディング処理は、オフライン時に限定されるものではない。たとえば、運用形態によっては、上記VCS2およびVCD22は、紙葉類が区分機1内を搬送されている間に、コーディング処理結果(打鍵情報)を区分機1へ返すようにしても良い。また、紙葉類が区分機1内を搬送されている間に、上記オンラインVCDとして機能するVCD22による打鍵情報が、オフラインOCR3でベリファイ処理されるようにすることも可能である。
上記オフラインOCR3は、上記分配装置21から供給された紙葉類の画像に対して区分情報の認識処理を行うものである。上記オフラインOCR3では、上記オンラインOCR11とは異なる認識アルゴリズムによりOCR処理を行う。上記オフラインOCR3での認識処理では、上記オンラインOCR11での認識処理に比べて処理時間の制約が緩和される。つまり、上記オフラインOCR3での認識処理は、上記オンラインOCR11での認識処理よりも多くの処理時間をかけることが可能である。このため、上記オフラインOCR3では、種々のアルゴリズムで上記オンラインOCR11よりも高精度な認識処理を行うことができる。
また、上記オフラインOCR3は、紙葉類の画像に対する区分情報の認識処理を行う機能だけでなく、外部から与えられた情報(たとえば、VCD22で打鍵入力された打鍵情報あるいはオンラインOCR11による認識結果など)が区分情報として正しいか否かを確認するベリファイ処理を行う機能も有している。外部から与えられた情報が区分情報として正しいか否かを判定するベリファイ処理については、後で詳細に説明するものとする。
なお、本実施の形態では、上記オフラインOCR3による処理は、主として、オフライン時に実行される形態を想定するものとする。ただし、オフラインOCR3による処理は、オフライン時に限定されるものではない。たとえば、運用形態によっては、上記オフラインOCR3は、紙葉類が区分機1内を搬送されている間に、区分情報の認識処理結果あるいは外部から与えられる情報(たとえば、VCD22による打鍵情報)のベリファイ処理結果が得られるようにしても良い。この場合も、第2の認識部として機能するオフラインOCR3は、第1の認識部として機能するオンラインOCR11とは異なる認識アルゴリズムにより区分情報の認識処理あるいはベリファイ処理を行う。
上記オフラインOCR3は、図1に示すように、制御部31及び複数の認識部32(32a、32b、…)などを有している。上記制御部31は、上記分配装置21からの紙葉類の画像などの情報を各認識部32へ分配する。また、上記制御部31は、各各認識部32による認識結果を上記分配装置21へ送信する制御を行う。また、各認識部32は、それぞれが1つの紙葉類の画像に対してオフラインOCRとしての認識処理を行うものである。各認識部32では、上記制御部31による制御に基づいて種々のアルゴリズムにより紙葉類の画像における区分情報の認識処理あるいはベリファイ処理などを行うようになっている。
次に、上記オフラインOCR3における認識アルゴリズムについて説明する。
上記オフラインOCR3の各認識部32は、認識処理用のプログラムにより紙葉類の画像から区分情報を認識する処理を実行する機能と、ベリファイ処理用のプログラムにより外部から与えらえた情報(確認対象とする情報)が区分情報として正しいか否かを確認するベリファイ処理を実行する機能とを有している。ベリファイ処理用のプログラムは、たとえば、確認対象とする情報が答えであると想定して紙葉類の画像に対する区分情報の認識処理を行うことにより、確認対象とする情報が区分情報として正しいか否かを判定する認識アルゴリズムにより構成されている。
上記のようなベリファイ処理用のプログラムに適用される認識アルゴリズムは、以下に示す(1)、(2)および(3)のような機能を有している。
(1)確認対象とする情報を当該紙葉類に記載されている区分情報として取り扱う。
(2)確認対象とする情報と一緒に与えられる当該紙葉類の画像における区分情報領域に確認対象とする情報があると想定して区分情報の認識処理を行う。
(3)確認対象とする情報と区分情報の認識結果との一致度が所定の閾値を超えた場合には、確認対象とする情報は、正しい結果と判定し、確認対象とする情報と区分情報の認識結果との一致度が所定の閾値を超えない場合には、確認対象とする情報には、誤りがあると判定する。
さらに、上記オフラインOCR3のベリファイ処理では、区分情報の認識結果に対して重み付けを行うようにして良い。すなわち、上記オフラインOCR3によるベリファイ処理では、外部より与えられる情報が答えであると想定する。このため、上記オフラインOCR3は、外部から与えられる情報に基づいて、区分情報の認識結果に対して重み付けを行うことが可能である。この機能によれば、外部から与えられる情報と区分情報の認識結果との一致度が重み付けに応じて動的に変更される。従って、重み付けの機能を適用したベリファイ処理用のプログラムに用いられる認識アルゴリズムでは、答えとして想定される情報を与えない場合には認識できなかった紙葉類の画像に対しても、当該紙葉類の区分情報を認識できたり、外部から与えられた情報の正否を確認できたりする。
また、上記オフラインOCR3によるベリファイ処理では、外部から与えられた情報の一部が誤っていた場合に、誤っている情報を補正するようにしても良い。すなわち、上記オフラインOCR3によるベリファイ処理では、上述したように、外部より与えられる情報が答えであると想定することにより、区分情報の認識率が向上とするものと考えられる。このような場合、外部から与えれた情報のうち一部の情報のみが誤っていれば、誤っている情報の部分だけ認識結果との一致度が極端に低くなることが予想される。このような一部だけ一致度が低くなった情報については、認識結果に基づいて補正することが可能である。ただし、このような形態であっても、上記オフラインOCR3は、外部から与えられた情報全体が認識結果全体との一致度が低い場合(つまり、外部から与えられた情報と認識結果とが大きく異なる場合)には、外部から与えられた情報を誤りと判定する。
なお、本区分システムでは、上記ベリファイ処理により確認対象とする情報は、上記VCS2内の各VCD22においてオペレータが打鍵入力した区分情報(打鍵情報)、あるいは、区分機1内のオンラインOCR11による区分情報の認識結果などが想定される。
次に、上記オフラインOCR3における打鍵情報のベリファイ処理に用いられるアルゴリズムの一例について説明する。
この例では、紙葉類には、区分情報(例えば、住所)全体を表現した文字情報と区分情報の一部を数字で表現した番号情報(例えば、郵便番号)とが付与されているものとする。このような紙葉類に対して、各VCD22では、区分情報の一部としての番号情報を打鍵入力する処理と、上記番号情報で表現されない部分の文字情報(たとえば、郵便番号以下の街区情報)を打鍵入力する処理とが2度実施される運用形態であることを前提とする。
このような運用形態において、上記分配装置21は、まず、VC情報に対する番号情報の打鍵入力をVCD22に要求する。上記分配装置21から番号情報の打鍵入力要求とともにVC情報が配信されたVCD22では、当該VC情報(紙葉類の画像)における番号情報のみがオペレータにより打鍵入力される。この打鍵入力された結果は、当該紙葉類における番号情報の打鍵結果としてVCD22から分配装置21に返される。上記分配装置21は、番号情報の打鍵入力要求に対して、VCD22から返された番号情報の打鍵結果を当該VC情報に対応づけて蓄積する。
さらに、上記分配装置21は、番号情報の打鍵結果が対応づけれらたVC情報に対する文字情報の打鍵入力を各VCD22に要求する。すると、上記分配装置21から文字情報の打鍵入力要求とともにVC情報が配信されたVCD22では、オペレータにより当該VC情報(紙葉類の画像)における文字情報(少なくとも番号情報で表現されていない部分の文字情報)が打鍵入力される。この打鍵入力された結果は、当該紙葉類における文字情報の打鍵結果としてVCD22から分配装置21に返される。上記分配装置21は、文字情報の打鍵入力要求に対して、VCD22から返された文字情報の打鍵結果を当該VC情報に対応づけて蓄積する。
このような処理によれば、上記分配装置21には、番号情報の打鍵結果と文字情報の打鍵結果とが対応づけられたVC情報が蓄積される。ここでは、区分情報において番号情報で表現される部分の文字情報は、番号情報に対応すべきものである。たとえば、番号情報としての郵便番号と住所情報における街区以前の情報(たとえば、都道府県名、都市名、町名など)の文字情報とは、1対1で対応している。
このため、オフラインOCR3では、番号情報に対応する文字情報を答えとして、番号情報が対応する部分の文字を認識する文字認識を行う。これにより、上記オフラインOCR3は、打鍵結果としての番号情報に対応する文字情報と、文字認識の結果としての文字情報とが一致するか否かを確認(一致度が所定値以上かを確認)するベリファイ処理を行う。このようなベリファイ処理により、上記オフラインOCR3では、VCD22でオペレータが打鍵入力した情報が正しいか否かを判定できる。
なお、番号情報が付与されていない紙葉類については、番号情報に対応する文字情報もVCD22のキーボードなどにより打鍵入力される。たとえば、番号情報に対応する文字情報は、住所情報における街区以前の情報(たとえば、都道府県名、都市名、町名など)である。このような都道府県名、都市名、町名などの情報には、VCD22のキーボードに短縮キーが割り当てられていることも多い。このような場合、上記オフラインOCR3は、短縮キーなどを用いて打鍵入力された情報を確認するため、上述した手法によるベリファイ処理を実行することも可能である。
次に、本区分システムに適用される第1の処理例について説明する。
この第1の処理例は、主として、VCD22で打鍵入力された打鍵情報をオフラインOCR3により確認する処理(ベリファイ処理)を実行するものである。
図2は、区分システムにおける第1の処理例としてのデータの流れを概略的に説明するための図である。
まず、分配装置21には、図2に示すように、区分機1のオンラインOCR11から紙葉類の画像(書状画像)、識別情報(書状ID番号)およびオンラインOCR11による認識結果(認識結果)を含む情報(以下、VC情報とも称する)が供給される。分配装置21は、区分機1からのVC情報を記憶部26に蓄積する。分配装置21は、記憶部26に蓄積したVC情報を、順次、VCD22あるいはオフラインOCR3へ配信する。
たとえば、VCD22によるコーディング処理よりもオフラインOCR3による認識処理を優先する場合、上記分配装置21は、まず、蓄積したVC情報をオフラインOCR3へ配信する。上記分配装置21からVC情報が配信されたオフラインOCR3では、上記分配装置21から配信したVC情報に含まれる紙葉類の画像に対する区分情報の認識結果を実行し、その認識結果を分配装置21へ返す。このVC情報に含まれる紙葉類の画像に対する区分情報の認識処理は、オフラインOCR3の各認識部32が上述した認識処理用プログラムを実行することにより実現される。
上記オフラインOCR3からVC情報に対する区分情報の認識に成功した旨の情報を受信した場合、上記分配装置21は、上記オフラインOCR3から与えられた認識結果を当該VC情報に含まれる識別情報の紙葉類の区分情報として区分機1へ送信する。なお、オフラインOCR3による認識処理を優先しない場合、上記分配装置21は、蓄積したVC情報を最初から何れかのVCD22に配信するようにしても良い。
また、上記オフラインOCR3から認識結果として区分情報の認識に失敗した旨の情報を受信した場合、上記分配装置21は、当該VC情報を何れかのVCD22に配信する。上記分配装置21からVC情報が配信されたVCD22では、区分情報のコーディング処理を行う。このコーディング処理は、オペレータに当該紙葉類の区分情報を打鍵入力させる処理である。すなわち、上記分配装置21からVC情報が配信されたVCD22は、図示しないディスプレイに紙葉類の画像などを表示し、この状態においてオペレータが区分情報として打鍵入力した情報(以下、打鍵情報と称する)を分配装置21へ返すコーディング処理を行う。
上記VCD22から打鍵情報が得られた場合、上記分配装置21は、当該打鍵情報の確認を行うため、打鍵情報(打鍵結果)、紙葉類の画像(書状画像)および識別情報(書状ID番号)を含む情報(以下、ベリファイ情報と称する)をオフラインOCR3へ配信する。ベリファイ情報が配信されたオフラインOCR3では、打鍵情報が正しいか否かを確認するベリファイ処理を行う。このベリファイ処理は、オフラインOCR3の各認識部32が上述したベリファイ処理用プログラムを実行することにより実現される。つまり、ベリファイ処理として、オフラインOCR3は、打鍵情報を当該紙葉類の区分情報と想定して区分情報の認識処理を行うことにより、打鍵情報が当該紙葉類の区分情報として正しいか否かを判定する。このようなベリファイ処理の結果は、オフラインOCR3から分配装置21へ返される。
上記オフラインOCR3から打鍵情報のベリファイ処理の結果が得られると、上記分配装置21は、ベリファイ処理の結果に基づいて区分情報を確定し、確定した区分情報をVCS2によるVC情報に対する処理結果として区分機1へ送信する。たとえば、上記ベリファイ処理により打鍵情報が正しいことが確認された場合、上記分配装置21は、打鍵情報を区分情報として確定し、当該打鍵情報を当該紙葉類の区分情報として区分機1へ送信する。また、上記ベリファイ処理により打鍵情報が正しいことが確認できなかった場合、上記分配装置21は、たとえば、当該VC情報を再度VCD22に配信し、上述した処理を再度実行させる。なお、上記ベリファイ処理により打鍵情報が正しいことが確認できなかった情報については、打鍵情報が正しいことが確認できなかった旨を分配装置21から区分機1へ送信するようにしても良い。
次に、第1の処理例の流れについて説明する。
図3は、本区分システムにおける第1の処理例の流れを説明するためのフローチャートである。なお、ここでは、図3に示すフローチャートのように、上記分配装置21の動作を中心に説明するものとする。
まず、上記分配装置21には、上記区分機1のオンラインOCR11で区分情報が認識できなかった紙葉類の画像を含むVC情報が記憶部26に蓄積される。上記分配装置21の記憶部26に蓄積されたVC情報に対しては、まず、上記オフラインOCR3による区分情報の認識処理が実行される(ステップS11〜S13)。なお、上記分配装置21に蓄積したVC情報に対して最初にオフラインOCR3による認識処理を行うのは、オペレータの介在を少なくすると共に、打鍵による誤打鍵の発生を抑えるためである。ただし、上記オフラインOCR3による区分情報の認識処理は、省略しても良い。この場合、上記分配装置21の制御部25は、後述するステップS17からの処理を実行する。
すなわち、上記分配装置21の制御部25は、まず、上記記憶部26に蓄積したVC情報を区分情報の認識処理の要求とともに、上記オフラインOCR3へ配信する(ステップS11)。上記分配装置21からVC情報が配信されたオフラインOCR3では、当該VC情報に含まれる紙葉類の画像に対して区分情報の認識処理を実行し、その処理結果を分配装置21へ返す(ステップS12)。上記VC情報に対する区分情報の認識結果をオフラインOCR3から受信すると(ステップS13)、上記分配装置21の制御部25は、オフラインOCR3による区分情報の認識結果が成功したか否かを判断する(ステップS14)。
この判断によりオフラインOCR3による区分情報の認識処理が成功した場合、つまり、上記オフラインOCR3から上記VC情報に対する認識処理の結果として一意に特定された区分情報を受信した場合(ステップS14、YES)、上記分配装置21の制御部25は、上記オフラインOCR3から受信した認識結果としての区分情報を当該VC情報の紙葉類に対する区分情報として採用する(ステップS15)。この場合、上記分配装置21の制御部25は、採用した区分情報を当該VC情報に含まれる紙葉類の識別情報に対応づけて区分機1へ供給する(ステップS16)。これにより、上記分配装置21から紙葉類の識別情報に対応づけられた区分情報を受信した区分機1では、各紙葉類の識別情報に基づいて区分情報が判定できるようになる。
また、上記判断によりオフラインOCR3による区分情報の認識処理が失敗したと判断した場合、つまり、上記オフラインOCR3から上記VC情報に対する区分情報が認識できなかった旨の情報を受信した場合(ステップS14、NO)、上記分配装置21の制御部25は、たとえば、変数N=0と定義することにより、変数Nを初期化する(ステップS17)。変数Nを初期化すると、上記分配装置21の制御部25は、上記VC情報に対するVCD22によるコーディング処理を実行する(ステップS18〜S20)。
すなわち、上記分配装置21の制御部25は、上記記憶部26に蓄積しているVC情報のうちVCD22でコーディング処理すべきVC情報を何れかのVCD22へ配信する(ステップS18)。上記分配装置21からVC情報を受信したVCD22では、上記VC情報に対するコーディング処理を実行する(ステップS19)。このコーディング処理において、上記VCD22は、上記VC情報に含まれる紙葉類の画像をディスプレイに表示し、オペレータによる区分情報の打鍵入力を受け付ける。この状態においてオペレータがキーボードなどにより区分情報を打鍵入力すると、上記VCD22は、打鍵入力された結果(打鍵情報)を紙葉類の識別情報に対応づけて分配装置21へ送信する。
上記VCD22から紙葉類の識別情報に対応づけられた打鍵情報を受信すると(ステップS20)、上記分配装置21の制御部25は、受信した打鍵情報を当該紙葉類の識別情報に対応づけて記憶部26に蓄積する(ステップS21)。
上記VCD22からの打鍵情報を記憶部26に蓄積すると、上記分配装置21の制御部25は、VCD22から供給された打鍵情報に対するオフラインOCR3によるベリファイ処理を実行する(ステップS22〜S24)。すなわち、上記分配装置21の制御部25は、ベリファイ処理の要求と共に、上記打鍵情報と当該紙葉類の画像と当該紙葉類の識別情報とをオフラインOCR3へ配信する(ステップS22)。
上記打鍵情報と紙葉類の画像と識別情報とを受信したオフラインOCR3では、上述したようなベリファイ処理用のプログラムにより上記打鍵情報が正しいか否かを判定する処理を行う(ステップS23)。上記オフラインOCR3のベリファイ処理では、打鍵情報を答えとして、当該紙葉類の画像に対する区分情報の認識処理を行う。このベリファイ処理により打鍵情報が紙葉類の画像に付与されている区分情報の認識結果と一致すると判定した場合、上記オフラインOCR3は、打鍵情報が正しいというベリファイ処理の結果を当該紙葉類の識別情報に対応づけて分配装置21へ送信する。また、上記ベリファイ処理により打鍵情報が紙葉類の画像に付与されている区分情報の認識結果と一致しないと判定した場合、上記オフラインOCR3は、打鍵情報が正しくないというベリファイ処理の結果を当該紙葉類の識別情報に対応づけて分配装置21へ送信する。
上記オフラインOCR3からベリファイ処理の結果を受信すると(ステップS24)、上記分配装置21の制御部25は、受信したベリファイ処理の結果に基づいて打鍵情報が正しいことが確認されたか否かを判断する(ステップS25)。この判断により打鍵情報が正しいことが確認されたと判断した場合(ステップS25、YES)、上記分配装置21の制御部25は、当該打鍵情報を当該紙葉類の区分情報として採用する(ステップS15)。この場合、上記分配装置21の制御部25は、採用した区分情報を当該VC情報に含まれる紙葉類の識別情報に対応づけて区分機1へ供給する(ステップS16)。
また、上記判断により打鍵情報が正しいことが確認されなかったと判断した場合(ステップS25、NO)、上記分配装置21の制御部25は、所定回数に達するまで、コーディング処理を複数回実行することにより当該紙葉類の区分情報を判定する処理を行う(ステップS26〜S28)。すなわち、上記オフラインOCR3によるベリファイ処理により打鍵情報が正しいことが確認されなかった場合、上記分配装置21の制御部25は、変数Nが所定数以上であるか否かを判断する(ステップS26)。上記変換Nが所定数未満であると判断した場合(ステップS26、NO)、上記分配装置21の制御部25は、変数Nをインクリメントし(ステップS27)、上記ステップS18へ戻る。このような処理により、上記分配装置21の制御部25は、上記オフラインOCR3によるベリファイ処理で打鍵情報が正しいことが確認されるまで、上記ステップS18〜S27の処理を所定回数分実行する。
また、上記ステップS26で変数Nが所定数以上と判断された場合、つまり、コーディング処理の再実行回数が所定数以上となった場合(ステップS26、YES)、上記分配装置21の制御部25は、当該紙葉類の画像に対して複数回実行した打鍵情報から区分情報として採用する打鍵情報を決定する(ステップS28)。このステップS28の処理により区分情報として採用される打鍵情報が決定すると、上記分配装置21の制御部25は、採用した区分情報を当該VC情報に含まれる紙葉類の識別情報に対応づけて区分機1へ供給する(ステップS16)。
また、上記ステップS28の処理としては、複数の打鍵情報に基づいて投票を行い、投票数が一番大きい情報を区分情報として採用する手法が考えられる。また、上記ステップS28の処理としては、複数の打鍵情報のうち過半数を超える打鍵情報をベリファイ処理の結果として採用することも可能である。なお、上記ステップS28の処理の代りに、当該紙葉類の区分情報が確定できない旨の情報を処理結果として採用するようにしても良い。この場合、ベリファイ処理により打鍵情報が正しいと確認されない紙葉類については、処理不能と判断される。
ただし、上記ステップS28の処理は、ベリファイ処理により打鍵情報が正しいことが確認できないような紙葉類に対する処理を想定している。つまり、オフラインOCR3におけるベリファイ処理用のプログラムに用いられているアルゴリズムでは、実際には打鍵情報が正しい場合であっても、正しいことが確認できない紙葉類の画像が存在する可能性も考えられる。このような場合であっても、上記ステップS28の処理によれば、複数の打鍵情報から最も確からしい打鍵情報を決定できる。
次に、本区分システムに適用される第2の処理例について説明する。
この第2の処理例は、VCD22で打鍵入力された打鍵情報だけでなく、オンラインOCR11による認識結果についても、オフラインOCR3により確認する処理(ベリファイ処理)を実行するものである。
すなわち、第2の処理例では、上記オフラインOCR3には、ベリファイ処理の対象として、上記オンラインOCR11で区分情報が認識できた紙葉類の画像と当該認識結果とが供給される。この場合、上記オフラインOCR3によるベリファイ処理では、上記オンラインOCR11による認識結果を答えと想定し、当該紙葉類の画像に対する認識処理を実行する。
このような紙葉類の画像に対する認識処理によりオンラインOCR11による認識結果と同じ認識結果が得られた場合、上記オフラインOCR3は、オンラインOCR11による認識結果が正しいことが確認できたものと判断する。これに対して、紙葉類に対する認識処理によってオンラインOCR11による認識結果と同じ認識結果が得られなかった場合、上記オフラインOCR3は、上記オンラインOCR11による認識結果が正しいことが確認できなかったものと判断する。さらに、上記オンラインOCR11による認識結果が正しいことが確認できなかった紙葉類の画像については、上述した第1の処理例と同様に、VCD22によるコーディング処理とオフラインOCR3による打鍵情報のベリファイ処理を行う。
次に、第2の処理例の流れについて説明する。
図4は、本区分システムにおける第2の処理例の流れを説明するためのフローチャートである。なお、図4に示すフローチャートでは、オンラインOCR11の動作を中心に説明するものとする。
まず、区分機1内では、スキャナ13により読取った紙葉類の画像がオンラインOCR11に供給される。スキャナ13により読取った紙葉類の画像が供給されると、オンラインOCR11は、オンラインOCR用の認識プログラムにより当該紙葉類の画像に対する区分情報の認識処理を行う(ステップS31)。
上記オンラインOCR11により紙葉類の区分情報が認識できなかった場合(ステップS32、NO)、上記オンラインOCR11は、当該紙葉類の画像、当該紙葉類の識別情報および当該紙葉類の画像に対する認識結果などを含む情報をVC情報として分配装置21へ送信する(ステップS33)。この場合、上記分配装置21は、上記オンラインOCR11からのVC情報を記憶部26に蓄積し、上記第1の処理例で説明したようなステップS17以降の処理を実行する。
上記オンラインOCR11により紙葉類の区分情報が認識できた場合(ステップS32、YES)、上記オンラインOCR11は、上記オフラインOCR3に対して認識結果のベリファイ処理を要求する処理を行う(ステップS34)。ここでは、上記オンラインOCR11は、上記分配装置21を介して認識結果のベリファイ処理をオフラインOCR3へ要求するものとする。すなわち、上記オンラインOCR11は、紙葉類の区分情報が認識できた場合、ベリファイ処理要求と共に、当該紙葉類に対する区分情報の認識結果と当該紙葉類の画像と当該紙葉類の画像とを、上記分配装置21を介して上記オフラインOCR3へ送信する。
このようなベリファイ処理要求を受信した上記オフラインOCR3では、オンラインOCR11による認識結果に対するベリファイ処理を実行する(ステップS35)。上記ステップS33のオフラインOCR3のベリファイ処理は、上述した打鍵情報に対するベリファイ処理と同様に、オンラインOCR11による認識結果を答えと想定して、当該紙葉類の画像に対する区分情報の認識処理を行う。この場合も、オンラインOCR11による認識結果を答えと想定して認識処理を実行するため、高精度な確認結果が期待できる。
たとえば、、上記ベリファイ処理によりオンラインOCR11による認識結果が紙葉類の画像に付与されている区分情報の認識結果と一致すると判定した場合、上記オフラインOCR3は、オンラインOCR11による認識結果が正しいというベリファイ処理の結果を上記分配装置21を介してオンラインOCR11へ送信する。また、上記ベリファイ処理によりオンラインOCR11による認識結果が紙葉類の画像に付与されている区分情報の認識結果と一致しないと判定した場合、上記オフラインOCR3は、オンラインOCR11による認識結果が正しくないというベリファイ処理の結果を分配装置21を介してオンラインOCR11へ送信する。
上記オンラインOCR11では、上記のようなオフラインOCR3からのベリファイ処理の結果を上記分配装置21を介して受信する(ステップS36)。上記オフラインOCR3からベリファイ処理の結果として認識結果が正しいことが確認された旨を受信した場合(ステップS37、YES)、上記オンラインOCR11は、当該認識結果を当該紙葉類の区分情報として採用する(ステップS38)。
また、上記オフラインOCR3からベリファイ処理の結果として認識結果が正しいことが確認されなかった旨を受信した場合(ステップS37、NO)、上記オンラインOCR11は、当該紙葉類の画像、当該紙葉類の識別情報および当該紙葉類の画像に対する認識結果などを含む情報をVC情報として分配装置21へ送信する(ステップS33)。この場合、上記分配装置21は、上記オンラインOCR11からのVC情報を記憶部26に蓄積し、上記第1の処理例で説明したようなステップS17以降の処理を実行する。
なお、上記オンラインOCR11による認識結果は、当該紙葉類がオンラインで区分できるタイミング(たとえば、図1に示す構成例では当該紙葉類がバーコードライタ14によるプリント位置に到達するまでの間)で得られるべきものである。つまり、上記オンラインOCR11による認識結果のベリファイ処理は、所定時間に完了する必要がある。このため、上記分配装置21および上記オフラインOCR3は、上記オンラインOCR11による認識結果のベリファイ処理が所定時間内に完了するように、優先的に処理を実行するものとする。また、上記オンラインOCR11による認識結果のベリファイ処理を高速化するために、上記オンラインOCR11とオフラインOCR3とは直接的に接続されているようにしても良い。
次に、本区分システムに適用される第3の処理例について説明する。
この第3の処理例は、上記第2の処理例を変形したものである。上記第2の処理例では、上記オンラインOCR11による認識処理で区分情報が認識できなかった場合、上記ステップS17へ進み、VCD22によるコーディング処理を行うものとして説明した。これに対して、上記第3の処理例では、上記オンラインOCR11による認識処理で区分情報が認識できなかった場合には、上記第1の処理例で説明したステップS11へ進むものとする。すなわち、上記第3の処理例では、上記オンラインOCR11で認識できなかったものについては、まず、オフラインOCR3で認識処理を行うことにより、人的作業を軽減させるものである。
次に、第3の処理例の流れについて説明する。
図5は、本区分システムにおける第3の処理例の流れを説明するためのフローチャートである。図5に示すフローチャートでは、図4に示すフローチャートと同様に、オンラインOCR11における処理の流れを示している。なお、図5に示すステップS41〜S48の処理は、それぞれ図4に示すステップS31〜S38の処理とほぼ同様な処理であるため、詳細な説明を省略する。
すなわち、図5に示す第3の処理例では、ステップS49の処理として、オンラインOCR11による認識処理で区分情報が認識できなった場合(ステップS42、NO)、上記オンラインOCR11は、当該紙葉類の画像、当該紙葉類の識別情報および認識結果を含むVC情報を、オフラインOCRで区分情報の認識処理を実行すべきVC情報(オフラインOCR用のVC情報)として分配装置21へ送信する。この場合、上記分配装置21では、当該VC情報をオフラインOCR用のVC情報として蓄積する。上記分配装置21の制御部25では、当該VC情報をVCD22へ配信する前に、オフラインOCR3へ配信してオフラインOCR3による区分情報の認識処理を実行するように制御する。このような処理の結果として、第3の処理例では、各VCD22には、オンラインOCR11による認識処理とオフラインOCR3による認識処理とで共に認識結果が得られなかった紙葉類の画像がコーディング処理の対象となる画像として配信される。
上記のように、本実施の形態では、オフラインOCRは、オペレータが打鍵入力した打鍵情報あるいはオンラインOCRによる認識結果などの外部から与えられた情報が認識結果であるとして想定して当該紙葉類の画像に対する認識処理を行うことにより、外部から与えられた情報のベリファイ処理を行う。言い換えると、上記オフラインOCRでは、オペレータが打鍵入力した打鍵情報あるいはオンラインOCRによる認識結果などの外部から与えられた情報が、当該紙葉類の画像に対する区分情報の認識処理結果として認められるか否かを判定するベリファイ処理を行う。
たとえば、当該紙葉類の画像に含まれる区分情報の認識結果が外部から与えられた情報と一致すると見なせると判断した場合、上記オフラインOCRは、外部から与えられた情報が正しいと確認したものとする。これに対して、当該紙葉類の画像に含まれる区分情報の認識結果が外部から与えられた情報と一致すると見なせないと判断した場合、上記オフラインOCRは、外部から与えられた情報が正しいと確認できないとする。
上記のようなベリファイ処理によれば、オペレータが打鍵入力した打鍵情報あるいはオンラインOCRによる認識結果が正しいか否かを、実際に当該紙葉類に記載されている区分情報に基づいて判定できる。これにより、単純にデータベースと比較するだけでは発見できない誤打鍵あるいは誤認識などが判定可能となり、誤打鍵あるいは誤認識の低減を図れる。
また、上記オフラインOCRによるベリファイ処理では、オペレータによる打鍵情報あるいはオンラインOCRによる認識結果における誤打鍵あるいは誤認識を、実際の紙葉類の画像に対する文字認識結果に基づいて高精度に発見できる。つまり、上記ベリファイ処理では、打鍵情報あるいはオンラインOCRによる認識結果の一部が実際の紙葉類上の区分情報と異なっていることも高精度に判定できる。この結果として打鍵情報あるいはオンラインOCRによる認識結果の一部が実際の紙葉類上の区分情報と異なっている場合、上記オフラインOCRは、実際の紙葉類の画像に対する文字認識結果に基づいて誤打鍵あるいは誤認識されている部分を補正することも可能となる。
また、上記のようなベリファイ処理を紙葉類に記載されている区分情報に基づいて紙葉類を区分する区分システムに適用することにより、誤打鍵あるいは誤認識に起因する誤区分を低減できる。特に、上記のような区分システムを郵便物を区分するための郵便物の区分システムに適用すれば、郵便物の誤配あるいは遅配の要因となる誤区分の低減を図ることができる。
図1は、この発明の実施の形態に係わる区分システムの概略構成を示す図である。 図2は、区分システムにおける第1の処理例としてのデータの流れを概略的に説明するための図である。 図3は、本区分システムにおける第1の処理例の流れを説明するためのフローチャートである。 図4は、本区分システムにおける第2の処理例の流れを説明するためのフローチャートである。 図5は、本区分システムにおける第3の処理例の流れを説明するためのフローチャートである。
符号の説明
2…ビデオコーディングシステム(VCS)、3…オフラインOCR、11…オンラインOCR、12…供給部、13…スキャナ、14…バーコードリーダ、15…バーコードライタ、16…区分部、17…辞書データベース、18…制御部、21…分配装置、22…ビデオコーディングディスク(VCD)、25…制御部、26…記憶部、31…制御部、32…認識部。

Claims (9)

  1. 画像に含まれている区分情報を特定するビデオコーディングシステムにおいて、
    文字で表現されている区分情報が含まれている画像を蓄積する蓄積部と、
    前記蓄積部に蓄積されている画像に含まれている区分情報らしい情報が外部から与えられた場合、前記外部から与えられた区分情報らしい情報が認識結果であると想定して当該画像に対して文字認識処理を行うにより、前記打鍵情報が当該画像に含まれる区分情報として正しいか否かを確認する認識部と、
    を有することを特徴とするビデオコーディングシステム。
  2. さらに、前記蓄積部に蓄積されている画像に含まれる区分情報を打鍵入力させるための端末部を有し、
    前記認識部は、前記端末部により打鍵入力された打鍵情報が与えられた場合、当該打鍵情報が認識結果であると想定して当該画像に対して文字認識処理を行うにより、前記打鍵情報が当該画像に含まれる区分情報として正しいか否かを確認する、
    ことを特徴とする前記請求項1に記載のビデオコーディングシステム。
  3. 前記認識部は、さらに、前記蓄積部に蓄積されている画像に対して区分情報の文字認識処理を行い、
    前記端末部は、前記文字認識処理により区分情報が認識できなかった画像に含まれる区分情報を打鍵入力させる、
    ことを特徴とする前記請求項2に記載のビデオコーディングシステム。
  4. 前記認識部は、前記蓄積部に蓄積されている画像に対する外部の認識装置による区分情報の文字認識処理で得られた情報が与えられた場合、前記外部の認識装置で得られた情報が認識結果であると想定して当該画像に対する区分情報の文字認識処理を行うにより、前記外部の認識装置で得られた情報が当該画像に含まれる区分情報として正しいか否かを確認する、
    ことを特徴とする前記請求項1に記載のビデオコーディングシステム。
  5. 紙葉類に付与されている区分情報に基づいて紙葉類を区分する区分システムにおいて、
    区分情報が付与されている紙葉類の画像を読取るスキャナと、
    前記スキャナにより読取った紙葉類の画像に対して区分情報の認識処理を行う第1の認識部と、
    前記第1の認識部により区分情報が認識できなかった紙葉類の画像を蓄積する蓄積部と、
    前記蓄積部に蓄積された紙葉類の画像に基づいて当該紙葉類の区分情報を打鍵入力させるための端末部と、
    前記端末部により打鍵入力された打鍵情報が認識結果であると想定して前記紙葉類の画像に対して区分情報の認識処理を行うにより、前記打鍵情報が当該紙葉類に付与されている区分情報として正しいか否かを確認する第2の認識部と、
    を有することを特徴とする区分システム。
  6. 前記第2の認識部は、前記第1の認識部により区分情報が認識できた紙葉類の画像に対しても、前記第1の認識部による認識結果としての区分情報が認識結果であると想定して区分情報の認識処理を行うにより、前記第1の認識部による認識結果としての区分情報が紙葉類に付与されている区分情報として正しいか否かを確認する、
    ことを特徴とする前記請求項5に記載の区分システム。
  7. 前記第2の認識部は、さらに、前記第1の認識部により区分情報が認識できなかった紙葉類の画像に対して前記第1の認識部とは異なるアルゴリズムで区分情報の認識処理を行い、
    前記蓄積部は、前記第2の認識部により区分情報が認識できなかった紙葉類の画像を蓄積する、
    ことを特徴とする前記請求項5又は6に記載の区分システム。
  8. 画像に含まれている区分情報を特定するビデオコーディングシステムに用いられるビデオコーディング方法であって、
    文字で表現されている区分情報が含まれている画像を蓄積し、
    前記蓄積されている画像に含まれている区分情報らしい情報が外部から与えられた場合、前記外部から与えられた区分情報らしい情報が認識結果であると想定して当該画像に対して文字認識処理を行うにより、前記打鍵情報が当該画像に含まれる区分情報として正しいか否かを確認する、
    ことを特徴とするビデオコーディング方法。
  9. 紙葉類に付与されている区分情報に基づいて紙葉類を区分する区分システムに用いられる区分方法であって、
    区分情報が付与されている紙葉類の画像を読取り、
    前記読取った紙葉類の画像に対して区分情報の認識処理を行い、
    前記区分情報が認識できなかった紙葉類の画像を蓄積し、
    前記蓄積された紙葉類の画像に基づいて当該紙葉類の区分情報を打鍵入力させ、
    前記打鍵入力された打鍵情報が認識結果であると想定して前記紙葉類の画像に対して区分情報の認識処理を行うにより、前記打鍵情報が当該紙葉類に付与されている区分情報として正しいか否かを確認する、
    を有することを特徴とする区分方法。
JP2008169314A 2008-06-27 2008-06-27 ビデオコーディングシステム、区分システム、コーディング方法、および、区分方法 Withdrawn JP2010009410A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2008169314A JP2010009410A (ja) 2008-06-27 2008-06-27 ビデオコーディングシステム、区分システム、コーディング方法、および、区分方法
EP09005124A EP2138952A3 (en) 2008-06-27 2009-04-07 Video coding system, sorting system, coding method and sorting method
KR1020090034086A KR20100002091A (ko) 2008-06-27 2009-04-20 비디오 코딩 시스템, 구분 시스템, 코딩 방법 및 구분 방법
US12/465,363 US20090324105A1 (en) 2008-06-27 2009-05-13 Video coding system, sorting system, coding method and sorting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008169314A JP2010009410A (ja) 2008-06-27 2008-06-27 ビデオコーディングシステム、区分システム、コーディング方法、および、区分方法

Publications (1)

Publication Number Publication Date
JP2010009410A true JP2010009410A (ja) 2010-01-14

Family

ID=41082404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008169314A Withdrawn JP2010009410A (ja) 2008-06-27 2008-06-27 ビデオコーディングシステム、区分システム、コーディング方法、および、区分方法

Country Status (4)

Country Link
US (1) US20090324105A1 (ja)
EP (1) EP2138952A3 (ja)
JP (1) JP2010009410A (ja)
KR (1) KR20100002091A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2801416A2 (en) 2013-05-09 2014-11-12 Kabushiki Kaisha Toshiba Sorting system
JP2021140632A (ja) * 2020-03-09 2021-09-16 株式会社東芝 認識装置及びプログラム
WO2021182185A1 (ja) * 2020-03-09 2021-09-16 株式会社 東芝 情報処理装置、システム及び制御方法
JP2022042796A (ja) * 2020-09-03 2022-03-15 株式会社東芝 情報処理装置及びプログラム
JP2022045557A (ja) * 2020-09-09 2022-03-22 株式会社東芝 情報処理装置及びプログラム
JP2022103517A (ja) * 2020-12-28 2022-07-08 株式会社東芝 制御装置、制御方法及びプログラム
WO2023053950A1 (ja) * 2021-09-29 2023-04-06 株式会社 東芝 システム及び情報処理方法
WO2023171622A1 (ja) * 2022-03-08 2023-09-14 株式会社 東芝 認識装置、プログラム及びシステム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101844135B (zh) * 2010-05-11 2013-05-08 上海邮政科学研究院 一种地址信息库驱动下的邮政信函按址分拣方法
CN103679719A (zh) * 2013-12-06 2014-03-26 河海大学 一种图像分割方法
CN114419932A (zh) * 2016-09-27 2022-04-29 深圳市大疆创新科技有限公司 Uav系统的部件和用户管理
US10321000B2 (en) * 2017-09-06 2019-06-11 Xerox Corporation Methods and systems for automatically sorting documents using a multi-function device
JP7600006B2 (ja) * 2021-03-22 2024-12-16 株式会社東芝 情報処理装置および情報入力システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3149859B2 (ja) 1998-09-21 2001-03-26 日本電気株式会社 ビデオコーディングシステム及び方法
US6741724B1 (en) * 2000-03-24 2004-05-25 Siemens Dematic Postal Automation, L.P. Method and system for form processing
US7436979B2 (en) * 2001-03-30 2008-10-14 Siemens Energy & Automation Method and system for image processing
ITTO20040299A1 (it) * 2004-05-07 2004-08-07 Elsag Spa Metodo di riconoscimento postale

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2801416A2 (en) 2013-05-09 2014-11-12 Kabushiki Kaisha Toshiba Sorting system
AU2021235688B2 (en) * 2020-03-09 2023-12-07 Kabushiki Kaisha Toshiba Information processing apparatus, system, and control method
JP2021140632A (ja) * 2020-03-09 2021-09-16 株式会社東芝 認識装置及びプログラム
JP2021140631A (ja) * 2020-03-09 2021-09-16 株式会社東芝 情報処理装置、システム及び制御方法
WO2021182186A1 (ja) * 2020-03-09 2021-09-16 株式会社 東芝 認識装置及びプログラム
JP7443095B2 (ja) 2020-03-09 2024-03-05 株式会社東芝 情報処理装置、システム及び制御方法
JP7443096B2 (ja) 2020-03-09 2024-03-05 株式会社東芝 認識装置及びプログラム
WO2021182185A1 (ja) * 2020-03-09 2021-09-16 株式会社 東芝 情報処理装置、システム及び制御方法
JP2022042796A (ja) * 2020-09-03 2022-03-15 株式会社東芝 情報処理装置及びプログラム
JP7527899B2 (ja) 2020-09-03 2024-08-05 株式会社東芝 情報処理装置及びプログラム
JP2022045557A (ja) * 2020-09-09 2022-03-22 株式会社東芝 情報処理装置及びプログラム
JP7562344B2 (ja) 2020-09-09 2024-10-07 株式会社東芝 情報処理装置及びプログラム
JP2022103517A (ja) * 2020-12-28 2022-07-08 株式会社東芝 制御装置、制御方法及びプログラム
JP7482022B2 (ja) 2020-12-28 2024-05-13 株式会社東芝 制御装置、制御方法及びプログラム
JP2023049545A (ja) * 2021-09-29 2023-04-10 株式会社東芝 システム及び情報処理方法
WO2023053950A1 (ja) * 2021-09-29 2023-04-06 株式会社 東芝 システム及び情報処理方法
WO2023171622A1 (ja) * 2022-03-08 2023-09-14 株式会社 東芝 認識装置、プログラム及びシステム
JP2023130957A (ja) * 2022-03-08 2023-09-21 株式会社東芝 認識装置、プログラム及びシステム

Also Published As

Publication number Publication date
KR20100002091A (ko) 2010-01-06
EP2138952A2 (en) 2009-12-30
US20090324105A1 (en) 2009-12-31
EP2138952A3 (en) 2012-05-09

Similar Documents

Publication Publication Date Title
JP2010009410A (ja) ビデオコーディングシステム、区分システム、コーディング方法、および、区分方法
US6292709B1 (en) Method and device for online processing of forwarding mail
KR101145967B1 (ko) 패턴 인식 방법, 문자 인식 방법, 패턴 인식 장치 및 문자 인식 장치
JP3740168B2 (ja) 郵便物の処理方法
JPH0929180A (ja) コーディングシステム及び郵便物処理システム
KR20120029351A (ko) 문자 인식 장치, 구분 장치, 구분 제어 장치 및 문자 인식 방법
JP2003510166A (ja) 郵便物の配達情報の認識のための方法及び装置
JPH11238097A (ja) 郵便物宛先読取装置及び宛先読取方法
US8170290B2 (en) Method for checking an imprint and imprint checking device
JP5433470B2 (ja) 住所データベース構築装置および住所データベース構築方法
US7181045B2 (en) Method and device for reading the addresses of items of mail
JPH0957204A (ja) 郵便物の宛先自動読取システム
US7215794B2 (en) Method and device for reading the addresses on items of mail
JP2010069438A (ja) 押印機、区分機および紙葉類処理方法
US6993155B1 (en) Method for reading document entries and addresses
JP2010269272A (ja) 紙葉類処理装置および紙葉類処理方法
JP4439249B2 (ja) 宛先認識装置と紙葉類処理システム
JP6736277B2 (ja) 帳票処理方法、帳票処理装置、システムおよびプログラム
JP5558065B2 (ja) 区分装置、区分情報の認識方法および区分情報の認識プログラム
JP2019109729A (ja) 区分装置および区分システム
JP4278277B2 (ja) Ocr為替集中処理システム
JPH07171505A (ja) 郵便物宛名コード読取装置
US20060167584A1 (en) System, apparatuses, methods and computer program for producing a batch of mail items and providing and generating identification codes
JP2001046977A (ja) 郵便物処理方法
JP2002254037A (ja) 郵便物の誤配防止方法および装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20110906