[go: up one dir, main page]

JP4094240B2 - 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体 - Google Patents

画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体 Download PDF

Info

Publication number
JP4094240B2
JP4094240B2 JP2001043145A JP2001043145A JP4094240B2 JP 4094240 B2 JP4094240 B2 JP 4094240B2 JP 2001043145 A JP2001043145 A JP 2001043145A JP 2001043145 A JP2001043145 A JP 2001043145A JP 4094240 B2 JP4094240 B2 JP 4094240B2
Authority
JP
Japan
Prior art keywords
ruled line
collapsed
image
run
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001043145A
Other languages
English (en)
Other versions
JP2002245405A (ja
Inventor
裕子 杉浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001043145A priority Critical patent/JP4094240B2/ja
Publication of JP2002245405A publication Critical patent/JP2002245405A/ja
Application granted granted Critical
Publication of JP4094240B2 publication Critical patent/JP4094240B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体に関し、詳細には文字認識装置の前処理として罫線や文字を含む認識対象画像の特性を判別する処理方法に関する。
【0002】
【従来の技術】
画像の罫線や文字の識別処理は、濃い又はかすれている等の処理対象画像の特性によって識別処理に使用されているアルゴリズムやしきい値が対応できずに識別精度が低下することがある。画像の特性は、スキャナ等の入力装置で入力する時の2値化スレッシュを変更したりすることで、入力画像の濃さなどを補正し識別アルゴリズムに対応した画像特性を得ることは可能である。
【0003】
【発明が解決しようとする課題】
しかし、一度入力されてしまった2値データに対して、アルゴリズムに合わない特性だからと言って再度入力し直すなどは現実的ではない上に、能率が悪い。罫線や文字識別処理の前処理として、処理画像の特性を把握しその特性の情報を提供することができれば、その情報に対応したアルゴリズムやしきい値などに変更することが可能となり、識別精度を向上させることが可能となる。また、画像が濃く、つぶれているような場合をつぶれ画像と定義すると、つぶれ画像の特徴は文字がつぶれて画像部が太り罫線に接触している場合が多い。更に、つぶれ画像における実線識別処理においては画像が密で結合しているためにつぶれた文字部に短い実線が誤認識されることが多い。
【0004】
本発明は入力画像の特徴のひとつである画像特性判別部を罫線や文字認識処理の前処理として設けることにより、罫線や文字の識別精度を向上させるための有益な情報を提供することを目的とする。
【0005】
【課題を解決するための手段】
前記問題点を解決するために、本発明に係る画像特性判別処理装置は光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手段と、該ラン抽出手段により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手段と、該罫線ラン判別手段により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手段と、該罫線抽出手段により抽出された罫線の長さが所定値より小さい罫線を短罫線とする短罫線判別手段と、該短罫線判別手段により判別された短罫線同士が交差している短罫線を含む領域を抽出する領域抽出手段と、該領域抽出手段により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の数が所定値以上であるつぶれ領域をつぶれ画像とするつぶれ画像判別手段と、該つぶれ画像判別手段により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手段とを有する。よって、接触しあう短実線を利用して画像特性を判別し、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0006】
また、つぶれ画像判別手段は、領域抽出手段により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の面積の分散値を求め、求めた分散値が所定値以上であれば当該領域をつぶれ画像とすることにより、つぶれ画像特性判別の精度を向上させ、罫線や文字の認識精度を向上させるための有益な情報を提供できる。
【0007】
更に、別の発明としての画像特性判別処理方法は、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出工程と、該ラン抽出工程により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別工程と、該罫線ラン判別工程により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出工程と、該罫線抽出工程により抽出された罫線の長さが所定値より小さい罫線を短罫線とする短罫線判別工程と、該短罫線判別工程により判別された短罫線同士が交差している短罫線を含む領域を抽出する領域抽出工程と、該領域抽出工程により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の数が所定値以上であるつぶれ領域をつぶれ画像とするつぶれ画像判別工程と、該つぶれ画像判別工程により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別工程とを有することに特徴がある。よって、接触しあう短実線を利用して画像特性を判別し、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0008】
また、つぶれ画像判別工程では、領域抽出工程により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の面積の分散値を求め、求めた分散値が所定値以上であれば当該領域をつぶれ画像とすることにより、つぶれ画像特性判別の精度を向上させ、罫線や文字の認識精度を向上させるための有益な情報を提供できる。
【0009】
更に、別の発明として、コンピュータに、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手順と、該ラン抽出手順により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手順と、該罫線ラン判別手順により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手順と、該罫線抽出手順により抽出された罫線の長さが所定値より小さい罫線を短罫線とする短罫線判別手順と、該短罫線判別手順により判別された短罫線同士が交差している短罫線を含む領域を抽出する領域抽出手順と、該領域抽出手順により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の数が所定値以上であるつぶれ領域をつぶれ画像とするつぶれ画像判別手順と、該つぶれ画像判別手順により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手順とを実行させるプログラムに特徴がある。よって、接触しあう短実線を利用して画像特性を判別し、罫線や文字の識別精度を向上させるための有益な情報を提供できる
【0010】
また、別の発明として、上記記載の画像特性判別処理方法を実行させるためのプログラムを格納したコンピュータ読み取り可能な記憶媒体に特徴がある。よって、既存のシステムを変えることなく、かつ画像特性判別処理システムを構築する装置を汎用的に使用することができる。
【0011】
【発明の実施の形態】
本発明に係る画像特性判別処理方法によれば、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとし、抽出したランの長さが所定値以上であるランを罫線ランとする。そして、判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とし、更には抽出された罫線の長さが所定値より小さい罫線を短罫線とする。そして、判別された短罫線同士が交差している短罫線を含む領域を抽出し、抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の数が所定値以上であるつぶれ領域をつぶれ画像とする。次に、判別されたつぶれ画像が占める割合に基づいて認識対象画像の特性を判別する。
【0012】
【実施例】
はじめに、本発明における構成及び動作の説明の中で使用する語句を以下に定義しておく。「矩形」とは2値画像データの画像部(例えば黒画素部)を一塊として、それらが接触包含される外接四角形で囲んだ範囲を矩形と定義する。よって、連結する黒画素を全て包含する外接範囲を矩形とする。「矩形抽出」とは矩形の位置座標を抽出することを矩形抽出と定義する。「処理方向」とは画像をX,Yの2次元とすれば、X方向(スキャン時の主走査方向)の処理とY方向(スキャン時の副走査方向)の処理を2方向の処理がある。点線抽出の場合には、点線がX方向に延びている場合とY方向に延びている場合があり、X方向とY方向の2方向でそれぞれ処理を行うものとする。「実線識別処理」の例として、矩形抽出後、着目する矩形を処理開始とし、同ベクトル上でかつ所定の距離内に存在する矩形どうしを結合してゆく処理とする。
【0013】
以下、図を用いて本発明の実施例の動作を説明する。
図1は本発明の第1の実施例に係る画像特性処理方法の全体動作を示すフローチャートである。同図において、先ず、処理のスキャナなどで画像を2値画像入力部で2値化データに変換し、高速化のために圧縮画像を作成する(ステップS101,S102)。ここで、圧縮画像とは1/4圧縮の場合4画素のうち全て白画素であった場合にのみ白画素ひとつに置き換え、4画素中1つでも黒画素が含まれていれば、黒画素ひとつに置き換えるといった圧縮処理をさす。次に、罫線認識処理で罫線を認識する(ステップS103)。抽出された罫線を使ってつぶれ領域候補抽出処理を実行する(ステップS104)。抽出されたつぶれ領域候補の特徴より画像の特性を判別する(ステップS105)。
【0014】
次に、図1のステップ103の処理で共通に用いられる処理、ラン抽出の一例を図2に従って説明する。ラン抽出処理はいずれの方法でもよしとする。ただし、ランの位置情報を提供する処理であることが必要である。また、入力された2値データをそのまま使用するか、処理時間短縮のために圧縮画像データを用いるかのどちらでも自由とする。ただし、本発明では、罫線認識処理の場合には圧縮画像(画素)データを矩形抽出処理の場合にはそのままの2値(画素)データを用いる。図2において、全ライン数を計数し、更に1ライン毎の画素数を計数する(ステップS201,S202)。そして、主走査方向の1ライン毎に黒画素連結を調べてゆき、黒画素の連結が途切れた時に黒画素一塊をランとして登録する(ステップS203;YES、ステップS204)。同様の処理を全ラインに対して繰返す(ステップS205)。
【0015】
また、図1のステップS103での罫線認識処理の一例を図3に従って説明する。罫線認識方法はいずれの方法でもよいが、罫線認識情報として、認識した罫線の位置を示すアドレス情報を提供する処理であることが必要である。ここでは一方向のみの罫線認識の場合であるが、X、Y方向と両方向の罫線認識するには、図3の処理を繰り返せばよい。図3において、図2で抽出されたランの全ての数を計数し、そのランの長さが所定値のA値以上であるかを判定する(ステップS301,S302)。所定値のA値以上であるものを罫線ランとして登録する(ステップS302;YES、ステップS303)。以上の処理を全てのランに対して行う(ステップS304)。次に、その罫線ラン数を計数し、罫線ラン同士が所定値以内に存在しているかを調べて、所定値内であれば罫線として登録する(ステップS305、ステップS306;YES、ステップS307)。同様の処理を全罫線ランの数だけ繰り返す(ステップS308)。
【0016】
更に、図1のステップS104でのつぶれ領域候補抽出処理の一例を図4に従って説明する。図1のステップS103で抽出された全罫線において、全罫線数を計数し、その罫線の長さが所定値のB値以下であるかを判定する(ステップS401,S402)。所定値のB値以下であるのものを短罫線として登録する(ステップS402;YES、ステップS403)。以上の処理を全ての罫線に対して行う(ステップS404)。次に、全短罫線数を計数し、短罫線同士で完全に交差しているものがないかを探索する(ステップS405,S406)。図5の(a)を例にすると、短罫線AとBは接触しているだけでなく完全に交差している。例えば、図5の(c)に示すように交差接触しているだけでは、枠の場合であることがあるために完全に突き抜けて交差していることが条件である。図5の(a)で示すような位置関係にあれば、それを包含する領域を登録する(ステップS406;YES、ステップS407)。次に、図5の(b)で示すように短罫線Cも完全交差していれば、図4のステップS407で登録した領域を成長させる。以上同様の処理を全短罫線に対して実施して領域を抽出する(ステップS408)。
【0017】
次に、図1のステップ105での画像特性判別処理を図6に従って説明する。図1のステップS104で抽出されたつぶれ領域候補は大体文字上で抽出される(図5の(d)参照)。そこで、通常の文字サイズを予測し、あるいは予め、サイズをいずれかの手段を用いて情報として与えておき、それよりも大きい領域の場合には「文字がつぶれて隣どうし接触しあいつながっている状態」であると判別する。従って、図6の抽出された全領域のうち領域面積が所定値のC値以上のものをつぶれ領域として登録する(ステップS501、ステップS502;YES、ステップS503)。以上の処理を全ての領域に対して行う(ステップS504)。ステップS503でつぶれ領域として登録されたものが所定値のD個以上あればつぶれ画像と判別する(ステップS505;YES、ステップS506)。
【0018】
また、図1のステップ105での画像特性判別処理の別の例を図7に従って説明する。図1のステップS104で抽出されたつぶれ領域候補に対して、各領域に包含されている罫線の信頼性を評価し、つぶれ領域であるか否かの判別をする(ステップS601〜S605)ことで、さらに画像特性判別の精度を向上させるものである。例えば図5の(a)を例にとると、罫線AとBが誤認識された罫線であるかの判定を行う。その判定方法はいずれの方式でも可とする。判定方法の一例をあげると、罫線Aの近傍に黒画素を利用し、例えば黒画素密度が高い場合には文字上で誤認識された罫線と判別する。このようにして、つぶれ領域候補を構成する罫線のうち誤認識された罫線の占める割合が所定値Z値以上であればつぶれ領域と判定する(ステップS603;YES)。ステップS604でつぶれ領域として登録されたものが所定値のD個以上あればつぶれ画像と判別する(ステップS606;YES、ステップS607)。
【0019】
また、上記実施例ではつぶれ領域候補の面積が文字サイズ以上という条件を判定理由に用いているが、文字サイズが不明であったり、想定した文字サイズが実際の認識対象の文字サイズと異なっていた場合には画像特性の判定精度が悪くなる可能性がある。そこで、全つぶれ領域候補の面積のバラツキを算出(分散値)を用いることでこれを解決する。つまり、抽出されたつぶれ領域候補がバラツキなく一定であれば、つぶれていない一文字一文字上で抽出された領域であると判別できるのである。図8のステップS701でつぶれ領域候補数が所定値のY個以上の場合(ステップS701;YES)、分散値を算出し、所定値のE値以上であれば、つぶれ画像と判別する(ステップS702、ステップS703;YES、ステップS704)。
【0020】
図9は本発明の第2の実施例に係る画像特性処理方法の全体動作を示すフローチャートである。同図において、先ず、処理のスキャナなどで画像を2値画像入力部で2値化データに変換し、高速化のために圧縮画像を作成する(ステップS801,S802)。次に、罫線認識処理で罫線を認識する(ステップS803)。抽出された罫線を使って罫線特徴判別処理を実行する(ステップS804)。判別された罫線特徴情報を用いて画像の特性を判別する(ステップS805)。
【0021】
図9のステップS803での罫線認識処理の一例を図10に従って説明する。図9のステップS803で抽出された全罫線を計数し、他の罫線と接触せずに単独に存在しているか否かを判別する(ステップS901,S902)。単独存在していれば単独罫線として登録する(ステップS902;YES、ステップS903)。以上の処理を全ての罫線に対して行う(ステップS904)。次に、単独罫線を計数し、単独罫線を判別された単独罫線周囲近傍の黒画素密度を求めてその値が所定値のG値以上であれば(ステップS905、ステップS906;YES)、つぶれ文字上に誤認識された罫線と判別して罫線として登録していたものを無効化する(ステップS907)。全単独罫線に対して判別処理が終了すれば(ステップS908;YES)、無効化罫線数が所定値のH値以上であれば、つぶれ画像であると判定する(ステップS909;YES、ステップS910)。
【0022】
また、図9のステップS803での罫線認識処理の別の例を図11に従って説明する。図9のステップS803で抽出された全罫線を計数し、他の罫線と接触せずに単独に存在しているか否かを判別する(ステップS1001,S1002)。単独存在していれば単独罫線として登録する(ステップS1002;YES、ステップS1003)。以上の処理を全ての罫線に対して行う(ステップS1004)。次に、単独罫線と判別された罫線に対して、その罫線範囲内を処理対象としてラン抽出処理を行う(ステップS1005,S1006)。その結果、抽出されたランの数が所定値のF値以上であれば、かすれ罫線であると判定して登録する(ステップS107;YES、ステップS1008)。以上の処理を全ての単独罫線に対して行う(ステップS1009)。次に、かすれ罫線と判別された罫線の数が所定値のY値以上であれば、かすれ画像であると判定する(ステップS1010;YES、ステップS1011)。
【0023】
次に、図12は本発明のシステム構成を示すブロック図である。つまり、同図は上記各実施例における画像特性判別処理方法によるソフトウェアを実行するマイクロプロセッサ等から構築されるハードウェアを示すものである。同図において、画像特性判別処理システムはインターフェース(以下I/Fと略す)121、CPU122、ROM123、RAM124、表示装置125、ハードディスク126、キーボード127及びCD−ROMドライブ128を含んで構成されている。また、汎用の処理装置を用意し、CD−ROMなどの読取可能な記憶媒体129には、本発明の画像特性判別処理方法を実行するプログラムが記録されている。更に、I/F121を介して外部装置から制御信号が入力され、キーボード127によって操作者による指令又は自動的に本発明のプログラムが起動される。そして、CPU122は当該プログラムに従って上述の画像特性判別処理方法を施し、その処理結果をRAM124やハードディスク126等の記録装置に格納し、必要により表示装置125などに出力する。以上のように、本発明の画像特性判別処理方法を実行するプログラムが記憶した媒体を用いることにより、既存のシステムを変えることなく、かつ画像特性判別処理システムを構築する装置を汎用的に使用することができる。
【0024】
なお、本発明は上記実施例に限定されるものではなく、特許請求の範囲内の記載であれば多種の変形や置換可能であることは言うまでもない。
【0025】
【発明の効果】
以上説明したように、本発明に係る画像特性判別処理装置は光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手段と、該ラン抽出手段により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手段と、該罫線ラン判別手段により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手段と、該罫線抽出手段により抽出された罫線の長さが所定値より小さい罫線を短罫線とする短罫線判別手段と、該短罫線判別手段により判別された短罫線同士が交差している短罫線を含む領域を抽出する領域抽出手段と、該領域抽出手段により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の数が所定値以上であるつぶれ領域をつぶれ画像とするつぶれ画像判別手段と、該つぶれ画像判別手段により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手段とを有する。よって、接触しあう短実線を利用して画像特性を判別し、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0026】
また、つぶれ画像判別手段は、領域抽出手段により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の面積の分散値を求め、求めた分散値が所定値以上であれば当該領域をつぶれ画像とすることにより、つぶれ画像特性判別の精度を向上させ、罫線や文字の認識精度を向上させるための有益な情報を提供できる。
【0027】
更に、別の発明としての画像特性判別処理方法は、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出工程と、該ラン抽出工程により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別工程と、該罫線ラン判別工程により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出工程と、該罫線抽出工程により抽出された罫線の長さが所定値より小さい罫線を短罫線とする短罫線判別工程と、該短罫線判別工程により判別された短罫線同士が交差している短罫線を含む領域を抽出する領域抽出工程と、該領域抽出工程により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の数が所定値以上であるつぶれ領域をつぶれ画像とするつぶれ画像判別工程と、該つぶれ画像判別工程により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別工程とを有することに特徴がある。よって、接触しあう短実線を利用して画像特性を判別し、罫線や文字の識別精度を向上させるための有益な情報を提供できる。
【0028】
また、つぶれ画像判別工程では、領域抽出工程により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の面積の分散値を求め、求めた分散値が所定値以上であれば当該領域をつぶれ画像とすることにより、つぶれ画像特性判別の精度を向上させ、罫線や文字の認識精度を向上させるための有益な情報を提供できる。
【0029】
更に、別の発明として、コンピュータに、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手順と、該ラン抽出手順により抽出したランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手順と、該罫線ラン判別手順により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手順と、該罫線抽出手順により抽出された罫線の長さが所定値より小さい罫線を短罫線とする短罫線判別手順と、該短罫線判別手順により判別された短罫線同士が交差している短罫線を含む領域を抽出する領域抽出手順と、該領域抽出手順により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の数が所定値以上であるつぶれ領域をつぶれ画像とするつぶれ画像判別手順と、該つぶれ画像判別手順により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手順とを実行させるプログラムに特徴がある。よって、接触しあう短実線を利用して画像特性を判別し、罫線や文字の識別精度を向上させるための有益な情報を提供できる
【0030】
また、別の発明として、上記記載の画像特性判別処理方法を実行させるためのプログラムを格納したコンピュータ読み取り可能な記憶媒体に特徴がある。よって、既存のシステムを変えることなく、かつ画像特性判別処理システムを構築する装置を汎用的に使用することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係る画像特性処理方法の全体動作を示すフローチャートである。
【図2】第1の実施例におけるラン抽出動作の一例を示すフローチャートである。
【図3】第1の実施例における罫線認識処理動作の一例を示すフローチャートである。
【図4】第1の実施例におけるつぶれ領域候補抽出処理動作の一例を示すフローチャートである。
【図5】第1の実施例における画像認識対象の一例を示す図である。
【図6】第1の実施例における画像特性判別処理動作の一例を示すフローチャートである。
【図7】第1の実施例における画像特性判別処理動作の別の例を示すフローチャートである。
【図8】第1の実施例におけるつぶれ領域候補抽出処理動作の別の例を示すフローチャートである。
【図9】本発明の第2の実施例に係る画像特性処理方法の全体動作を示すフローチャートである。
【図10】第2の実施例における罫線認識処理動作の一例を示すフローチャートである。
【図11】第2の実施例における罫線認識処理動作の別の例を示すフローチャートである。
【図12】本発明のシステム構成を示すブロック図である。
【符号の説明】
121;I/F、122;CPU、123;ROM、124;RAM、
125;表示装置、126;ハードディスク、127;キーボード、
128;CD−ROMドライブ、129;記憶媒体。

Claims (6)

  1. 光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手段と、
    該ラン抽出手段により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手段と、
    該罫線ラン判別手段により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出手段と、
    該罫線抽出手段により抽出された罫線の長さが所定値より小さい罫線を短罫線とする短罫線判別手段と、
    該短罫線判別手段により判別された短罫線同士が交差している短罫線を含む領域を抽出する領域抽出手段と、
    該領域抽出手段により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の数が所定値以上であるつぶれ領域をつぶれ画像とするつぶれ画像判別手段と、
    該つぶれ画像判別手段により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手段と
    を有することを特徴とする画像特性判別処理装置
  2. 前記つぶれ画像判別手段は、前記領域抽出手段により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の面積の分散値を求め、求めた分散値が所定値以上であれば当該領域をつぶれ画像とする請求項1記載の画像特性判別処理装置
  3. 光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出工程と、
    該ラン抽出工程により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別工程と、
    該罫線ラン判別工程により判別された罫線ランの数を計数して罫線ラン同士が所定値以内に存在している罫線ラン同士を罫線とする罫線抽出工程と、
    該罫線抽出工程により抽出された罫線の長さが所定値より小さい罫線を短罫線とする短罫線判別工程と、
    該短罫線判別工程により判別された短罫線同士が交差している短罫線を含む領域を抽出する領域抽出工程と、
    該領域抽出工程により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の数が所定値以上であるつぶれ領域をつぶれ画像とするつぶれ画像判別工程と、
    該つぶれ画像判別工程により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別工程と
    を有することを特徴とする画像特性判別処理方法。
  4. 前記つぶれ画像判別工程では、前記領域抽出工程により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の面積の分散値を求め、求めた分散値が所定値以上であれば当該領域をつぶれ画像とする請求項3記載の画像特性判別処理方法。
  5. コンピュータに、光学的に読み取った画像データの主走査方向及び副走査方向の1ライン毎に黒画素連結を調べ、黒画素の連結が途切れた時に黒画素一塊をランとするラン抽出手順と、
    該ラン抽出手順により抽出した前記ランの長さが所定値以上であるランを罫線ランとする罫線ラン判別手順と、
    該罫線ラン判別手順により判別された罫線ランの数を計数して罫線ラン同士が所定値以 内に存在している罫線ラン同士を罫線とする罫線抽出手順と、
    該罫線抽出手順により抽出された罫線の長さが所定値より小さい罫線を短罫線とする短罫線判別手順と、
    該短罫線判別手順により判別された短罫線同士が交差している短罫線を含む領域を抽出する領域抽出手順と、
    該領域抽出手順により抽出した領域の面積が所定値以上である領域をつぶれ領域とし、当該つぶれ領域の数が所定値以上であるつぶれ領域をつぶれ画像とするつぶれ画像判別手順と、
    該つぶれ画像判別手順により判別されたつぶれ画像が占める割合に基づいて認識対象の画像の特性を判別する画像特性判別手順と
    を実行させるためのプログラム
  6. 請求項5記載のプログラムを格納したコンピュータ読み取り可能な記憶媒体
JP2001043145A 2001-02-20 2001-02-20 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体 Expired - Fee Related JP4094240B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001043145A JP4094240B2 (ja) 2001-02-20 2001-02-20 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001043145A JP4094240B2 (ja) 2001-02-20 2001-02-20 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007329762A Division JP4381445B2 (ja) 2007-12-21 2007-12-21 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体

Publications (2)

Publication Number Publication Date
JP2002245405A JP2002245405A (ja) 2002-08-30
JP4094240B2 true JP4094240B2 (ja) 2008-06-04

Family

ID=18905360

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001043145A Expired - Fee Related JP4094240B2 (ja) 2001-02-20 2001-02-20 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体

Country Status (1)

Country Link
JP (1) JP4094240B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4135752B2 (ja) 2006-06-12 2008-08-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム

Also Published As

Publication number Publication date
JP2002245405A (ja) 2002-08-30

Similar Documents

Publication Publication Date Title
US6839466B2 (en) Detecting overlapping images in an automatic image segmentation device with the presence of severe bleeding
CN110503054B (zh) 文本图像的处理方法及装置
TWI254891B (en) Face image detection method, face image detection system, and face image detection program
CN111461126B (zh) 文本行中的空格识别方法、装置、电子设备及存储介质
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
EP1081648A2 (en) Method for processing a digital image
JP5111055B2 (ja) 画像処理装置及び画像処理方法、コンピュータプログラム
EP0551403B1 (en) Character recognition methods and apparatus for locating and extracting predetermined data from a document
US6141444A (en) Method for deleting ruled lines and a recording medium storing programs for performing the method
EP1679655A1 (en) Face image candidate area search method, face image candidate area search system, and face image candidate area search program
JP4094240B2 (ja) 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体
JP4381445B2 (ja) 画像特性判別処理装置、画像特性判別処理方法、該方法を実行させるためのプログラム及び該プログラムを格納したコンピュータ読み取り可能な記憶媒体
JP4213357B2 (ja) 画像処理装置、画像処理方法及び該方法を実行させるためのプログラム
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JPH11312215A (ja) 二次元コードデコード装置、及び記憶媒体
JP4159071B2 (ja) 画像処理方法,画像処理装置および該処理方法を実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
CN114937017B (zh) 图像处理方法、装置、电子设备和存储介质
JP2003281469A (ja) 文書画像処理方法
JP4248700B2 (ja) 罫線識別方法、罫線識別装置および記録媒体
JP5691281B2 (ja) 文字認識装置、文字認識プログラム及び文字認識方法
US20220406083A1 (en) Image processing apparatus, control method thereof, and storage medium
JP7599861B2 (ja) 情報処理装置、情報処理方法及びプログラム
JPH11242716A (ja) 画像処理方法および記録媒体
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP4270767B2 (ja) 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080305

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120314

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130314

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140314

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees