[go: up one dir, main page]

JPH1125218A - 行切出し方法、行切出し修正方法、行切出し装置および行切出し修正装置 - Google Patents

行切出し方法、行切出し修正方法、行切出し装置および行切出し修正装置

Info

Publication number
JPH1125218A
JPH1125218A JP9218913A JP21891397A JPH1125218A JP H1125218 A JPH1125218 A JP H1125218A JP 9218913 A JP9218913 A JP 9218913A JP 21891397 A JP21891397 A JP 21891397A JP H1125218 A JPH1125218 A JP H1125218A
Authority
JP
Japan
Prior art keywords
section
black pixel
length
divided
pixel section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9218913A
Other languages
English (en)
Inventor
Kazuhiro Ishikawa
和弘 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9218913A priority Critical patent/JPH1125218A/ja
Publication of JPH1125218A publication Critical patent/JPH1125218A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文書画像の行方向が不明である場合でも、事
前に個別に行方向を判定することなく、行切出しを可能
とする。 【解決手段】 行方向が不明である場合または行方向が
第1方向である場合に、第1方向分割領域を生成し、こ
れを走査して第1方向射影分布を作成し、この分布に基
づいて第1分割行を切出す。一方、行方向が不明である
場合または行方向が第2方向である場合に、第2方向分
割領域を生成し、これを走査して第2方向射影分布を作
成し、この分布に基づいて第2分割行を切出す。そし
て、行方向が不明である場合に、第1および第2分割行
の情報を用いて行方向の判定を行なうい、判定された行
方向の分割行どうしを互いに接続して行を切り出す。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、原稿上の文字を
光学的に走査して例えば2値画像で表される文書画像
(イメージデータ)を取得し、その文書画像に対して文
字認識を行なう光学式文字読取装置(OCR)におい
て、文書画像の行を切り出す方法および装置、行切出し
修正方法および装置に関する。
【0002】
【従来の技術】文字認識にあたり、一般に、先ず、原稿
をスキャナで読み込んで生成された文書画像の行切出し
を行なう。次に、切り出された行から文字を切り出す。
そして、切り出された文字の認識を行なう。
【0003】従来の行切出し方法の一例が、文献1:
「特開昭64−48186号公報」に開示されている。
この文献に開示の技術によれば、行切出しを行なうにあ
たり、先ず、文書画像を文字列(行)を横切る分割線に
よって分割する。次に、分割領域毎に、文字列方向の射
影分布(投影)を作成する。次に、この射影分布に基づ
いて、各分割領域毎にそれぞれ部分文字列を切り出す。
次に、各部分文字列それぞれ、隣接する分割領域の部分
文字列の切出し座標が重複するものに同一のラベルを付
す。そして、隣接した分割領域のラベルが同一の部分文
字列どうしを連結して、文書画像の行切出しを行なう。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
行切出し方法においては、文書画像の行方向が既知であ
ることが前提である。従って、従来の行切出し方法にお
いては、行方向が不明である文書画像の行切出しは行な
うことができない。このため、従来は、文書画像の行方
向が不明の場合には、行切出しを行なう前に個別に行方
向を判定しておく必要があった。
【0005】このため、文書画像の行方向が不明である
場合でも、事前に個別に行方向を判定することなく、行
切出しが可能な行切出し方法および装置の出現が望まれ
ていた。
【0006】また、従来の行切出し方法においては、例
えば、隣り合った行どうしが近接している場合や、例え
ば射影分布を作成する際の走査方向に対して文書画像の
行方向(文字列を構成する文字が並んでいる方向)が傾
斜して入力された場合には、隣り合った2つの個別の行
が1つの行として切り出されてしまうことがあった。
【0007】また、従来の行切出し方法においては、例
えば、ある文字列を構成する各文字が、いずれも上下に
分かれる部首からなる場合に、1つの行が2つの個別の
行として切り出されてしまうことがあった。
【0008】このため、行切出しの確実化を図ることが
できる行切出し修正方法および装置の出現が望まれてい
た。
【0009】
【課題を解決するための手段】
(行切出し方法)この出願に係る発明者は、種々の研究
および実験を重ねた結果、行切出しの処理によって得ら
れる情報を用いて行方向の判定を行なえば、行切出しの
前に行切出しの処理とは別個に行方向判定の処理を行な
わなくとも、行方向が不明である文書画像の行切出しが
可能になることに想到した。
【0010】そこで、この発明の行切出し方法によれ
ば、(a1)文書画像の行方向が不明である場合および
文書画像の行方向が第1方向である場合に、該第1方向
と直交する第2方向に沿った分割線によって文書画像を
分割することにより、該第1方向に沿って並んだ複数の
第1方向分割領域を生成するプロセスと、(b1)第1
方向分割領域が生成された場合に、当該第1方向分割領
域の各々を、第1方向に沿って走査して走査毎の累積黒
画素数を検出し、当該累積黒画素数の第2方向に沿った
分布を求めることにより第1方向射影分布を作成するプ
ロセスと、(c1)第1方向射影分布が作成された場合
に、当該第1方向射影分布の各々において第1基準値以
上の累積黒画素数が第2方向に沿って連続する区間をそ
れぞれ第1黒画素区間として、当該第1黒画素区間が得
られる走査領域をそれぞれ第1分割行として分割行切出
しを行なうプロセスと、(a2)文書画像の行方向が不
明である場合およびこの文書画像の行方向が第2方向で
ある場合に、第1方向に沿った分割線によって文書画像
を分割することにより、この第1方向と直交する第2方
向に沿って並んだ複数の第2方向分割領域を生成するプ
ロセスと、(b2)第2方向分割領域が生成された場合
に、当該第2方向分割領域の各々を、第2方向に沿って
走査して走査毎の累積黒画素数を検出し、当該累積黒画
素数の第1方向に沿った分布を求めることにより第2方
向射影分布を作成するプロセスと、(c2)第2方向射
影分布が作成された場合に、当該第2方向射影分布の各
々において第2基準値以上の累積黒画素数が第1方向に
沿って連続する区間をそれぞれ第2黒画素区間として、
当該第2黒画素区間が得られる走査領域をそれぞれ第2
分割行として分割行切出しを行なうプロセスと、(d)
文書画像の行方向が不明である場合に、第1方向射影分
布と第2方向射影分布とに基づいて、文書画像の行方向
を判定するプロセスと、(e1)文書画像の行方向が第
1方向である場合に、第1方向で互いに隣接する第1方
向分割領域にそれぞれ含まれる分割行どうしであって、
当該分割行を走査して得られた第1黒画素区間の少なく
とも一部分どうしが重なっている分割行どうしを接続し
て行切出しを行なうプロセスと、(e2)文書画像の行
方向が第2方向である場合に、第2方向で互いに隣接す
る第2方向分割領域にそれぞれ含まれる分割行どうしで
あって、当該分割行を走査して得られた第2黒画素区間
の少なくとも一部分どうしが重なっている分割行どうし
を接続して行切出しを行なうプロセスとを含むことを特
徴とする。
【0011】このように、この発明の行切出し方法によ
れば、文書画像の行方向が不明である場合に、行切出し
の処理の一環である(b1)のプロセスにおいて得られ
た第1方向射影分布および(b2)のプロセスにおいて
得られた第2方向射影分布を用いて、(d)のプロセス
において行方向を判定する。従って、この発明によれ
ば、文書画像の行方向が不明である場合でも、事前に行
切出しとは個別に行方向を判定する処理を行なうことな
く、行切出しを行なうことができる。
【0012】尚、行方向に沿って文書画像を走査して得
られた射影分布において、各行にそれぞれ対応した黒画
素区間を求めるためには、累積黒画素数の基準値(例え
ば上記の第1基準値および第2基準値)を設定して、こ
の基準値以上の累積黒画素数の部分を黒画素区間とする
と良い。例えば、文書画像のうち、行(文字列)以外の
文書画像部分を走査して1画素以上の累積黒画素数が検
出される場合(例えば、文書画像の走査領域に枠線が含
まれている場合)でも、任意好適な基準値を適切に設定
すれば、各行にそれぞれ対応した黒画素区間が求まる可
能性が高くなる。
【0013】また、例えば、文書画像の行方向が走査方
向に対して傾斜している場合には、隣り合った分割行の
射影どうしが、射影分布において、部分的に重複してし
まう場合がある。その場合、重複部分の射影の累積黒画
素数は、非重複部分の射影累積黒画素数よりも少ないこ
とが多い。そこで、任意好適な基準値(例えば重複部分
の累積黒画素数程度の数値や、例えば重複部分の累積黒
画素数程度の数値と非重複部分の累積黒画素数程度の数
値との間の数値)を設定すれば、各行にそれぞれ対応し
た黒画素区間が求まる可能性が高くなる。
【0014】(黒画素区間長のばらつきによる行方向判
定)ところで、上記の(d)のプロセスにおいて行方向
の判定を行なうにあたり、この出願に係る発明者は、行
方向の判定の手がかりの一つとして、行の高さや行の幅
のばらつきに着目した。
【0015】一般に、文書画像が横書きの場合には、各
行の文字の高さが揃っている。また、文書画像が縦書き
の場合には、各行の文字の幅が揃っている。従って、文
書画像を行方向に沿って走査して得られる射影分布にお
いては、各行にそれぞれ対応する射影部分である黒画素
区間の長さ(黒画素区間長)のばらつきが一般に小さ
い。これに対して、行方向と直交する方向に沿って走査
して得られる射影分布においては、一般に、各黒画素区
間長のばらつきが大きい。従って、この黒画素区間長の
ばらつきの大小に着目すれば、行方向判定が可能とな
る。
【0016】そこで、この発明の行切出し方法の実施に
あたり、好ましくは、(d)のプロセスにおいて、第1
黒画素区間の各々の長さをそれぞれ第1黒画素区間長と
して、当該第1黒画素区間長のばらつきを算出するプロ
セスと、第2黒画素区間の各々の長さをそれぞれ第2黒
画素区間長として、当該第2黒画素区間長のばらつきを
算出するプロセスと、および、第1黒画素区間長のばら
つきと第2黒画素区間長のばらつきとを比較して、当該
第1黒画素区間長のばらつきと当該第2黒画素区間長の
ばらつきとの比率が第3基準値以上の場合に、ばらつき
の小さい方の黒画素区間長が得られた射影分布の走査方
向を行方向と判定するプロセスとを含むと良い。
【0017】前述のように、文書画像を行方向に実質的
に沿って走査して得られる射影分布の黒画素区間長のば
らつきは、文書画像を行を横切って走査して得られる射
影分布の黒画素区間長のばらつきよりも一般に小さい。
従って、第1黒画素区間長のばらつきと第2黒画素区間
長のばらつきとを比較すれば、行方向の判定の確実化を
図ることができる。
【0018】また、上記の第3基準値は、任意好適な値
を設定すると良い。例えば第3基準値を「1」と設定し
た場合は、第1黒画素区間のばらつきと第2黒画素区間
のばらつきとの大小を単に比較することに相当する。
尚、第3基準値を「1」に限定しない理由は、ばらつき
の比率が小さい場合に、単にばらつきの大小だけで行方
向を判定すると、誤った判定結果が出力される場合があ
り得るためである。
【0019】(平均白画素区間長による行方向判定)ま
た、この出願に係る発明者は、行方向の判定のさらなる
手がかりの一つとして、行間隔と文字間隔に着目した。
一般の文書画像においては、行間隔が文字間隔よりも広
い。この行間隔は、文書画像を行方向に沿って走査して
得られる射影分布において、各行に対応する黒画素区間
の隣どうしの間隔に反映される。また、文字間隔は、行
方向を直交する方向に沿って走査して得られる射影分布
において、隣り合った黒画素区間どうしの間隔に反映さ
れる。従って、この行間隔および文字間隔に着目すれ
ば、行方向の判定が可能となる。
【0020】そこで、この発明の行切出し方法の実施に
あたり、より好ましくは、(d)のプロセスにおいて、
第1黒画素区間長のばらつきと第2黒画素区間長のばら
つきとの比率が第3基準値未満の場合に、第1方向射影
分布において隣り合った第1黒画素区間どうしの間の第
1白画素区間の長さと、第2方向射影分布において隣り
合った第2黒画素区間どうしの間の第2白画素区間の長
さとを利用して、行方向を判定するプロセスを含むのが
良い。
【0021】ところで、第1および第2黒画素区間長の
ばらつきどうしを比較しない場合であっても、行間隔お
よび文字間隔に着目することにより、行方向の判定は可
能となる。
【0022】そこで、この発明の行切出し方法の実施に
あたっては、(d)のプロセスにおいて、第1方向射影
分布において隣り合った第1黒画素区間どうしの間の第
1白画素区間の長さと、第2方向射影分布において隣り
合った第2黒画素区間どうしの間の第2白画素区間の長
さとを利用して、行方向を判定するプロセスを含むのが
良い。
【0023】さらに、この第1白画素区間長および第2
白画素区間長に着目して行方向判定を行なうにあたり、
より好ましくは、第1白画素区間が1箇所の場合には、
当該第1白画素区間の長さを第1平均白画素区間長と
し、かつ、第1白画素区間が複数箇所の場合には、当該
第1白画素区間の各々の長さの相加平均を第1平均白画
素区間長として算出するプロセスと、第2白画素区間が
1箇所の場合には、当該第2白画素区間の長さを第2平
均白画素区間長とし、かつ、第2白画素区間が複数箇所
の場合には、当該第2白画素区間の各々の長さの相加平
均を第2平均白画素区間長として算出するプロセスと第
1平均白画素区間長と第2平均白画素区間長とを比較し
て、より大きな平均白画素区間長の得られた射影分布の
走査方向を行方向と判定するプロセスとを含むと良い。
【0024】前述のように、行間隔は、一般に文字間隔
よりも広い。従って、第1平均白画素区間長と第2平均
白画素区間長とのうちの、より大きな平均白画素区間長
の方が行間の空白に対応する。従って、第1平均白画素
区間長と第2平均白画素区間長とを比較して行方向を判
定すれば、第1黒画素区間長のばらつきと第2黒画素区
間長のばらつきとの比率が小さい場合(例えば、文字間
隔が固定ピッチの場合)であっても、行方向判定の確実
化を図ることができる。
【0025】(1行のみの場合の行方向判定)ところ
で、文書画像に文字列が1行のみ含まれている場合に
は、行方向と直交する分割線によって分割されて生成さ
れた各分割領域に、分割行が1つずつ含まれる。その結
果、この場合には、分割領域の数と、各分割領域にそれ
ぞれ含まれる分割行の数の合計とが一致する。これに対
して、行方向に沿った分割線によって文書画像を分割し
た場合には、分割領域の数と、分割行の数の合計とは一
致しない。例えば、複数の分割領域が生成されても、分
割行の数の合計は1つのままとなる。従って、文字列が
1行だけの場合には、分割領域の数と分割行の数の合計
とを比較すれば、黒画素区間長のばらつきどうしや平均
白画素区間長どうしを比較するまでもなく、行方向を判
定することができる。
【0026】そこで、この発明の行切出し方法を実施す
るにあたり、好ましくは、(d)のプロセスにおいて、
第1方向分割領域の数の合計を第1分割領域数として求
めるプロセスと、第1黒画素区間の数の、全ての第1方
向分割領域にわたっての合計を第1黒画素区間数として
求めるプロセスと、第2方向分割領域の数の合計を第2
分割領域数として求めるプロセスと、第2黒画素区間の
数の、全ての第2方向分割領域にわたっての合計を第2
黒画素区間数として求めるプロセスと、第1黒画素区間
数とこの第1分割領域数とが一致し、かつ、第2黒画素
区間数と第2分割領域数とが不一致の場合に、行方向を
第1方向と判定するプロセスと、および、第2黒画素区
間数とこの第2分割領域数とが一致し、かつ、第1黒画
素区間数と第1分割領域数とが不一致の場合に、行方向
を第2方向と判定するプロセスとを含むと良い。
【0027】このように、分割領域の数と分割行の数の
合計とを比較すれば、文字列が1行だけの場合には、黒
画素区間長のばらつきどうしや平均白画素区間長どうし
を比較するまでもなく、行方向判定を行なうことができ
る。
【0028】(分割行の接続)ところで、各分割領域に
おいてそれぞれ分割行を切り出した後、各分割行を接続
する際に、1つの分割行が片側だけで2つの分割行と接
続可能な場合がある。すなわち、1つの分割行の黒画素
区間が、片側だけで2つの分割行の黒画素区間とそれぞ
れ部分的に重複している場合がある。このような、重複
は、文書画像の行方向が走査方向に対して傾斜している
場合に発生し易い傾向がある。
【0029】また、このように行方向が傾斜している場
合には、例えば、上記の文献1に開示の技術において
も、部分文字列(分割行に相当する)の切出し座標が隣
接する分割領域の2つの部分文字列の切出し座標とそれ
ぞれ重複するため、同じラベルを2つの部分文字列の両
方に付けなければならなくなる場合が生じ得る。この場
合、文献1に開示の技術においては、行切出しが困難と
なる。
【0030】そこで、この発明の行切出し方法を実施す
るにあたり、好ましくは、(e1)のプロセス、すなわ
ち、第1分割行どうしの接続を行なうプロセスにおい
て、分割領域に含まれる第1方向分割行の第1黒画素区
間の一部分が、当該分割領域と隣接する他の1つの分割
領域に含まれる2つの第1分割行の第1黒画素区間の一
部分とそれぞれ重なっている場合、重なっている区間の
長さが第4基準値よりも長い分割行どうしを接続し、
(e2)のプロセス、すなわち、第2分割行どうしの接
続を行なうプロセスにおいて、分割領域に含まれる第2
方向分割行の第2黒画素区間の一部分が、当該分割領域
と隣接する他の1つの分割領域に含まれる2つの第2分
割行の第2黒画素区間の一部分とそれぞれ重なっている
場合、重なっている区間の長さが第5基準値よりも長い
分割行どうしを接続すると良い。
【0031】このように、第4基準値や第5基準値を用
いて接続する分割行どうしを決定すれば、分割行の片側
で2つの分割行と重なっている場合でも、適切に分割行
どうしを接続することができる。その結果、各分割領域
にわたって分割行を適切に接続して行切出しを行なうこ
とができる。
【0032】また、上記の第4基準値および第5基準値
は、任意好適な値を設定すると良い。例えば、第4基準
値と第5基準値とは互いに等しくても良いし、互いに異
なっていても良い。また、第4および第5基準値は、そ
れぞれ、互いに接続される分割行どうしのずれの量が最
小となるように設定するのが望ましい。例えば、黒画素
区間長と白画素区間長とが同程度の長さの場合には、第
4および第5基準値の少なくとも一方を「0.5」程度
の値としても良い。その場合、1つの分割行の片側でそ
れぞれ重なっている、となりの分割領域の2つの分割行
のうち、一方が、基準値を満たすと、他方が基準値を満
たさなくなる。
【0033】(統合修正1)ところで、分割行切出しの
際には、本来1つの分割行を誤って2つの分割行として
切り出してしまうことがある。例えば、ある横書き文字
列を構成する各文字が、いずれも上下に分かれる部首か
らなる場合に、本来1つの分割行を2つの個別の分割行
として切り出すことがある。また、例えば、ある縦書き
の文字列を構成する各文字が、いずれも左右に分かれる
部首からなる場合に、本来1つの分割行を2つの個別の
分割行として切り出してしまうことがある。
【0034】この誤って切り出された2つの分割行は、
それぞれ分割行の高さ(横書きの場合)または幅(縦書
きの場合)が、適切に切り出された他の分割行に比べて
短い。そして、誤って切り出された2つの分割行の高さ
または幅は、一般に、他の分割行の半分程度である。さ
らに、この誤って切り出された2つの分割行どうしの行
間隔は、一般に、他の分割行どうしの行間隔間に比べて
狭い。
【0035】従って、切り出された分割行の高さ若しく
は幅と行間隔とに着目すれば、本来1つの分割行として
切り出されるべきところを誤って2つの分割行として切
り出された分割行を発見して、分割行切出しの修正が可
能となる。
【0036】そこで、この発明の行切出し方法を実施す
るにあたり、好ましくは、(e1)のプロセスを行なう
前に、(c1)のプロセスにおいて切り出された第1分
割行の第1黒画素区間の長さ(以下、第1黒画素区間長
とも称する。)の相加平均を第1平均黒画素区間長とし
て求めるプロセスと、この第1平均黒画素区間長と第1
黒画素区間長とを比較して、第1黒画素区間のうち、第
1平均黒画素区間長に対する第1黒画素区間長の比率が
第6基準値よりも小さな第1黒画素区間を第1候補区間
として選択するプロセスと、この第1候補区間の一方の
側の直近の第1黒画素区間である第1候補黒画素区間と
この第1候補区間とを一つの連続した黒画素区間とした
場合の当該黒画素区間を第1統合区間とし、当該第1統
合区間の長さを求めるプロセスと、この第1統合区間の
長さと第1平均黒画素区間長との差の大きさを第1統合
区間長誤差として求めるプロセスと、この第1候補区間
の他方の側の直近の第1黒画素区間である第2候補黒画
素区間とこの第1候補区間とを1つの連続した黒画素区
間とした場合の当該黒画素区間を第2統合区間とし、当
該第2統合区間の長さを求めるプロセスと、この第2統
合区間の長さと第1平均黒画素区間長との差の大きさを
第2統合区間長誤差として求めるプロセスと、第1統合
区間長誤差と第2統合区間長誤差とを比較して、誤差の
小さい方の統合区間を第1選択統合区間として選択する
プロセスと、この第1選択統合区間のうちの、第1候補
区間と当該第1候補区間の直近の第1黒画素区間との間
の第1白画素区間の長さを求めるプロセスと、この第1
白画素区間の長さと第7基準値とを比較して、当該第1
白画素区間の長さが当該第7基準値よりも短い場合に、
第1選択統合区間を1つの連続した第1黒画素区間とす
ることにより、行切出しの修正を行なうプロセスとを含
むと良い。
【0037】ここでは、行切出しの修正にあたり、先
ず、黒画素区間長に着目して、誤って分割されて切り出
された可能性の高い第1候補区間を選択する。第1候補
区間の選択にあたっては、第1黒画素区間長と第1平均
黒画素区間長とを比較する。そして、第1平均黒画素区
間長に対する比率が第6基準値よりも小さい第1黒画素
区間を第1候補区間として選択する。この第6基準値
は、例えば1未満で0よりも大きな任意好適な値(例え
ば0.5程度)を設定すると良い。
【0038】この第1候補区間の両側には、第1候補区
間が端の行である場合を除いて、それぞれ分割行が存在
している。そして、この両側の2つの分割行のうちのど
ちらの分割行を第1候補区間と統合して修正すべきかを
決定する。この決定にあたっては、第1統合区間長誤差
と第2統合区間長誤差とを比較して、誤差の小さい方を
第1選択統合区間として選択する。
【0039】さらに、1行を誤って2つの行に分割した
場合には、一般に、分割された2つの行の間の白画素区
間の長さが短い。そこで、第1候補区間と第1選択統合
区間との間の第1白画素区間の長さを、第7基準値と比
較する。この第7基準値は、任意好適な値を設定すると
良い。例えば、白画素区間の長さの平均値よりも小さい
値(例えば、平均値の半分程度の長さ)を第7基準値と
して設定しても良い。
【0040】そして、第1白画素区間の長さが第7基準
値よりも短い場合に、第1選択統合区間を1つの行とし
て行切出しを修正する。尚、第1白画素区間の長さが第
7基準値以上の場合には、第1選択統合区間が本来1行
ではない可能性が高いため、その第1候補区間の行切出
しから第1選択統合区間の行切出しへ修正は行なわな
い。
【0041】(統合修正2)また、この発明の行切出し
方法を実施するにあたり、好ましくは、(e2)のプロ
セスを行なう前に、(c2)のプロセスにおいて切り出
された第2分割行の第2黒画素区間の長さ(以下、第2
黒画素区間長とも称する。)の相加平均を第2平均黒画
素区間長として求めるプロセスと、第2平均黒画素区間
長と第2黒画素区間長とを比較して、第2黒画素区間の
うち、第2平均黒画素区間長に対する第2黒画素区間長
の比率が第8基準値よりも小さな第2黒画素区間を第2
候補区間として選択するプロセスと、この第2候補区間
の一方の側の直近の第2黒画素区間である第3候補黒画
素区間とこの第2候補区間とを一つの連続した黒画素区
間とした場合の当該黒画素区間を第3統合区間とし、当
該第3統合区間の長さを求めるプロセスと、この第3統
合区間の長さと第2平均黒画素区間長との差の大きさを
第3統合区間長誤差として求めるプロセスと、この第2
候補区間の他方の側の直近の第2黒画素区間である第4
候補黒画素区間とこの第2候補区間とを1つの連続した
黒画素区間とした場合の当該黒画素区間を第4統合区間
とし、当該第4統合区間の長さを求めるプロセスと、こ
の第4統合区間の長さと第2平均黒画素区間長との差の
大きさを第4統合区間長誤差として求めるプロセスと、
第3統合区間長誤差と第4統合区間長誤差とを比較し
て、誤差の小さい方の統合区間を第2選択統合区間とし
て選択するプロセスと、この第2選択統合区間のうち
の、第2候補区間と当該第2候補区間の直近の第2黒画
素区間との間の第2白画素区間の長さを求めるプロセス
と、この第2白画素区間の長さと第9基準値とを比較し
て、当該第2白画素区間の長さが当該第9基準値よりも
短い場合に、第2選択統合区間を1つの連続した第2黒
画素区間とすることにより、行切出しの修正を行なうプ
ロセスとを含むと良い。
【0042】ここでも、上記の第1黒画素区間に対する
行切出の修正の場合と同様にして、第2選択統合区間を
選択して行切出の修正を行なう。また、第8基準値は、
上記の第6基準値と同様に、任意好適な値を設定すると
良い。また、第9基準値も、上記の第7基準値と同様
に、任意好適な値を設定すると良い。
【0043】(分割修正1)ところで、分割行切出しの
際に、2つの個別の行を誤って1つの行として切り出し
てしまうことがある。例えば、隣り合った行どうしが近
接している場合や、例えば射影分布を作成する際の走査
方向に対して文書画像の行方向(文字列を構成する文字
が並んでいる方向)が傾斜して入力された場合には、隣
り合った2つの個別の行が誤って1つの行として切り出
されてしまうことがある。
【0044】誤って1行として切り出された分割行は、
分割行の高さ(横書きの場合)または幅(縦書きの場
合)が、適切に切り出された他の分割行に比べて長い。
そして、誤って1行として切り出された分割行の高さま
たは幅は、一般に、他の分割行の2倍程度である。
【0045】従って、切り出された分割行の高さ若しく
は幅に着目すれば、本来2つの分割行として個別に切り
出されるべきところを誤って1つの分割行として切り出
された分割行を発見して、分割行切出しの修正が可能と
なる。
【0046】そこで、この発明の行切出し方法を実施す
るにあたり、好ましくは、(c1)のプロセスにおいて
切り出された第1分割行の第1黒画素区間の長さ(以
下、第1黒画素区間長とも称する。)の相加平均を第1
平均黒画素区間長として求めるプロセスと、第1平均黒
画素区間長と第1黒画素区間長とを比較して、第1黒画
素区間のうち、第1平均黒画素区間長に対する第1黒画
素区間長の比率が第11基準値よりも大きな第1黒画素
区間を第1分割候補区間として選択するプロセスと、走
査線のうち第1分割候補区間の中央付近を走査する走査
線上で黒画素の検出される位置のうち、第1方向に沿っ
て最も一方寄りの位置を第1位置として求めるプロセス
と、第1位置のうち、第1方向に沿って最も他方寄りの
第1位置を最寄第1位置として求めるプロセスと、走査
線のうち第1分割候補区間の中央付近を走査する走査線
上で黒画素の検出される位置のうち、第2方向に沿って
最も他方寄りの位置を第2位置として求めるプロセス
と、第2位置のうち、第2方向に沿って最も一方寄りの
第2位置を最寄第2位置として求めるプロセスと、最寄
第1位置と最寄第2位置とを比較して、この最寄第1位
置がこの最寄第2位置よりも他方側である場合またはこ
の最寄第1位置とこの最寄第2位置とが第2方向に沿っ
た同一直線上に位置する場合に、第1分割候補区間を、
当該第1分割候補区間の中央で2つに分割させて2つの
分割黒画素区間を生成することにより、行切出しの修正
を行なうプロセスと、最寄第1位置と最寄第2位置とを
比較して、この最寄第1位置がこの最寄第2位置よりも
一方側である場合に、この最寄第1位置とこの最寄第2
位置との中間を通りかつ第2方向に沿った分割線で第1
分割候補区間を分割することにより、一方側の第一方分
割領域および他方側の他方分割領域を生成し、一方分割
領域を最寄第2位置が得られた走査線によって分割して
2つの分割黒画素区間を生成し、かつ、他方分割領域を
最寄第1位置が得られた走査線によって分割して2つの
分割黒画素区間を生成することにより行切出しの修正を
行なうプロセスとを含むと良い。
【0047】ここでは、行切出しの修正にあたり、先
ず、第1黒画素区間長に着目して、誤って統合されて切
り出された可能性の高い第1分割候補区間を選択する。
第1分割候補区間の選択にあたっては、第1黒画素区間
長と第1平均黒画素区間長とを比較する。そして、第1
平均黒画素区間長に対する比率が第11基準値よりも大
きな第1黒画素区間を第1分割候補区間として選択す
る。この第11基準値は、例えば1以上の任意好適な値
(例えば1.5〜2程度)を設定すると良い。
【0048】2つの個別の分割行が1つの分割行として
誤って切り出されてしまう場合には、例えば、その2
つの個別の分割行どうしが近接している場合と、文書
画像の行方向が走査方向に対して傾斜している場合とが
ある。いずれの場合も、2つの個別の分割行のそれぞれ
の射影分布が互いに重なって、1つの連続した黒画素区
間として誤って切り出されてしまうことがある。
【0049】例えば、上記の分割行どうしが近接して
いる場合には、走査方向に沿った分割線によって、第1
分割候補区間を強制的に2分割すれば良い。これに対し
て、例えば、上記の行方向が走査走行に対して傾斜し
ている場合には、強制的に2分割したのでは、各行を適
切に切り出せない場合がある。すなわち、強制的に2分
割したのでは、分割された各行に、それぞれ2つの行の
一部分ずつが斜めに含まれてしまう場合がある。
【0050】そこで、ここでは、最寄第1位置と最寄第
2位置とを比較する。そして、最寄第1位置がこの最寄
第2位置よりも一方側である場合またはこの最寄第1位
置とこの最寄第2位置とが第2方向に沿った同一直線上
に位置する場合に(これらの場合は、例えば上記のの
場合に相当する。)、第1分割候補区間を強制的に2分
割することにより、行切出の修正を行なう。
【0051】一方、この最寄第1位置がこの最寄第2位
置よりも他方側である場合に(この場合は、例えば上記
のの場合に相当する。)、第1分割候補区間を4分割
することにより、行切出の修正を行なう。
【0052】(分割修正2)また、この発明の行切出し
方法を実施するにあたり、好ましくは、(c2)のプロ
セスにおいて切り出された第2分割行の第2黒画素区間
の長さ(以下、第2黒画素区間長とも称する。)の相加
平均を第2平均黒画素区間長として求めるプロセスと、
第2平均黒画素区間長と第2黒画素区間長とを比較し
て、第2黒画素区間のうち、第2平均黒画素区間長に対
する第2黒画素区間長の比率が第12基準値よりも大き
な第2黒画素区間を第2分割候補区間として選択するプ
ロセスと、第2分割候補区間の中央付近を走査する走査
線上で黒画素の検出される位置のうち、第2方向に沿っ
て最も一方寄りの位置を第3位置として求めるプロセス
と、第3位置のうち、第2方向に沿って最も他方寄りの
第3位置を最寄第3位置として求めるプロセスと、走査
線のうち第2分割候補区間の中央付近を走査する走査線
上で黒画素の検出される位置のうち、第1方向に沿って
最も他方寄りの位置を第4位置として求めるプロセス
と、第4位置のうち、第1方向に沿って最も一方寄りの
第4位置を最寄第4位置として求めるプロセスと、最寄
第3位置と最寄第4位置とを比較して、この最寄第3位
置がこの最寄第4位置よりも他方側である場合に、第2
分割候補区間を、当該第2分割候補区間の中央で2つに
分割させて2つの分割黒画素区間を生成することによ
り、行切出しの修正を行なうプロセスと、最寄第3位置
と最寄第4位置とを比較して、この最寄第3位置がこの
最寄第4位置よりも一方側である場合およびこの最寄第
3位置とこの最寄第4位置とが第1方向に沿った同一直
線上に位置する場合に、この最寄第3位置とこの最寄第
4位置との中間を通りかつ第1方向に沿った分割線で第
2分割候補区間を分割することにより、一方側の第一方
分割領域および他方側の他方分割領域を生成し、一方分
割領域を最寄第4位置が得られた走査線によって分割し
て2つの分割黒画素区間を生成し、かつ、他方分割領域
を最寄第3位置が得られた走査線によって分割して2つ
の分割黒画素区間を生成することにより行切出しの修正
を行なうプロセスとを含むと良い。
【0053】ここでは、上記の第1分割候補区間を選択
する場合と同様にして、第2分割候補区間を選択する。
尚、第12基準値は、上記の11基準値と同様に任意好
適な値を設定すると良い。
【0054】そして、上記の最寄第1位置と最寄第2位
置との比較と同様にして、最寄第3位置と最寄第4位置
とを比較して、上記の第1第分割候補区間の場合と同様
にして、第2分割候補区間を2分割若しくは4分割す
る。
【0055】(第1の行切出し修正方法)この発明の行
切出し方法における上記の(統合修正1)および(統合
修正2)においては、分割行の切出しについて修正を行
なったが、これらの統合修正の方法は、分割行の切出し
の修正に限定せず、分割されていない行の切出しの修正
にも適用することができる。
【0056】そこで、この発明の第1の行切出し修正方
法によれば、文書画像の行方向に実質的に沿った第1方
向に沿って文書画像を走査して走査毎の累積黒画素数を
検出し、当該累積黒画素数の第1方向と直交する第2方
向に沿った分布を求めて射影分布を作成し、射影分布に
おいて第13基準値以上の累積黒画素数の射影部分が第
2方向に連続する各黒画素区間が得られる走査領域をそ
れぞれ1つの行領域として行切出しを行なった後に、行
切出しの修正を行なうにあたり、切り出された行領域の
黒画素区間の長さ(黒画素区間長)の相加平均を平均黒
画素区間長として求めるプロセスと、平均値と黒画素区
間長とを比較して、黒画素区間のうち、平均値に対する
黒画素区間長の比率が第14基準値よりも小さな黒画素
区間を候補区間として選択するプロセスと、この候補区
間の一方の側の直近の黒画素区間である第1候補黒画素
区間とこの候補区間とを一つの連続した黒画素区間とし
た場合の当該黒画素区間を第1統合区間とし、当該第1
統合区間の長さを求めるプロセスと、この第1統合区間
の長さと平均黒画素区間長との差の大きさを第1統合黒
画素区間長として求めるプロセスと、この候補区間の他
方の側の直近の黒画素区間である第2候補黒画素区間と
この候補区間とを1つの連続した黒画素区間とした場合
の当該黒画素区間を第2統合区間とし、当該第2統合区
間の長さを求めるプロセスと、この第2統合区間の長さ
と平均黒画素区間長との差の大きさを第2統合黒画素区
間長として求めるプロセスと、第1統合区間長誤差と第
2統合区間長誤差とを比較して、誤差の小さい方の統合
区間を選択統合区間として選択するプロセスと、選択統
合区間のうちの候補区間と当該候補区間の直近の黒画素
区間との間の白画素区間の長さを求めるプロセスと、白
画素区間の長さと第15基準値とを比較して、当該白画
素区間の長さが当該第15基準値よりも短い場合に、選
択統合区間を1つの連続した黒画素区間とすることによ
り、行切出しの修正を行なうプロセスとを含むことを特
徴とする。
【0057】このように、この発明の第1の行切出し修
正方法では、この発明の行切出し方法における上記の
(統合修正1)の場合と同様にして、1つの行が誤って
2つの行として切り出されてしまった場合の行切出しの
修正を行なうことができる。また、第14基準値は、上
記の第6基準値と同様に、任意好適な値を設定すると良
い。また、第15基準値も、上記の第7基準値と同様
に、任意好適な値を設定すると良い。
【0058】(第2の行切出し修正方法)この発明の行
切出し方法における上記の(分割修正1)および(分割
修正2)においては、分割行の切出しについて修正を行
なったが、これらの分割修正の方法は、分割行の切出し
の修正に限定せず、分割されていない行の切出しの修正
にも適用することができる。
【0059】そこで、この発明の第2の行切出し修正方
法によれば、文書画像の行方向に実質的に沿った第1方
向に沿って走査して、走査毎の累積黒画素数を検出し、
当該累積黒画素数の第1方向と直交する第2方向に沿っ
た分布を求めることにより射影分布を作成し、射影分布
において第16基準値以上の累積黒画素数の射影部分が
第2方向に連続する各黒画素区間が得られる走査領域を
それぞれ1つの行領域として行切出しを行なった後に、
行切出しの修正を行なうにあたり、切り出された行領域
の黒画素区間の長さ(黒画素区間長)の平均値を求める
プロセスと、平均値と黒画素区間長とを比較して、黒画
素区間のうち、平均値に対する黒画素区間長の比率が第
17基準値よりも大きな黒画素区間を分割候補区間とし
て選択するプロセスと、走査線のうち分割候補区間の中
央付近を走査する走査線上で黒画素の検出される位置の
うち、第1方向に沿って最も一方寄りの位置を第1位置
として求めるプロセスと、第1位置のうち、第1方向に
沿って最も他方寄りの第1位置を最寄第1位置として求
めるプロセスと、走査線のうち分割候補区間の中央付近
を走査する走査線上で黒画素の検出される位置のうち、
第2方向に沿って最も他方寄りの位置を第2位置として
求めるプロセスと、第2位置のうち、第2方向に沿って
最も一方寄りの第2位置を最寄第2位置として求めるプ
ロセスと、最寄第1位置と最寄第2位置とを比較して、
この最寄第1位置がこの最寄第2位置よりも他方側であ
る場合およびこの最寄第1位置とこの最寄第2位置とが
第2方向に沿った同一直線上に位置する場合に、分割候
補区間を、当該分割候補区間の中央で2つに分割させて
2つの分割黒画素区間を生成することにより、行切出し
の修正を行なうプロセスと、最寄第1位置と最寄第2位
置とを比較して、この最寄第1位置がこの最寄第2位置
よりも一方側である場合に、この最寄第1位置とこの最
寄第2位置との中間を通りかつ第2方向に沿った分割線
で第1分割候補区間を分割することにより、一方側の第
一方分割領域および他方側の他方分割領域を生成し、一
方分割領域を最寄第2位置が得られた走査線によって分
割して2つの分割黒画素区間を生成し、かつ、他方分割
領域を最寄第1位置が得られた走査線によって分割して
2つの分割黒画素区間を生成することにより行切出しの
修正を行なうプロセスとを含むことを特徴とする。
【0060】このように、この発明の第2の行切出し修
正方法では、この発明の行切出し方法における上記の
(分割修正1)の場合と同様にして、2つの個別の行が
誤って1つの行として切り出されてしまった場合の行切
出しの修正を行なうことができる。また、第16基準値
は、上記の第11基準値と同様に、任意好適な値を設定
すると良い。
【0061】(行切出し装置)また、この発明の行切出
し装置によれば、文書画像の行方向が不明である場合お
よび文書画像の行方向が第1方向である場合に、第1方
向に直交する第2方向に沿った分割線によって文書画像
を分割することにより、該第1方向に沿って並んだ複数
の第1方向分割領域を生成する第1方向分割領域生成部
と、第1方向分割領域が生成された場合に、当該第1方
向分割領域の各々を、第1方向に沿って走査して、走査
毎の累積黒画素数を検出し、当該累積黒画素数の第2方
向に沿った分布を求めることにより第1方向射影分布を
作成する第1方向射影分布作成部と、第1方向射影分布
が作成された場合に、当該第1方向射影分布の各々にお
いて第1基準値以上の累積黒画素数が第2方向に沿って
連続する区間をそれぞれ第1黒画素区間として、当該第
1黒画素区間が得られる走査領域をそれぞれ第1分割行
として分割行切出しを行なう第1分割行切出し部と、文
書画像の行方向が不明である場合およびこの文書画像の
行方向が第2方向である場合に、第1方向に沿った分割
線によって文書画像を分割することにより、この第1方
向と直交する第2方向に沿って並んだ複数の第2方向分
割領域を生成する第2方向分割領域生成部と、第2方向
分割領域が生成された場合に 当該第2方向分割領域の
各々を、第2方向に沿って走査して、走査毎の累積黒画
素数を検出し、当該累積黒画素数の第1方向に沿った分
布を求めることにより第2方向射影分布を作成する第2
方向射影分布作成部と、第2方向射影分布が作成された
場合に、当該第2方向射影分布の各々において第2基準
値以上の累積黒画素数が第1方向に沿って連続する区間
をそれぞれ第2黒画素区間として、当該第2黒画素区間
が得られる走査領域をそれぞれ第2分割行として分割行
切出しを行なう第2分割行切出し部と、文書画像の行方
向が不明である場合に、第1方向射影分布と第2方向射
影分布とに基づいて、文書画像の行方向を判定する行方
向判定部と、文書画像の行方向が第1方向である場合
に、第1方向で互いに隣接する第1方向分割領域にそれ
ぞれ含まれる分割行どうしであって、当該分割行を走査
して得られた第1黒画素区間の少なくとも一部分どうし
が重なっている分割行どうしを接続して行切出しを行な
う第1分割行接続部と、文書画像の行方向が第2方向で
ある場合に、第2方向で互いに隣接する第2方向分割領
域にそれぞれ含まれる分割行どうしであって、当該分割
行を走査して得られた第2黒画素区間の少なくとも一部
分どうしが重なっている分割行どうしを接続して行切出
しを行なう第2分割行接続部とを具えてなることを特徴
とする。
【0062】このように、この発明の行切出し装置によ
れば、上述のこの発明の行切出し方法と同様にして、文
書画像の行方向が不明である場合でも、事前に行切出し
とは別個に行方向を判定する処理を行なうことなく、行
切出しを行なうことができる。
【0063】(行方向判定部1)また、この発明の行切
出し装置の実施にあたり、好ましくは、行方向判定部
は、第1黒画素区間の各々の長さをそれぞれ第1黒画素
区間長として、当該第1黒画素区間長のばらつきを算出
する第1ばらつき算出部と、第2黒画素区間の各々の長
さをそれぞれ第2黒画素区間長として、当該第2黒画素
区間長のばらつきを算出する第2ばらつき算出部と、第
1黒画素区間長のばらつきと第2黒画素区間長のぱらつ
きとを比較して、当該第1黒画素区間長のばらつきと当
該第2黒画素区間長のばらつきとの比率が第3基準値以
上の場合に、ばらつきの小さい方の黒画素区間長が得ら
れた射影分布の走査方向を行方向と判定するばらつき比
較判定部とを具えてなると良い。
【0064】このように、この行方向判定部(行方向判
定部1)を設ければ、上述のこの発明の行方向判定方法
における(黒画素区間長のばらつきによる行方向判定)
の欄で説明したように、行方向の判定の確実化を図るこ
とができる。
【0065】(行方向判定部2)さらに、この発明の行
切出し装置の実施にあたり、好ましくは、行間隔および
文字間隔に着目することにより、行方向判定部は、第1
黒画素区間長のばらつきと第2黒画素区間長のばらつき
との比率が第3基準値未満の場合に、第1方向射影分布
において隣り合った第1黒画素区間どうしの間の第1白
画素区間の長さと、第2方向射影分布において隣り合っ
た第2黒画素区間どうしの間の第2白画素区間の長さと
を利用して行方向を判定するのが良い。
【0066】ところで、第1および第2黒画素区間長の
ばらつきどうしを比較しない場合であっても、行間隔お
よび文字間隔に着目することにより、行方向の判定が可
能となる。
【0067】そこで、この発明の行切出し装置の実施に
あたり、好ましくは、行方向判定部は、第1方向射影分
布において隣り合った第1黒画素区間どうしの間の第1
白画素区間の長さと、第2方向射影分布において隣り合
った第2黒画素区間どうしの間の第2白画素区間の長さ
とを利用して行方向を判定するのが良い。
【0068】さらに、第1および第2白画素区間の長さ
を利用して、行方向を判定するにあたり、行方向判定部
は、第1黒画素区間長のばらつきと第2黒画素区間長の
ばらつきとの比率が第3基準値未満の場合に、第1方向
射影分布において隣り合った第1黒画素区間どうしの間
の第1白画素区間が1箇所の場合には、当該第1白画素
区間の長さを第1平均白画素区間長とし、かつ、この第
1白画素区間が複数箇所の場合には、当該第1白画素区
間の各々の長さの相加平均を第1平均白画素区間長とし
て算出する第1平均白画素区間長算出部と、第2方向射
影分布において隣り合った第2黒画素区間どうしの間の
第2白画素区間が1箇所の場合には、当該第2白画素区
間の長さを第2平均白画素区間長とし、かつ、この第2
白画素区間が複数箇所の場合には、当該第2白画素区間
の各々の長さの相加平均を第2平均白画素区間長として
算出する第2平均白画素区間長算出部と、第1平均白画
素区間長と第2平均白画素区間長とを比較して、より大
きな平均値の白画素区間の得られた射影分布の走査方向
を行方向と判定する平均値比較判定部とを具えてなるの
が良い。
【0069】このように、この行方向判定部(行方向判
定部2)を設ければ、上述のこの発明の行方向判定方法
における(平均白画素区間長による行方向判定)の欄で
説明したように、行方向の判定の確実化を図ることがで
きる。
【0070】(行方向判定部3)また、この発明の行切
出し装置の実施にあたり、好ましくは、行方向判定部
は、第1方向分割領域の数の合計を第1分割領域数とし
て求める第1分割領域数計数部と、第1黒画素区間の数
の、全ての第1方向分割領域にわたっての合計を第1黒
画素区間数として求める第1黒画素区間数計数部と、第
2方向分割領域の数の合計を第2分割領域数として求め
る第2分割領域数計数部と、第2黒画素区間の数の、全
ての第2方向分割領域にわたっての合計を第2黒画素区
間数として求める第2黒画素区間数計数部と、第1黒画
素区間数とこの第1分割領域数とが一致し、かつ、第2
黒画素区間数と第2分割領域数とが不一致の場合に、行
方向を第1方向と判定し、または、第2黒画素区間数と
この第2分割領域数とが一致し、かつ、第1黒画素区間
数と第1分割領域数とが不一致の場合に、行方向を第2
方向と判定する区間数分割数比較判定部と、を具えてな
るのが良い。
【0071】このように、この行方向判定部(行方向判
定部3)を設ければ、上述のこの発明の行方向判定方法
における(1行のみの場合の行方向判定)の欄で説明し
たように、文書画像に含まれる行数が1行の場合に容易
に行方向を判定することができる。
【0072】(分割行接続部)また、この発明の行切出
し装置の実施にあたり、好ましくは、第1分割行接続部
は、分割領域に含まれる第1方向分割行の第1黒画素区
間の一部分が、当該分割領域と隣接する他の1つの分割
領域に含まれる2つの第1分割行の第1黒画素区間の一
部分とそれぞれ重なっている場合に、重なっている区間
の長さが第4基準値よりも長い分割行どうしを接続し、
第2分割行接続部は、分割領域に含まれる第2方向分割
行の第2黒画素区間の一部分が、当該分割領域と隣接す
る他の1つの分割領域に含まれる2つの第2分割行の第
2黒画素区間の一部分とそれぞれ重なっている場合に、
重なっている区間の長さが第5基準値よりも長い分割行
どうしを接続すると良い。
【0073】このように、この第1分割行接続部および
第2分割行接続部を設ければ、上述のこの発明の行方向
判定方法における(分割行の接続)の欄で説明したよう
に、分割行を適切に接続して行切出しを行なうことがで
きる。
【0074】(第1統合修正部)また、この発明の行切
出し装置の実施にあたり、好ましくは、行切出しの修正
を行なう第1統合修正部を具え、この第1統合修正部
は、第1分割行切出し部において切り出された第1分割
行の第1黒画素区間の長さ(以下、第1黒画素区間長と
も称する。)の相加平均を第1平均黒画素区間長として
求める第1平均黒画素区間長算出部と、この第1平均黒
画素区間長と第1黒画素区間長とを比較して、第1黒画
素区間のうち、第1平均黒画素区間長に対する第1黒画
素区間長の比率が第6基準値よりも小さな第1黒画素区
間を第1候補区間として選択する第1候補区間選択部
と、この第1候補区間の一方の側の直近の第1黒画素区
間である第1候補黒画素区間とこの第1候補区間とを一
つの連続した黒画素区間とした場合の当該黒画素区間を
第1統合区間とし、当該第1統合区間の長さを求める第
1統合区間長検出部と、この第1統合区間の長さと第1
平均黒画素区間長との差の大きさを第1統合区間長誤差
として求める第1統合区間長誤差算出部と、この第1候
補区間の他方の側の直近の第1黒画素区間である第2候
補黒画素区間とこの第1候補区間とを1つの連続した黒
画素区間とした場合の当該黒画素区間を第2統合区間と
し、当該第2統合区間の長さを求める第2統合区間長検
出部と、この第2統合区間の長さと第1平均黒画素区間
長との差の大きさを第2統合区間長誤差として求める第
2統合区間長誤差算出部と、第1統合区間長誤差と第2
統合区間長誤差とを比較して、誤差の小さい方の統合区
間を第1選択統合区間として選択する第1選択統合区間
選択部と、この第1選択統合区間のうちの、第1候補区
間と当該第1候補区間の直近の第1黒画素区間との間の
第1白画素区間の長さを求める第1白画素区間長検出部
と、この第1白画素区間の長さと第7基準値とを比較し
て、当該第1白画素区間の長さが当該第7基準値よりも
短い場合に、第1選択統合区間を1つの連続した第1黒
画素区間とすることにより、行切出しの修正を行なう第
1統合部とを具えてなると良い。
【0075】このように、この第1統合修正部を設けれ
ば、上述のこの発明の行方向判定方法における(統合修
正1)の欄で説明したように、分割行切出しの修正が可
能となる。
【0076】(第2統合修正部)また、この発明の行切
出し装置の実施にあたり、好ましくは、行切出しの修正
を行なう第2統合修正部を具え、この第2統合修正部
は、第2分割行切出し部において切り出された第2分割
行の第2黒画素区間の長さ(以下、第2黒画素区間長と
も称する。)の相加平均を第2平均黒画素区間長として
求める第2平均黒画素区間長算出部と、第2平均黒画素
区間長と第2黒画素区間長とを比較して、第2黒画素区
間のうち、第2平均黒画素区間長に対する第2黒画素区
間長の比率が第8基準値よりも小さな第2黒画素区間を
第2候補区間として選択する第2候補区間選択部と、こ
の第2候補区間の一方の側の直近の第2黒画素区間であ
る第3候補黒画素区間とこの第2候補区間とを一つの連
続した黒画素区間とした場合の当該黒画素区間を第3統
合区間とし、当該第3統合区間の長さを求める第3統合
区間長抽出部と、この第3統合区間の長さと第2平均黒
画素区間長との差の大きさを第3統合区間長誤差として
求める第3統合区間長誤差算出部と、この第2候補区間
の他方の側の直近の第2黒画素区間である第4候補黒画
素区間とこの第2候補区間とを1つの連続した黒画素区
間とした場合の当該黒画素区間を第4統合区間とし、当
該第4統合区間の長さを求める第4統合区間長抽出部
と、この第4統合区間の長さと第2平均黒画素区間長と
の差の大きさを第4統合区間長誤差として求める第4統
合区間長誤差算出部と、第3統合区間長誤差と第4統合
区間長誤差とを比較して、誤差の小さい方の統合区間を
第2選択統合区間として選択する第2選択統合区間選択
部と、この第2選択統合区間のうちの、第2候補区間と
当該第2候補区間の直近の第2黒画素区間との間の第2
白画素区間の長さを求める第2白画素区間長抽出部と、
この第2白画素区間の長さと第9基準値とを比較して、
当該第2白画素区間の長さが当該第10基準値よりも短
い場合に、第2選択統合区間を1つの連続した第2黒画
素区間とすることにより、行切出しの修正を行なう第2
統合部とを具えてなると良い。
【0077】このように、この第2統合修正部を設けれ
ば、上述のこの発明の行方向判定方法における(統合修
正2)の欄で説明したように、分割行切出しの修正が可
能となる。
【0078】(第1分割修正部)また、この発明の行切
出し装置の実施にあたり、好ましくは、行切出しの修正
を行なう第1分割修正部を具え、この第1分割修正部
は、第1分割行切出し部において切り出された第1分割
行の第1黒画素区間の長さ(以下、第1黒画素区間長と
も称する。)の相加平均を第1平均黒画素区間長として
求める第1平均黒画素区間長算出部と、第1平均黒画素
区間長と第1黒画素区間長とを比較して、第1黒画素区
間のうち、第1平均黒画素区間長に対する第1黒画素区
間長の比率が第11基準値よりも大きな第1黒画素区間
を第1分割候補区間として選択する第1分割候補区間選
択部と、走査線のうち第1分割候補区間の中央付近を走
査する走査線上で黒画素の検出される位置のうち、第1
方向に沿って最も一方寄りの位置を第1位置として求め
る第1位置抽出部と、第1位置のうち、第1方向に沿っ
て最も他方寄りの第1位置を最寄第1位置として求める
最寄第1位置抽出部と、走査線のうち第1分割候補区間
の中央付近を走査する走査線上で黒画素の検出される位
置のうち、第2方向に沿って最も他方寄りの位置を第2
位置として求める第2位置抽出部と、第2位置のうち、
第2方向に沿って最も一方寄りの第2位置を最寄第2位
置として求める最寄第2位置抽出部と、最寄第1位置と
最寄第2位置とを比較して、この最寄第1位置がこの最
寄第2位置よりも他方側である場合およびこの最寄第1
位置とこの最寄第2位置とが第2方向に沿った同一直線
上に位置する場合に、第1分割候補区間を、当該第1分
割候補区間の中央で2つに分割させて2つの分割黒画素
区間を生成することにより、行切出しの修正を行なう第
1分割部と、最寄第1位置と最寄第2位置とを比較し
て、この最寄第1位置がこの最寄第2位置よりも一方側
である場合に、この最寄第1位置とこの最寄第2位置と
の中間を通りかつ第2方向に沿った分割線で第1分割候
補区間を分割することにより、一方側の第一方分割領域
および他方側の他方分割領域を生成し、一方分割領域を
最寄第2位置が得られた走査線によって分割して2つの
分割黒画素区間を生成し、かつ、他方分割領域を最寄第
1位置が得られた走査線によって分割して2つの分割黒
画素区間を生成することにより行切出しの修正を行なう
第2分割部とを具えてなると良い。
【0079】このように、この第1分割修正部を設けれ
ば、上述のこの発明の行方向判定方法における(分割修
正1)の欄で説明したように、分割行切出しの修正が可
能となる。
【0080】(第2分割修正部)また、この発明の行切
出し装置の実施にあたり、好ましくは、行切出しの修正
を行なう第2分割修正部を具え、この第2分割修正部
は、第2分割行切出し部において切り出された第2分割
行の第2黒画素区間の長さ(以下、第2黒画素区間長と
も称する。)の相加平均を第2平均黒画素区間長として
求める第2平均黒画素区間長算出部と、第2平均黒画素
区間長と第2黒画素区間長とを比較して、第2黒画素区
間のうち、第2平均黒画素区間長に対する第2黒画素区
間長の比率が第12基準値よりも大きな第2黒画素区間
を第2分割候補区間として選択する第2分割候補区間選
択部と、走査線のうち第2分割候補区間の中央付近を走
査する走査線上で黒画素の検出される位置のうち、第2
方向に沿って最も一方寄りの位置を第3位置として求め
る第3位置抽出部と、第3位置のうち、第2方向に沿っ
て最も他方寄りの第3位置を最寄第3位置として求める
最寄第3位置抽出部と、走査線のうち第2分割候補区間
の中央付近を走査する走査線上で黒画素の検出される位
置のうち、第1方向に沿って最も他方寄りの位置を第4
位置として求める第4位置抽出部と、第4位置のうち、
第1方向に沿って最も一方寄りの第4位置を最寄第4位
置として求める最寄第4位置抽出部と、最寄第3位置と
最寄第4位置とを比較して、この最寄第3位置がこの最
寄第4位置よりも他方側である場合に、第2分割候補区
間を、当該第2分割候補区間の中央で2つに分割させて
2つの分割黒画素区間を生成することにより、行切出し
の修正を行なう第3分割部と、最寄第3位置と最寄第4
位置とを比較して、この最寄第3位置がこの最寄第4位
置よりも一方側である場合およびこの最寄第3位置とこ
の最寄第4位置とが第1方向に沿った同一直線上に位置
する場合に、この最寄第3位置とこの最寄第4位置との
中間を通りかつ第1方向に沿った分割線で第2分割候補
区間を分割することにより、一方側の第一方分割領域お
よび他方側の他方分割領域を生成し、一方分割領域を最
寄第4位置が得られた走査線によって分割して2つの分
割黒画素区間を生成し、かつ、他方分割領域を最寄第3
位置が得られた走査線によって分割して2つの分割黒画
素区間を生成することにより行切出しの修正を行なう第
4分割部とを具えてなると良い。
【0081】このように、この第2分割修正部を設けれ
ば、上述のこの発明の行方向判定方法における(分割修
正2)の欄で説明したように、分割行切出しの修正が可
能となる。
【0082】(行方向確認切替部および切替出力部)ま
た、この発明の行切出し装置の実施にあたり、好ましく
は、外部から当該行切出し装置に入力された文書画像の
情報に当該文書画像の行方向を示す情報が付与されてい
るか否かを確認し、行方向が第1方向であることを示す
情報が付与されている場合には、当該文書画像の情報を
第1分割領域生成部へ送出し、行方向が第2方向である
ことを示す情報が付与されている場合には、当該文書画
像の情報を第2分割領域生成部へ送出し、または、行方
向を示す情報が非付与の場合には、当該文書画像の情報
を第1および第2分割領域生成部へ送出する行方向確認
切替部と、行方向判定部において、行方向が第1方向で
あると判定された場合には、第1分割行切出し部から得
られた情報を出力し、行方向が第2方向であると判定さ
れた場合には、第2分割行切出し部から得られた情報を
出力する切替出力部とを具えてなると良い。
【0083】このように、行方向確認切替部を具えれ
ば、文書画像に付与された情報によって、文書画像の情
報の送出先を選択することができる。また、切替出力部
を具えれば、行方向が判定された場合に、判定された行
方向の行切出しに必要な情報のみを得ることができる。
【0084】尚、行方向確認切替部および切替出力部
は、行切出し装置の外付けであっても良い。
【0085】(第1の行切出し修正装置)また、この発
明の第1の行切出し修正装置によれば、文書画像の行方
向に実質的に沿った第1方向に沿って文書画像を走査し
て、走査毎の累積黒画素数を検出し、当該累積黒画素区
間数の第2方向に沿った分布を求めることにより射影分
布を作成し、当該射影分布において第13基準値以上の
累積黒画素数の射影部分が第2方向に連続する各黒画素
区間が得られる走査領域をそれぞれ1つの行領域として
行切出しを行なって得られた行の切出しを修正する行切
出し修正装置であって、切り出された行領域の黒画素区
間の長さ(以下、黒画素区間長とも称する。)の平均黒
画素区間長を求める平均黒画素区間長算出部と、平均黒
画素区間長と黒画素区間長とを比較して、黒画素区間の
うち、平均黒画素区間長に対する黒画素区間長の比率が
第14基準値よりも小さな黒画素区間を候補区間として
選択する候補区間選択部と、この候補区間の一方の側の
直近の黒画素区間である第1候補黒画素区間とこの候補
区間とを一つの連続した黒画素区間とした場合の当該黒
画素区間を第1統合区間とし、当該第1統合区間の長さ
を求める第1統合区間長抽出部と、この第1統合区間の
長さと平均黒画素区間長との差の大きさを第1統合区間
長誤差として求める第1統合区間長誤差算出部と、この
候補区間の他方の側の直近の黒画素区間である第2候補
黒画素区間とこの候補区間とを1つの連続した黒画素区
間とした場合の当該黒画素区間を第2統合区間とし、当
該第2統合区間の長さを求める第2統合区間長抽出部
と、この第2統合区間の長さと平均黒画素区間長との差
の大きさを第2統合区間長誤差として求める第2統合区
間長誤差算出部と、第1統合区間長誤差と第2統合区間
長誤差とを比較して、誤差の小さい方の統合区間を選択
統合区間として選択する選択統合区間選択部と、選択統
合区間のうちの候補区間と当該候補区間の直近の黒画素
区間との間の白画素区間の長さを求める白画素区間長抽
出部と、白画素区間の長さと第15基準値とを比較し
て、当該白画素区間の長さが当該第15基準値よりも短
い場合に、選択統合区間を1つの連続した黒画素区間と
することにより、行切出しの修正を行なう統合部とを具
えてなることを特徴とする。
【0086】このように、この発明の第1の行切出し修
正装置によれば、1つの行が誤って2つの行として切り
出さてしまった場合に、上述のこの発明の第1の行切出
し修正方法と同様にして、行切出しの修正を行なうこと
ができる。
【0087】(第2の行切出し修正装置)また、この発
明の第2の行切出し修正装置によれば、文書画像の行方
向に実質的に沿った第1方向に沿って文書が層を走査し
て走査毎の累積黒画素数を検出し、当該累積黒画素数の
第1方向と直交する第2方向に沿った分布を求めること
により射影分布を作成し、当該射影分布において第16
基準値以上の累積黒画素数の射影部分が第2方向に連続
する各黒画素区間が得られる走査領域をそれぞれ1つの
行領域として行切出しを行なって得られた行の切出しを
修正する行切出し修正装置であって、切り出された行領
域の黒画素区間の長さ(以下、黒画素区間長とも称す
る。)の平均黒画素区間長を求める平均黒画素区間長算
出部と、平均黒画素区間長と黒画素区間長とを比較し
て、黒画素区間のうち、平均黒画素区間長に対する黒画
素区間長の比率が第17基準値よりも大きな黒画素区間
を分割候補区間として選択する分割候補区間選択部と、
走査線のうち分割候補区間の中央付近を走査する走査線
上で黒画素の検出される位置のうち、第1方向に沿って
最も一方寄りの位置を第1位置として求める第1位置抽
出部と、第1位置のうち、第1方向に沿って最も他方寄
りの第1位置を最寄第1位置として求める最寄第1位置
抽出部と、走査線のうち分割候補区間の中央付近を走査
する走査線上で黒画素の検出される位置のうち、第2方
向に沿って最も他方寄りの位置を第2位置として求める
第2位置抽出部と、第2位置のうち、第2方向に沿って
最も一方寄りの第2位置を最寄第2位置として求める最
寄第2位置抽出部と、最寄第1位置と最寄第2位置とを
比較して、この最寄第1位置がこの最寄第2位置よりも
他方側である場合およびこの最寄第1位置とこの最寄第
2位置とが第2方向に沿った同一直線上に位置する場合
に、分割候補区間を、当該分割候補区間の中央で2つに
分割させて2つの分割黒画素区間を生成することによ
り、行切出しの修正を行なう第1分割部と、最寄第1位
置と最寄第2位置とを比較して、この最寄第1位置がこ
の最寄第2位置よりも一方側である場合に、この最寄第
1位置とこの最寄第2位置との中間を通りかつ第2方向
に沿った分割線で第1分割候補区間を分割することによ
り、一方側の一方分割領域および他方側の他方分割領域
を生成し、一方分割領域を最寄第2位置が得られた走査
線によって分割して2つの分割黒画素区間を生成し、か
つ、他方分割領域を最寄第1位置が得られた走査線によ
って分割して2つの分割黒画素区間を生成することによ
り行切出しの修正を行なう第2分割部とを具えてなるこ
とを特徴とする。
【0088】このように、この発明の第2の行切出し修
正装置によれば、2つの行が誤って1つの行として切り
出されてしまった場合に、上述のこの発明の第2の行切
出し修正方法と同様にして、行切出しの修正を行なうこ
とができる。
【0089】
【発明の実施の形態】以下、図面を参照して、この発明
の行切出し方法、第1および第2の行切出し修正方法、
行切出し装置、および、第1および第2の行切出し修正
装置の実施の形態について併せて説明する。尚、この発
明は、図示例に限定されるものではない。
【0090】(構成について)先ず、図1を参照して、
この発明の行切出し装置について説明する。図1はこの
実施の形態の行切出し装置の構成の説明に供する機能ブ
ロック図である。尚、行切出し装置10の動作の詳細な
説明は(動作について)の欄で後述する。
【0091】この実施の形態の行切出し装置10は、行
方向確認切替部12、第1方向分割領域生成部14a、
第2方向分割領域生成部14b、第1方向射影分布作成
部16a、第2方向射影分布作成部16b、第1分割行
切出し部18a、第2分割行切出し部18b、行方向判
定部20、切替出力部22、第1修正24a、第2修正
部24b、第1分割行接続部26a、第2分割行接続部
26bおよび制御部28を具えている。
【0092】そして、この行方向確認切替部12は、行
方向確認部12aと切替部12bとを以って構成してあ
る。この行方向確認部12aは、外部から当該行切出し
装置に入力された文書画像の情報に当該文書画像の行方
向を示す情報が付与されているか否かを確認する。
【0093】ここで、第1方向および第2方向には、互
いに直交した任意の方向をそれぞれ設定することができ
る。例えば、第1方向を横方向(水平方向)とすれば、
第2方向は縦方向(垂直方向)となる。また、第1方向
を縦方向として、第2方向を横方向としても良い。
【0094】そして、文書画像の情報に、当該文書画像
の行方向が第1方向であることを示す情報が付与されて
いることを、この行方向確認部12aが確認した場合に
は、この切替部12bは、その情報(確認結果)と共
に、当該文書画像の情報を第1方向分割領域生成部14
aへ出力する。
【0095】また、この文書画像の情報に、当該文書画
像の行方向が第2方向であることを示す情報が付与され
ていることを、この行方向確認部12aが確認した場合
には、この切替部12bは、その情報(確認結果)と共
に、当該文書画像の情報を第2方向分割領域生成部14
bへ出力する。
【0096】また、この文書画像の情報に、当該文書画
像の行方向を示す情報が非付与であることを、この行方
向確認部12aが確認した場合には、この切替部12b
は、当該文書画像の情報を第1および第2方向分割領域
生成部14aおよび14bの両方へ出力する。
【0097】また、第1方向分割領域生成部14aは、
文書画像の行方向が不明である場合および文書画像の行
方向が第1方向である場合に、第2方向に沿った分割線
によって文書画像を分割することにより、第1方向に沿
って並んだ複数の第1方向分割領域を生成する。そし
て、この第1方向分割領域生成部14aは、生成された
第1方向分割領域の情報を第1方向射影分布作成部16
aへ送出する。
【0098】また、第1方向射影分布作成部16aは、
第1方向分割領域が生成された場合に、当該第1方向分
割領域の各々を、第1方向に沿って走査して、走査毎の
累積黒画素数を検出し、累積黒画素数の第1方向と直交
する第2方向に沿った分布を求めることにより第1方向
射影分布を作成する。すなわち、第1方向射影分布作成
部16aは、第1方向分割領域が生成された場合に、第
1方向分割領域の各々について、第1方向を主走査方向
とし第2方向を副走査方向として当該第1方向分割領域
を走査して走査毎の累積黒画素数を検出することにより
第1方向射影分布を作成する。そして、第1方向射影分
布作成部16aは、作成された第1方向射影分布の情報
を第1分割行切出し部18aへ送出する。
【0099】また、第1分割行切出し部18aは、第1
方向射影分布が作成された場合に、当該第1方向射影分
布の各々において第1基準値以上の累積黒画素数が第2
方向に沿って連続する区間をそれぞれ第1黒画素区間と
して、当該第1黒画素区間が得られる走査領域をそれぞ
れ第1分割行として分割行切出しを行なう。そして、第
1分割行切出し部18aは、行方向が第1方向である場
合には、切り出された分割行の情報を第1修正部24a
へ送出する。また、この第1分割行切出し部18aは、
行方向が不明である場合には、切り出された分割行の情
報を行方向判定部20へ送出する。
【0100】また、第2方向分割領域生成部14bは、
文書画像の行方向が不明である場合およびこの文書画像
の行方向が第2方向である場合に、第1方向に沿った分
割線によって文書画像を分割することにより、この第1
方向と直交する第2方向に沿って並んだ複数の第2方向
分割領域を生成する。そして、第2方向分割領域生成部
14bは、生成された第2方向分割領域の情報を第2方
向射影分布作成部16bへ送出する。
【0101】また、第2方向射影分布作成部16bは、
第2方向分割領域が生成された場合に、当該第2方向分
割領域の各々を、第2方向に沿って走査して、走査毎の
累積黒画素数を検出し、当該累積黒画素数の第1方向に
沿った分布を求めることにより第2方向射影分布を作成
する。すなわち、第2方向射影分布作成部16bは、第
2方向分割領域が生成された場合に、当該第2方向分割
領域の各々について、第2方向を主走査方向とし第1方
向を副走査方向として当該第2方向分割領域を走査し
て、走査毎の累積黒画素数を検出することにより第2方
向射影分布を作成する。そして、第2方向射影分布作成
部16bは、作成された第2方向射影分布の情報を第2
分割行切出し部18bへ送出する。
【0102】また、第2分割行切出し部18bは、第2
方向射影分布が作成された場合に、当該第2方向射影分
布の各々において第2基準値以上の累積黒画素数が第1
方向に沿って連続する区間をそれぞれ第2黒画素区間と
して、当該第2黒画素区間が得られる走査領域をそれぞ
れ第2分割行として分割行切出しを行なう。そして、第
2分割行切出し部18bは、行方向が第2方向である場
合には、切り出された第2分割行の情報を第2修正部2
4bへ送出する。また、この第2分割行切出し部18b
は、行方向が不明である場合には、切り出された第2分
割行の情報を行方向判定部20へ送出する。
【0103】また、行方向判定部20は、文書画像の行
方向が不明である場合に、第1方向射影分布と第2方向
射影分布とに基づいて、文書画像の行方向を判定する。
そして、行方向判定部20は、行方向の判定結果、第1
分割行および第2分割行の情報を切替出力部22へ送出
する。また、行方向判定部20は、行方向の判定結果お
よび判定された行方向の分割行の情報のみを着替え出力
部22へ送出しても良い。
【0104】また、切替出力部22は、判定された行方
向が第1方向である場合には、第1分割行の情報を第1
修正部24aへ送出する。また、この切替出力部22
は、判定された行方向が第2方向である場合には、第2
分割行の情報を第2修正部24bへ送出する。
【0105】また、第1修正部24aは、第1分割行が
誤って切り出されている場合に、分割行切出しの修正を
行なう。そして、修正された第1分割行の情報を第1分
割行接続部26aへ送出する。
【0106】また、第1分割行接続部26aは、文書画
像の行方向が第1方向である場合に、第1方向で互いに
隣接する第1方向分割領域にそれぞれ含まれる分割行ど
うしであって、当該分割行を走査して得られた第1黒画
素区間の少なくとも一部分どうしが重なっている分割行
どうしを接続して行切出しを行なう。
【0107】ところで、各分割行を接続する際に、1つ
の分割行が片側だけで2つの分割行と接続可能な場合が
ある。すなわち、1つの分割行の黒画素区間が、片側だ
けで2つの分割行の黒画素区間とそれぞれ部分的に重複
している場合がある。
【0108】そこで、この実施の形態の第1分割行接続
部26aにおいては、分割領域に含まれる第1方向分割
行の第1黒画素区間の一部分が、当該分割領域と隣接す
る他の1つの分割領域に含まれる2つの第1分割行の第
1黒画素区間の一部分とそれぞれ重なっている場合、重
なっている区間の長さが第4基準値よりも長い分割行ど
うしを接続する。
【0109】そして、第1分割行接続部26aは、切り
出された行の情報を制御部28へ送出する。
【0110】尚、上記の第4基準値は、任意好適な値を
設定すると良い。例えば、第4基準値は、それぞれ、互
いに接続される分割行どうしのずれの量が最小となるよ
うに設定するのが望ましい。また、例えば、黒画素区間
長と白画素区間長とが同程度の長さの場合には、第4基
準値を「0.5」程度の値としても良い。第4基準値を
この程度の値とすれば、1つの分割行の片側でそれぞれ
重なっている、となりの分割領域の2つの分割行のう
ち、一方が、基準値を満たすと、他方が基準値を満たさ
なくなる。
【0111】また、第2修正部24bは、第2分割行が
誤って切り出されている場合に、分割行切出しの修正を
行なう。そして、修正された第2分割行を第2分割行接
続部26bへ送出する。
【0112】また、第2分割行接続部26bは、文書画
像の行方向が第2方向である場合に、第2方向で互いに
隣接する第2方向分割領域にそれぞれ含まれる分割行ど
うしであって、当該分割行を走査して得られた第2黒画
素区間の少なくとも一部分どうしが重なっている分割行
どうしを接続して行切出しを行なう。
【0113】また、第2分割行接続部26bは、第2分
割行どうしの接続を行なうプロセスにおいて、分割領域
に含まれる第2方向分割行の第2黒画素区間の一部分
が、当該分割領域と隣接する他の1つの分割領域に含ま
れる2つの第2分割行の第2黒画素区間の一部分とそれ
ぞれ重なっている場合、重なっている区間の長さが第5
基準値よりも長い分割行どうしを接続する。
【0114】そして、第2分割行接続部26bは、切り
出された行の情報を制御部28へ送出する。
【0115】尚、第5基準値は、上記の第4基準値と同
様に、任意好適な値を設定すると良い。例えば、第4基
準値と第5基準値とは互いに等しくても良いし、互いに
異なっていても良い。
【0116】また、制御部28は、行切出し装置10の
各部の動作を制御する。そして、制御部28は、行切出
し結果を行切出し装置10の外部へ出力する。尚、図1
においては、制御部28と、行切出し装置10の各部と
の結線を一部省略して示しててある。
【0117】従って、この行切出し装置10によれば、
文書画像の行方向が不明である場合に、行切出しの処理
の一環である分割領域の生成のプロセスにおいて得られ
た第1および第2方向射影分布を用いて、行方向の判定
を行なう。従って、この行切出し装置10によれば、文
書画像の行方向が不明である場合でも、事前に行切出し
とは個別に行方向を判定する処理を行なうことなく、行
切出しを行なうことができる。
【0118】(文字認識装置の構成例)次に、図2を参
照して、この実施の形態の行切出し装置10を用いた文
字認識装置の構成例について説明する。図2は、この文
字認識装置の構成例の説明に供する機能ブロック図であ
る。
【0119】この文字認識装置は、スキャナ30、イメ
ージメモリ31、文字領域設定部32、行切出し装置1
0、文字切出し部33および文字認識部34を具えてい
る。
【0120】そして、このスキャナ30は、認識対象の
原稿から文書画像(イメージデータ)を作成する。すな
わち、このスキャナ30は、原稿の紙面を光学的に走査
して、量子化された電気信号例えば白黒2値を表す電気
信号からなる文書画像のイメージデータを生成する。こ
のイメージデータにおいては、文字画素を黒画素で表
し、かつ、背景画素を白画素で表す。
【0121】また、このイメージメモリ31は、スキャ
ナ30で生成された文書画像を一旦格納する。
【0122】また、文字領域設定部32は、先ず、この
イメージメモリ31に格納された文書画像を読み出して
くる。そして、文字領域設定部32は、この文書画像の
うち、文字方向の判定の対象となる領域としての文字領
域を設定する。文字領域の設定にあたっては、例えば、
イメージデータをディスプレイに表示して、オペレータ
がディスプレイ上で文字領域を指定しても良い。また、
この出願に係る発明者は、文字領域を抽出する方法の一
例を、文献2:「特開平3−126181号公報」にお
いて提案している。この文献2に開示の方法によれば、
文字画素の領域の外接矩形を求め、この外接矩形により
文書画像から文字領域を切り出している。尚、この実施
の形態においては、この他の従来周知の任意好適な方法
を用いて文字領域を抽出しても良い。また、この発明で
は、行切出しにあたり、文字領域は必ずしも設定する必
要はない。
【0123】また、行切出し装置10は、図1に示す構
成を有し、(動作)の欄において後述するように動作す
る。
【0124】また、文字切出し部33は、行切出し装置
10において切り出された各行から、それぞれ文字パタ
ンを切り出す。文字パタンの切出しにあたっては、従来
周知の任意好適な方法を用いることができる。また、こ
の文字切出し部33は、切り出された文字パタンを一旦
格納する内蔵メモリを具えていても良い。
【0125】また、文字認識部34は、切り出された文
字パタンを、パターンマッチング法により文字の辞書デ
ータと照合し、この照合結果に基づいて文字パタンを認
識する。尚、辞書データは、文字認識部34の内蔵メモ
リに格納しておいても良いし、文字認識部34から独立
させて例えば文字認識辞書部を設けて、そこに保持して
おいても良い。
【0126】(行方向判定部について)次に、図3を参
照して、この実施の形態の行切出し装置10における行
方向判定部20の構成について説明する。この行方向判
定部20は、第1判定部201、第2判定部202およ
び第3判定部203を具えている。次に、各判定部の構
成について順次に説明する。
【0127】(第1判定部の構成について)次に、図4
を参照して、この第1判定部201の構成について説明
する。図4は、第1判定部201の構成の説明に供する
機能ブロック図である。尚、第1判定部201の動作に
ついては、後述の(第1判定部の動作について)の欄に
おいて詳細に説明する。
【0128】この第1判定部201は、文書画像に文字
列が1行のみ含まれている場合の行方向判定を行なう。
そして、この第1判定部201は、第1分割領域数計数
部36a、第2分割領域数計数部36b、第1黒画素区
間数計数部38a、第2黒画素区間数計数部38bおよ
び区間数分割数比較判定部40を具えている。
【0129】そして、この第1分割領域数計数部36a
は、第1方向分割領域の数の合計を第1分割領域数とし
て求める。そして、第1分割領域数計数部36aは、計
数された第1方向分割領域数の情報を区間数分割数比較
判定部40へ送出する。
【0130】また、第1黒画素区間数計数部38aは、
第1黒画素区間の数の、全ての第1方向分割領域にわた
っての合計を第1黒画素区間数として求める。そして、
第1黒画素区間数計数部38aは、計数された第1黒画
素区間数の情報を区間数分割数比較判定部40へ送出す
る。
【0131】また、第2分割領域数計数部36bは、第
2方向分割領域の数の合計を第2分割領域数として求め
る。そして、第2分割領域数計数部36bは、計数され
た第2分割領域数の情報を区間数分割数比較判定部40
へ送出する。
【0132】また、第2黒画素区間数計数部38bは、
第2黒画素区間の数の、全ての第2方向分割領域にわた
っての合計を第2黒画素区間数として求める。そして、
第2黒画素区間数計数部38bは、計数された第2黒画
素区間数の情報を区間数分割数比較判定部40へ送出す
る。
【0133】また、区間数分割数比較判定部40は、第
1黒画素区間数とこの第1分割領域数とが一致し、か
つ、第2黒画素区間数と第2分割領域数とが不一致の場
合に、行方向を第1方向と判定し、および、第2黒画素
区間数とこの第2分割領域数とが一致し、かつ、第1黒
画素区間数と第1分割領域数とが不一致の場合に、行方
向を第2方向と判定する。
【0134】このように、第1判定部201において
は、分割領域の数と分割行の数の合計とを比較すことに
より、文字列が1行だけの場合には、第2判定部202
や第3判定部203で、黒画素区間長のばらつきどうし
や平均白画素区間長どうしを比較するまでもなく、行方
向判定を行なうことができる。
【0135】(第2判定部の構成について)次に、図5
を参照して、この第2判定部202の構成について説明
する。図5は、第2判定部202の構成の説明に供する
機能ブロック図である。尚、第2判定部202の動作に
ついては、後述の(第2判定部の動作について)の欄に
おいて詳細に説明する。
【0136】この第2判定部202は、行方向の判定の
手がかりの一つとして、行の高さや行の幅のばらつきに
着目することによって、射影分布における黒画素区間長
のばらつきによる行方向の判定を行なう。そして、この
第2判定部202は、第1ばらつき算出部42a、第2
ばらつき算出部42bおよびばらつき比較判定部44を
具えている。
【0137】そして、この第1ばらつき算出部42a
は、第1黒画素区間の各々の長さをそれぞれ第1黒画素
区間長として、当該第1黒画素区間長のばらつきを算出
する。そして、第1ばらつき算出部42aは、算出され
た第1黒画素区間長のばらつきの情報をばらつき比較判
定部44へ送出する。
【0138】また、第2ばらつき算出部42bは、第2
黒画素区間の各々の長さをそれぞれ第2黒画素区間長と
して、当該第2黒画素区間長のばらつきを算出する。そ
して、第2ばらつき算出部42bは、算出された第2黒
画素区間長のばらつきの情報をばらつき比較判定部44
へ送出する。
【0139】ばらつき比較判定部44は、第1黒画素区
間長のばらつきと第2黒画素区間長のばらつきとを比較
して、当該第1黒画素区間長のばらつきと当該第2黒画
素区間長のばらつきとの比率が第3基準値以上の場合
に、ばらつきの小さい方の黒画素区間長が得られた射影
分布の走査方向を行方向と判定する。
【0140】このように、第1黒画素区間長のばらつき
と第2黒画素区間長のばらつきとを比較すれば、行方向
の判定の確実化を図ることができる。
【0141】(第3判定部の構成について)次に、図6
を参照して、この第3判定部203の構成について説明
する。図6は、第3判定部203の構成の説明に供する
機能ブロック図である。尚、第3判定部203の動作に
ついては、後述の(第3判定部の動作について)の欄に
おいて詳細に説明する。
【0142】この第3判定部203は、上記の第2判定
部202において第1黒画素区間長のばらつきと第2黒
画素区間長のばらつきとの比率が第3基準値未満の場合
に、行方向の判定のさらなる手がかりの一つとして、行
間隔と文字間隔に着目することによって、射影分布にお
ける黒画素区間どうしの間隔の平均による行方向の判定
を行なう。そして、この第3判定部203は、第1平均
白画素区間長算出部(第1平均値算出部)46a、第2
平均白画素区間長算出部(第2平均値算出部)46bお
よび平均値比較判定部48を具えている。
【0143】そして、この第1平均白画素区間長算出部
46aは、第1方向射影分布において隣り合った第1黒
画素区間どうしの間の第1白画素区間が1箇所の場合に
は、当該第1白画素区間の長さを第1平均白画素区間長
とし、かつ、この第1白画素区間が複数箇所の場合に
は、当該第1白画素区間の各々の長さの相加平均を第1
平均白画素区間長として算出する。そして、この第1平
均白画素区間長算出部46aは、算出された第1白画素
区間長を平均値比較判定部48へ送出する。
【0144】また、第2平均白画素区間長算出部46b
は、第2方向射影分布において隣り合った第2黒画素区
間どうしの間の第2白画素区間が1箇所の場合には、当
該第2白画素区間の長さを第2平均白画素区間長とし、
かつ、この第2白画素区間が複数箇所の場合には、当該
第2白画素区間の各々の長さの相加平均を第2平均白画
素区間長として算出する。そして、この第2平均白画素
区間長算出部46bは、算出された第2白画素区間長を
平均比較判定部48へ送出する。
【0145】また、平均比較判定部48は、第1平均白
画素区間長と第2平均白画素区間長とを比較して、より
大きな平均白画素区間長の得られた射影分布の走査方向
を行方向と判定する。
【0146】前述のように、行間隔は、一般に文字間隔
よりも広い。従って、第1平均白画素区間長と第2平均
白画素区間長とのうちの、より大きな平均白画素区間長
の方が行間の空白に対応する。従って、第1平均白画素
区間長と第2平均白画素区間長とを比較して行方向を判
定すれば、第1黒画素区間長のばらつきと第2黒画素区
間長のばらつきとの比率が小さい場合(例えば、文字間
隔が固定ピッチの場合)であっても、行方向判定の確実
化を図ることができる。
【0147】(第1修正部の構成について)次に、図7
を参照して、第1修正部24aの構成について説明す
る。図7は、第1修正部の構成の説明に供する機能ブロ
ック図である。第1修正部24aは、第1統合修正部9
0aと第1分割修正部92aとを具えている。第1修正
部24aに入力された情報は、第1統合修正部90aお
よび第1分割修正部92aへそれぞれ入力される。ま
た、第1統合修正部90aおよび第1分割修正部92a
の出力は、それぞれ第1分割行接続部26aへ送出され
る。
【0148】尚、この第1統合修正部90aは、この発
明の第1の行切出し修正装置の実施の形態でもある。ま
た、この第1分割修正部92aは、この発明の第2の行
切出し修正装置の実施の形態でもある。
【0149】(第1統合修正部の構成について)次に、
図8を参照して、第1統合修正部90aの構成について
説明する。図8は、第1統合修正部90aの構成の説明
に供する機能ブロック図である。第1統合修正部90a
は、切り出された第1分割行の高さ若しくは幅と行間隔
とに着目して、本来1つの分割行として切り出されるべ
きところを誤って2つの分割行として切り出された分割
行を発見する。そして、第1統合修正部90aは、その
2つの分割行を1つの分割行として切り出すことによ
り、第1分割行の行切出しの修正を行なう。
【0150】そのために、第1統合修正部90aは、第
1平均黒画素区間長算出部120a、第1候補区間選択
部122a、第1統合区間長検出部124a、第2統合
区間長検出部124b、第1統合区間長誤差算出部12
5a、第2統合区間長誤差算出部125b、第1選択統
合区間選択部126a、第1白画素区間長検出部128
aおよび第1統合部130aを具えている。
【0151】そして、この第1平均黒画素区間長算出部
120aは、第1分割行行切出し部18aにおいて切り
出された第1分割行の第1黒画素区間の長さ(第1黒画
素区間長)の相加平均を第1平均黒画素区間長として求
める。そして、この第1平均黒画素区間長算出部120
aは、第1平均黒画素区間長の情報を第1候補区間選択
部122aへ送出する。
【0152】また、第1候補区間選択部122aは、第
1平均黒画素区間長と第1黒画素区間長とを比較して、
第1黒画素区間のうち、第1平均黒画素区間長に対する
第1黒画素区間長の比率が第6基準値よりも小さな第1
黒画素区間を第1候補区間として選択する。そして、第
1候補区間選択部122aは、選択された第1候補区間
の情報を第1および第2統合区間長検出部124aおよ
び124bにそれぞれ送出する。尚、この第6基準値
は、例えば1未満で0よりも大きな任意好適な値(例え
ば0.5程度)を設定すると良い。
【0153】また、第1統合区間長検出部124aは、
この第1候補区間の一方の側の直近の第1黒画素区間で
ある第1候補黒画素区間とこの第1候補区間とを一つの
連続した黒画素区間とした場合の当該黒画素区間を第1
統合区間とし、当該第1統合区間の長さ(第1統合区間
長)を求める。そして、この第1統合区間長検出部12
4aは、求められた第1統合区間長の情報を第1統合区
間長誤差算出部125aへ送出する。
【0154】また、第1統合区間長誤差算出部125a
は、第1統合区間の長さと第1平均黒画素区間長との差
の大きさを第1統合区間長誤差として算出する。そし
て、この第1統合区間長誤差算出部125aは、算出さ
れた第1統合区間長誤差を第1選択統合区間選択部12
6aへ送出する。
【0155】また、第2統合区間長検出部124bは、
この第1候補区間の他方の側の直近の第1黒画素区間で
ある第2候補黒画素区間とこの第1候補区間とを1つの
連続した黒画素区間とした場合の当該黒画素区間を第2
統合区間とし、当該第2統合区間の長さ(第2統合区間
長)を求める。そして、この第2統合区間長検出部12
4bは、求められた第2統合区間長の情報を第2統合区
間長誤差算出部125bへ送出する。
【0156】また、第2統合区間長誤差算出部125b
は、第2統合区間の長さと第1平均黒画素区間長との差
の大きさを第2統合区間長誤差として算出する。そし
て、この第2統合区間長誤差算出部125bは、算出さ
れた第2統合区間長誤差を第1選択統合区間選択部12
6aへ送出する。
【0157】また、第1選択統合区間選択部126a
は、第1統合区間長と第2統合区間長とを比較して、長
さの短い方の統合区間を第1選択統合区間として選択す
る。そして、第1選択統合区間選択部126aは、選択
された第1選択統合区間の情報を第1白画素区間長検出
部128aへ送出する。
【0158】また、第1白画素区間長検出部128a
は、この第1選択統合区間のうちの、第1候補区間と当
該第1候補区間の直近の第1黒画素区間との間の第1白
画素区間の長さを求める。そして、第1白画素区間長検
出部128aは、求められた第1白画素区間の長さの情
報を第1統合部130aへ送出する。
【0159】また、第1統合部130aは、この第1白
画素区間の長さと第7基準値とを比較して、当該第1白
画素区間の長さが当該第7基準値よりも短い場合に、第
1選択統合区間を1つの連続した第1黒画素区間とする
ことにより、行切出しの修正を行なう。尚、この第7基
準値は、任意好適な値を設定すると良い。例えば、白画
素区間の長さの平均値よりも小さい値(例えば、平均値
の半分程度の長さ)を第7基準値として設定しても良
い。
【0160】尚、第1白画素区間の長さが第7基準値以
上の場合には、第1選択統合区間が本来1行ではない可
能性が高いため、その第1候補区間の行切出を第1選択
統合区間の行切出しへ修正する処理は行なわない。
【0161】(第1分割修正部の構成について)次に、
図9を参照して、第1分割修正部92aの構成について
説明する。図9は、第1分割修正部92aの構成の説明
に供する機能ブロック図である。第1分割修正部92a
は、切り出された第1分割行の高さ若しくは幅に着目し
て、本来2つの分割行として切り出されるべきところを
誤って1つの分割行として切り出された分割行を発見す
る。そして、第1分割修正部92aは、その分割行を2
つの分割行として切り出すことにより、第1分割行の行
切出しの修正を行なう。
【0162】そのために、第1分割修正部92aは、第
1平均黒画素区間長算出部131a、第1分割候補区間
選択部132a、第1位置抽出部134a、第2位置抽
出部134b、最寄第1位置抽出部136a、最寄第2
位置抽出部136b、第1分割部138aおよび第2分
割部138bを具えている。
【0163】そして、この第1平均黒画素区間長算出部
131aは、第1分割行切出し部18aにおいて切り出
された第1分割行の第1黒画素区間の長さ(第1黒画素
区間長)の相加平均を第1平均黒画素区間長として求め
る。そして、第1平均黒画素区間長算出部131aは、
求められた第1平均黒画素区間長の情報を第1分割候補
区間選択部132aへ送出する。
【0164】また、第1分割候補区間選択部132a
は、第1平均黒画素区間長と第1黒画素区間長とを比較
して、第1黒画素区間のうち、第1平均黒画素区間長に
対する第1黒画素区間長の比率が第11基準値よりも大
きな第1黒画素区間を第1分割候補区間として選択す
る。そして、第1分割候補区間選択部132aは、選択
された第1分割候補区間の情報を第1および第2位置抽
出部134aおよび134bへ送出する。尚、この第1
1基準値は、例えば1以上の任意好適な値(例えば1.
5〜2程度)を設定すると良い。
【0165】また、第1位置抽出部134aは、走査線
のうち第1分割候補区間の中央付近を走査する走査線上
で黒画素の検出される位置のうち、第1方向に沿って最
も一方寄りの位置を第1位置として抽出する。そして、
第1位置抽出部134aは、抽出された第1位置の情報
を最寄第1位置抽出部136aへ送出する。
【0166】また、最寄第1位置抽出部136aは、第
1位置のうち、第1方向に沿って最も他方寄りの第1位
置を最寄第1位置として抽出する。そして、最寄第1位
置抽出部136aは、抽出された最寄第1位置の情報を
第1および第2分割部138aおよび138bへ送出す
る。
【0167】また、第2位置抽出部134bは、走査線
のうち第1分割候補区間の中央付近を走査する走査線上
で黒画素の検出される位置のうち、第2方向に沿って最
も他方寄りの位置を第2位置として抽出する。そして、
第2位置抽出部134bは、抽出された第2位置の情報
を最寄第2位置抽出部136bへ送出する。
【0168】また、最寄第2位置抽出部136bは、第
2位置のうち、第2方向に沿って最も一方寄りの第2位
置を最寄第2位置として抽出する。そして、最寄第2位
置抽出部136bは、抽出された最寄第2位置の情報を
第1および第2分割部138aおよび138bへ送出す
る。
【0169】また、第1分割部138aは、最寄第1位
置と最寄第2位置とを比較して、この最寄第1位置がこ
の最寄第2位置よりも他方側である場合またはこの最寄
第1位置とこの最寄第2位置とが第2方向に沿った同一
直線上に位置する場合に、第1分割候補区間を、当該第
1分割候補区間の中央で2つに分割させて2つの分割黒
画素区間を生成することにより、行切出しの修正を行な
う。
【0170】また、第2分割部138bは、最寄第1位
置と最寄第2位置とを比較して、この最寄第1位置がこ
の最寄第2位置よりも一方側である場合に、この最寄第
1位置とこの最寄第2位置との中間を通りかつ第2方向
に沿った分割線で第1分割候補区間を分割することによ
り、一方側の一方分割領域および他方側の他方分割領域
を生成し、一方分割領域を最寄第2位置が得られた走査
線によって分割して2つの分割黒画素区間を生成し、か
つ、他方分割領域を最寄第1位置が得られた走査線によ
って分割して2つの分割黒画素区間を生成することによ
り行切出しの修正を行なう。
【0171】(第2修正部の構成について)次に、図1
0を参照して、第2修正部24bの構成について説明す
る。図10は、第2修正部の構成の説明に供する機能ブ
ロック図である。第2修正部24bは、第2統合修正部
90bと第2分割修正部92bとを具えている。第2修
正部24bに入力された情報は、第2統合修正部90b
および第2分割修正部92bへそれぞれ入力される。ま
た、第2統合修正部90bおよび第2分割修正部92b
の出力は、それぞれ第2分割行接続部26bへ送出され
る。
【0172】尚、この第2統合修正部90bは、この発
明の第1の行切出し修正装置の実施の形態でもある。ま
た、この第2分割修正部92bは、この発明の第2の行
切出し修正装置の実施の形態でもある。
【0173】(第2統合修正部の構成について)次に、
図11を参照して、第2統合修正部90bの構成につい
て説明する。図11は、第2統合修正部90bの構成の
説明に供する機能ブロック図である。第2統合修正部9
0bは、切り出された第2分割行の高さ若しくは幅と行
間隔とに着目して、本来1つの分割行として切り出され
るべきところを誤って2つの分割行として切り出された
分割行を発見する。そして、第2統合修正部90bは、
その2つの分割行を1つの分割行として切り出すことに
より、第2分割行の行切出しの修正を行なう。
【0174】そのために、第2統合修正部90bは、第
2平均黒画素区間長算出部120b、第2候補区間選択
部122b、第3統合区間長検出部124c、第4統合
区間長検出部124d、第3統合区間長誤差算出部12
5c、第4統合区間長誤差算出部125d、第2選択統
合区間選択部126b、第2白画素区間長検出部128
bおよび第2統合部130bを具えている。
【0175】そして、この第2平均黒画素区間長算出部
120bは、第2分割行切出し部18bにおいて切り出
された第2分割行の第2黒画素区間の長さ(第2黒画素
区間長)の相加平均を第2平均黒画素区間長として求め
る。そして、この第2平均黒画素区間長算出部120b
は、第2平均黒画素区間長の情報を第2候補区間選択部
122bへ送出する。
【0176】また、第2候補区間選択部122bは、第
2平均黒画素区間長と第2黒画素区間長とを比較して、
第2黒画素区間のうち、第2平均黒画素区間長に対する
第2黒画素区間長の比率が第8基準値よりも小さな第2
黒画素区間を第2候補区間として選択する。そして、第
2候補区間選択部122bは、選択された第2候補区間
の情報を第3および第4統合区間長検出部124cおよ
び124dにそれぞれ送出する。尚、この第8基準値
は、上記の第6基準値と同様に、例えば1未満で0より
も大きな任意好適な値(例えば0.5程度)を設定する
と良い。また、第8基準値と第6基準値とは互いに等し
くとも良く、また、互いに異なる値であっても良い。
【0177】また、第3統合区間長検出部124cは、
この第2候補区間の一方の側の直近の第2黒画素区間で
ある第2候補黒画素区間とこの第2候補区間とを一つの
連続した黒画素区間とした場合の当該黒画素区間を第3
統合区間とし、当該第3統合区間の長さ(第3統合区間
長)を求める。そして、この第3統合区間長検出部12
4cは、求められた第3統合区間長の情報を第3統合区
間長誤差算出部125cへ送出する。
【0178】また、第3統合区間長誤差算出部125c
は、第3統合区間の長さと第2平均黒画素区間長との差
を第3統合区間長誤差として算出する。そして、第3統
合区間長誤差算出部125cは、算出された第3統合区
間長誤差を、第2選択統合区間選択部126bへ送出す
る。
【0179】また、第4統合区間長検出部124dは、
この第2候補区間の他方の側の直近の第2黒画素区間で
ある第4候補黒画素区間とこの第2候補区間とを1つの
連続した黒画素区間とした場合の当該黒画素区間を第4
統合区間とし、当該第4統合区間の長さ(第4統合区間
長)を求める。そして、この第4統合区間長検出部12
4dは、求められた第4統合区間長の情報を第4統合区
間長誤差算出部125dへ送出する。
【0180】また、第4統合区間長誤差算出部125d
は、第4統合区間の長さと第2平均黒画素区間長との差
を第4統合区間長誤差として算出する。そして、第4統
合区間長誤差算出部125dは、算出された第4統合区
間長誤差を、第2選択統合区間選択部126bへ送出す
る。
【0181】また、第2選択統合区間選択部126b
は、第3統合区間長誤差と第4統合区間長誤差とを比較
して、誤差の小さい方の統合区間を第2選択統合区間と
して選択する。そして、第2選択統合区間選択部126
bは、選択された第2選択統合区間の情報を第2白画素
区間長検出部128bへ送出する。
【0182】また、第2白画素区間長検出部128b
は、この第2選択統合区間のうちの、第2候補区間と当
該第2候補区間の直近の第2黒画素区間との間の第2白
画素区間の長さを求める。そして、第2白画素区間長検
出部128bは、求められた第2白画素区間の長さの情
報を第2統合部130bへ送出する。
【0183】また、第2統合部130bは、この第2白
画素区間の長さと第9基準値とを比較して、当該第2白
画素区間の長さが当該第9基準値よりも短い場合に、第
2選択統合区間を1つの連続した第2黒画素区間とする
ことにより、行切出しの修正を行なう。尚、この第9基
準値は、上記の第7基準値と同様に、任意好適な値を設
定すると良い。例えば、第9基準値と第7基準値とは互
いに等しくとも良く、また、互いに異なっていても良
い。
【0184】尚、第2白画素区間の長さが第9基準値以
上の場合には、第2選択統合区間が本来1行ではない可
能性が高いため、その第2候補区間の行切出を第2選択
統合区間の行切出しへ修正する処理は行なわない。
【0185】(第2分割修正部の構成について)次に、
図12を参照して、第2分割修正部92bの構成につい
て説明する。図12は、第2分割修正部92bの構成の
説明に供する機能ブロック図である。第2統合修正部9
2bは、切り出された第2分割行の高さ若しくは幅に着
目して、本来2つの分割行として切り出されるべきとこ
ろを誤って1つの分割行として切り出された分割行を発
見する。そして、第2分割修正部92bは、その分割行
を2つの分割行として切り出すことにより、第1分割行
の行切出しの修正を行なう。
【0186】そのために、第2分割修正部92bは、第
2平均黒画素区間長算出部131b、第2分割候補区間
選択部132b、第3位置抽出部134c、第4位置抽
出部134d、最寄第3位置抽出部136c、最寄第4
位置抽出部136d、第3分割部138cおよび第4分
割部138cを具えている。
【0187】そして、この第2平均黒画素区間長算出部
131bは、第2分割行切出し部18bにおいて切り出
された第2分割行の第2黒画素区間の長さ(第2黒画素
区間長)の相加平均を第2平均黒画素区間長として求め
る。そして、第2平均黒画素区間長算出部131bは、
求められた第2平均黒画素区間長の情報を第2分割候補
区間選択部132bへ送出する。
【0188】また、第2分割候補区間選択部132b
は、第2平均黒画素区間長と第2黒画素区間長とを比較
して、第2黒画素区間のうち、第2平均黒画素区間長に
対する第2黒画素区間長の比率が第16基準値よりも大
きな第2黒画素区間を第2分割候補区間として選択す
る。そして、第2分割候補区間選択部132bは、選択
された第2分割候補区間の情報を第3および第4位置抽
出部134cおよび134dへ送出する。尚、この第1
6基準値は、上記の第11基準値と同様に、任意好適な
値を設定すると良い。
【0189】また、第3位置抽出部134cは、走査線
のうち第2分割候補区間の中央付近を走査する走査線上
で黒画素の検出される位置のうち、第1方向に沿って最
も一方寄りの位置を第3位置として抽出する。そして、
第3位置抽出部134cは、抽出された第3位置の情報
を最寄第3位置抽出部136cへ送出する。
【0190】また、最寄第3位置抽出部136cは、第
3位置のうち、第1方向に沿って最も他方寄りの第3位
置を最寄第3位置として抽出する。そして、最寄第3位
置抽出部136cは、抽出された最寄第3位置の情報を
第3および第4分割部138cおよび138dへ送出す
る。
【0191】また、第4位置抽出部134dは、走査線
のうち第2分割候補区間の中央付近を走査する走査線上
で黒画素の検出される位置のうち、第2方向に沿って最
も他方寄りの位置を第4位置として抽出する。そして、
第4位置抽出部134dは、抽出された第4位置の情報
を最寄第4位置抽出部136dへ送出する。
【0192】また、最寄第4位置抽出部136dは、第
4位置のうち、第2方向に沿って最も一方寄りの第4位
置を最寄第4位置として抽出する。そして、最寄第4位
置抽出部136dは、抽出された最寄第4位置の情報を
第3および第4分割部138cおよび138dへ送出す
る。
【0193】また、第3分割部138cは、最寄第3位
置と最寄第4位置とを比較して、この最寄第3位置がこ
の最寄第4位置よりも他方側である場合またはこの最寄
第3位置とこの最寄第4位置とが第1方向に沿った同一
直線上に位置する場合に、第2分割候補区間を、当該第
2分割候補区間の中央で2つに分割させて2つの分割黒
画素区間を生成することにより、行切出しの修正を行な
う。
【0194】また、第4分割部138dは、最寄第3位
置と最寄第4位置とを比較して、この最寄第3位置がこ
の最寄第4位置よりも一方側である場合に、この最寄第
3位置とこの最寄第4位置との中間を通りかつ第2方向
に沿った分割線で第2分割候補区間を分割することによ
り、一方側の一方分割領域および他方側の他方分割領域
を生成し、一方分割領域を最寄第4位置が得られた走査
線によって分割して2つの分割黒画素区間を生成し、か
つ、他方分割領域を最寄第3位置が得られた走査線によ
って分割して2つの分割黒画素区間を生成することによ
り行切出しの修正を行なう。
【0195】(動作について)次に、図13を参照し
て、この実施の形態の行切出し装置10の動作、この発
明の行切出し方法、この発明の第1および第2の行切出
し修正方法の例について併せて詳細に説明する。図13
は、この実施の形態の行切出し装置10の全体的な動作
の流れの説明に供する流れ図である。
【0196】また、図13においては、切替S2のステ
ップから終了に到るまで、行方向が事前に判明している
場合の行切出し処理の流れを実線で示す(行方向が第1
方向の場合と第2方向の場合との2通りの処理の流れを
それぞれ示す。)。また、行方向が事前に不明である場
合の行切出し処理の流れを破線で示す。
【0197】(行方向が不明である場合の動作の全体的
な流れについて)ここでは、先ず、事前に行方向が不明
である場合の行切出し装置10の動作の全体的な流れに
ついて説明する。行方向が不明である場合とは、例え
ば、文書画像60の情報に当該文書画像の行方向を示す
情報が何も付与されていない場合、若しくは、文書画像
60の情報に行方向を示す情報が付与されていてもその
付与された情報が確認できなかった場合が該当する。
【0198】行切出し装置10に文書画像60が入力さ
れると、制御部28は、先ず、行方向確認切替部12を
起動させる。起動された行方向確認切替部12の行方向
確認部12aは、文書画像60の情報に、当該文書画像
60の行方向を示す情報が付与されているか確認する。
この場合は、文書画像60には、行方向を示す情報が付
与されていないとする。従って、行方向確認部12a
は、行方向が不明という確認結果を切替部12bに、文
書画像60の情報と共に出力する(図13のS1)。
【0199】そして、行方向確認部12aから行方向が
不明であるという確認結果を受けた切替部12bは、図
13において破線で示すように、文書画像60の情報を
第1および第2方向分割領域生成部14aおよび14b
の両方へ送出する(図13のS2)。
【0200】第1方向分割領域生成部14aは、文書画
像60を分割して、第1分割領域を生成する(図13の
S3)。生成された第1分割領域の情報は、第1方向射
影分布作成部16aへ送出される。
【0201】次に、第1方向射影分布作成部16aは、
各第1分割領域について第1方向射影分布をそれぞれ作
成する(図13のS4)。生成された第1方向射影分布
の情報は、第1分割行切出し部18aへ送出される。
【0202】次に第1分割行切出し部18aは、各第1
分割領域について第1方向射影分布に基づいて、それぞ
れ第1分割行を切り出す(図13のS5)。切り出され
た第1分割行の情報(例えば、第1黒画素区間の位置、
数、長さ)は、行方向判定部20へ送出される。
【0203】一方、第1方向分割領域生成部14bは、
文書画像60を分割して、第2分割領域を生成する(図
13のS6)。生成された第2分割領域の情報は、第2
方向射影分布作成部16bへ送出される。
【0204】次に、第2方向射影分布作成部16bは、
各第2分割領域について第2方向射影分布をそれぞれ作
成する(図13のS7)。生成された第2方向射影分布
の情報は、第2分割行切出し部18bへ送出される。
【0205】次に第2分割行切出し部18bは、各第2
分割領域について第2方向射影分布に基づいて、それぞ
れ第2分割行を切り出す(図13のS8)。切り出され
た第2分割行の情報(例えば、第2黒画素区間の位置、
数、長さ)は、行方向判定部20へ送出される。
【0206】行方向判定部20は、第1分割行の情報お
よび第2分割行の情報とに基づいて、文書画像60の行
方向の判定を行なう(図13のS9)。行方向の判定結
果は、切替出力部22へ送出される。
【0207】切替出力部22は、行方向の判定結果が第
1方向である場合は、第1分割行切出し部18aで切り
出された第1分割行の情報を第1修正部24aへ送出す
る。また、切替出力部22は、行方向の判定結果が第2
方向である場合は、第2分割行切出し部18bで切り出
された第2分割行の情報を第2修正部24bへ送出する
(図13のS10)。
【0208】そして、行方向の判定結果が第1方向であ
る場合には、第1修正部24aは、切り出された分割行
の修正を必要に応じて行なう(図13のS11)。修正
された第1分割行の情報は、第1分割行接続部26aへ
送出される。
【0209】そして、第1分割行接続部26aでは、第
1分割行どうしを接続して行の切出しを行なう(図13
のS12)。
【0210】一方、行方向の判定結果が第2方向である
場合には、第2修正部24bは、切り出された分割行の
修正を必要に応じて行なう(図13のS13)。修正さ
れた第2分割行の情報は、第2分割行接続部26bへ送
出される。
【0211】そして、第2分割行接続部26bでは、第
2分割行どうしを接続して行の切出しを行なう(図13
のS14)。
【0212】このようにして、行方向が事前に不明であ
る場合の行切出しの動作を終了する。
【0213】(行方向が第1方向である場合の動作の全
体的な流れについて)次に、行方向が事前に第1方向で
あると分かっている場合の行切出し装置10の動作につ
いて説明する。
【0214】行切出し装置10に文書画像60が入力さ
れると、制御部28は、先ず、行方向確認切替部12を
起動させる。起動された行方向確認切替部12の行方向
確認部12aは、文書画像60の情報に、当該文書画像
60の行方向を示す情報が付与されているか確認する。
この場合は、文書画像60に、行方向が第1方向である
ことを示す情報が付与されているものする。従って、行
方向確認部12aは、行方向が第1方向であるという確
認結果を切替部12bに、文書画像60の情報と共に出
力する(図13のS1)。
【0215】そして、行方向確認部12aから行方向が
第1方向であるという確認結果を受けた切替部12b
は、図13において紙面右寄りの実線Iで示すように、
文書画像60の情報を第1方向分割領域生成部14aへ
送出する(図13のS2)。
【0216】次に、第1方向分割領域生成部14aは、
文書画像60を分割して、第1分割領域を生成する(図
13のS3)。生成された第1分割領域の情報は、第1
方向射影分布作成部16aへ送出される。
【0217】次に、第1方向射影分布作成部16aは、
各第1分割領域について第1方向射影分布をそれぞれ作
成する(図13のS4)。生成された第1方向射影分布
の情報は、第1分割行切出し部18aへ送出される。
【0218】次に第1分割行切出し部18aは、各第1
分割領域について第1方向射影分布に基づいて、それぞ
れ第1分割行を切り出す(図13のS5)。そして、行
方向が第1方向である場合には、切り出された第1分割
行の情報(例えば、第1黒画素区間の位置、数、長さ)
は、第1修正部24aへ送出される。
【0219】次に、第1修正部24aは、切り出された
分割行の修正を必要に応じて行なう(図13のS1
1)。修正された第1分割行の情報は、第1分割行接続
部26aへ送出される。
【0220】次に、第1分割行接続部26aでは、第1
分割行どうしを接続して行の切出しを行なう(図13の
S12)。
【0221】このようにして、行方向が第1方向である
ことが事前に分かっている場合の行切出しの動作を終了
する。
【0222】(行方向が第2方向である場合の動作の全
体的な流れについて)次に、行方向が事前に第2方向で
あると分かっている場合の行切出し装置10の動作につ
いて説明する。
【0223】行切出し装置10に文書画像60が入力さ
れると、制御部28は、先ず、行方向確認切替部12を
起動させる。起動された行方向確認切替部12の行方向
確認部12aは、文書画像60の情報に、当該文書画像
60の行方向を示す情報が付与されているか確認する。
この場合は、文書画像60に、行方向が第2方向である
ことを示す情報が付与されているものする。従って、行
方向確認部12aは、行方向が第2方向であるという確
認結果を切替部12bに、文書画像60の情報と共に出
力する(図13のS1)。
【0224】そして、行方向確認部12aから行方向が
第2方向であるという確認結果を受けた切替部12b
は、図13において紙面左寄りの実線IIで示すよう
に、文書画像60の情報を第2方向分割領域生成部14
bへ送出する(図13のS2)。
【0225】次に、第2方向分割領域生成部14bは、
文書画像60を分割して、第2分割領域を生成する(図
13のS6)。生成された第2分割領域の情報は、第2
方向射影分布作成部16bへ送出される。
【0226】次に、第2方向射影分布作成部16bは、
各第2分割領域について第2方向射影分布をそれぞれ作
成する(図13のS7)。生成された第2方向射影分布
の情報は、第2分割行切出し部18bへ送出される。
【0227】次に第2分割行切出し部18bは、各第2
分割領域について第2方向射影分布に基づいて、それぞ
れ第2分割行を切り出す(図13のS8)。そして、行
方向が第2方向である場合には、切り出された第2分割
行の情報(例えば、第2黒画素区間の位置、数、長さ)
は、第2修正部24bへ送出される。
【0228】次に、第2修正部24bは、切り出された
分割行の修正を必要に応じて行なう(図13のS1
3)。修正された第2分割行の情報は、第2分割行接続
部26bへ送出される。
【0229】次に、第2接続部26bでは、第2分割行
どうしを接続して行の切出しを行なう(図13のS1
4)。
【0230】このようにして、行方向が第2方向である
ことが事前に分かっている場合の行切出しの動作を終了
する。
【0231】(行切出しの対象について)以下、図14
に示す文書画像60の行切出しを行なう場合の各ステッ
プの動作についてそれぞれ説明する。この文書画像60
の行方向は横方向である。すなわち、この文書画像60
には、横書きの文字列62が10行含まれている。この
文字列62にはそれぞれ全角文字および半角文字が含ま
れている。また、各文字列62の文字間隔は固定ピッチ
ではなく、可変ピッチ(プロポーショナル)とする。ま
た、図14においては、各文字列に含まれる各文字をそ
れぞれ、ハッチングを付した円で模式的に示す。例え
ば、全角文字64aを正円で示し、かつ、半角文字64
bを縦長の楕円で示す。
【0232】また、図14においては、紙面の横方向に
X軸をとり、紙面の縦方向にY軸をとる。以下、X軸方
向を水平方向とも称する。また、Y軸方向を垂直方向と
も称する。
【0233】また、この文書画像60には、図2に示し
た文字領域設定部32において文字領域66が設定され
る。そして、文字領域66が設定された文書画像60
が、行切出し装置10へ入力される。
【0234】(文書画像の分割処理について)次に、文
書画像60を対象として、文書画像の分割処理の例につ
いて説明する。
【0235】文書画像60の行方向が不明である場合ま
たは行方向が第1方向である場合に、制御部28は、第
1方向分割領域生成部14aを起動する。起動された第
1方向分割領域生成部14aは、図15の(A)に示す
ように、第2方向(縦方向)に沿った分割線A−Aおよ
び分割線B−Bによって、文書画像60の文字領域66
を分割する(図13のS3)。また、文字領域66を分
割することにより、文字領域66中の各文字列(行)6
2もそれぞれ分割される。尚、文字領域66を分割すれ
ば、結果的に文書画像60も分割されることになる。
【0236】そして、図15の(A)に示すように、こ
の分割により、この実施の形態では、この第2方向と直
交する第1方向、すなわち横方向に沿って並んだ3つの
第1方向分割領域(水平方向分割領域)68が生成され
る。ここでは、水平方向分割領域68として、第1分割
領域68a、第2分割領域68bおよび第3分割領域6
8cをそれぞれ生成する。
【0237】また、行方向が不明である場合または行方
向第2方向である場合に、制御部28は、第2方向分割
領域生成部14bを起動する。起動された第2方向分割
領域生成部14bは、図15の(B)に示すように、第
1方向(横方向)に沿った分割線にC−C、分割線D−
Dおよび分割線E−Eによって文書画像60の文書領域
66を分割する(図13のS6)。
【0238】そして、図15の(B)に示すように、こ
の実施の形態では、この分割により、この第1方向と直
交する第2方向、すなわち縦方向に沿って並んだ4つの
第2方向分割領域(垂直分割領域)70が生成される。
ここでは、垂直分割領域70として、第4分割領域70
a、第5分割領域70b、第6分割領域70cおよび第
7分割領域70dをそれぞれ生成する。
【0239】また、この実施の形態においては、文字領
域66を3つの分割領域に水平分割したが、この分割数
は、任意好適な値(自然数)とすることができる。例え
ば、分割数は、文書画像の文字領域の解像度、文字領域
の面積といった条件にじて、適宜設定すると良い。
【0240】例えば、文字領域66の水平方向(X軸方
向、横方向)に沿った幅をWaとし、最大幅がWth以
下の水平分割領域を生成する場合、水平方向の分割数n
を下記の(1)によって求めても良い。
【0241】 n=(Wa+Wth)/Wth・・・(1) 但し、上記の(1)式においては、除算の商を整数で表
し、除算のあまりを切り捨てるものとする。
【0242】そして、文字領域66を均等にn分割する
場合には、各水平分割領域の幅をWa/n画素(ドッ
ト)とすると良い。
【0243】また、例えば、文字領域を垂直方向(Y軸
方向、縦方向)に沿った高さをHaとし、最大高さがH
th以下の垂直分割領域を生成する場合、垂直方向の分
割数mを下記の(2)式によって求めても良い。
【0244】 m=(Ha+Hth)/Hth・・・(2) 但し、上記の(2)式においては、除算のあまりを切り
捨てて、除算の商を整数で表すものとする。
【0245】そして、文字領域66を均等にm分割する
場合には、各垂直分割領域の高さをHa/m画素(ドッ
ト)とすると良い。
【0246】また、この発明では、文字領域66は必ず
しも均等に分割しなくとも良い。また、この発明では、
文字領域66を設定せずに文書画像60を分割しても良
い。
【0247】(射影分布の作成処理について)次に、射
影分布の作成処理についてより詳細に説明する。行方向
が不明である場合若しくは行方向が第1方向である場
合、制御部28は、第1方向射影分布作成部16aを起
動する。起動された第1方向射影分布作成部16aは、
第1方向分割領域(水平分割領域)68の各々につい
て、第1方向(水平方向)を主走査方向とし第2方向
(垂直方向)を副走査方向として当該第1方向分割領域
を走査して走査線毎に累積黒画素数を検出することによ
り第1方向射影分布(水平射影分布)72を作成する
(図13のS4)。
【0248】この実施の形態においては、第1方向分割
領域68のうちの第1分割領域68aについて第1方向
射影分布72を作成する。ここで、図16の(A)に、
第1分割領域68aおよびその第1方向射影分布72を
示す。この第1方向射影分布72は、走査線毎の累積黒
画素数をヒストグラムで表したものである。従って、射
影分布の高さは、累積黒画素数を相対的に表す。
【0249】また、この第1方向射影分布72は、文書
画像60の行方向に沿って走査して得られたものであ
る。このため、第1方向射影分布72には、複数の互い
に独立した射影ブロック74が含まれる。第1方向射影
分布72は、第1方向射影分布作成部16aの内部メモ
リに格納される。
【0250】また、行方向が不明である場合若しくは行
方向が第2方向である場合、制御部28は、第2方向射
影分布作成部14bを起動する。起動された第2方向射
影分布作成部16bは、第2方向分割領域(垂直分割領
域)70の各々について、第2方向(垂直方向)を主走
査方向とし第1方向(水平方向)を副走査方向として第
2方向分割領域を走査して走査線毎に累積黒画素数を検
出することにより第2方向射影分布(垂直射影分布)7
8を作成する(図13のS7)。
【0251】この実施の形態においては、第2方向分割
領域70のうちの第4分割領域70aについて第2方向
射影分布78を作成する。ここで、図16の(B)に、
第1分割領域70aおよびその第2方向射影分布78を
示す。この第2方向射影分布78は、走査線毎の累積黒
画素数をヒストグラムで表したものである。従って、射
影分布の高さは、累積黒画素数を相対的に表す。
【0252】また、この第2方向射影分布78は、文書
画像60の行方向を横断する方向に走査して得られたも
のである。従って、第2方向射影分布78は、不規則に
連続した射影となる。第2方向射影分布78のデータ
は、第2方向射影分布作成部16b内部のメモリに格納
される。
【0253】(分割行の切出し処理について)次に、分
割行の切出し処理についてより詳細に説明する。
【0254】行方向が不明である場合若しくは行方向が
第1方向である場合、制御部28は、第1分割行切出し
部18aを起動する。起動された第1分割行切出し部1
8aは、第1方向射影分布72の各々において第1基準
値(例えば1画素)以上の累積黒画素数が第2方向(垂
直方向)に沿って連続する区間をそれぞれ第1黒画素区
間とする。そして、第1分割行切出し部18aは、この
第1黒画素区間がそれぞれ得られる走査領域をそれぞれ
第1分割行として分割行切出しを行なう(図13のS
5)。
【0255】その結果、第1方向射影分布72における
各射影ブロック74の得られた各副走査区間は、それぞ
れ、各文字列62が分割線A−Aによって分割されて生
成した分割行76に対応する。図16の(A)では、切
り出された10行の各分割行76をそれぞれ矩形枠76
で模式的に示す。尚、この分割行の切出しは、全ての第
1分割領域68について行なう。
【0256】また、行方向が不明である場合若しくは行
方向が第2方向である場合、制御部28は、第2分割行
切出し部18bを起動する。起動された第2分割行切出
し部18bは、第2方向射影分布78の各々において第
2基準値(例えば1画素)以上の累積黒画素数が第1方
向(水平方向)に沿って連続する区間をそれぞれ第2黒
画素区間とする。そして、第2分割行切出し部18b
は、この第2黒画素区間がそれぞれ得られる走査領域を
それぞれ第2分割行として分割行切出しを行なう(図1
3のS8)。
【0257】この第2方向射影分布78は、図16の
(B)においてa、b、cおよびdの符号でそれぞれ示
す部位で途切れている。そして、図16の(B)では、
第4分割領域70aに含まれる文字列62を、第2方向
射影分布78の射影が途切れた各部位で分割して生成し
た各分割行80を矩形枠80で模式的に示す。各分割行
80は、互いに第1方向(水平方向)に並んでおり、か
つ、それぞれ複数の文字列62の一部分ずつを含んでい
る。図16の(B)では、5つの分割行80を生成した
例を示す。
【0258】以下、第1分割領域68a中の分割行76
を水平分割行76と称し、第4分割領域70a中の分割
行78を垂直分割行80と称する。
【0259】また、この実施の形態においては、図13
のS3〜S5のステップと、S6〜S8のステップとを
互いに並列に処理しても良い。
【0260】(行方向判定部の動作について)次に、文
書画像60の行方向が事前に不明である場合の行方向判
定部の動作例について詳細に説明する。
【0261】行方向判定部20における行方向判定の動
作(図13のS9)について、図17を参照して説明す
る。図17は、行方向判定部20の動作の説明に供する
流れ図である。以下、行方向判定部20を構成する第1
判定部201、第2判定部202および第3判定部20
3の動作について順次に説明する。
【0262】(第1判定部の動作について)先ず、第1
判定部201の動作の一例として、図14に示した、複
数の行を含む文書画像60の判定を行なう場合の動作に
ついて説明する。
【0263】制御部28は、先ず、行方向判定部20の
第1判定部201を起動する。そして、制御部28は、
起動された第1判定部201へ、第1分割行切出し部1
8aおよび第2分割行切出し部18bから、それぞれ第
1射影分布および第2射影分布のデータを送る。
【0264】第1方向射影分布作成部16aにおいて
は、全ての分割領域68について第1方向射影分布72
を作成した。従って、第1判定部201の第1分割領域
数計数部36aは、生成された分割領域68の数の合計
である第1分割領域数nを「3」と計数する。
【0265】また、各分割領域の第1方向射影分布72
には、前述のように、それぞれ10個の射影ブロック7
4が含まれる。各射影ブロック74は、第1方向射影分
布72において第1基準値(ここでは1画素)以上の累
積黒画素の射影が第1方向に連続した第1黒画素区間で
ある。従って、第1判定部201の第1黒画素区間数計
数部38aは、第1方向射影分布における黒画素区間の
数の、全ての分割領域にわたっての合計である第1黒画
素区間数Nhを「30(10×3)」と計数する。
【0266】また、第2方向射影分布作成部16bにお
いては、全ての分割領域70について第2方向射影分布
78を作成した。従って、第1判定部201の第2分割
領域数計数部36bは、分割領域の数の合計である第2
分割領域数mを「4」と計数する。
【0267】また、各分割領域の第2方向射影分布78
には、それぞれ5つの第2黒画素区間が含まれていると
する。例えば、前述のように、第4分割領域70aの第
2方向射影分布78は、a、b、cおよびdの4箇所で
途切れている。この4箇所で途切れた5つの射影分布の
各々は、いずれも、第2方向射影分布78において第2
基準値(ここでは1画素)以上の累積黒画素数の射影が
第1方向(横方向)に連続する第2黒画素区間である。
ここでは、そのほかの第2分割領域の第2方向射影分布
においても、同じ数の黒画素区間が含まれているものと
する。従って、第1判定部201の第2黒画素区間数計
数部38bは、各第2黒画素区間の数の全ての分割領域
にわたっての合計である第2黒画素区間数Mvを「20
(5×4)」と計数する。
【0268】尚、これら第1分割領域数計数部36a、
第2分割領域数計数部36b、第1黒画素区間数計数部
38aおよび第2黒画素区間数計数部38bの処理の順
序は限定されない。
【0269】次に、第1判定部201の区間数分割数比
較判定部40において、第1黒画素区間数Nhと第1分
割領域数nとを比較し、かつ第2黒画素区間数Mvと第
2分割領域数mとを比較する(図17のS1およびS
2)。
【0270】この実施例では、先ず、n=Nhかつm≠
Mvであるか否かを判断する(図17のS1)。そし
て、n=Nhかつm≠Mvである場合(Y)には、この
文書画像60を横書きと判定する。これに対して、n=
Nhかつm≠Mvでない場合(N)には、次のS2のス
テップへ進む。
【0271】ステップS2においては、n≠Nhかつm
=Mvであるか否かを判断する(図17のS2)。そし
て、n≠Nhかつm=Mvである場合(Y)には、この
文書画像60を縦書きと判定する。これに対して、n≠
Nhかつm=Mvでない場合(N)には、次のS3およ
びS4のステップへ進む。
【0272】ここでは、第1黒画素区間数Nh(10)
と第1分割領域数n(1)とは一致せず、かつ、第2黒
画素区間数Mv(5)と第2分割領域数m(1)とも一
致しない。このため、この場合は、第1判定部201で
は、行方向を判定することができない。
【0273】そこで、制御部28は、次のステップS3
およびS4の処理へ進むため、行方向判定部20のうち
の第2判定部202に判定を行なわせる。
【0274】(文字列が1行の場合の第1判定部の動作
例について)この実施の形態において行方向の判定の対
象とした文書画像60には、上述のように、複数の行が
含まれている。このため、第1判定部201において
は、文書画像60の行方向を判定しない。
【0275】そこで、第1判定部201の動作の一層の
理解を図るため、1行の文字列のみが含まれている文書
画像の行方向の判定を行なう動作例について説明する。
ここでは、図18の(A)に、文書画像の文字領域50
に横書きの文字列52が1行のみ含まれている例を示
す。また、図18では、便宜的に、文字列52の領域に
斜線を付して示す。以下、この実施の形態では、横方向
を第1方向、縦方向を第2方向として説明する。
【0276】先ず、図18の(B)に示すように、上述
の第1方向分割領域生成部14aにおいて、この文字領
域50を縦方向の分割線A−Aおよび分割線B−Bによ
って3分割する場合について説明する。この分割の結
果、横方向に順次に並んだ第1分割領域50a、第2分
割領域50bおよび第3分割領域50cが生成される。
また、この分割の結果、文字列52も、第1分割行52
a、第2分割行52bおよび第3分割行52cに分割さ
れる。この第1分割行52aは、第1分割領域50aに
含まれる。また、第2分割行52bは、第2分割領域5
0bに含まれる。また、第3分割行52cは、第3分割
領域50cに含まれる。
【0277】そして、上述の第1方向射影分布作成部1
6aにおいて、この3つの分割領域のうちの例えば、第
1分割領域50aおよび第2分割領域50bの2つの分
割領域について横方向の射影分布(第1方向射影分布)
をそれぞれ作成する。
【0278】ここで、図18の(C)に、第1分割領域
50aを示す。この第1分割領域50aには、第1分割
行52aが1行だけ含まれている。そして、第1分割領
域50aの右側に、第1分割領域50aを横方向に走査
して得られた第1方向射影分布54aを示す。この第1
方向射影分布54aは、第1分割行52aに対応した1
つのブロック状の射影である。このブロック状の射影は
1つの黒画素区間56aに対応する。従って、1つの分
割領域50aにつき1つの黒画素区間56aが得られ
る。
【0279】また、図18の(D)に、第2分割領域5
0bを示す。この第2分割領域50bには、第2分割行
52bが1行だけ含まれている。そして、第2分割領域
50bの右側に、第2分割領域50bを横方向に走査し
て得られた第1方向射影分布54bを示す。この第1方
向射影分布54bは、第2分割行52bに対応した1つ
のブロック状の射影である。このブロック状の射影は1
つの黒画素区間56bに対応する。従って、1つの分割
領域50bにつき1つの黒画素区間56bが得られる。
【0280】そして、前述のように、分割領域数は、3
つである。従って、この第1分割領域数計数部36a
は、分割領域の数の合計である第1分割領域数を「3」
と計数する。
【0281】また、前述のように、第1分割領域50a
の第1方向射影分布54aの黒画素区間56aの数は
「1」である。また、第2分割領域50bの第1方向射
影分布54bの黒画素区間56bの数も「1」である。
また、第3分割領域50cの第1方向射影分布54cの
黒画素区間56cの数も「1」である。
【0282】従って、第1黒画素区間数計数部38a
は、第1方向射影分布における黒画素区間の数の、全て
の分割領域にわたっての合計である第1黒画素区間数を
「3」(=1+1+1)と計数する。
【0283】次に、図19の(A)に示すように、上述
の第2方向分割領域生成部12bにおいて、図18の
(A)に示した文字領域50を横方向の分割線C−Cお
よび分割線D−Dによって3分割する場合について説明
する。この分割の結果、縦方向に順次に並んだ第4分割
領域50d、第5分割領域50eおよび第6分割領域5
0fの3つの分割領域が生成される。そして、文字列5
2は、第5分割領域50eに含まれる。
【0284】そして、上述の第1方向射影分布作成部1
6aにおいて、この3つの分割領域について縦方向の射
影分布(第2方向射影分布)をそれぞれ作成する。
【0285】ここで、図19の(B)に、第4分割領域
50dを示す。第4分割領域50dには、文字列52が
含まれていない。従って、第4分割領域50dを縦方向
に走査しても、射影分布は得られない。従って、第4分
割領域50dからは黒画素区間は得られない。また、第
6分割領域50fからも同様に、黒画素区間は得られな
い。
【0286】また、図19の(C)に、第5分割領域5
0eを示す。第5分割領域50eには、文字列52がそ
のまま含まれる。そして、第5分割領域50eの下側
に、第5分割領域50eを縦方向に走査して得られた第
2方向射影分布54eを示す。この第2方向射影分布5
4eは、1つの連続した射影である。この射影は、1つ
の黒画素区間56eに対応する。従って、1つの分割領
域50eにつき1つの黒画素区間56eが得られる。
【0287】そして、この第2分割領域数計数部36b
は、分割領域の数の合計である第2分割領域数を「3」
と計数する。
【0288】また、前述のように、第4および第6分割
領域50dおよび50fの黒画素区間の数はいずれも
「0」である。また、第5分割領域50eの第2方向射
影分布54eの黒画素区間56eの数は「1」である。
【0289】従って、第2黒画素区間数計数部38b
は、第2方向射影分布における黒画素区間の数の、全て
の分割領域にわたっての合計である第2黒画素区間数を
「1」(=0+1+0)と計数する。
【0290】次に、区間数分割数比較判定部40におい
て、行方向を判定する。ここでは、、第1黒画素区間数
(3)と第1分割領域数(3)とが一致し、かつ、第2
黒画素区間数(1)と第2分割領域数(3)とが一致し
ないので、行方向を第1方向、すなわち横方向と判定す
る。
【0291】このように、文書画像の文字領域に文字列
が1行のみ含まれている場合には、行方向と直交する分
割線によって分割された各分割領域に、分割行が1つず
つ含まれる。その結果、この場合には、分割領域の数
と、各分割領域にそれぞれ含まれる分割行の数の合計と
が一致する。これに対して、行方向に沿った分割線によ
って文字領域を分割した場合には、分割領域の数と、分
割行の数の合計とは一致しない。例えば、複数の分割領
域が生成されても、分割行の数の合計は1つのままとな
る。従って、文字列が1行だけ場合には、分割領域の数
と分割行の数の合計とを比較すれば、黒画素区間長のば
らつきや白画素区間長の平均値を比較するまでもなく、
行方向を判定することができる。
【0292】従って、文書画像中の文字列が1行だけ場
合には、第1判定部201において分割領域の数と分割
行の数の合計とを比較することにより、第2判定部20
2で後述のように黒画素区間長のばらつきを比較した
り、第3判定部203で後述のように白画素区間長の平
均値を比較するまでもなく、行方向の判定精度の向上を
図ることができる。
【0293】尚、上記の動作例においては、2つの第1
方向分割領域と2つの第2方向分割領域についてそれぞ
れ射影分布を作成したが、例えば、全ての分割領域につ
いて射影分布を作成しても良い。また、1つの第1方向
分割領域と1つの第2方向分割領域についてのみ射影分
布を作成しても良い。
【0294】また、例えば、第2分割領域50bと第5
分割領域50eのみについて射影分布を作成した場合
は、第1分割領域数および第2分割領域数はいずれも
「1」となる。そして、第1黒画素区間数および第2黒
画素区間数はいずれも「1」となる。この場合は、第1
分割領域数「1」と第1黒画素区間数「1」とが等し
く、かつ、第2分割領域数「1」と第2黒画素区間数
「1」とが等しいので、区間数分割数比較判定部40に
おける判定条件が満たされない。従って、この場合は、
区間数分割数比較判定部40は行方向を判定しない。そ
の場合は、第2判定部202で行方向の判定を試みる。
【0295】(第2判定部の動作について)次に、第2
判定部の動作について説明する。
【0296】次に、制御部28は、判定部20の第2判
定部202を起動する。そして、制御部28は、起動さ
れた第2判定部202へ第1分割行切出し部18aおよ
び第2分割行切出し部18bから、それぞれ第1射影分
布および第2射影分布のデータを送る。
【0297】(第1ばらつき算出部の動作について)先
ず、図20の(A)を参照して、第2判定部202の第
1ばらつき算出部42aの動作について説明する。図2
0の(A)は、第1ばらつき算出部42aの説明に供す
る図であり、図16の(A)に示された第1分割領域6
8aの一部分およびその部分に対応する第1方向射影分
72の部分を示す。
【0298】図20の(A)においては、第1分割領域
68a中の分割行76を、紙面の上側から順に、第1分
割行76a、第2分割行76b、第3分割行76c・・
・第10分割行76jとする。また、第1分割行76
a、第2分割行76b、第3分割行76c・・・第10
分割行76jをそれぞれ走査して得られた射影ブロック
74をそれぞれ第1射影ブロック74a、第2射影ブロ
ック74b、第3射影ブロック74c・・・第10射影
ブロック74jとする。尚、図20の(A)において
は、第4〜第9射影ブロックの図示を省略する。
【0299】そして、第1ばらつき算出部42aは、先
ず、第1方向射影分布72を形成する累積黒画素数のう
ち、第1基準値(例えば1画素)以上の累積黒画素数が
第2方向(垂直方向)に沿って連続しているとき、その
連続する区間82を第1黒画素区間として、当該第1黒
画素区間82の長さ(第1黒画素区間長)を求める。こ
こでは、第1射影ブロック74a,第2射影ブロック7
4b,第3射影ブロック74c・・・第10射影ブロッ
ク74jに対応する各黒画素区間82の第1黒画素区間
長をそれぞれH(1)、H(2)、H(3)・・・H
(10)として求める。
【0300】また、第1黒画素区間長のデータは、例え
ば、文書画像60において各射影ブロック74の端が得
られる位置をXY座標を求め、各射影ブロック74の副
走査方向に沿った両端のXY座標の距離(この場合はY
座標の値の差)として表しても良い。また、第1黒画素
区間長のデータは、例えば、各射影ブロック74の副走
査方向に沿った両端間の画素数で表示しても良い。
【0301】また、第1基準値を1画素とした場合に
は、各第1黒画素区間長は、それぞれ各射影ブロック7
4の副走査方向の長さと一致する。各射影ブロック74
の副走査方向の長さは、それぞれ各分割行76の高さと
一致する。これに対して、第1基準値を2画素以上の値
とした場合(例えば数画素とした場合)には、各第1黒
画素区間長は、それぞれ各射影ブロック74の副走査方
向の長さよりも若干短くなる傾向がある。しかし、この
場合でも、黒画素区間長と、射影ブロックの副走査方向
の長さおよび分割行76の高さとは、実質的に対応して
いる。第1基準値は、任意好適な画素数(自然数)を取
ることができる。
【0302】尚、各第1黒画素区間長を既に求めてある
場合、例えば、第1方向射影分布作成部16aで各第1
黒画素区間長を既に求めてある場合には、第1ばらつき
算出部42aで改めて各第1黒画素区間長を求める必要
はない。
【0303】次に、第1ばらつき算出部42aは、第1
黒画素区間長のばらつきを算出する(図17のS3)。
第1黒画素区間長のばらつきの算出あたっては、第1ば
らつき算出部42aは、先ず、各黒画素区間82の黒画
素区間長の相加平均値を算出する。黒画素区間の相加平
均値Hhは、下記の(3)式で与えられる。
【0304】 Hh={H(1)+H(2)+H(3)+・・・+H(10)}/Nh・・・ (3) 但し、Nhは、黒画素区間82の数を表し、この実施の
形態ではNh=10である。また、複数の分割領域68
について第1方向射影分布72を作成した場合には、第
1方向射影分布72を作成した各分割領域68にそれぞ
れ含まれる黒画素区間82の数の合計が、Nhとなる。
例えば、2つの分割領域68について第1方向射影分布
72を作成した場合には、黒画素区間82の数の合計は
Nh=20となる。
【0305】次に、第1ばらつき算出部42aは、各黒
画素区間長と相加平均値Hhとの差の和を黒画素区間の
数で割った値を第1画素区間長のばらつきEhとして算
出する(図17のS4)。
【0306】第1黒画素区間長のばらつきEhは、下記
の(4)式で与えられる。
【0307】 Eh={Σ|H(i)−Hm|}/Nh・・・(4) 但し、上記の(4)式中の「Σ」は、i=1〜Nhの場
合の和を表す。
【0308】尚、この実施の形態においては、第1黒画
素区間長のばらつきEhを上記の(4)式で与えたが、
第1黒画素区間長のばらつきはこれに限定されるもので
はない。この発明では、第1黒画素区間長のばらつきと
して、例えば、分散や標準偏差を求めても良い。
【0309】(第2ばらつき算出部の動作について)次
に、図20(B)を参照して、第2判定部202の第2
ばらつき算出部42bの動作について説明する。図20
の(B)は、第2ばらつき算出部42bの説明に供する
図であり、図16の(B)に示された第4分割領域70
aおよび第2方向射影分78を示す。
【0310】図20の(B)においては、第4分割領域
70a中の分割行80を、紙面の左側から順に、第1分
割行80a、第2分割行80b、第3分割行80c、第
4分割行80dおよび第5分割量80eとする。また、
第1分割行80a、第2分割行80b、第3分割行80
c、第4分割行80dおよび第5分割行80eをそれぞ
れ走査して得られた射影78部分をそれぞれ第1射影7
8a、第2射影78b、第3射影78c、第4射影78
dおよび第5射影78eとする。
【0311】そして、第2ばらつき算出部42bは、先
ず、第2方向射影分布78を形成する累積黒画素数のう
ち、第2基準値(例えば1画素)以上の累積黒画素数が
第1方向(水平方向)に沿って連続しているとき、その
連続する区間84を第2黒画素区間として、当該第2黒
画素区間84の長さ(第2黒画素区間長)を求める。こ
こでは、第1射影78a、第2射影78b、第3射影7
8c、第4射影78dおよび第5射影78eに対応する
各黒画素区間84の第2黒画素区間長をそれぞれW
(1)、W(2)、W(3)、W(4)およびW(5)
として求める。
【0312】また、第2黒画素区間長のデータは、例え
ば、各射影78の端の位置をXY座標を求め、各射影7
8の副走査方向に沿った両端のXY座標の距離(この場
合はX座標の値の差)として表しても良い。また、第2
黒画素区間長のデータは、例えば、各射影78の副走査
方向に沿った両端間の画素数で表示しても良い。
【0313】尚、各第2黒画素区間長を既に求めてある
場合、例えば、第2方向射影分布作成部16bで各第2
黒画素区間長を既に求めてある場合には、第2ばらつき
算出部42bで改めて各第2黒画素区間長を求める必要
はない。
【0314】次に、第2ばらつき算出部42bは、第2
黒画素区間長のばらつきを算出する(図17のS5)。
第2黒画素区間長のばらつきの算出あたっては、第2ば
らつき算出部42bは、先ず、各黒画素区間84の黒画
素区間長の相加平均値を算出する。黒画素区間の相加平
均値Wvは、下記の(5)式で与えられる。
【0315】 Wv={W(1)+W(2)+W(3)+W(4)+W(5)}/Nw・・・ (5) 但し、Nwは、黒画素区間84の数を表し、この実施の
形態ではNw=5である。また、複数の分割領域70に
ついて第2方向射影分布78を作成した場合には、第1
方向射影分布78を作成した各分割領域70にそれぞれ
含まれる黒画素区間84の数の合計がNwとなる。
【0316】次に、第2ばらつき算出部42bは、各第
2黒画素区間長と相加平均値Wvとの差の和を黒画素区
間の数で割った値を第2画素区間長のばらつきEvとし
て算出する(図17のS6)。
【0317】第2黒画素区間長のばらつきEvは、下記
の(6)式で与えられる。
【0318】 Ev={Σ|W(j)−Wv|}/Nw・・・(6) 但し、上記の(6)式中の「Σ」は、j=1〜Nwの場
合の和を表す。
【0319】尚、この実施の形態においては、第2黒画
素区間長のばらつきEvを上記の(6)式で与えたが、
第2黒画素区間長のばらつきはこれに限定されるもので
はない。この発明では、第2黒画素区間長のばらつきと
して、例えば、分散や標準偏差を求めても良い。
【0320】また、この実施の形態においては、第1お
よび第2黒画素区間のばらつきをそれぞれ求めるための
処理を図17のS3〜S6のステップの順に従って行な
ったが、この発明では、S3およびS5のステップの処
理と、S4およびS6のステップの処理とは個別に独立
して行なうことができる。従って、この発明では、S3
〜S6のステップについては、S3およびS4のステッ
プを順次に行なう点とS5およびS6のステップを順次
に行なう点とを除いては、処理の順序は限定されない。
例えば、S5のステップを行なった後にS3のステップ
行なっても良い。また、例えば、S5およびS6のステ
ップの処理を順次に行なった後に、S3およびS4のス
テップの処理を順次に行なっても良い。
【0321】(ばらつき比較判定部の動作について)次
に、第2判定部20のばらつき比較判定部44の動作に
ついて説明する。ばらつき比較判定部44は、第1黒画
素区間長のばらつきEhと、第2黒画素区間長のばらつ
きとEvを比較して、第1黒画素区間長のばらつきEh
と第2黒画素区間長のばらつきEvとの比率が第3基準
値P以上の場合に、ばらつきの小さい方の黒画素区間長
が得られた走査方向を行方向と判定する(図17のS7
およびS8)。尚、この基準値Pの値は任意好適な値を
設定することができる。また、P=1の場合には、Eh
とEvとの大小を比較することと同等になる。
【0322】この実施の形態では、先ず、下記の(7)
式が満たされるか否かを判断する(図17のS7)。そ
して、下記の(7)式が満たされた場合には、文書画像
60を横書きと判定する。これに対して、下記の(7)
式が満たされない場合には、次のS8のステップへ進
む。
【0323】Eh・P<Ev・・・(7) ステップS8においては、下記の(8)式が満たされる
か否かを算段する(図17のS8)。そして、下記の
(8)式が満たされる場合には、文書画像60を縦書き
と判定する。これに対して、下記の(8)式が満たされ
ない場合には、次のS9およびS10のステップへ進
む。
【0324】Ev・P<Eh・・・(8) ここでは、文書画像60は横書きであるため、第1黒画
素区間長のばらつきEhにくらべて、第2黒画素区間長
のばらつきEvが大きくなる。その結果、この場合に
は、通常、上記の(7)式が満たされる。
【0325】ところで、図20の(B)に示したよう
に、各行の文字間隔が固定ピッチである場合には、第1
黒画素区間長のばらつきと第2黒画素区間長のばらつき
とがどちらも小さいため、上記の(7)式および(8)
式のどちらも満たされない場合がある。その場合には、
制御部28は、ステップS9およびS10へ進むため、
行方向判定部20のうちの第2判定部202に判定を行
なわせる。
【0326】(第3判定部の動作について)次に、制御
部28は、行方向判定部20の第3判定部203を起動
し、起動された第3判定部203へ第1分割行切出し部
18aおよび第2分割行切出し部18bから、それぞれ
第1射影分布および第2射影分布のデータを送る。
【0327】(第1平均値算出部の動作について)この
第1平均値算出部46aは、先ず、第1方向射影分布7
2において隣り合った第1黒画素区間82どうしの間の
第1白画素区間86の長さ(第1白画素区間長)をそれ
ぞれ求める。
【0328】ここでは、図20の(A)に示すように、
第1射影ブロック74aの黒画素区間と第2射影ブロッ
ク74bの黒画素区間との間の第1白画素区間の区間長
をSh(1)として求める。また、第2射影ブロック7
4bと第3射影ブロック74cとの間の第1白画素区間
の区間長をSh(2)として求める。同様にして、他の
白画素区間の区間長Sh(3)、Sh(4)、Sh
(5)、Sh(6)、Sh(第17)、Sh(8)およ
びSh(9)を求める。
【0329】尚、各第1白画素区間長を既に求めてある
場合、例えば、第1方向射影分布作成部16aで各白画
素区間長を既に求めてある場合には、第1平均値算出部
46aで改めて各白画素区間長を求める必要はない。
【0330】次に、第1平均値出部46aは、第1白画
素区間長の平均値Shmを算出する(図17のS9)。
第1白画素区間長の平均値の算出にあたっては、第1平
均値算出部46aは、第1白画素区間86の各々の長さ
の相加平均を第1平均値として算出する。第1平均値S
hmは、下記の(9)式で与えられる。
【0331】 Shm={Sh(1)+Sh(2)+Sh(3)+・・・+Sh(9)}/( Nh−n)・・・(9) 但し、Nh−nは、白画素区間86の数の合計を表す。
この実施の形態ではNh−n=9となる。すなわち、N
hは、前述のように第1黒画素区間82の数を表し、n
は、第1方向射影分布72を作成した分割領域68の数
(この実施の形態ではn=1)を表す。また、例えば、
2つの分割領域68について第1方向射影分布72を作
成して、この2つの分割領域68を合わせた白画素区間
の相加平均値を算出する場合には、n=2となる。すな
わち、Nh−nは、それぞれの分割領域68における第
1黒画素区間82の数から、それぞれ1を引いた値を足
し合わせた値となる。
【0332】尚、第1方向射影分布において黒画素区間
どうしの間の白画素区間が1箇所だけの場合には、その
白画素区間の区間長を第1平均値とする。
【0333】(第2平均値算出部の動作について)ま
た、第2平均値算出部46bは、隣り合った第2黒画素
区間どうしの間隔をそれぞれ第2白画素区間長として求
める。
【0334】ここでは、図20の(B)に示すように、
第1射影78aと第2射影78bとの間の、図20の
(B)においてaで示す部分の第2白画素区間長をSw
(1)として求める。また、第2射影78bと第3射影
78cとの間の、図20の(B)においてbで示す部分
の第2白画素区間長をSw(2)として求める。また、
第3射影78cと第4射影78dとの間の、図20の
(B)においてcで示す部分第2白画素区間長をSw
(3)として求める。また、第4射影78dと第5射影
78eとの間の、、図20の(B)においてdで示す部
分第2白画素区間長をSw(4)として求める。これら
の第2白画素区間長Sw(1)〜Sw(4)は、図20
の(B)においては、いずれも1画素分程度である。
【0335】尚、各第2白画素区間長を既に求めてある
場合、例えば、第2方向射影分布作成部16bで各第2
白画素区間長を既に求めてある場合には、第2平均値出
部46bで改めて各第2白画素区間長を求める必要はな
い。
【0336】次に、第2平均値出部46bは、第2白画
素区間長の平均値Swmを算出する(図17のS1
0)。第2白画素区間長の平均値の算出にあたっては、
第2平均値算出部46bは、各第2白画素区間88の白
画素区間長の相加平均値を第2平均値として算出する。
第2平均値Swmは、下記の(10)式で与えられる。
【0337】 Swm={Sw(1)+Sw(2)+Sw(3)+Sw(4)}/(Nw−m )・・・(10) 但し、Nw−mは、第2白画素区間88の数を表し、こ
の実施の形態ではNw−m=4である。すなわち、Nw
は、前述のように第2黒画素区間84の数を表し、m
は、第2方向射影分布78を求めた第2方向分割領域7
0の数(この実施の形態ではm=1)を表す。
【0338】尚、第2方向射影分布において黒画素区間
どうしの間の白画素区間が1箇所だけの場合には、その
白画素区間の区間長を第2平均値とする。
【0339】尚、この実施の形態では、S7のステップ
の次にS8のステップへ進んだ例について説明したが、
S8のステップの次にS7のステップへ進んでも良い。
【0340】(平均値比較判定部の動作について)次
に、平均値比較判定部48の動作について説明する。平
均値比較判定部48では、第1平均値Shmと第2平均
値Swmとを比較して、より大きな平均値の白画素区間
長の得られた射影分布の走査方向を行方向と判定する
(図17のS11)。
【0341】そして、この実施の形態では、Shm≧S
wmが成立する場合(Y)には、文書画像60を横書き
と判定する。これに対して、Shm≧Swmが成立しな
い場合(N)には、文書画像60を縦書きと判定する。
【0342】この場合は、Shm>Swmとなる。従っ
て、平均値比較判定部48は、第1方向射影分布72が
得られた走査方向、すなわち水平方向を行方向と判定す
る。従って、文書画像60は横書きであると判定され
る。
【0343】尚、この実施の形態においては、平均比較
判定部において第1平均値Shmと第2平均値Swmと
を比較して行方向を判定したが、第1白画素区間の長さ
と第2白画素区間の長さとを利用して行方向を判定する
にあたっては、平均値を用いる場合に限定する必要はな
い。例えば、特定の白画素区間どうし、例えば、最大の
第1白画素区間長と最大の第2白画素区間長とを比較し
て行方向を判定しても良い。また、例えば、特定の第1
および第2白画素区間の長さどうしを比較して行方向を
判定しても良い。
【0344】(統合修正の動作例)次に、1つの分割行
が誤って2つの分割行として切り出された場合の修正方
法の例について説明する。
【0345】図22の(A)および(B)に、修正対象
の分割行をそれぞれ示す。図22の(A)には、横書き
の分割行150の例を示す。この分割行150は、
「二」、「吉」および「合」の3文字が含まれている。
そして、この3文字の形は、いずれも上下に部首が分離
したものとなっている。このため、分割行切出しのプロ
セスにおいて、1つの分割行として切り出されるべきこ
の分割行150は、誤って、上下に分離した2つの分割
行、すなわち、上側の分割行150aと下側の分割行1
50bとして切り出されてしまっている。
【0346】また、図22の(B)には、縦書きの分割
行152の例を示す。この分割行152は、「八」、
「北」および「札」の3文字が含まれている。そして、
この3文字の形は、いずれも左右に部首が分離したもの
となっている。このため、分割行切出しのプロセスにお
いて、1つの分割行として切り出されるべきこの分割行
152は、誤って、左右に分離した2つの分割行、すな
わち、右側の分割行152aと左側の分割行152bと
して切り出されてしまっている。
【0347】また、ここでは、第1方向を水平方向(紙
面横方向、X軸に沿った方向)とし、第2方向を垂直方
向(紙面縦方向、Y軸に沿った方向)とする。従って、
図22の(A)に示された横書きの分割行150の統合
修正の処理は、第1統合修正部90aにおいて行なわれ
る。また、図22の(B)に示された縦書きに分割行の
統合修正の処理は、第2統合修正部90bにおいて行な
われる。尚、第1方向を垂直方向、第2方向を水平方向
と入れ替えれば、第1および第2統合修正部90aおよ
び90bにおける処理内容も入れ替わることになる。
【0348】(水平分割行の統合修正について)先ず、
図21を参照して、図22の(A)に示した水平分割行
150の統合修正方法の一例について説明する。図21
は、水平分割行の統合修正方法の説明に供する流れ図で
ある。
【0349】一般に、誤って2つに切り出された水平分
割行の高さは、適切に切り出された他の分割行に比べて
低く、他の分割行の半分程度である。さらに、この誤っ
て切り出された2つの分割行どうしの行間隔は、一般
に、他の分割行どうしの行間隔間に比べて狭い。従っ
て、切り出された分割行の高さ若しくは幅と行間隔とに
着目すれば、本来1つの分割行として切り出されるべき
ところを誤って2つの分割行として切り出された分割行
を発見して、分割行切出しの修正が可能となる。
【0350】そこで、この実施の形態においては、水平
分割行の統合修正を行なうにあたり、先ず、第1平均黒
画素区間長算出部120aにおいて、第1分割行切出し
部18aにおいて切り出された第1分割行の第1黒画素
区間の長さ(第1黒画素区間長)の相加平均を第1平均
黒画素区間長として求める(図21のS1)。第1分割
行が水平分割行である場合、第1分割行の第1黒画素区
間長は、水平分割行の高さを表す。そして、この場合、
第1平均区間長Hhは、水平分割行の高さの平均値を表
す。
【0351】次に、各水平分割行について、誤って切り
出されたものか否かを順次に調べるために、第1候補区
間選択部122aに、水平分割行の通し番号を便宜的に
与えるパラメータiを用意する。そして、このパラメー
タiに1を代入する(図21のS2)。
【0352】このパラメータiの最大値は、水平分割行
の総数Nhとなる。
【0353】次に、第1候補区間選択部122aにおい
て、この第1平均黒画素区間長と第1黒画素区間長とを
比較する。そして、第1黒画素区間のうち、第1平均黒
画素区間長Hhに対する第1黒画素区間長Hh(i)の
比率が第6基準値Q(例えば0.5)よりも小さな第1
黒画素区間を第1候補区間として選択する(図21のS
3)。
【0354】ここでは、各水平分割行の高さと平均値と
を順次に比較する。そして、ある水平分割行の高さが平
均値に対して一定の割合よりも低い場合、例えば高さH
h(i)の1/Q倍(例えば2倍)の値が平均値Hhよ
りも低い場合に、その水平分割行は、誤って分割された
可能性が高い。このため、その水平分割行を統合修正対
象の候補としての第1候補区間として選択する。
【0355】そして、この実施の形態では、図22の
(A)に示した分割行150aを第1候補区間として選
択する。
【0356】尚、各水平分割行の高さと平均値とを順次
に比較する場合、高さが条件を満たさない場合には、順
次に図21のS4のステップへ進む。S4のステップに
おいては、パラメータiが、Nh未満であるか否かを判
断する。すなわち、全ての分割行について高さと平均値
とを比較しか否かを判断する。
【0357】そして、パラメータiがNh未満でない場
合、すなわち、全ての水平分割行についてその高さと平
均値とを比較したと判断した場合には、水平分割行の統
合処理を終了する。
【0358】また、パラメータiがNh未満である場
合、すなわち、その高さと平均値とを比較していない水
平分割行がまだ残っていると判断した場合には、図21
のS5の処理へ進む。
【0359】このS5の処理においては、パラメータi
の値を1増加させる(インクリメントする。)。そし
て、図21のS3の処理へ進んで、次のパラメータi+
1に対応する水平分割行についてその高さと平均値とを
比較する。
【0360】ところで、この第1候補区間として抽出さ
れた水平分割行150aの両側には、それぞれ分割行が
存在している。このため、この両側の2つの分割行のう
ちのどちらの分割行を第1候補区間と統合して修正すべ
きかを決定する必要がある。この決定の方法について、
後述のS6〜S10のステップにおいて説明する。
【0361】ここで、上述の図21のS3のステップに
おいて第1候補区間として選択された分割行150aに
対する統合修正処理の理解を容易にするために、図23
の(A)を供す。図23の(A)は、水平分割行150
aの統合修正処理の説明に供する図である。
【0362】次に、第1統合区間長検出部124aにお
いて、先ず、第1候補区間である水平分割行150a
の、一方の側の直近の第1黒画素区間を第1候補黒画素
区間154とする。ここでは、水平分割行150aの、
紙面上方の直近の第1黒画素区間を第1候補黒画素区間
154とする。そして、この第1候補黒画素区間154
と水平分割行150aとを一つの連続した黒画素区間と
した場合の当該黒画素区間を第1統合区間とする。そし
て、この第1統合区間156の長さHtを求める(図2
1のS6)。
【0363】この第1統合区間156の長さHtは、図
23の(A)に示すように、第1候補区間である水平分
割行150aの長さと第1候補黒画素区間154の長さ
との合計に、水平分割行150aと第1候補黒画素区間
154との間の第1白画素区間158の長さStを加え
た長さである。
【0364】次に、第1統合区間長誤差算出部125a
において、第1統合区間156の長さHtと第1平均黒
画素区間長Hhとの差の大きさEtを第1統合区間長誤
差として求める(図21のS7)。
【0365】この第1統合区間長誤差Etは、下記の
(11)式で与えられる。
【0366】Et=|Ht−Hh|・・・(11) また、第2統合区間長検出部124bにおいて、先ず、
第1候補区間である水平分割行150aの、他方の側の
直近の第1黒画素区間を第2候補黒画素区間とする。こ
こでは、水平分割行150aの、紙面下方の直近の第1
黒画素区間である水平分割行150bを第2候補黒画素
区間150bとする。そして、この第2候補黒画素区間
150bと水平分割行150aとを一つの連続した黒画
素区間とした場合の当該黒画素区間を第2統合区間16
0とする。そして、この第2統合区間160の長さHb
を求める(図21のS8)。
【0367】この第2統合区間160の長さHbは、図
23の(A)に示すように、第1候補区間である水平分
割行150aの長さと第2候補黒画素区間150bの長
さとの合計に、水平分割行150aと第2候補黒画素区
間150bとの間の第2白画素区間162の長さSbを
加えた長さである。
【0368】次に、第2統合区間長誤差算出部125b
において、第2統合区間160の長さHbと第1平均黒
画素区間長Hhとの差の大きさEbを第2統合区間長誤
差として求める(図21のS9)。
【0369】この第2統合区間長誤差Ebは、下記の
(12)式で与えられる。
【0370】Eb=|Hb−Hh|・・・(12) 次に、第1選択統合区間選択部126aにおいて、第1
統合区間長誤差Etと第2統合区間長誤差Ebとを比較
する。そして、誤差の小さい方の統合区間を第1選択統
合区間として選択する(図21のS10)。
【0371】また、実施の形態では第1統合区間長誤差
Etと第2統合区間長誤差Ebとが等しい場合には、第
2統合区間長誤差Ebを第1選択統合区間として選択す
ることとする。
【0372】そして、この実施の形態では、第2統合区
間長誤差Ebが第1統合区間長誤差Etよりも短い。す
なわち、Eb<Etである。従って、この実施の形態で
は、第2統合区間長誤差Ebを第1選択統合区間として
選択する(図21のS10において「Y」の場合に対応
する。)。
【0373】次に、この第1選択統合区間としての第2
統合区間160のうちの、第1候補区間150aと当該
第1候補区間150aの直近の第1黒画素区間(この場
合は、第2候補黒画素区間150b)との間の第2白画
素区間162の長さSbを求める(図21のS11)。
【0374】ところで、1行を誤って2つの行に分割し
て切り出した場合には、一般に、分割された2つの行の
間の白画素区間の長さが比較的短い。これに対して、適
切に切り出された分割行どうしの間の白画素区間は、そ
の長さが比較的長い。従って、この白画素区間の長さが
比較的長い場合には、当該白画素区間の両側の分割行
は、誤って分割された分割行でない可能性が高い。そこ
で、次のS12のステップにおいては、白画素区間の長
さを基準値と比較する。
【0375】次に、この第2白画素区間162の長さS
bと第7基準値Rとを比較する(図21のS12)。
【0376】この実施の形態では、Sb<Rとなるの
で、次のS13のステップへ進む(図21のS12の
「Y」の場合に対応する。)。また、Sb≧Rの場合、
すなわち、図21のS12の「N」の場合には、第1選
択統合区間が本来1行ではない可能性が高い。このた
め、その第1候補区間についての行切出しへ修正は行な
わずに、S4のステップへ進む。
【0377】次に、当該第2白画素区間162の長さS
bが当該第7基準値Rよりも短い場合に、第1選択統合
区間としての第2統合区間160を1つの連続した第1
黒画素区間とすることにより、行切出しの修正を行なう
(図21のS13)。
【0378】この実施の形態では、2つの水平分割行1
50aおよび150bを含む第2統合区間160を1つ
の水平分割行150として切り出すことにより修正す
る。この水平分割行150には、「二」、「吉」および
「合」の3文字が含まれている。
【0379】尚、この実施の形態においては該当しなか
ったが、S10において、Et<Ebの場合には、第1
選択統合区間として第1統合区間156を選択する。そ
して、その場合は、この第1統合区間156について、
S14〜S16のステップの処理を行なう。
【0380】その場合、先ず、第1白画素区間158の
長さStを検出する(図21のS14)。
【0381】次に、第1白画素区間158の長さStと
第7基準値Rとを比較する(図21のS15)。尚、S
t≧Rの場合には、S4のステップへ進む。
【0382】次に、第1白画素区間158の長さStが
当該第7基準値Rよりも短い場合(S15の「Y」の場
合に対応する。)に、第1選択統合区間としての第1統
合区間156を1つの連続した第1黒画素区間として統
合することにより、行切出しの修正を行なう(図21の
S16)。
【0383】(垂直分割行の統合修正について)次に、
図24を参照して、図22の(B)に示した垂直分割行
152の統合修正方法の一例について説明する。図24
は、垂直分割行の統合修正方法の説明に供する流れ図で
ある。
【0384】一般に、誤って2つに分離されて切り出さ
れた垂直分割行の幅は、適切に切り出された他の分割行
に比べて狭く、他の分割行の半分程度である。さらに、
この誤って切り出された2つの分割行どうしの行間隔
は、一般に、他の分割行どうしの行間隔間に比べて狭
い。従って、切り出された分割行の幅若しくは幅と行間
隔とに着目すれば、本来1つの垂直分割行として切り出
されるべきところを誤って2つの垂直分割行として切り
出された分割行を発見して、分割行切出しの修正が可能
となる。
【0385】そこで、この実施の形態においては、垂直
分割行の統合修正を行なうにあたり、先ず、第2平均黒
画素区間長算出部120bにおいて、第2分割行切出し
部18bにおいて切り出された第2分割行(垂直分割
行)の第2黒画素区間の長さ(第2黒画素区間長)の相
加平均を第2平均黒画素区間長として求める(図24の
S1)。
【0386】第2分割行が垂直分割行である場合、第2
分割行の第2黒画素区間長は、垂直分割行の幅を表す。
そして、この場合、第2平均区間長Wvは、垂直分割行
の幅の平均値を表す。
【0387】次に、各垂直分割行について、誤って切り
出されたものか否かを順次に調べるために、第2候補区
間選択部122bに、垂直分割行の通し番号を便宜的に
与えるパラメータjを用意する。そして、このパラメー
タjに1を代入する(図24のS2)。
【0388】このパラメータjの最大値は、垂直分割行
の総数Nvとなる。
【0389】次に、第2候補区間選択部122bにおい
て、この第2平均黒画素区間長と第2黒画素区間長とを
比較する。そして、第2黒画素区間のうち、第2平均黒
画素区間長Wvに対する第2黒画素区間長Wv(j)の
比率が第8基準値Q(例えば0.5)よりも小さな第2
黒画素区間を第2候補区間として選択する(図24のS
3)。
【0390】ここでは、各垂直分割行の幅と平均値とを
順次に比較する。そして、ある垂直分割行の幅が平均値
に対して一定の割合よりも狭い場合、例えば幅Wv
(j)の1/Q倍(例えば2倍)の値が平均値Wvより
も低い場合に、その垂直分割行は、誤って分割された可
能性が高い。このため、その垂直分割行を統合修正対象
の候補としての第2候補区間として選択する。
【0391】そして、この実施の形態では、図22の
(B)に示した分割行152aを第2候補区間として選
択する。
【0392】尚、各垂直分割行の幅と平均値とを順次に
比較する場合、幅が条件を満たさない場合には、順次に
図24のS4のステップへ進む。S4のステップにおい
ては、パラメータjが、Nv未満であるか否かを判断す
る。すなわち、全ての分割行について幅と平均値とを比
較しか否かを判断する。
【0393】そして、パラメータjがNv未満でない場
合、すなわち、全ての垂直分割行についてその幅と平均
値とを比較したと判断した場合には、垂直分割行の統合
処理を終了する。
【0394】また、パラメータjがNv未満である場
合、すなわち、その幅と平均値とを比較していない垂直
分割行がまだ残っていると判断した場合には、図24の
S5の処理へ進む。
【0395】このS5の処理においては、パラメータj
の値を1増加させる(インクリメントする。)。そし
て、図24のS3の処理へ進んで、次のパラメータj+
1に対応する垂直分割行についてその幅と平均値とを比
較する。
【0396】ところで、この第2候補区間として抽出さ
れた垂直分割行152aの両側には、それぞれ分割行が
存在している。このため、この両側の2つの分割行のう
ちのどちらの分割行を第2候補区間と統合して修正すべ
きかを決定する必要がある。この決定の方法について、
後述のS6〜S10のステップにおいて説明する。
【0397】ここで、上述の図24のS3のステップに
おいて第2候補区間として選択された分割行152aに
対する統合修正処理の理解を容易にするために、図23
の(B)を供す。図23の(B)は、垂直分割行152
bの統合修正処理の説明に供する図である。
【0398】次に、第3統合区間長検出部124cにお
いて、先ず、第2候補区間である垂直分割行152a
の、一方の側の直近の第2黒画素区間を第3候補黒画素
区間164とする。ここでは、垂直分割行152aの、
紙面左側の直近の第2黒画素区間を第3候補黒画素区間
164とする。そして、この第3候補黒画素区間164
と垂直分割行152aとを一つの連続した黒画素区間と
した場合の当該黒画素区間を第3統合区間166とす
る。そして、この第3統合区間166の長さWlを求め
る(図24のS6)。
【0399】この第3統合区間166の長さWlは、図
23の(B)に示すように、第2候補区間である垂直分
割行152aの長さと第3候補黒画素区間164の長さ
との合計に、垂直分割行152aと第3候補黒画素区間
164との間の第3白画素区間168の長さS1を加え
た長さである。
【0400】次に、第2統合区間長誤差算出部125b
において、第3統合区間166の長さWlと第2平均黒
画素区間長Wvとの差の大きさElを第3統合区間長誤
差として求める(図24のS7)。
【0401】この第3統合区間長誤差Elは、下記の
(13)式で与えられる。
【0402】El=|Wl−Wv|・・・(13) また、第4統合区間長検出部124dにおいて、先ず、
第2候補区間である垂直分割行152aの、他方の側の
直近の第2黒画素区間を第2候補黒画素区間とする。こ
こでは、垂直分割行152aの、紙面右側の直近の第2
黒画素区間である垂直分割行152bを第2候補黒画素
区間152bとする。そして、この第2候補黒画素区間
152bと垂直分割行152aとを一つの連続した黒画
素区間とした場合の当該黒画素区間を第4統合区間17
0とする。そして、この第4統合区間170の長さWr
を求める(図24のS8)。
【0403】この第4統合区間170の長さWrは、図
23の(B)に示すように、第2候補区間である垂直分
割行152aの長さと第4候補黒画素区間152bの長
さとの合計に、垂直分割行152aと第4候補黒画素区
間152bとの間の第4白画素区間172の長さSrを
加えた長さである。
【0404】次に、第2統合区間長誤差算出部125b
において、第4統合区間170の長さWrと第2平均黒
画素区間長Wvとの差の大きさErを第4統合区間長誤
差として求める(図24のS9)。
【0405】この第4統合区間長誤差Erは、下記の
(14)式で与えられる。
【0406】Er=|Wr−Wv|・・・(14) 次に、第2選択統合区間長選択部126bにおいて、第
3統合区間長誤差Elと第4統合区間長誤差Erとを比
較する。そして、誤差の小さい方の統合区間を第2選択
統合区間として選択する(図24のS10)。
【0407】また、実施の形態では第3統合区間長誤差
Elと第4統合区間長誤差Erとが等しい場合には、第
4統合区間長誤差Erを第2選択統合区間として選択す
ることとする。
【0408】そして、この実施の形態では、第4統合区
間長誤差Erが第3統合区間長誤差Elよりも短い。す
なわち、Er<Elである。従って、この実施の形態で
は、第3統合区間長誤差Erを第2選択統合区間として
選択する(図24のS10において「Y」の場合に対応
する。)。
【0409】次に、この第2選択統合区間としての第4
統合区間170のうちの、第2候補区間152aと当該
第2候補区間152aの直近の第2黒画素区間(この場
合は、第2候補黒画素区間152b)との間の第4白画
素区間172の長さSrを求める(図24のS11)。
【0410】ところで、1行を誤って2つの行に分割し
て切り出した場合には、一般に、分割された2つの行の
間の白画素区間の長さが比較的短い。これに対して、適
切に切り出された分割行どうしの間の白画素区間は、そ
の長さが比較的長い。従って、この白画素区間の長さが
比較的長い場合には、当該白画素区間の両側の分割行
は、誤って分割された分割行でない可能性が高い。そこ
で、次のS12のステップにおいては、白画素区間の長
さを基準値と比較する。
【0411】次に、この第4白画素区間172の長さS
rと第9基準値Rとを比較する(図24のS12)。
【0412】この実施の形態では、Sr<Rとなるの
で、次のS13のステップへ進む(図24のS12の
「Y」の場合に対応する。)。また、Sr≧Rの場合、
すなわち、図24のS12の「N」の場合には、第2選
択統合区間が本来1行ではない可能性が高い。このた
め、その第2候補区間についての行切出しへ修正は行な
わずに、S4のステップへ進む。
【0413】次に、当該第4白画素区間172の長さS
rが当該第9基準値Rよりも短い場合に、第2選択統合
区間としての第4統合区間170を1つの連続した第2
黒画素区間とすることにより、行切出しの修正を行なう
(図24のS13)。
【0414】この実施の形態では、2つの垂直分割行1
52aおよび152aを含む第4統合区間170を1つ
の垂直分割行152として切り出すことにより修正す
る。この垂直分割行152には、「八」、「北」および
「礼」の3文字が含まれている。
【0415】尚、この実施の形態においては該当しなか
ったが、S10において、El<Erの場合には、第2
選択統合区間として第3統合区間166を選択する。そ
して、その場合は、この第3統合区間166について、
S14〜S16のステップの処理を行なう。
【0416】その場合、先ず、第3白画素区間168の
長さS1を検出する(図24のS14)。
【0417】次に、第3白画素区間168の長さS1と
第9基準値Rとを比較する(図24のS15)。尚、S
1≧Rの場合には、S4のステップへ進む。
【0418】次に、第3白画素区間168の長さS1が
当該第9基準値Rよりも短い場合(S15の「Y」の場
合に対応する。)に、第2選択統合区間としての第3統
合区間166を1つの連続した第2黒画素区間として統
合することにより、行切出しの修正を行なう(図24の
S16)。
【0419】(分割修正の動作例)次に、1つの分割行
が誤って2つの分割行として切り出された場合の修正方
法の例について説明する。
【0420】図26の(A)および(B)に、修正対象
の横書きの水平分割行の例をそれぞれ示す。図26の
(A)には、行間隔が狭く、2つの分割行どうしの一部
分が重なっているために、上下2つの分割行が1つの分
割行として誤って切り出された水平分割行180を示
す。この水平分割行180の上寄りには「symbo
l」の文字列が含まれており、下寄りには「calcu
late」の文字列が含まれている。そして、この「s
ymbol」の文字列の2文字目の「y」と、「cal
culate」の文字列の3文字目の「l」とが一部分
で互いに重なっている。そして、この「symbol」
の文字列と「calculate」の文字列とは、個別
の分割行としてそれぞれ切り出されるべきものである。
【0421】また、図26の(B)には、文書画像の行
方向が走査方向に対して斜めとなっているために、射影
分布における上下2つの行のそれぞれの黒画素区間が連
続して、上下2つの分割行が1つの分割行として誤って
切り出された水平分割行182を示す。この水平分割行
182の上寄りには「symbol」の文字列が含まれ
ており、下寄りには「calculate」の文字列が
含まれている。そして、これらの文字列は、矩形枠で輪
郭を示した分割行182に対して、いずれも右上りに傾
斜している。
【0422】また、ここでは、第1方向を水平方向(紙
面横方向、X軸に沿った方向)とし、第2方向を垂直方
向(紙面縦方向、Y軸に沿った方向)とする。従って、
図26の(A)に示された横書きの水平分割行180の
分割修正の処理は、第1分割修正部92aにおいて行な
われる。また、第2方向を水平方向とすれば、この水平
分割行180の分割修正の処理を、第2分割修正部92
bにおいて行なうことになる。
【0423】(水平分割行の分割修正 その1)先ず、
図25を参照して、図26の(A)に示した水平分割行
180の分割修正方法の一例について説明する。図25
は、水平分割行の分割修正方法の説明に供する流れ図で
ある。
【0424】一般に、誤って2つの水平分割行が1つの
水平分割行として切り出された場合、その誤って切り出
された水平分割行の高さは、適切に切り出された他の水
平分割行に比べて高く、他の分割行の2倍程度となる。
従って、切り出された分割行の高さに着目すれば、本来
2の分割行として切り出されるべきところを誤って1つ
の分割行として切り出された分割行を発見して、分割行
切出しの修正が可能となる。
【0425】そこで、この実施の形態においては、水平
分割行の分割修正を行なうにあたり、先ず、第1平均黒
画素区間長算出部131aにおいて、第1分割行切出し
部18aにおいて切り出された第1分割行の第1黒画素
区間の長さ(第1黒画素区間長)の相加平均を第1平均
黒画素区間長として求める(図25のS1)。第1分割
行が水平分割行である場合、第1分割行の第1黒画素区
間長は、水平分割行の高さを表す。そして、この場合、
第1平均区間長Hhは、水平分割行の高さの平均値を表
す。
【0426】次に、各水平分割行について、その水平分
割行が誤って切り出されたものか否かを順次に調べるた
めに、第1分割候補区間選択部132aにおいて、水平
分割行の通し番号を便宜的に与えるパラメータiを用意
する。そして、このパラメータiに1を代入する(図2
5のS2)。
【0427】このパラメータiの最大値は、水平分割行
の総数Nhとなる。
【0428】次に、第1分割候補区間選択部132aに
おいて、この第1平均黒画素区間長と第1黒画素区間長
とを比較する。そして、第1黒画素区間のうち、第1平
均黒画素区間長Hhに対する第1黒画素区間長Hh
(i)の比率が第11基準値U(例えば2)よりも小さ
な第1黒画素区間を第1候補区間として選択する(図2
5のS3)。
【0429】ここでは、各水平分割行の高さと平均値と
を順次に比較する。そして、ある水平分割行の高さが平
均値に対して一定の割合よりも低い場合、例えば高さH
h(i)の1/Q倍(例えば1/2倍)の値が平均値H
hよりも高い場合に、その水平分割行は、本来2つの分
割行が1つの分割行に誤って分割された可能性が高い。
このため、その水平分割行を分割修正対象の候補として
の第1候補区間として選択する。
【0430】そして、この実施の形態では、図26の
(A)に示した分割行180を第1候補区間として選択
する。
【0431】尚、各水平分割行の高さと平均値とを順次
に比較する場合、高さが条件を満たさない場合には、順
次に図25のS4のステップへ進む。S4のステップに
おいては、パラメータiが、Nh未満であるか否かを判
断する。すなわち、全ての分割行について高さと平均値
とを比較したか否かを判断する。
【0432】そして、パラメータiがNh未満でない場
合、すなわち、全ての水平分割行についてその高さと平
均値とを比較したと判断した場合には、水平分割行の統
合処理を終了する。
【0433】また、パラメータiがNh未満である場
合、すなわち、その高さと平均値とを比較していない水
平分割行がまだ残っていると判断した場合には、図25
のS5の処理へ進む。
【0434】このS5の処理においては、パラメータi
の値を1増加させる(インクリメントする。)。そし
て、図25のS3の処理へ進んで、次のパラメータi+
1に対応する水平分割行についてその高さと平均値とを
比較する。
【0435】次に、後述の第1位置および第2位置を求
める際の走査範囲を決めるため、以下のS6〜S8の処
理を行なう。また、この処理の様子を図27の(A)〜
(C)に示す。
【0436】先ず、水平分割行180の上端から、平均
の高さの半分であるHh/2(平均黒画素区間長の半
分)の距離だけ下がった位置に予備上限Yhsを設定す
る。この予備上限Yhsは、Y座標で与えられる。ま
た、水平分割行180の下端から、平均高さの半分であ
るHh/2の距離だけ上がった位置に予備下限Yheを
設定する。この予備下限Yheは、Y座標で与えられ
る。(図25のS6)(図27の(A))。
【0437】次に、水平分割行180のうち、予備上限
Yhsと予備下限Yheとの間の範囲の部分を、X軸方
向を走査方向としY軸方向を副走査方向として走査し
て、各走査線毎の累積黒画素数を検出して部分射影分布
178を作成する。そして、部分射影分布178のうち
で、累積黒画素数が最小となる最小位置Ydを求める。
この最小位置Ydは、Y座標で与えられる(図25のS
7)(図27の(B))。
【0438】次に、水平分割行180の最小位置Ydか
ら、平均高さの半分であるHh/2の距離だけ上がった
位置に上限Ydsを設定する。この上限Ydsは、Y座
標で与えられる。また、水平分割行180の最小位置Y
dから、平均高さの半分であるHh/2の距離だけ下が
った位置に下限Ydeを設定する。この下限Ydeは、
Y座標で与えられる(図25のS8)(図27の
(C))。
【0439】このようにして、第1および第2位置を求
める際の走査範囲の上限Ydsおよび下限Ydeが決定
される。以下、図28の(A)および(B)を参照し
て、この走査範囲の中で第1および第2位置を検出する
処理について説明する。
【0440】次に、第1位置抽出部134aにおいて、
走査線のうち第1分割候補区間の中央付近を走査する走
査線上で黒画素の検出される位置のうち、第1方向に沿
って最も一方寄りの位置を第1位置として求める。そし
て、最寄第1位置抽出部136aにおいて、第1位置の
うち、第1方向に沿って最も他方寄りの第1位置を最寄
第1位置として求める(図25のS9)。
【0441】この実施の形態においては、図28の紙面
の左寄りを「一方寄り」とし、紙面の右寄りを「他方寄
り」とする。従って、第1位置は、上限Ydsおよび下
限Ydeとの間の走査範囲を左から右へ走査して、各走
査線毎に、最初に黒画素が検出される位置となる。ま
た、最寄第1位置は、第1位置のうちの最も右寄りの位
置となる。
【0442】そして、この実施の形態では、最寄第1位
置を検出して、その座標(Xr、Yr)を得る(図28
の(A))。
【0443】次に、第2位置抽出部134bにおいて、
走査線のうち第1分割候補区間の中央付近を走査する走
査線上で黒画素の検出される位置のうち、第2方向に沿
って最も他方寄りの位置を第2位置として求める。そし
て、最寄第2位置抽出部136bにおいて、第2位置の
うち、第2方向に沿って最も一方寄りの第2位置を最寄
第2位置として求める(図25のS10)。
【0444】この実施の形態においては、第2位置は、
上限Ydsおよび下限Ydeとの間の走査範囲を右から
左へ走査して、各走査線毎に、最初に黒画素が検出され
る位置となる。また、最寄第2位置は、第2位置のうち
の最も左寄りの位置となる。
【0445】そして、この実施の形態では、最寄第2位
置を検出して、その座標(Xl、Yl)を得る(図28
の(A))。
【0446】次に、最寄第1位置と最寄第2位置とを比
較する(図25のS11)。そして、この最寄第1位置
(Xr、Yr)のX座標(Xr)がこの最寄第2位置
(Xl、Yl)のX座標(Xl)よりも一方側(左側)
である場合(すなわちXr<Xl)、または、この最寄
第1位置のx座標(Xl)とこの最寄第2位置のX座標
(Xr)とが第2方向に沿った同一直線上に位置する場
合(すなわちXr=Xl)に該当するか否かを判断す
る。すなわち、Xr≦Xlを満足するか否かを判断す
る。
【0447】そして、Xr≦Xlの場合に、第1分割部
138aにおいて、第1分割候補区間を、当該第1分割
候補区間の中央で2つに分割させて2つの分割黒画素区
間を生成することにより、行切出しの修正を行なう(図
25のS12)。
【0448】水平分割行180においては、Xr<Xl
である。従って、ここでは、水平分割行180を最小位
置Ydに沿った分割線によって、上下に強制的に2分割
する(図28の(B))。この分割によって、2つの水
平分割行180aおよび180bが生成される。上側の
水平分割行180aには、「symbol」の文字列が
含まれる。また、下側の水平分割行180bには、「c
alculate」の文字列が含まれる。
【0449】このように、図26の(A)に示された水
平分割行のように、分割行どうしが近接しているために
誤って統合されて切り出された分割行の行切出しを修正
する場合の多くは、このように、水平分割行を強制的に
上下に2分割することによって行切出しの修正を行なう
ことができる。
【0450】(水平分割行の分割修正 その2)次に、
図25を参照して、図26の(B)に示した水平分割行
182の分割修正方法の一例について説明する。この場
合、図25のS11までの処理内容は、前述の、図26
の(A)についての分割修正の場合の処理内容と同様で
あるので、その詳細な説明を省略する。
【0451】ここでは、分割候補黒画素区間としての水
平分割行182を求めた後、後述の第1位置および第2
位置を求める際の走査範囲を決めるため、以下のS6〜
S8の処理を行なう。また、この処理の様子を図29の
(A)〜(C)に示す。
【0452】先ず、水平分割行182の上端から、平均
の高さの半分であるHh/2(平均黒画素区間長の半
分)の距離だけ下がった位置に予備上限Yhsを設定す
る。この予備上限Yhsは、Y座標で与えられる。ま
た、水平分割行180の下端から、平均高さの半分であ
るHh/2の距離だけ上がった位置に予備下限Yheを
設定する。この予備下限Yheは、Y座標で与えられ
る。(図25のS6)(図29の(A))。
【0453】次に、水平分割行182のうち、予備上限
Yhsと予備下限Yheとの間の範囲の部分を、X軸方
向を走査方向としY軸方向を副走査方向として走査し
て、各走査線毎の累積黒画素数を検出して部分射影分布
を176を作成する。そして、部分射影分布176のう
ちで、累積黒画素数が最小となる最小位置Ydを求め
る。この最小位置Ydは、Y座標で与えられる(図25
のS7)(図29の(B))。
【0454】次に、水平分割行180の最小位置Ydか
ら。平均高さの半分であるHh/2の距離だけ上がった
位置に上限Ydsを設定する。この上限Ydsは、Y座
標で与えられる。また、水平分割行180の最小位置Y
dから、平均高さの半分であるHh/2の距離だけ下が
った位置に下限Ydeを設定する。この下限Ydeは、
Y座標で与えられる(図25のS8)(図29の
(C))。
【0455】このようにして、第1および第2位置を求
める際の走査範囲の上限Ydsおよび下限Ydeが決定
される。以下、図30の(A)および(B)を参照し
て、この走査範囲の中で第1および第2位置を検出する
処理について説明する。
【0456】次に、第1位置抽出部134aにおいて、
走査線のうち第1分割候補区間の中央付近を走査する走
査線上で黒画素の検出される位置のうち、第1方向に沿
って最も一方寄りの位置を第1位置として求める。そし
て、最寄第1位置抽出部136aにおいて、第1位置の
うち、第1方向に沿って最も他方寄りの第1位置を最寄
第1位置として求める(図25のS9)。
【0457】この実施の形態においては、図30の紙面
の左寄りを「一方寄り」とし、紙面の右寄りを「他方寄
り」とする。従って、第1位置は、上限Ydsおよび下
限Ydeとの間の走査範囲を左から右へ走査して、各走
査線毎に、最初に黒画素が検出される位置となる。ま
た、最寄第1位置は、第1位置のうちの最も右寄りの位
置となる。
【0458】そして、この実施の形態では、最寄第1位
置を検出して、その座標(Xr、Yr)を得る(図30
の(A))。
【0459】次に、第2位置抽出部134bにおいて、
走査線のうち第1分割候補区間の中央付近を走査する走
査線上で黒画素の検出される位置のうち、第2方向に沿
って最も他方寄りの位置を第2位置として求める。そし
て、最寄第2位置抽出部136bにおいて、第2位置の
うち、第2方向に沿って最も一方寄りの第2位置を最寄
第2位置として求める(図25のS10)。
【0460】この実施の形態においては、第2位置は、
上限Ydsおよび下限Ydeとの間の走査範囲を左から
右へ走査して、各走査線毎に、最初に黒画素が検出され
る位置となる。また、最寄第2位置は、第2位置のうち
の最も左寄りの位置となる。
【0461】そして、この実施の形態では、最寄第2位
置を検出して、その座標(Xl、Yl)を得る(図30
の(A))。
【0462】次に、最寄第1位置と最寄第2位置とを比
較する。(図25のS11)。そして、この最寄第1位
置(Xr、Yr)のX座標(Xr)がこの最寄第2位置
(Xl、Yl)のX座標(Xl)よりも他方側(右側)
である場合(すなわちXl<Xr)であるか否かを判断
する。ここでは、図30の(A)に示すようにXl<X
rを満足する。
【0463】そして、Xl<Xrの場合に、第2分割部
138bにおいて、この最寄第1位置とこの最寄第2位
置との中間を通りかつ第2方向に沿った分割線で第1分
割候補区間としての水平分割行182を分割する。ここ
では、X座標が(Xr+Xl)/2の位置で水平分割行
182を左右に2分割する。
【0464】この分割によって、一方側(左側)の第一
方分割領域184および他方側(右側)の他方分割領域
186を生成する。
【0465】そして、この一方分割領域184を最寄第
2位置(Xr、Yr)が得られた走査線によってさらに
分割して2つの分割黒画素区間184aおよび184b
を生成する。すなわち、一方分割領域184をYrの位
置で上下に2分割する。この分割によって、左上分割行
184aおよび左下分割行184bが生成される。
【0466】また、他方分割領域186を最寄第1位置
(Xl、Yl)が得られた走査線によってさらに分割し
て2つの分割黒画素区間186aおよび186bを生成
する。すなわち、他方分割領域186をYlの位置で上
下に2分割する。この分割によって、右上分割行186
aおよび右下分割行186bが生成される。
【0467】このようにして合計4つの分割黒画素区間
を生成することにより行切出しの修正を行なう(図25
のS13)(図30の(B))。
【0468】このように、図26の(B)に示された水
平分割行のように、文書画像の行方向が走査方向に対し
て傾斜しているために誤って統合されて切り出された分
割行の行切出しを修正する場合の多くは、このように、
分割行を4分割することによって行切出しの修正を行な
うことができる。
【0469】尚、左上分割行184aと右上分割行18
6aとは、分割行の接続の処理の際に、互いに接続され
る。また、左下分割行184bと右下分割行186bと
は、分割行の連結の処理の際に、互いに接続される。
【0470】(分割行の接続の動作例について)次に、
分割行の接続の動作例について説明する。
【0471】(水平分割行の接続の動作について)先
ず、図31の(A)および(B)を参照して、水平分割
行どうしの連結の例について説明する。ここでは、水平
方向を第1方向、垂直方向を第2方向とする。また、図
31の(A)および(B)では、それぞれ水平方向にX
軸をとり、垂直方向にY軸をとっている。
【0472】図31の(A)には、互いに隣接する分割
領域にそれぞれ含まれる2つの水平分割行190aおよ
び190bをそれぞれ示す。この水平分割行190aお
よび190bどうしは、第1黒画素区間の一部分どうし
が重なっている。すなわち、水平分割行190aと19
0bとは、互いに少しずれて隣接している。
【0473】そして、第1分割行接続部26aでは、水
平分割行190aと190bとの互いに重なっている第
1黒画素区間の長さKhが、第4基準値Vよりも長い場
合に、その水平分割行どうしを接続する。この第4基準
値Vの値は、例えば。水平分割行の高さの平均の半分程
度とすると良い。ここでは、Kh>Vを満たしているの
で、水平分割行190aおよび190bどうしを接続す
る。
【0474】この接続によって、図31の(B)に示す
ように、行190が生成される。尚、図31の(B)に
おいては、便宜的に、行190の輪郭を、水平分割行1
90aおよび190bの輪郭よりも一回り大きく示して
ある。しかし、実際には、行190の輪郭は、水平分割
行190aおよび190bの輪郭と一致する。
【0475】(垂直分割行の接続の動作について)次
に、図32の(A)および(B)を参照して、垂直分割
行どうしの連結の例について説明する。ここでは、水平
方向を第2方向、垂直方向を第1方向とする。また、図
32の(A)および(B)では、それぞれ水平方向にX
軸をとり、垂直方向にY軸をとっている。
【0476】図32の(A)には、互いに隣接する分割
領域にそれぞれ含まれる2つの垂直分割行192aおよ
び192bをそれぞれ示す。この垂直分割行192aお
よび192bどうしは、第2黒画素区間の一部分どうし
が重なっている。すなわち、垂直分割行192aと19
2bとは、互いに少しずれて隣接している。
【0477】そして、第2分割行接続部26bでは、垂
直分割行192aと192bとの互いに重なっている第
2黒画素区間の長さKwが、第5基準値Vよりも長い場
合に、その垂直分割行どうしを接続する。この第5基準
値Vの値は、例えば。垂直分割行の高さの平均の半分程
度とすると良い。ここでは、Kw>Vを満たしているの
で、垂直分割行192aおよび192bどうしを接続す
る。
【0478】この接続によって、図32の(B)に示す
ように、行192が生成される。尚、図32の(B)に
おいては、便宜的に、行192の輪郭を、垂直分割行1
92aおよび192b輪郭よりも一回り大きく示してあ
る。しかし、実際には、行192の輪郭は、垂直分割行
192aおよび192bの輪郭と一致する。
【0479】上述した各実施の形態では、この発明を特
定の条件で構成した例についてのみ説明したが、この発
明は多くの変更および変形を行うことができる。例え
ば、上述した実施の形態では、横方向を第1方向とし、
かつ、縦方向を第2方向として説明したが、この発明で
は、例えば、縦方向を第2方向とし、かつ、横方向を第
1方向としても良い。また、第1方向および第2方向は
互いに直交していれば良く、必ずしも文書画像の文書領
域の縦方向および横方向に沿っていなくとも良い。
【0480】また、上述した実施の形態においては、射
影分布における黒画素区間を求めるための第1および第
2基準値をそれぞれ1画素としたが、この発明では、第
1および第2基準値として任意好適な自然数をとること
ができ、例えば数画素を基準値としても良い。また、第
1基準値と第2基準値とは互いに異なっても良い。
【0481】また、上述した実施の形態においては、第
1方向分割領域と第2方向分割領域とを同数生成した
が、この発明では、第1方向分割領域の数と第2方向分
割領域の数とは必ずしも同数でなくとも良い。
【0482】また、上述した実施の形態においては、第
1修正部24aおよび第2修正部24bを設けたが、こ
の発明の行切出し装置および方法は、これらの修正部を
設けていない場合にも適用することができる。
【0483】また、上述した実施の形態においては、行
方向確認切替部12を設けたが、この発明の行切出し装
置は、行方向確認切替部12を設けない場合にも適用す
ることができる。その場合は、例えば、オペレータが、
行方向の情報を確認して文書画像の情報の送出先を切り
替えても良い。
【0484】また、上述した実施の形態においては、切
替出力部22を設けたが、この発明の行切出し装置は、
切替出力部22を設けない場合にも適用することができ
る。その場合は、例えば、オペレータが、行方向判定の
結果を確認して文書画像の送出先を切り替えても良い。
【0485】
【発明の効果】
(行切出し方法および行切出し装置)この発明の行切出
し方法および行切出し装置によれば、文書画像の行方向
が不明である場合に、行切出しの処理の一環のプロセス
において得られた第1方向射影分布に基づいて切り出さ
れた第1分割行の情報と、行切出しの処理の一環のプロ
セスにおいて得られた第2方向射影分布に基づいて切り
出された第2分割行の情報とを用いて、行方向を判定す
る。そして、行方向が判定された後は、判定された行方
向に対応する分割行どうしの接続を行なって行の切出し
を行なう。従って、この発明によれば、文書画像の行方
向が不明である場合でも、事前に行切出しとは個別に行
方向を判定する処理行なうことなく、行切出しの処理の
プロセスで得られた情報を用いて行方向を判定して、行
切出しを行なうことができる。
【0486】(第1の行切出し修正方法および第1の行
切出し修正装置)また、この発明の第1の行切出し修正
方法および第1の行切出し修正装置によれば、1つの行
が誤って2つの行として切り出されてしまった場合の行
切出しの修正を行なうことができる。
【0487】(第2の行切出し修正方法および第2の行
切出し修正装置)また、この発明の第2の行切出し修正
方法および第2の行切出し修正装置によれば、2つの個
別の行が誤って1つの行として切り出されてしまった場
合の行切出しの修正を行なうことができる。
【図面の簡単な説明】
【図1】実施の形態の行切出し装置の構成の説明に供す
る機能ブロック図である。
【図2】文字認識装置の構成の説明に供する機能ブロッ
ク図である。
【図3】行方向判定部の構成の説明に供する機能ブロッ
ク図である。
【図4】第1判定部の構成の説明に供する機能ブロック
図である。
【図5】第2判定部の構成の説明に供する機能ブロック
図である。
【図6】第3判定部の構成の説明に供する機能ブロック
図である。
【図7】第1修正部の構成の説明に供する機能ブロック
図である。
【図8】第1統合修正部の構成の説明に供する機能ブロ
ック図である。
【図9】第1分割修正部の構成の説明に供する機能ブロ
ック図である。
【図10】第2修正部の構成の説明に供する機能ブロッ
ク図である。
【図11】第2統合修正部の構成の説明に供する機能ブ
ロック図である。
【図12】第2分割修正部の構成の説明に供する機能ブ
ロック図である。
【図13】行切出し装置の動作の説明に供する流れ図で
ある。
【図14】判定対象の文書画像である。
【図15】(A)および(B)は、分割領域の説明に供
する図である。
【図16】(A)および(B)は、分割領域およびその
射影分布の説明に供する図である。
【図17】判定部の動作の説明に供する流れ図である。
【図18】(A)〜(D)は、第1判定部の動作の説明
(第1方向)に供する図である。
【図19】(A)〜(C)は、第1判定部の動作の説明
(第2方向)に供する図である。
【図20】(A)および(B)は、分割領域の黒画素区
間長および白画素区間長のばらつきの算出の説明に供す
る図である。
【図21】水平分割行の統合修正の動作の説明に供する
流れ図である。
【図22】(A)および(B)は、統合修正の対象例で
ある。
【図23】(A)および(B)は、統合修正方法の説明
に供する図である。
【図24】垂直分割行の統合修正の動作の説明に供する
流れ図である。
【図25】水平分割行の分割修正の動作の説明に供する
流れ図である。
【図26】(A)および(B)は、分割修正の対象例で
ある。
【図27】(A)〜(C)は、第1の分割修正例の説明
に供する図(その1)である。
【図28】(A)および(B)は、図27の(C)に続
く、第1の分割修例の説明に供する図(その2)であ
る。
【図29】(A)〜(C)は、第2の分割修例の説明に
供する図(その1)である。
【図30】(A)および(B)は、図29の(C)に続
く、第2の分割修正例の説明に供する図(その2)であ
る。
【図31】(A)および(B)は、水平分割行の接続の
説明に供する図である。
【図32】(A)および(B)は、垂直分割行の接続の
説明に供する図である。
【符号の説明】
10:行切出し装置 12:行方向確認切替部 12a:行方向確認部 12b:切替部 14a:第1方向分割領域生成部 14b:第2方向分割領域生成部 16a:第1方向射影分布作成部 16b:第2方向射影分布作成部 18a:第1分割行切出し部 18b:第2分割行切出し部 20:行方向判定部 22:切替出力部 24a:第1修正部 24b:第2修正部 26a:第1分割行接続部 26b:第2分割行接続部 28:制御部 30:スキャナ 31:イメージメモリ 32:文字領域設定部 33:文字切出し部 34:文字認識部 36a:第1分割領域数計数部 36b:第2分割領域数計数部 38a:第1黒画素区間数計数部 38b:第2黒画素区間数計数部 40:区間数分割数比較判定部 42a:第1ばらつき算出部 42b:第2ばらつき算出部 44:ばらつき比較判定部 46a:第1平均値算出部 46b:第2平均値算出部 48:平均値比較判定部 50:文字領域 50a:第1分割領域 50b:第2分割領域 50c:第3分割領域 50d:第4分割領域 50e:第5分割領域 50f:第6分割領域 52:文字列、行 52a:第1分割行 52b:第2分割行 52c:第3分割行 54a、54b:第1方向射影分布 54e:第2方向射影分布 56a、56b:黒画素区間 60:文書画像 62:文字列、行 64a:全角文字 64b:半角文字 66:文字領域 68:第1方向分割領域 68a:第1分割領域 68b:第2分割領域 68c:第3分割領域 70:第2方向分割領域 70a:第4分割領域 70b:第5分割領域 70c:第6分割領域 70d:第7分割領域 72:第1方向射影分布 74:射影ブロック 74a:第1射影ブロック 74b:第2射影ブロック 74c:第3射影ブロック 74j:第10射影ブロック 76:分割行、水平分割行 78:第2方向射影分布 78a:第1射影 78b:第2射影 78c:第3射影 78d:第4射影 78e:第5射影 80:分割行、垂直分割行 82:第1黒画素区間 84:第2黒画素区間 86:第1白画素区間 88:第2白画素区間 90a:第1統合修正部 90b:第2統合修正部 92a:第1分割修正部 92b:第2分割修正部 120a:第1平均黒画素区間長算出部 120b:第2平均黒画素区間長算出部 122a:第1候補区間選択部 122b:第2候補区間選択部 124a:第1統合区間長検出部 124b:第2統合区間長検出部 124c:第3統合区間長検出部 124d:第4統合区間長検出部 125a:第1統合区間長誤差算出部 125b:第2統合区間長誤差算出部 125c:第3統合区間長誤差算出部 125d:第4統合区間長誤差算出部 126a:第1選択統合区間長選択部 126b:第2選択統合区間長選択部 128a:第1白画素区間長検出部 128b:第2白画素区間長検出部 130a:第1統合部 130b:第2統合部 131a:第1平均黒画素区間長算出部 131b:第2平均黒画素区間長算出部 132a:第1分割候補区間選択部 132b:第2分割候補区間選択部 134a:第1位置抽出部 134b:第2位置抽出部 134c:第3位置抽出部 134d:第4位置抽出部 136a:最寄第1位置抽出部 136b:最寄第2位置抽出部 136c:最寄第3位置抽出部 136d:最寄第4位置抽出部 138a:第1分割部 138b:第2分割部 138c:第3分割部 138d:第4分割部 150、150a、150b:分割行 152、152a、152b:分割行 154:第1候補黒画素区間 156:第1統合区間 158:第1白画素区間 160:第2統合区間 162:第2白画素区間 164:第3候補黒画素区間 166:第3統合区間 168:第3白画素区間 170:第4統合区間 172:第4白画素区間 176、178:部分射影分布 180、180a、180b、182、182a、18
2b:水平分割行 184:一方分割領域 184a:左上分割行 184b:左下分割行 186:他方分割領域 186a:右上分割行 186b:右下分割行 190:水平行 190a、190b:水平分割行 192:垂直行 192a、192b:垂直分割行 201:第1判定部 202:第2判定部 203:第3判定部

Claims (27)

    【特許請求の範囲】
  1. 【請求項1】 (a1)文書画像の行方向が不明である
    場合および前記文書画像の行方向が第1方向である場合
    に、第2方向に沿った分割線によって前記文書画像を分
    割することにより、該第2方向と直交する第1方向に沿
    って並んだ複数の第1方向分割領域を生成するプロセス
    と、 (b1)前記第1方向分割領域が生成された場合に、当
    該第1方向分割領域の各々を、前記第1方向に沿って走
    査して、走査毎の累積黒画素数を検出し、当該累積黒画
    素数の前記第2方向に沿った分布を求めることにより第
    1方向射影分布を作成するプロセスと、 (c1)前記第1方向射影分布が作成された場合に、当
    該第1方向射影分布の各々において第1基準値以上の累
    積黒画素数が前記第2方向に沿って連続する区間をそれ
    ぞれ第1黒画素区間として、当該第1黒画素区間が得ら
    れる走査領域をそれぞれ第1分割行として分割行切出し
    を行なうプロセスと、 (a2)文書画像の行方向が不明である場合および該文
    書画像の行方向が第2方向である場合に、前記第1方向
    に沿った分割線によって文書画像を分割することによ
    り、前記第2方向に沿って並んだ複数の第2方向分割領
    域を生成するプロセスと、 (b2)前記第2方向分割領域が生成された場合に、当
    該第2方向分割領域の各々を、前記第2方向に沿って走
    査して、走査毎の累積黒画素数を検出し、当該累積黒画
    素数の前記第1方向に沿った分布を求めることにより第
    2方向射影分布を作成するプロセスと、 (c2)前記第2方向射影分布が作成された場合に、当
    該第2方向射影分布の各々において第2基準値以上の累
    積黒画素数が前記第1方向に沿って連続する区間をそれ
    ぞれ第2黒画素区間として、当該第2黒画素区間が得ら
    れる走査領域をそれぞれ第2分割行として分割行切出し
    を行なうプロセスと、 (d)前記文書画像の行方向が不明である場合に、前記
    第1方向射影分布と前記第2方向射影分布とに基づい
    て、前記文書画像の行方向を判定するプロセスと、 (e1)前記文書画像の行方向が前記第1方向である場
    合に、前記第1方向で互いに隣接する前記第1方向分割
    領域にそれぞれ含まれる前記分割行どうしであって、当
    該分割行を走査して得られた前記第1黒画素区間の少な
    くとも一部分どうしが重なっている分割行どうしを接続
    して行切出しを行なうプロセスと、 (e2)前記文書画像の行方向が前記第2方向である場
    合に、前記第2方向で互いに隣接する前記第2方向分割
    領域にそれぞれ含まれる前記分割行どうしであって、当
    該分割行を走査して得られた前記第2黒画素区間の少な
    くとも一部分どうしが重なっている分割行どうしを接続
    して行切出しを行なうプロセスとを含むことを特徴とす
    る行切出し方法。
  2. 【請求項2】 請求項1に記載の行切出し方法におい
    て、前記(d)のプロセスを行なうにあたり、 前記第1黒画素区間の各々の長さをそれぞれ第1黒画素
    区間長として、当該第1黒画素区間長のばらつきを算出
    するプロセスと、 前記第2黒画素区間の各々の長さをそれぞれ第2黒画素
    区間長として、当該第2黒画素区間長のばらつきを算出
    するプロセスと、 前記第1黒画素区間長のばらつきと前記第2黒画素区間
    長のばらつきとを比較して、当該第1黒画素区間長のば
    らつきと当該第2黒画素区間長のばらつきとの比率が第
    3基準値以上の場合に、ばらつきの小さい方の黒画素区
    間長が得られた射影分布の走査方向を行方向と判定する
    プロセスとを含むことを特徴とする行切出し方法。
  3. 【請求項3】 請求項2に記載の行切出し方法におい
    て、前記(d)のプロセスを行なうにあたり、 前記第1黒画素区間長のばらつきと前記第2黒画素区間
    長のばらつきとの比率が前記第3基準未満の場合に、 前記第1方向射影分布において隣り合った前記第1黒画
    素区間どうしの間の第1白画素区間の長さと、前記第2
    方向射影分布において隣り合った前記第2黒画素区間ど
    うしの間の第2白画素区間の長さとを利用して、行方向
    を判定するプロセスを含むことを特徴とする行切出し方
    法。
  4. 【請求項4】 請求項1に記載の行切出し方法におい
    て、前記(d)のプロセスを行なうにあたり、 前記第1方向射影分布において隣り合った前記第1黒画
    素区間どうしの間の第1白画素区間の長さと、前記第2
    方向射影分布において隣り合った前記第2黒画素区間ど
    うしの間の第2白画素区間の長さとを利用して、行方向
    を判定するプロセスを含むことを特徴とする行切出し方
    法。
  5. 【請求項5】 請求項3または4に記載の行切出し方法
    において、 前記第1白画素区間が1箇所の場合には、当該第1白画
    素区間の長さを第1平均白画素区間長とし、かつ、前記
    第1白画素区間が複数箇所の場合には、当該第1白画素
    区間の各々の長さの相加平均を第1平均白画素区間長と
    して算出するプロセスと、 前記第2白画素区間が1箇所の場合には、当該第2白画
    素区間の長さを第2平均白画素区間長とし、かつ、前記
    第2白画素区間が複数箇所の場合には、当該第2白画素
    区間の各々の長さの相加平均を第2平均白画素区間長と
    して算出するプロセスと、および、 前記第1平均白画素区間長と前記第2平均白画素区間長
    とを比較して、より大きな平均白画素区間長の得られた
    射影分布の走査方向を行方向と判定するプロセスとを含
    むことを特徴とする行切出し方法。
  6. 【請求項6】 請求項1に記載の行切出し方法におい
    て、前記(d)のプロセスを行なうにあたり、 前記第1方向分割領域の数の合計を第1分割領域数とし
    て求めるプロセスと、 前記第1黒画素区間の数の、全ての前記第1方向分割領
    域にわたっての合計を第1黒画素区間数として求めるプ
    ロセスと、 前記第2方向分割領域の数の合計を第2分割領域数とし
    て求めるプロセスと、 前記第2黒画素区間の数の、全ての前記第2方向分割領
    域にわたっての合計を第2黒画素区間数として求めるプ
    ロセスと、 前記第1黒画素区間数と該第1分割領域数とが一致し、
    かつ、前記第2黒画素区間数と前記第2分割領域数とが
    不一致の場合に、前記行方向を前記第1方向と判定する
    プロセスと、 前記第2黒画素区間数と該第2分割領域数とが一致し、
    かつ、前記第1黒画素区間数と前記第1分割領域数とが
    不一致の場合に、前記行方向を前記第2方向と判定する
    プロセスとを含むことを特徴とする行切出し方法。
  7. 【請求項7】 請求項1に記載の行切出し方法におい
    て、 前記(e1)のプロセスにおいて、前記分割領域に含ま
    れる前記第1方向分割行の前記第1黒画素区間の一部分
    が、当該分割領域と隣接する他の1つの分割領域に含ま
    れる2つの第1分割行の前記第1黒画素区間の一部分と
    それぞれ重なっている場合、重なっている区間の長さが
    第4基準値よりも長い分割行どうしを接続し、 前記(e2)のプロセスにおいて、前記分割領域に含ま
    れる前記第2方向分割行の前記第2黒画素区間の一部分
    が、当該分割領域と隣接する他の1つの分割領域に含ま
    れる2つの第2分割行の前記第2黒画素区間の一部分と
    それぞれ重なっている場合、重なっている区間の長さが
    第5基準値よりも長い分割行どうしを接続することを特
    徴とする行切出し方法。
  8. 【請求項8】 請求項1に記載の行切出し方法におい
    て、前記(e1)のプロセスを行なう前に、 前記(c1)のプロセスにおいて切り出された前記第1
    分割行の第1黒画素区間の長さ(以下、第1黒画素区間
    長とも称する。)の相加平均を第1平均黒画素区間長と
    して求めるプロセスと、 該第1平均黒画素区間長と前記第1黒画素区間長とを比
    較して、前記第1黒画素区間のうち、前記第1平均黒画
    素区間長に対する第1黒画素区間長の比率が第6基準値
    よりも小さな第1黒画素区間を第1候補区間として選択
    するプロセスと、 該第1候補区間の一方の側の直近の第1黒画素区間であ
    る第1候補黒画素区間と該第1候補区間とを一つの連続
    した黒画素区間とした場合の当該黒画素区間を第1統合
    区間とし、当該第1統合区間の長さを求めるプロセス
    と、 該第1統合区間の長さと前記第1平均黒画素区間長との
    差の大きさを第1統合区間長誤差として求めるプロセス
    と、 該第1候補区間の他方の側の直近の第1黒画素区間であ
    る第2候補黒画素区間と該第1候補区間とを1つの連続
    した黒画素区間とした場合の当該黒画素区間を第2統合
    区間とし、当該第2統合区間の長さを求めるプロセス
    と、 該第2統合区間の長さと前記第1平均黒画素区間長との
    差の大きさを第2統合区間長誤差として求めるプロセス
    と、 前記第1統合区間長誤差と前記第2統合区間長誤差とを
    比較して、誤差の小さい方の統合区間を第1選択統合区
    間として選択するプロセスと、 該第1選択統合区間のうちの、前記第1候補区間と当該
    第1候補区間の直近の第1黒画素区間との間の第1白画
    素区間の長さを求めるプロセスと、 該第1白画素区間の長さと第7基準値とを比較して、当
    該第1白画素区間の長さが当該第7基準値よりも短い場
    合に、前記第1選択統合区間を1つの連続した第1黒画
    素区間とすることにより、行切出しの修正を行なうプロ
    セスとを含むことを特徴とする行切出し方法。
  9. 【請求項9】 請求項1に記載の行切出し方法におい
    て、前記(e2)のプロセスを行なう前に、 前記(c2)のプロセスにおいて切り出された前記第2
    分割行の第2黒画素区間の長さ(以下、第2黒画素区間
    長とも称する。)の相加平均を第2平均黒画素区間長と
    して求めるプロセスと、 前記第2平均黒画素区間長と前記第2黒画素区間長とを
    比較して、前記第2黒画素区間のうち、前記第2平均黒
    画素区間長に対する第2黒画素区間長の比率が第8基準
    値よりも小さな第2黒画素区間を第2候補区間として選
    択するプロセスと、 該第2候補区間の一方の側の直近の第2黒画素区間であ
    る第3候補黒画素区間と該第2候補区間とを一つの連続
    した黒画素区間とした場合の当該黒画素区間を第3統合
    区間とし、当該第3統合区間の長さを求めるプロセス
    と、 該第3統合区間の長さと前記第2平均黒画素区間長との
    差の大きさを第3統合区間長誤差として算出するプロセ
    スと、 該第2候補区間の他方の側の直近の第2黒画素区間であ
    る第4候補黒画素区間と該第2候補区間とを1つの連続
    した黒画素区間とした場合の当該黒画素区間を第4統合
    区間とし、当該第4統合区間の長さを求めるプロセス
    と、 該第4統合区間の長さと前記第2平均黒画素区間長との
    差の大きさを第4統合区間長誤差として算出するプロセ
    スと、 前記第3統合区間長誤差と前記第4統合区間長誤差とを
    比較して、誤差の小さい方の統合区間を第2選択統合区
    間として選択するプロセスと、 該第2選択統合区間のうちの、前記第2候補区間と当該
    第2候補区間の直近の第2黒画素区間との間の第2白画
    素区間の長さを求めるプロセスと、 該第2白画素区間の長さと第9基準値とを比較して、当
    該第2白画素区間の長さが当該第10基準値よりも短い
    場合に、前記第2選択統合区間を1つの連続した第2黒
    画素区間とすることにより、行切出しの修正を行なうプ
    ロセスとを含むことを特徴とする行切出し方法。
  10. 【請求項10】 請求項1に記載の行切出し方法におい
    て、 前記(c1)のプロセスにおいて切り出された前記第1
    分割行の第1黒画素区間の長さ(以下、第1黒画素区間
    長とも称する。)の相加平均を第1平均黒画素区間長と
    して求めるプロセスと、 前記第1平均黒画素区間長と前記第1黒画素区間長とを
    比較して、前記第1黒画素区間のうち、前記第1平均黒
    画素区間長に対する第1黒画素区間長の比率が第11基
    準値よりも大きな第1黒画素区間を第1分割候補区間と
    して選択するプロセスと、 前記走査線のうち前記第1分割候補区間の中央付近を走
    査する走査線上で黒画素の検出される位置のうち、前記
    第1方向に沿って最も一方寄りの位置を第1位置として
    求めるプロセスと、 前記第1位置のうち、前記第1方向に沿って最も他方寄
    りの第1位置を最寄第1位置として求めるプロセスと、 前記走査線のうち前記第1分割候補区間の中央付近を走
    査する走査線上で黒画素の検出される位置のうち、前記
    第2方向に沿って最も前記他方寄りの位置を第2位置と
    して求めるプロセスと、 前記第2位置のうち、前記第2方向に沿って最も前記一
    方寄りの第2位置を最寄第2位置として求めるプロセス
    と、 前記最寄第1位置と前記最寄第2位置とを比較して、該
    最寄第1位置が該最寄第2位置よりも前記他方側である
    場合および該最寄第1位置と該最寄第2位置とが前記第
    2方向に沿った同一直線上に位置する場合に、前記第1
    分割候補区間を、当該第1分割候補区間の中央で2つに
    分割させて2つの分割黒画素区間を生成することによ
    り、行切出しの修正を行なうプロセスと、 前記最寄第1位置と前記最寄第2位置とを比較して、該
    最寄第1位置が該最寄第2位置よりも前記一方側である
    場合に、該最寄第1位置と該最寄第2位置との中間を通
    りかつ前記第2方向に沿った分割線で前記第1分割候補
    区間を分割することにより、前記一方側の第一方分割領
    域および前記他方側の他方分割領域を生成し、前記一方
    分割領域を前記最寄第2位置が得られた走査線によって
    分割して2つの分割黒画素区間を生成し、かつ、前記他
    方分割領域を前記最寄第1位置が得られた走査線によっ
    て分割して2つの分割黒画素区間を生成することにより
    行切出しの修正を行なうプロセスとを含むことを特徴と
    する行切出し方法。
  11. 【請求項11】 請求項1に記載の行切出し方法におい
    て、 前記(c2)のプロセスにおいて切り出された前記第2
    分割行の第2黒画素区間の長さ(以下、第2黒画素区間
    長とも称する。)の相加平均を第2平均黒画素区間長と
    して求めるプロセスと、 前記第2平均黒画素区間長と前記第2黒画素区間長とを
    比較して、前記第2黒画素区間のうち、前記第2平均黒
    画素区間長に対する第2黒画素区間長の比率が第12基
    準値よりも大きな第2黒画素区間を第2分割候補区間と
    して選択するプロセスと、 前記走査線のうち前記第2分割候補区間の中央付近を走
    査する走査線上で黒画素の検出される位置のうち、前記
    第2方向に沿って最も一方寄りの位置を第3位置として
    求めるプロセスと、 前記第3位置のうち、前記第2方向に沿って最も他方寄
    りの第3位置を最寄第3位置として求めるプロセスと、 前記走査線のうち前記第2分割候補区間の中央付近を走
    査する走査線上で黒画素の検出される位置のうち、前記
    第1方向に沿って最も前記他方寄りの位置を第4位置と
    して求めるプロセスと、 前記第4位置のうち、前記第1方向に沿って最も前記一
    方寄りの第4位置を最寄第4位置として求めるプロセス
    と、 前記最寄第3位置と前記最寄第4位置とを比較して、該
    最寄第3位置が該最寄第4位置よりも前記他方側である
    場合に、前記第2分割候補区間を、当該第2分割候補区
    間の中央で2つに分割させて2つの分割黒画素区間を生
    成することにより、行切出しの修正を行なうプロセス
    と、 前記最寄第3位置と前記最寄第4位置とを比較して、該
    最寄第3位置が該最寄第4位置よりも前記一方側である
    場合および該最寄第3位置と該最寄第4位置とが前記第
    1方向に沿った同一直線上に位置する場合に、該最寄第
    3位置と該最寄第4位置との中間を通りかつ前記第1方
    向に沿った分割線で前記第2分割候補区間を分割するこ
    とにより、前記一方側の第一方分割領域および前記他方
    側の他方分割領域を生成し、前記一方分割領域を前記最
    寄第4位置が得られた走査線によって分割して2つの分
    割黒画素区間を生成し、かつ、前記他方分割領域を前記
    最寄第3位置が得られた走査線によって分割して2つの
    分割黒画素区間を生成することにより行切出しの修正を
    行なうプロセスとを含むことを特徴とする行切出し方
    法。
  12. 【請求項12】 文書画像の行方向に実質的に沿った第
    1方向に沿って該文書画像を走査して走査毎に累積黒画
    素数を検出し、当該累積黒画素数の該第1方向と直交す
    る第2方向に沿った分布を求めることにより射影分布を
    作成し、 前記射影分布において第13基準値以上の累積黒画素数
    の射影部分が前記第2方向に連続する各黒画素区間が得
    られる走査領域をそれぞれ1つの行領域として行切出し
    を行なった後に、行切出しの修正を行なうにあたり、 切り出された前記行領域の黒画素区間の長さ(以下、黒
    画素区間長とも称する。)の相加平均を平均黒画素区間
    長として求めるプロセスと、 前記平均値と前記黒画素区間長とを比較して、前記黒画
    素区間のうち、前記平均値に対する黒画素区間長の比率
    が第14基準値よりも小さな黒画素区間を候補区間とし
    て選択するプロセスと、 該候補区間の一方の側の直近の黒画素区間である第1候
    補黒画素区間と該候補区間とを一つの連続した黒画素区
    間とした場合の当該黒画素区間を第1統合区間とし、当
    該第1統合区間の長さを求めるプロセスと、 該第1統合区間の長さと前記平均値との差を第1統合区
    間長誤差として算出するプロセスと、 該候補区間の他方の側の直近の黒画素区間である第2候
    補黒画素区間と該候補区間とを1つの連続した黒画素区
    間とした場合の当該黒画素区間を第2統合区間とし、当
    該第2統合区間の長さを求めるプロセスと、 該第2統合区間の長さと前記平均黒画素区間長との差を
    第2統合区間長誤差として算出するプロセスと、 前記第1統合区間長誤差と前記第2統合区間長誤差とを
    比較して、誤差の小さい方の統合区間を選択統合区間と
    して選択するプロセスと、 前記選択統合区間のうちの前記候補区間と当該候補区間
    の直近の黒画素区間との間の白画素区間の長さを求める
    プロセスと、 前記白画素区間の長さと第15基準値とを比較して、当
    該白画素区間の長さが当該第15基準値よりも短い場合
    に、前記選択統合区間を1つの連続した黒画素区間とす
    ることにより、行切出しの修正を行なうプロセスとを含
    むことを特徴とする行切出し修正方法。
  13. 【請求項13】 文書画像の行方向に実質的に沿った第
    1方向を主走査方向とし、該第1方向と直交する第2方
    向を副走査方向として、該文書画像を走査して走査線毎
    に累積黒画素数を検出することにより射影分布を作成
    し、 前記射影分布において第16基準値以上の累積黒画素数
    の射影部分が前記第2方向に連続する各黒画素区間が得
    られる走査領域をそれぞれ1つの行領域として行切出し
    を行なった後に、行切出しの修正を行なうにあたり、 切り出された前記行領域の黒画素区間の長さ(以下、黒
    画素区間長とも称する。)の平均値を求めるプロセス
    と、 前記平均値と前記黒画素区間長とを比較して、前記黒画
    素区間のうち、前記平均値に対する黒画素区間長の比率
    が第17基準値よりも大きな黒画素区間を分割候補区間
    として選択するプロセスと、 前記走査線のうち前記分割候補区間の中央付近を走査す
    る走査線上で黒画素の検出される位置のうち、前記第1
    方向に沿って最も一方寄りの位置を第1位置として求め
    るプロセスと、 前記第1位置のうち、前記第1方向に沿って最も他方寄
    りの第1位置を最寄第1位置として求めるプロセスと、 前記走査線のうち前記分割候補区間の中央付近を走査す
    る走査線上で黒画素の検出される位置のうち、前記第2
    方向に沿って最も前記他方寄りの位置を第2位置として
    求めるプロセスと、 前記第2位置のうち、前記第2方向に沿って最も前記一
    方寄りの第2位置を最寄第2位置として求めるプロセス
    と、 前記最寄第1位置と前記最寄第2位置とを比較して、該
    最寄第1位置が該最寄第2位置よりも前記他方側である
    場合および該最寄第1位置と該最寄第2位置とが前記第
    2方向に沿った同一直線上に位置する場合に、前記分割
    候補区間を、当該分割候補区間の中央で2つに分割させ
    て2つの分割黒画素区間を生成することにより、行切出
    しの修正を行なうプロセスと、 前記最寄第1位置と前記最寄第2位置とを比較して、該
    最寄第1位置が該最寄第2位置よりも前記一方側である
    場合に、該最寄第1位置と該最寄第2位置との中間を通
    りかつ前記第2方向に沿った分割線で前記第1分割候補
    区間を分割することにより、前記一方側の一方分割領域
    および前記他方側の他方分割領域を生成し、前記一方分
    割領域を前記最寄第2位置が得られた走査線によって分
    割して2つの分割黒画素区間を生成し、かつ、前記他方
    分割領域を前記最寄第1位置が得られた走査線によって
    分割して2つの分割黒画素区間を生成することにより行
    切出しの修正を行なうプロセスとを含むことを特徴とす
    る行切出し修正方法。
  14. 【請求項14】 文書画像の行方向が不明である場合お
    よび前記文書画像の行方向が第1方向である場合に、該
    第1方向と直交する第2方向に沿った分割線によって前
    記文書画像を分割することにより、該第1方向に沿って
    並んだ複数の第1方向分割領域を生成する第1方向分割
    領域生成部と、 前記第1方向分割領域が生成された場合に、当該第1方
    向分割領域の各々を、前記第1方向に沿って走査して、
    走査毎の累積黒画素数を検出し、当該累積黒画素数の前
    記第2方向に沿った分布を求めることにより第1方向射
    影分布を作成する第1方向射影分布作成部と、 前記第1方向射影分布が作成された場合に、当該第1方
    向射影分布の各々において第1基準値以上の累積黒画素
    数が前記第2方向に沿って連続する区間をそれぞれ第1
    黒画素区間として、当該第1黒画素区間が得られる走査
    領域をそれぞれ第1分割行として分割行切出しを行なう
    第1分割行切出し部と、 文書画像の行方向が不明である場合および該文書画像の
    行方向が第2方向である場合に、第1方向に沿った分割
    線によって文書画像を分割することにより、該第1方向
    と直交する第2方向に沿って並んだ複数の第2方向分割
    領域を生成する第2方向分割領域生成部と、 前記第2方向分割領域が生成された場合に 当該第2方
    向分割領域の各々を、前記第2方向に沿って走査して、
    走査毎の累積黒画素数を検出し、当該累積黒画素数の前
    記第1方向に沿った分布を求めることにより第2方向射
    影分布を作成する第2方向射影分布作成部と、 前記第2方向射影分布が作成された場合に、当該第2方
    向射影分布の各々において第2基準値以上の累積黒画素
    数が前記第1方向に沿って連続する区間をそれぞれ第2
    黒画素区間として、当該第2黒画素区間が得られる走査
    領域をそれぞれ第2分割行として分割行切出しを行なう
    第2分割行切出し部と、 前記文書画像の行方向が不明である場合に、前記第1方
    向射影分布と前記第2方向射影分布とに基づいて、前記
    文書画像の行方向を判定する行方向判定部と、 前記文書画像の行方向が前記第1方向である場合に、前
    記第1方向で互いに隣接する前記第1方向分割領域にそ
    れぞれ含まれる前記分割行どうしであって、当該分割行
    を走査して得られた前記第1黒画素区間の少なくとも一
    部分どうしが重なっている分割行どうしを接続して行切
    出しを行なう第1分割行接続部と、 前記文書画像の行方向が前記第2方向である場合に、前
    記第2方向で互いに隣接する前記第2方向分割領域にそ
    れぞれ含まれる前記分割行どうしであって、当該分割行
    を走査して得られた前記第2黒画素区間の少なくとも一
    部分どうしが重なっている分割行どうしを接続して行切
    出しを行なう第2分割行接続部とを具えてなることを特
    徴とする行切出し装置。
  15. 【請求項15】 請求項14に記載の行切出し装置にお
    いて、前記行方向判定部は、 前記第1黒画素区間の各々の長さをそれぞれ第1黒画素
    区間長として、当該第1黒画素区間長のばらつきを算出
    する第1ばらつき算出部と、 前記第2黒画素区間の各々の長さをそれぞれ第2黒画素
    区間長として、当該第2黒画素区間長のばらつきを算出
    する第2ばらつき算出部と、 前記第1黒画素区間長のばらつきと前記第2黒画素区間
    長のばらつきとを比較して、当該第1黒画素区間長のば
    らつきと当該第2黒画素区間長のばらつきとの比率が第
    3基準値以上の場合に、ばらつきの小さい方の黒画素区
    間長が得られた射影分布の走査方向を行方向と判定する
    ばらつき比較判定部とを具えてなることを特徴とする行
    切出し装置。
  16. 【請求項16】 請求項15に記載の行切出し装置にお
    いて、前記行方向判定部は、 前記第1黒画素区間長のばらつきと前記第2黒画素区間
    長のばらつきとの比率が前記第3基準値未満の場合に、 前記第1方向射影分布において隣り合った前記第1黒画
    素区間どうしの間の第1白画素区間の長さと、前記第2
    方向射影分布において隣り合った前記第2黒画素区間ど
    うしの間の第2白画素区間の長さとを利用して、行方向
    を判定することを特徴とする行切出し装置。
  17. 【請求項17】 請求項14に記載の行切し出装置にお
    いて、前記行方向判定部は、 前記第1方向射影分布において隣り合った前記第1黒画
    素区間どうしの間の第1白画素区間の長さと、前記第2
    方向射影分布において隣り合った前記第2黒画素区間ど
    うしの間の第2白画素区間の長さとを利用して、行方向
    を判定することを特徴とする行切出し装置。
  18. 【請求項18】 請求項16または17に記載の行切出
    し装置において、前記行方向判定部は、 前記第1白画素区間が1箇所の場合には、当該第1白画
    素区間の長さを第1平均白画素区間長とし、かつ、前記
    第1白画素区間が複数箇所の場合には、当該第1白画素
    区間の各々の長さの相加平均を第1平均白画素区間長と
    して算出する第1平均白画素区間長算出部と、 前記第2白画素区間が1箇所の場合には、当該第2白画
    素区間の長さを第2平均白画素区間長とし、かつ、前記
    第2白画素区間が複数箇所の場合には、当該第2白画素
    区間の各々の長さの相加平均を第2平均白画素区間長と
    して算出する第2平均白画素区間長算出部と、 前記第1平均白画素区間長と前記第2平均白画素区間長
    とを比較して、より大きな平均値の白画素区間の得られ
    た射影分布の走査方向を行方向と判定する平均値比較判
    定部とを具えてなることを特徴とする行切出し装置。
  19. 【請求項19】 請求項14に記載の行切出し装置にお
    いて、前記行方向判定部は、 前記第1方向分割領域の数の合計を第1分割領域数とし
    て求める第1分割領域数計数部と、 前記第1黒画素区間の数の、全ての前記第1方向分割領
    域にわたっての合計を第1黒画素区間数として求める第
    1黒画素区間数計数部と、 前記第2方向分割領域の数の合計を第2分割領域数とし
    て求める第2分割領域数計数部と、 前記第2黒画素区間の数の、全ての前記第2方向分割領
    域にわたっての合計を第2黒画素区間数として求める第
    2黒画素区間数計数部と、 前記第1黒画素区間数と該第1分割領域数とが一致し、
    かつ、前記第2黒画素区間数と前記第2分割領域数とが
    不一致の場合に、前記行方向を前記第1方向と判定し、
    または、前記第2黒画素区間数と該第2分割領域数とが
    一致し、かつ、前記第1黒画素区間数と前記第1分割領
    域数とが不一致の場合に、前記行方向を前記第2方向と
    判定する区間数分割数比較判定部と、を具えてなること
    を特徴とする行切出し装置。
  20. 【請求項20】 請求項14に記載の行切出し装置にお
    いて、 前記第1分割行接続部は、前記分割領域に含まれる前記
    第1方向分割行の前記第1黒画素区間の一部分が、当該
    分割領域と隣接する他の1つの分割領域に含まれる2つ
    の第1分割行の前記第1黒画素区間の一部分とそれぞれ
    重なっている場合に、重なっている区間の長さが第4基
    準値よりも長い分割行どうしを接続し、 前記第2分割行接続部は、前記分割領域に含まれる前記
    第2方向分割行の前記第2黒画素区間の一部分が、当該
    分割領域と隣接する他の1つの分割領域に含まれる2つ
    の第2分割行の前記第2黒画素区間の一部分とそれぞれ
    重なっている場合に、重なっている区間の長さが第5基
    準値よりも長い分割行どうしを接続することを特徴とす
    る行切出し装置。
  21. 【請求項21】 請求項14に記載の行切出し装置にお
    いて、行切出しの修正を行なう第1統合修正部を具え、 該第1統合修正部は、 前記第1分割行切出し部において切り出された前記第1
    分割行の第1黒画素区間の長さ(以下、第1黒画素区間
    長とも称する。)の相加平均を第1平均黒画素区間長と
    して求める第1平均黒画素区間長算出部と、 該第1平均黒画素区間長と前記第1黒画素区間長とを比
    較して、前記第1黒画素区間のうち、前記第1平均黒画
    素区間長に対する第1黒画素区間長の比率が第6基準値
    よりも小さな第1黒画素区間を第1候補区間として選択
    する第1候補区間選択部と、 該第1候補区間の一方の側の直近の第1黒画素区間であ
    る第1候補黒画素区間と該第1候補区間とを一つの連続
    した黒画素区間とした場合の当該黒画素区間を第1統合
    区間とし、当該第1統合区間の長さを求める第1統合区
    間長検出部と、 該第1統合区間の長さと前記第1平均黒画素区間長との
    差の大きさを第1統合区間長誤差として算出する第1統
    合区間長誤差算出部と、 該第1候補区間の他方の側の直近の第1黒画素区間であ
    る第2候補黒画素区間と該第1候補区間とを1つの連続
    した黒画素区間とした場合の当該黒画素区間を第2統合
    区間とし、当該第2統合区間の長さを求める第2統合区
    間長検出部と、 該第2統合区間の長さと前記第1平均黒画素区間長との
    差の大きさを第2統合区間長誤差として算出する第2統
    合区間長誤差算出部と、 前記第1統合区間長誤差と前記第2統合区間長誤差とを
    比較して、誤差の小さい方の統合区間を第1選択統合区
    間として選択する第1選択統合区間選択部と、 該第1選択統合区間のうちの、前記第1候補区間と当該
    第1候補区間の直近の第1黒画素区間との間の第1白画
    素区間の長さを求める第1白画素区間長検出部と、 該第1白画素区間の長さと第7基準値とを比較して、当
    該第1白画素区間の長さが当該第7基準値よりも短い場
    合に、前記第1選択統合区間を1つの連続した第1黒画
    素区間とすることにより、行切出しの修正を行なう第1
    統合部とを具えてなることを特徴とする行切出し装置。
  22. 【請求項22】 請求項14に記載の行切出し装置にお
    いて、行切出しの修正を行なう第2統合修正部を具え、 該第2統合修正部は、 前記第2分割行切出し部において切り出された前記第2
    分割行の第2黒画素区間の長さ(以下、第2黒画素区間
    長とも称する。)の相加平均を第2平均黒画素区間長と
    して求める第2黒画素区間長平均値算出部と、 前記第2平均黒画素区間長と前記第2黒画素区間長とを
    比較して、前記第2黒画素区間のうち、前記第2平均黒
    画素区間長に対する第2黒画素区間長の比率が第8基準
    値よりも小さな第2黒画素区間を第2候補区間として選
    択する第2候補区間選択部と、 該第2候補区間の一方の側の直近の第2黒画素区間であ
    る第3候補黒画素区間と該第2候補区間とを一つの連続
    した黒画素区間とした場合の当該黒画素区間を第3統合
    区間とし、当該第3統合区間の長さを求める第3統合区
    間長抽出部と、 該第3統合区間の長さと前記第2平均黒画素区間長との
    差の大きさを第3統合区間長誤差として算出する第3統
    合区間長誤差算出部と、 該第2候補区間の他方の側の直近の第2黒画素区間であ
    る第4候補黒画素区間と該第2候補区間とを1つの連続
    した黒画素区間とした場合の当該黒画素区間を第4統合
    区間とし、当該第4統合区間の長さを求める第4統合区
    間長抽出部と、 該第4統合区間の長さと前記第2平均黒画素区間長との
    差の大きさを第4統合区間長誤差として算出する第4統
    合区間長誤差算出部と、 前記第3統合区間長誤差と前記第4統合区間長誤差とを
    比較して、誤差の小さい方の統合区間を第2選択統合区
    間として選択する第2選択統合区間選択部と、 該第2選択統合区間のうちの、前記第2候補区間と当該
    第2候補区間の直近の第2黒画素区間との間の第2白画
    素区間の長さを求める第2白画素区間長抽出部と、 該第2白画素区間の長さと第9基準値とを比較して、当
    該第2白画素区間の長さが当該第10基準値よりも短い
    場合に、前記第2選択統合区間を1つの連続した第2黒
    画素区間とすることにより、行切出しの修正を行なう第
    2統合部とを具えてなることを特徴とする行切出し装
    置。
  23. 【請求項23】 請求項14に記載の行切出し装置にお
    いて、行切出しの修正を行なう第1分割修正部を具え、 該第1分割修正部は、 前記第1分割行切出し部において切り出された前記第1
    分割行の第1黒画素区間の長さ(以下、第1黒画素区間
    長とも称する。)の相加平均を第1平均黒画素区間長と
    して求める第1平均黒画素区間長算出部と、 前記第1平均黒画素区間長と前記第1黒画素区間長とを
    比較して、前記第1黒画素区間のうち、前記第1平均黒
    画素区間長に対する第1黒画素区間長の比率が第11基
    準値よりも大きな第1黒画素区間を第1分割候補区間と
    して選択する第1分割候補区間選択部と、 前記走査線のうち前記第1分割候補区間の中央付近を走
    査する走査線上で黒画素の検出される位置のうち、前記
    第1方向に沿って最も一方寄りの位置を第1位置として
    求める第1位置抽出部と、 前記第1位置のうち、前記第1方向に沿って最も他方寄
    りの第1位置を最寄第1位置として求める最寄り第1位
    置抽出部と、 前記走査線のうち前記第1分割候補区間の中央付近を走
    査する走査線上で黒画素の検出される位置のうち、前記
    第2方向に沿って最も前記他方寄りの位置を第2位置と
    して求める第2位置抽出部と、 前記第2位置のうち、前記第2方向に沿って最も前記一
    方寄りの第2位置を最寄第2位置として求める最寄第2
    位置抽出部と、 前記最寄第1位置と前記最寄第2位置とを比較して、該
    最寄第1位置が該最寄第2位置よりも前記他方側である
    場合および該最寄第1位置と該最寄第2位置とが前記第
    2方向に沿った同一直線上に位置する場合に、前記第1
    分割候補区間を、当該第1分割候補区間の中央で2つに
    分割させて2つの分割黒画素区間を生成することによ
    り、行切出しの修正を行なう第1分割部と、 前記最寄第1位置と前記最寄第2位置とを比較して、該
    最寄第1位置が該最寄第2位置よりも前記一方側である
    場合に、該最寄第1位置と該最寄第2位置との中間を通
    りかつ前記第2方向に沿った分割線で前記第1分割候補
    区間を分割することにより、前記一方側の第一方分割領
    域および前記他方側の他方分割領域を生成し、前記一方
    分割領域を前記最寄第2位置が得られた走査線によって
    分割して2つの分割黒画素区間を生成し、かつ、前記他
    方分割領域を前記最寄第1位置が得られた走査線によっ
    て分割して2つの分割黒画素区間を生成することにより
    行切出しの修正を行なう第2分割部とを具えてなること
    を特徴とする行切出し装置。
  24. 【請求項24】 請求項14に記載の行切出し装置にお
    いて、行切出しの修正を行なう第2分割修正部を具え、 該第2分割修正部は、 前記第2分割行切出し部において切り出された前記第2
    分割行の第2黒画素区間の長さ(以下、第2黒画素区間
    長とも称する。)の相加平均を第2平均黒画素区間長と
    して求める第2平均黒画素区間長算出部と、 前記第2平均黒画素区間長と前記第2黒画素区間長とを
    比較して、前記第2黒画素区間のうち、前記第2平均黒
    画素区間長に対する第2黒画素区間長の比率が第12基
    準値よりも大きな第2黒画素区間を第2分割候補区間と
    して選択する第2分割候補区間選択部と、 前記走査線のうち前記第2分割候補区間の中央付近を走
    査する走査線上で黒画素の検出される位置のうち、前記
    第2方向に沿って最も一方寄りの位置を第3位置として
    求める第3位置抽出部と、 前記第3位置のうち、前記第2方向に沿って最も他方寄
    りの第3位置を最寄第3位置として求める最寄第3位置
    抽出部と、 前記走査線のうち前記第2分割候補区間の中央付近を走
    査する走査線上で黒画素の検出される位置のうち、前記
    第1方向に沿って最も前記他方寄りの位置を第4位置と
    して求める第4位置抽出部と、 前記第4位置のうち、前記第1方向に沿って最も前記一
    方寄りの第4位置を最寄第4位置として求める最寄第4
    位置抽出部と、 前記最寄第3位置と前記最寄第4位置とを比較して、該
    最寄第3位置が該最寄第4位置よりも前記他方側である
    場合に、前記第2分割候補区間を、当該第2分割候補区
    間の中央で2つに分割させて2つの分割黒画素区間を生
    成することにより、行切出しの修正を行なう第3分割部
    と、 前記最寄第3位置と前記最寄第4位置とを比較して、該
    最寄第3位置が該最寄第4位置よりも前記一方側である
    場合および該最寄第3位置と該最寄第4位置とが前記第
    1方向に沿った同一直線上に位置する場合に、該最寄第
    3位置と該最寄第4位置との中間を通りかつ前記第1方
    向に沿った分割線で前記第2分割候補区間を分割するこ
    とにより、前記一方側の第一方分割領域および前記他方
    側の他方分割領域を生成し、前記一方分割領域を前記最
    寄第4位置が得られた走査線によって分割して2つの分
    割黒画素区間を生成し、かつ、前記他方分割領域を前記
    最寄第3位置が得られた走査線によって分割して2つの
    分割黒画素区間を生成することにより行切出しの修正を
    行なう第4分割部とを具えてなることを特徴とする行切
    出し装置。
  25. 【請求項25】 請求項14に記載の行切出し装置にお
    いて、 外部から当該行切出し装置に入力された文書画像の情報
    に当該文書画像の行方向を示す情報が付与されているか
    否かを確認し、行方向が第1方向であることを示す情報
    が付与されている場合には、当該文書画像の情報を前記
    第1分割領域生成部へ送出し、行方向が第2方向である
    ことを示す情報が付与されている場合には、当該文書画
    像の情報を前記第2分割領域生成部へ送出し、または、
    行方向を示す情報が非付与の場合には、当該文書画像の
    情報を前記第1および第2分割領域生成部へ送出する行
    方向確認切替部と、 前記行方向判定部において、行方向が第1方向であると
    判定された場合には、前記第1分割行切出し部から得ら
    れた情報を出力し、行方向が第2方向であると判定され
    た場合には、前記第2分割行切出し部から得られた情報
    を出力する切替出力部とを具えてなることを特徴とする
    行切出し装置。
  26. 【請求項26】 文書画像の行方向に実質的に沿った第
    1方向に沿って該文書画像を走査して走査毎の累積黒画
    素数を検出し、当該累積黒画素数の該第1方向と直交す
    る第2方向をに沿った分布を求めることにより射影分布
    を作成し、当該射影分布において第13基準値以上の累
    積黒画素数の射影部分が前記第2方向に連続する各黒画
    素区間が得られる走査領域をそれぞれ1つの行領域とし
    て行切出しを行なって得られた行の切出しを修正する行
    切出し修正装置であって、 切り出された前記行領域の黒画素区間の長さ(以下、黒
    画素区間長とも称する。)の相加平均を平均黒画素区間
    長として求める平均黒画素区間長算出部と、 前記平均黒画素区間長と前記黒画素区間長とを比較し
    て、前記黒画素区間のうち、前記平均黒画素区間長に対
    する黒画素区間長の比率が第14基準値よりも小さな黒
    画素区間を候補区間として選択する候補区間選択部と、 該候補区間の一方の側の直近の黒画素区間である第1候
    補黒画素区間と該候補区間とを一つの連続した黒画素区
    間とした場合の当該黒画素区間を第1統合区間とし、当
    該第1統合区間の長さを求める第1統合区間長抽出部
    と、 該第1統合区間の長さと前記平均黒画素区間長との差の
    大きさを第1統合区間長誤差として算出する第1統合区
    間長誤差算出部と、 該候補区間の他方の側の直近の黒画素区間である第2候
    補黒画素区間と該候補区間とを1つの連続した黒画素区
    間とした場合の当該黒画素区間を第2統合区間とし、当
    該第2統合区間の長さを求める第2統合区間長抽出部
    と、 該第2統合区間の長さと前記平均黒画素区間長との差の
    大きさを第2統合区間長誤差として算出する第2統合区
    間長誤差算出部と、 前記第1統合区間長誤差と前記第2統合区間長誤差とを
    比較して、誤差の小さい方の統合区間を選択統合区間と
    して選択する選択統合区間選択部と、 前記選択統合区間のうちの前記候補区間と当該候補区間
    の直近の黒画素区間との間の白画素区間の長さを求める
    白画素区間長抽出部と、 前記白画素区間の長さと第15基準値とを比較して、当
    該白画素区間の長さが当該第15基準値よりも短い場合
    に、前記選択統合区間を1つの連続した黒画素区間とす
    ることにより、行切出しの修正を行なう統合部とを具え
    てなることを特徴とする行切出し修正装置。
  27. 【請求項27】 文書画像の行方向に実質的に沿った第
    1方向に沿って該文書画像を走査して走査毎の累積黒画
    素数を検出し、当該累積黒画素数の該第1方向と直交す
    る第2方向に沿った分布を求めることにより射影分布を
    作成し、当該射影分布において第16基準値以上の累積
    黒画素数の射影部分が前記第2方向に連続する各黒画素
    区間が得られる走査領域をそれぞれ1つの行領域として
    行切出しを行なって得られた行の切出しを修正する行切
    出し修正装置であって、 切り出された前記行領域の黒画素区間の長さ(以下、黒
    画素区間長とも称する。)の平均黒画素区間長を求める
    平均黒画素区間長算出部と、 前記平均黒画素区間長と前記黒画素区間長とを比較し
    て、前記黒画素区間のうち、前記平均黒画素区間長に対
    する黒画素区間長の比率が第17基準値よりも大きな黒
    画素区間を分割候補区間として選択する分割候補区間選
    択部と、 前記走査線のうち前記分割候補区間の中央付近を走査す
    る走査線上で黒画素の検出される位置のうち、前記第1
    方向に沿って最も一方寄りの位置を第1位置として求め
    る第1位置抽出部と、 前記第1位置のうち、前記第1方向に沿って最も他方寄
    りの第1位置を最寄第1位置として求める最寄第1位置
    抽出部と、 前記走査線のうち前記分割候補区間の中央付近を走査す
    る走査線上で黒画素の検出される位置のうち、前記第2
    方向に沿って最も前記他方寄りの位置を第2位置として
    求める第2位置抽出部と、 前記第2位置のうち、前記第2方向に沿って最も前記一
    方寄りの第2位置を最寄第2位置として求める最寄第2
    位置抽出部と、 前記最寄第1位置と前記最寄第2位置とを比較して、該
    最寄第1位置が該最寄第2位置よりも前記他方側である
    場合および該最寄第1位置と該最寄第2位置とが前記第
    2方向に沿った同一直線上に位置する場合に、前記分割
    候補区間を、当該分割候補区間の中央で2つに分割させ
    て2つの分割黒画素区間を生成することにより、行切出
    しの修正を行なう第1分割部と、 前記最寄第1位置と前記最寄第2位置とを比較して、該
    最寄第1位置が該最寄第2位置よりも前記一方側である
    場合に、該最寄第1位置と該最寄第2位置との中間を通
    りかつ前記第2方向に沿った分割線で前記第1分割候補
    区間を分割することにより、前記一方側の一方分割領域
    および前記他方側の他方分割領域を生成し、前記一方分
    割領域を前記最寄第2位置が得られた走査線によって分
    割して2つの分割黒画素区間を生成し、かつ、前記他方
    分割領域を前記最寄第1位置が得られた走査線によって
    分割して2つの分割黒画素区間を生成することにより行
    切出しの修正を行なう第2分割部とを具えてなることを
    特徴とする行切出し修正装置。
JP9218913A 1997-07-08 1997-07-08 行切出し方法、行切出し修正方法、行切出し装置および行切出し修正装置 Withdrawn JPH1125218A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9218913A JPH1125218A (ja) 1997-07-08 1997-07-08 行切出し方法、行切出し修正方法、行切出し装置および行切出し修正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9218913A JPH1125218A (ja) 1997-07-08 1997-07-08 行切出し方法、行切出し修正方法、行切出し装置および行切出し修正装置

Publications (1)

Publication Number Publication Date
JPH1125218A true JPH1125218A (ja) 1999-01-29

Family

ID=16727291

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9218913A Withdrawn JPH1125218A (ja) 1997-07-08 1997-07-08 行切出し方法、行切出し修正方法、行切出し装置および行切出し修正装置

Country Status (1)

Country Link
JP (1) JPH1125218A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004151781A (ja) * 2002-10-28 2004-05-27 Ricoh Co Ltd 行切り出し装置、行切り出し方法およびプログラム
US7352897B2 (en) 2001-09-27 2008-04-01 Canon Kabushiki Kaisha Method and means for dividing an image into character image lines, and method and apparatus for character image recognition
JP2025009695A (ja) * 2023-06-28 2025-01-20 株式会社朝日新聞社 情報処理装置、情報処理方法、及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7352897B2 (en) 2001-09-27 2008-04-01 Canon Kabushiki Kaisha Method and means for dividing an image into character image lines, and method and apparatus for character image recognition
JP2004151781A (ja) * 2002-10-28 2004-05-27 Ricoh Co Ltd 行切り出し装置、行切り出し方法およびプログラム
JP2025009695A (ja) * 2023-06-28 2025-01-20 株式会社朝日新聞社 情報処理装置、情報処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
CN112507782B (zh) 文本图像的识别方法及装置
EP0063454B1 (en) Method for recognizing machine encoded characters
US4903311A (en) Character region extracting method and apparatus capable of implementing the method
JP2951814B2 (ja) 画像抽出方式
JPH07120385B2 (ja) 光学的読取り方法
JPH08293001A (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
US20020159639A1 (en) Form identification method
US6275608B1 (en) Image processing method and apparatus and memory medium
JP3936436B2 (ja) 表認識方法
JPH1125218A (ja) 行切出し方法、行切出し修正方法、行切出し装置および行切出し修正装置
US5982952A (en) Optical character reader with tangent detection for detecting tilt of image data
JPH1125217A (ja) 行切出し方法、行切出し修正方法、行切出し装置および行切出し修正装置
JP3516541B2 (ja) 建設図面の寸法情報認識方法及び認識装置
JPH07220023A (ja) 表認識方法及びその装置
JP3516540B2 (ja) 建設図面認識方法及び認識装置
JP2872768B2 (ja) 文字切出し装置
JPH1125213A (ja) 行方向判定方法および行方向判定装置
JPH07182459A (ja) 表構造抽出装置
JP3187895B2 (ja) 文字領域抽出方法
JP3516502B2 (ja) 建設図面認識方法及び認識装置
JPH09185675A (ja) 様式解析方法
JPH0492992A (ja) 文字切出し装置
JPH02138674A (ja) 文書処理方法及び装置
JPH06223224A (ja) 行切出し方法
JP3606218B2 (ja) 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20041005