JPH0256688A - 文字切出し装置 - Google Patents
文字切出し装置Info
- Publication number
- JPH0256688A JPH0256688A JP63208892A JP20889288A JPH0256688A JP H0256688 A JPH0256688 A JP H0256688A JP 63208892 A JP63208892 A JP 63208892A JP 20889288 A JP20889288 A JP 20889288A JP H0256688 A JPH0256688 A JP H0256688A
- Authority
- JP
- Japan
- Prior art keywords
- character
- image data
- area
- binarization
- grayscale image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005520 cutting process Methods 0.000 title claims description 32
- 238000001514 detection method Methods 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims description 23
- 238000003384 imaging method Methods 0.000 claims description 20
- 238000009826 distribution Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 9
- 230000003247 decreasing effect Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000005484 gravity Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000010422 painting Methods 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は文字切出し装置、特に文字を含む濃淡画像デー
タの中から、個々の文字が存在する領域を抽出出力する
文字切出し装置の改良に関する。
タの中から、個々の文字が存在する領域を抽出出力する
文字切出し装置の改良に関する。
[従来の技術]
刻印文字は、経年変化や汚れに強く、各種生産工程にお
いて生産指示や管理の重要な情報を示す文字として幅広
く用いられている−特に自動車の生産工程では、車体を
構成する各部品やエンジン等に固有の番号を記すものと
して広く用いられている。
いて生産指示や管理の重要な情報を示す文字として幅広
く用いられている−特に自動車の生産工程では、車体を
構成する各部品やエンジン等に固有の番号を記すものと
して広く用いられている。
このような刻印文字の認識には、通常、文字切出し装置
と文字識別装置とが組合せて用いられている。
と文字識別装置とが組合せて用いられている。
従来の文字切出し装置は、ITVカメラ等を用いて刻印
文字を撮像しその濃淡画像を得るとともに、この濃淡画
像の各画素データを2値画像データに変換し0、この2
値画像データから各文字を検出し切出していた。
文字を撮像しその濃淡画像を得るとともに、この濃淡画
像の各画素データを2値画像データに変換し0、この2
値画像データから各文字を検出し切出していた。
そして、文字識別装置は、このように切出された個々の
文字画像データを、あらかじめ登録した標準の文字画像
データと逐次重ね合せて比較するパターンマツチングを
行い、両画像の一致度あるいは類似度に基づいて文字の
識別を行っていた。
文字画像データを、あらかじめ登録した標準の文字画像
データと逐次重ね合せて比較するパターンマツチングを
行い、両画像の一致度あるいは類似度に基づいて文字の
識別を行っていた。
しかし、従来の文字切出し装置では、画像データ全体を
固定されたしきい値で2値化し文字の切出しを行ってい
るため、画像データの背景部に濃淡むらやノイズ等があ
ったり、画像データの文字部と背景部とのコントラスト
が個々の文字毎に変化するような場合には、所望の文字
を正確に検出し切出すことが難しいという問題があった
。
固定されたしきい値で2値化し文字の切出しを行ってい
るため、画像データの背景部に濃淡むらやノイズ等があ
ったり、画像データの文字部と背景部とのコントラスト
が個々の文字毎に変化するような場合には、所望の文字
を正確に検出し切出すことが難しいという問題があった
。
すなわち、現在広く用いられている刻印機では、打刻条
件がいつも同じになるように制御することが器しく、刻
印文字毎に清の深さがばらつくことが多い、また打刻さ
れる鋼板が薄い場合には、不均一な打刻圧のため文字の
周囲に緩かな凹凸が生じることがある。このため、刻印
文字の濃淡画像データでは、文字部と背景部との濃度の
コントラストが個々の文字毎に変化し、さらに背景部の
濃度が部分的に変動する。
件がいつも同じになるように制御することが器しく、刻
印文字毎に清の深さがばらつくことが多い、また打刻さ
れる鋼板が薄い場合には、不均一な打刻圧のため文字の
周囲に緩かな凹凸が生じることがある。このため、刻印
文字の濃淡画像データでは、文字部と背景部との濃度の
コントラストが個々の文字毎に変化し、さらに背景部の
濃度が部分的に変動する。
また、認識対象となる文字の桁数が多い場合。
たとえば車体番号のように文字の桁数が多い場合には、
光源に対する各文字の酒の角度や向きが不均一となる。
光源に対する各文字の酒の角度や向きが不均一となる。
このため、刻印文字の画像では、同じ文字でも文字部の
濃度が文字線の部分毎に異なる場合が多い。
濃度が文字線の部分毎に異なる場合が多い。
また、刻印文字が打刻された後に、防錆処理や塗装が施
されると、防錆処理や塗装のむらあるいは照明条件の変
化等に起因して画像の背景部に濃淡むらが発生する。さ
らに、刻印文字周辺には細かい傷や汚れが付着し易く、
このため画像の背景にはノイズが多く現れる。
されると、防錆処理や塗装のむらあるいは照明条件の変
化等に起因して画像の背景部に濃淡むらが発生する。さ
らに、刻印文字周辺には細かい傷や汚れが付着し易く、
このため画像の背景にはノイズが多く現れる。
しかし、画像の背景部に濃淡むちゃノイズが生じ、文字
部と背景部とのコントラストが個々の文字毎に変化し、
さらに1つの文字の中でも文字線の部分毎に濃度が異な
る濃淡画像データに対して、画像データ全体を固定され
たしきい値で2値化し文字の切出しを行う従来技術を用
いると、第7図に示すように1文字となるはずの画像が
部分的にとぎれたり、隣接する文字同士が接触して分離
できないことがあるという問題があった。
部と背景部とのコントラストが個々の文字毎に変化し、
さらに1つの文字の中でも文字線の部分毎に濃度が異な
る濃淡画像データに対して、画像データ全体を固定され
たしきい値で2値化し文字の切出しを行う従来技術を用
いると、第7図に示すように1文字となるはずの画像が
部分的にとぎれたり、隣接する文字同士が接触して分離
できないことがあるという問題があった。
また、1文字として抽出できた場合でも、文字の一部が
つぶれて部分的に太い文字画像になったり、逆に文字線
の一部が細すぎたり、文字領域の中にノイズが残ったり
するなど、様々に変形した文字画像が生じるという問題
があった。
つぶれて部分的に太い文字画像になったり、逆に文字線
の一部が細すぎたり、文字領域の中にノイズが残ったり
するなど、様々に変形した文字画像が生じるという問題
があった。
このような問題を解決するために、特開昭60−144
884号公報に開示された技術が知られている。
884号公報に開示された技術が知られている。
この従来技術は、光源に対する各文字の角度や向き等に
起因する画像濃度のばらつきを抑制するものであり、刻
印文字の撮像・に際し、刻印面に対し少なくとも2つの
異なる方向から斜光照射を行い、それぞれの照射に対応
した刻印文字の濃淡画像データを入力して2値画像化し
、これらの2値画像の論理和をとることで最終的な2値
画像を形成することを特徴としている。
起因する画像濃度のばらつきを抑制するものであり、刻
印文字の撮像・に際し、刻印面に対し少なくとも2つの
異なる方向から斜光照射を行い、それぞれの照射に対応
した刻印文字の濃淡画像データを入力して2値画像化し
、これらの2値画像の論理和をとることで最終的な2値
画像を形成することを特徴としている。
しかし、この従来技術も、入力した濃淡画像データ全体
を固定されたしきい値で2値化するため、2値化しきい
値を逐次設定し直しても、個々の文字部てを正確に検出
することが困難であるという問題があった。
を固定されたしきい値で2値化するため、2値化しきい
値を逐次設定し直しても、個々の文字部てを正確に検出
することが困難であるという問題があった。
また、濃淡画像データから文字を検出する別の技術とし
て、文字部と背景部との濃度の変化に注目した、特開昭
60−211583号公報に開示された技術が知られて
いる。
て、文字部と背景部との濃度の変化に注目した、特開昭
60−211583号公報に開示された技術が知られて
いる。
この従来技術は、カメラで撮像した濃淡の画像データの
各画素に対して、注目する画素および周辺に位置する画
素の濃度レベルのうち最小値を求め、その値でしきい値
を設定して、注目する画素と周辺の画素との濃度レベル
の差分値を評価し、文字のエツジ部分か否かを検出する
ことを特徴としている。
各画素に対して、注目する画素および周辺に位置する画
素の濃度レベルのうち最小値を求め、その値でしきい値
を設定して、注目する画素と周辺の画素との濃度レベル
の差分値を評価し、文字のエツジ部分か否かを検出する
ことを特徴としている。
しかし、この従来技術も、刻印文字の画像のように個々
の文字毎に文字部と背景部との濃度差が変化し、1つの
文字の中で濃度が異なるような場合には、正確に文字を
検出し切出すことが難しいという問題があった。
の文字毎に文字部と背景部との濃度差が変化し、1つの
文字の中で濃度が異なるような場合には、正確に文字を
検出し切出すことが難しいという問題があった。
[発明が解決しようとする問題点]
本発明は、このような従来の課題に鑑みてなされたもの
であり、その目的は、前述した従来の問頭点を解決し、
背景部に濃淡むちゃノイズ等が含まれ、文字部と背景部
との濃度のコントラストが個々の文字毎に変化し、しか
も1つの文字の文字線の各部分で濃度が異なるような濃
淡画像データからでも、所望の文字を正確に検出し、か
つ検出した各文字がノイズを含まず、文字変形も少ない
2値画像となるよう切出すことができる文字切出し装置
を提供することにある。
であり、その目的は、前述した従来の問頭点を解決し、
背景部に濃淡むちゃノイズ等が含まれ、文字部と背景部
との濃度のコントラストが個々の文字毎に変化し、しか
も1つの文字の文字線の各部分で濃度が異なるような濃
淡画像データからでも、所望の文字を正確に検出し、か
つ検出した各文字がノイズを含まず、文字変形も少ない
2値画像となるよう切出すことができる文字切出し装置
を提供することにある。
[問題点を解決するための手段]
前記目的を達成するため、第1図に示すように本発明に
かかる文字切出し装置は、 撮像手段1000を用いて画像化された文字を含む濃淡
画像データから、個々の文字を検出して切出す文字切出
し装置において4 濃淡画像データをいくつかの小領域に分割し、各小領域
毎に最適な文字領域検出用2値化しきい値を計算すると
共に濃淡画像データを各小領域毎に2値化する文字領域
検出用の分割領域別2値化手段1200と、 分割領域別2値化手段1200から出力される2値画像
データに基づき、文字列の存在する小領域を検出する文
字列領域検出手段1400と、文字列領域検出手段14
00で検出された文字列の存在する小領域において、個
々の文字が存在する小領域を逐次検出する文字領域検出
手段1500と、 個々の文字が存在する小領域毎にfi適な文字切出し用
2値化しきい値を計算し、濃淡画像データを各小領域毎
に2値化する文字領域別2値化手段1700と、 を含み、個々の文字画像データを切出し出力することを
特徴とする。
かかる文字切出し装置は、 撮像手段1000を用いて画像化された文字を含む濃淡
画像データから、個々の文字を検出して切出す文字切出
し装置において4 濃淡画像データをいくつかの小領域に分割し、各小領域
毎に最適な文字領域検出用2値化しきい値を計算すると
共に濃淡画像データを各小領域毎に2値化する文字領域
検出用の分割領域別2値化手段1200と、 分割領域別2値化手段1200から出力される2値画像
データに基づき、文字列の存在する小領域を検出する文
字列領域検出手段1400と、文字列領域検出手段14
00で検出された文字列の存在する小領域において、個
々の文字が存在する小領域を逐次検出する文字領域検出
手段1500と、 個々の文字が存在する小領域毎にfi適な文字切出し用
2値化しきい値を計算し、濃淡画像データを各小領域毎
に2値化する文字領域別2値化手段1700と、 を含み、個々の文字画像データを切出し出力することを
特徴とする。
ここにおいて、前記分割領域別2111化手段1200
は、文字の大きさに対応して予め定められた分割数で濃
淡画1象デ一タ全体を分割し、分割された各小領域毎に
濃度ヒストグラムを作成して、ヒストグラムからisな
しきい値を求めて濃淡画像データを各小領域毎に2値化
するよう形成することが好ましい。
は、文字の大きさに対応して予め定められた分割数で濃
淡画1象デ一タ全体を分割し、分割された各小領域毎に
濃度ヒストグラムを作成して、ヒストグラムからisな
しきい値を求めて濃淡画像データを各小領域毎に2値化
するよう形成することが好ましい。
また、前記文字列領域検出手段1400は、2値化され
た画像データを文字列の並びと平行に走査して投影分布
を作り、投影分布と文字の大きさとに基づき文字列が存
在する領域を検出するよう形成され、 前記文字領域検出手段1500は、文字列が存在する小
領域の2値画像データを文字列の並びと垂直な方向に走
査して投影分布を作り、投影分布と、文字の大きさとに
基づき個々の文字が存在する小領域を逐次検出するよう
形成することが好ましい。
た画像データを文字列の並びと平行に走査して投影分布
を作り、投影分布と文字の大きさとに基づき文字列が存
在する領域を検出するよう形成され、 前記文字領域検出手段1500は、文字列が存在する小
領域の2値画像データを文字列の並びと垂直な方向に走
査して投影分布を作り、投影分布と、文字の大きさとに
基づき個々の文字が存在する小領域を逐次検出するよう
形成することが好ましい。
また、前記文字領域別2値化手段1700は、個々の文
字が存在する小領域毎に濃淡画像データの濃度ヒストグ
ラムを作成して各ヒストグラムから各小領域毎に最適な
しきい値を求め濃淡画像データを2値化するよう形成す
ることが好ましい。
字が存在する小領域毎に濃淡画像データの濃度ヒストグ
ラムを作成して各ヒストグラムから各小領域毎に最適な
しきい値を求め濃淡画像データを2値化するよう形成す
ることが好ましい。
また、文字領域別2値化手段1700の後段に、文字領
域別2値化手段1700から出力された個々の文字領域
毎の2値画像データの良否を判定し、良質な文字画像の
条件を満たすよう各文字領域毎に濃淡画像データを再2
値化し、文字画像を得る文字領域別再2値化手段180
0を設けることが好ましい。
域別2値化手段1700から出力された個々の文字領域
毎の2値画像データの良否を判定し、良質な文字画像の
条件を満たすよう各文字領域毎に濃淡画像データを再2
値化し、文字画像を得る文字領域別再2値化手段180
0を設けることが好ましい。
また、前記文字領域別再2値化手段1800は、個々の
文字領域毎に2値画像データに対してラベリング処理を
行い、文字線のまとまりの程度および文字線幅の程度を
判定することによりしきい値を増減して文字領域におけ
る濃淡画像データを再2値化し、これをくりかえすこと
により良質な文字画像を得るよう形成することが好まし
い。
文字領域毎に2値画像データに対してラベリング処理を
行い、文字線のまとまりの程度および文字線幅の程度を
判定することによりしきい値を増減して文字領域におけ
る濃淡画像データを再2値化し、これをくりかえすこと
により良質な文字画像を得るよう形成することが好まし
い。
また、文字領域検出手段1500と文字領域別°2値化
手段1700との間に、1つの文字の中での文字線のと
ぎれおよび2つ以上の文字同士の接触を検出し、文字領
域を修正して検出する文字領域修正検出手段1600を
設けることが好ましい。
手段1700との間に、1つの文字の中での文字線のと
ぎれおよび2つ以上の文字同士の接触を検出し、文字領
域を修正して検出する文字領域修正検出手段1600を
設けることが好ましい。
また、撮像手段1000と分割領域2値化手段1200
とQ間に、撮像手段1000から出力された濃淡画像デ
ータの背景部の濃淡むらを緩和して、文字部の候補とな
る濃度を抽出する文字候補濃度抽出手段1100を設け
ることが好ましい。
とQ間に、撮像手段1000から出力された濃淡画像デ
ータの背景部の濃淡むらを緩和して、文字部の候補とな
る濃度を抽出する文字候補濃度抽出手段1100を設け
ることが好ましい。
また、前記文字列領域検出手段1100は、濃淡画像デ
ータの狭い範囲で濃度が大きく変化する領域を、周りの
背景と同じ濃度で置換える処理を行い、処理を施した濃
淡画像データと元の濃淡画像データとの差分画像データ
を求めることにより、濃淡画像データの背景部分の潰淡
むらを緩和して文字候補となる領域の濃度を抽出するよ
う形成することが好ましい。
ータの狭い範囲で濃度が大きく変化する領域を、周りの
背景と同じ濃度で置換える処理を行い、処理を施した濃
淡画像データと元の濃淡画像データとの差分画像データ
を求めることにより、濃淡画像データの背景部分の潰淡
むらを緩和して文字候補となる領域の濃度を抽出するよ
う形成することが好ましい。
また、分割領域別2値化手段1200と文字列領域検出
手段1400との間に、分割領域別2値化手段1200
から出力された2値画像データからノイズを除去するノ
イズ除去手段1300を設けることが好ましい。
手段1400との間に、分割領域別2値化手段1200
から出力された2値画像データからノイズを除去するノ
イズ除去手段1300を設けることが好ましい。
[本発明の着眼点]
前述したように、従来の文字切出し技術では、刻印文字
を撮像手段1000を用いて撮影し、この撮像手段10
00から出力される濃淡の画像データを2値画像データ
に変換したり、また濃淡画像データを微分処理または差
分手段した後2値化して文字のエツジ部を表す画像デー
ータに変換し、これらの2値画像データから文字の切出
しを行っていた。
を撮像手段1000を用いて撮影し、この撮像手段10
00から出力される濃淡の画像データを2値画像データ
に変換したり、また濃淡画像データを微分処理または差
分手段した後2値化して文字のエツジ部を表す画像デー
ータに変換し、これらの2値画像データから文字の切出
しを行っていた。
しかし、これらの従来技術は、いずれも刻印文字の濃淡
画1象データが、印刷文字などの濃淡画像データとは具
なり、文字部および背景部共にその濃度が部分的に変り
易いという点を充分に考慮していなかった。
画1象データが、印刷文字などの濃淡画像データとは具
なり、文字部および背景部共にその濃度が部分的に変り
易いという点を充分に考慮していなかった。
これに対し、本発明者等は、文字部および背景部の濃度
がともに少しずつ変化する濃淡画像データから、個々の
文字を全て良質な2値画像として抽出するためにはどの
ようにしたらよいかについての研究を進め、この結果衣
の各点に着眼するに至った。
がともに少しずつ変化する濃淡画像データから、個々の
文字を全て良質な2値画像として抽出するためにはどの
ようにしたらよいかについての研究を進め、この結果衣
の各点に着眼するに至った。
本発明の第1の着眼点は、濃淡画像データから個々の文
字が存在する文字領域を検出するに際し、濃淡画像デー
タをいくつかの小領域に分割し、各小領域毎に最適なし
きい値を計算し、この最適しきい値を用いて濃淡画像デ
ータを各小領域毎に2値化することにある。
字が存在する文字領域を検出するに際し、濃淡画像デー
タをいくつかの小領域に分割し、各小領域毎に最適なし
きい値を計算し、この最適しきい値を用いて濃淡画像デ
ータを各小領域毎に2値化することにある。
すなわち、文字を検出するための2値画像データを考え
ると、個々の文字の文字線がとぎれていないこと、文字
同士が接触していないことが重要である。
ると、個々の文字の文字線がとぎれていないこと、文字
同士が接触していないことが重要である。
そこで、画像全体を予め定めた分割数でいくつかの小領
域に分け、各小領域毎に文字領域検出用の21ia化し
きい値を計算して求め、画像データを各小領域単位で2
値化する。
域に分け、各小領域毎に文字領域検出用の21ia化し
きい値を計算して求め、画像データを各小領域単位で2
値化する。
そして、文字列および文字検出を行う際は、このように
して得られた2#!画像データに対して文字の大きさや
間隔の情報を加え、さらに簡単なとぎれ、接触の確認を
行うことにより、個々の文字領域を正確に検出すること
ができる。
して得られた2#!画像データに対して文字の大きさや
間隔の情報を加え、さらに簡単なとぎれ、接触の確認を
行うことにより、個々の文字領域を正確に検出すること
ができる。
本発明の第2の着眼点は、検出された個々の文字領域に
基づいて各文字の画像データを切り出すに際し、検出し
た各文字毎の小領域で、濃度ヒストグラムにより最適な
文字切出し用2値化しきい値を計算により求め、このよ
うにして求めた各文字切出し用2値化しきい値を用いて
、濃淡画像データを各文字の小領域毎に2値化すること
にある。
基づいて各文字の画像データを切り出すに際し、検出し
た各文字毎の小領域で、濃度ヒストグラムにより最適な
文字切出し用2値化しきい値を計算により求め、このよ
うにして求めた各文字切出し用2値化しきい値を用いて
、濃淡画像データを各文字の小領域毎に2値化すること
にある。
このようにすることにより、濃淡画像データから、個々
の文字を2値画像として切出すことができる。
の文字を2値画像として切出すことができる。
このように、本発明によれば、前記第1および第2の着
眼点に従って、濃淡画像データを小領域に分割して文字
列および文字領域検出用に用いる2値画像データを作成
することにより、文字部、背景部共に濃度が少しずつ変
化するような濃淡画像データからでも、個々の文字を良
質な2値画像データとして抽出することができる。
眼点に従って、濃淡画像データを小領域に分割して文字
列および文字領域検出用に用いる2値画像データを作成
することにより、文字部、背景部共に濃度が少しずつ変
化するような濃淡画像データからでも、個々の文字を良
質な2値画像データとして抽出することができる。
ところで、このようにして抽出した各文字の2値画像デ
ータの中には、文字部および背景部の部分的なばらつき
により、文字線がとぎれたり、背景にノイズが生じたり
、あるいは文字線幅が他の文字と著しく異なったりする
ものがある。
ータの中には、文字部および背景部の部分的なばらつき
により、文字線がとぎれたり、背景にノイズが生じたり
、あるいは文字線幅が他の文字と著しく異なったりする
ものがある。
本発明の第3の着眼点は、このような文字の2値画像デ
ータを再2値化することにより、各文字を良好な2値画
像として切出すことにある。
ータを再2値化することにより、各文字を良好な2値画
像として切出すことにある。
すなわち、検出した各文字領域毎に、文字線のまとまり
具合、文字線とノイズの区別、さらに適正な文字線幅か
否かを確認するために、本発明では、2値化された文字
画像データに対しラベリング処理を行い、異なるラベル
となった文字線を統合するよう再2値化を繰り返して行
う、そして、再2値化を繰り返しても、文字線に統合さ
れないラベルをノイズとみなして除去する。
具合、文字線とノイズの区別、さらに適正な文字線幅か
否かを確認するために、本発明では、2値化された文字
画像データに対しラベリング処理を行い、異なるラベル
となった文字線を統合するよう再2値化を繰り返して行
う、そして、再2値化を繰り返しても、文字線に統合さ
れないラベルをノイズとみなして除去する。
このような再2値化作業を繰り返して行うことにより、
濃淡画像データに含まれる各文字を、良質な2値画像と
して切出し、出力することができる。
濃淡画像データに含まれる各文字を、良質な2値画像と
して切出し、出力することができる。
[作用]
次に本発明の詳細な説明する。
まず、例えばITVカメラなどの撮像手段1000によ
り文字を読み取ると、この撮像手段1000からは、文
字を含む濃淡画像データが出力される。
り文字を読み取ると、この撮像手段1000からは、文
字を含む濃淡画像データが出力される。
L12 −
第2図(a)には、このような濃淡画像データに含まれ
る文字列の一部が示されている。
る文字列の一部が示されている。
本発明の第1の特徴は、分割領域別2値化手段1200
を用いて、濃淡画像データをいくつかの小領域に分割し
、各小領域毎に最適な文字領域検出用2値化しきい値を
計算し、濃淡画像データを21化することにある。
を用いて、濃淡画像データをいくつかの小領域に分割し
、各小領域毎に最適な文字領域検出用2値化しきい値を
計算し、濃淡画像データを21化することにある。
第2図(b)には、同図<a)の濃淡画像データを予め
定めた大きさに分割(破線が分割線を示す)したときの
1つの小領域か示されている。
定めた大きさに分割(破線が分割線を示す)したときの
1つの小領域か示されている。
本発明においては、各小領域毎に文字領域検出用2値化
しきい値を計算するなめに、各小領域毎に画像データの
濃度ヒストグラムを作成し、この濃度ヒストグラムから
しきい値を求めている。
しきい値を計算するなめに、各小領域毎に画像データの
濃度ヒストグラムを作成し、この濃度ヒストグラムから
しきい値を求めている。
同図(c)は、同図(b)の小領域内における画像デー
タの個々の要素(これを画素という)を、その濃度レベ
ル別に分け、各濃度レベル毎の頻度を説明した図(これ
を濃度ヒストグラムと呼ぶ)である、なお、同図(c)
は、撮像手段1000により、文字部が暗く、背景部が
明るい画像が出力された場合を表しており、この濃度ヒ
ストグラムからは、文字部および背景部を示す濃度レベ
ル付近においてその頻度が高い2つの山ができているこ
とが理解されよう。
タの個々の要素(これを画素という)を、その濃度レベ
ル別に分け、各濃度レベル毎の頻度を説明した図(これ
を濃度ヒストグラムと呼ぶ)である、なお、同図(c)
は、撮像手段1000により、文字部が暗く、背景部が
明るい画像が出力された場合を表しており、この濃度ヒ
ストグラムからは、文字部および背景部を示す濃度レベ
ル付近においてその頻度が高い2つの山ができているこ
とが理解されよう。
したがって、同図(c)に示すように、小領域が文字を
含む場合には、文字部の山と背景部の山との間の谷の部
分を見つけ、そこを文字領域検出用2値化しきい値とし
て求める4 また、小領域が文字を含まない場合には、濃度レベルが
ほぼ背景部のみに集中するので、山は1つとなる。した
がって、この場合には、背景部の山より暗いレベルを、
文字領域検出用2値化しきい値として求める。
含む場合には、文字部の山と背景部の山との間の谷の部
分を見つけ、そこを文字領域検出用2値化しきい値とし
て求める4 また、小領域が文字を含まない場合には、濃度レベルが
ほぼ背景部のみに集中するので、山は1つとなる。した
がって、この場合には、背景部の山より暗いレベルを、
文字領域検出用2値化しきい値として求める。
このようにして各小領域毎に求めた最適な文字領域検出
用2値化しきい値を用い濃淡画像データの2値化を行う
と、第2図(d)に示すような2値画像データが得られ
る。
用2値化しきい値を用い濃淡画像データの2値化を行う
と、第2図(d)に示すような2値画像データが得られ
る。
本発明の分割領域別2値化手段1200は、このような
2値化を各小領域毎に繰り返し行い、濃淡画像データ全
体を2値画像データに変換する。
2値化を各小領域毎に繰り返し行い、濃淡画像データ全
体を2値画像データに変換する。
S −−
なお、濃淡画像データにおいて、背景部の濃度むらが著
しく、分割領域別2値化手段1200で2値化された文
字画像データに、文字線のつぶれ(特に閉曲線を構成す
る文字線で起こりやすい)や背景のノイズ、文字同士の
接触が多くある場合には、分割領域別2値化手段120
0の前段に文字候補濃度抽出手段1100を設けること
が好ましい。
しく、分割領域別2値化手段1200で2値化された文
字画像データに、文字線のつぶれ(特に閉曲線を構成す
る文字線で起こりやすい)や背景のノイズ、文字同士の
接触が多くある場合には、分割領域別2値化手段120
0の前段に文字候補濃度抽出手段1100を設けること
が好ましい。
この文字候補抽出手段は、撮像手段toooがら、例え
ば第6図(a)に示すように背景部の濃淡むらが著しい
濃淡画像データが出力された場合に、この濃淡画像デー
タに含まれる文字部の各画素を、周囲の画素の濃度レベ
ルのうち最も明るいレベル(背景部のレベル)で置き換
える処理を繰り返して行う、そして、文字部の暗いレベ
ルを全て背景部の明るいレベルで置き換えた後、各画素
毎に元の濃淡画像データとの差を取り、これを新しい濃
度レベルとする濃淡画像データを出力する。
ば第6図(a)に示すように背景部の濃淡むらが著しい
濃淡画像データが出力された場合に、この濃淡画像デー
タに含まれる文字部の各画素を、周囲の画素の濃度レベ
ルのうち最も明るいレベル(背景部のレベル)で置き換
える処理を繰り返して行う、そして、文字部の暗いレベ
ルを全て背景部の明るいレベルで置き換えた後、各画素
毎に元の濃淡画像データとの差を取り、これを新しい濃
度レベルとする濃淡画像データを出力する。
このようにすることにより、撮像手段1000から第6
図(a)で示すような濃淡画像データが出力されるよう
な場合でも、文字部はど濃度レベルの変化が急でない部
分は緩和され、第6図(b)で示すように、元の濃淡画
像データに比べて文字部が強調された濃淡画像データを
得ることができる。
図(a)で示すような濃淡画像データが出力されるよう
な場合でも、文字部はど濃度レベルの変化が急でない部
分は緩和され、第6図(b)で示すように、元の濃淡画
像データに比べて文字部が強調された濃淡画像データを
得ることができる。
したがって、このような文字候補濃度抽出手段1100
を用いることにより、撮像手段1000から出力される
濃淡画像データにおける背景部濃淡むらが著しいような
場合でも、これに影響されることなく、分割領域別2値
化手段1200を用いて濃淡画1象データを全体文字領
域検出用の2値画像データに変換することができる。
を用いることにより、撮像手段1000から出力される
濃淡画像データにおける背景部濃淡むらが著しいような
場合でも、これに影響されることなく、分割領域別2値
化手段1200を用いて濃淡画1象データを全体文字領
域検出用の2値画像データに変換することができる。
ノイズ および 列
ところで、このように分割領域別2値化手段1200か
ら出力される文字領域検出用2値画像データには、細か
なノイズが含まれることが多い。
ら出力される文字領域検出用2値画像データには、細か
なノイズが含まれることが多い。
このため、分割領域別2値化画像手段から出力される2
値画像データは、ノイズ除去手段1300を用いて、細
かいノイズを除去することが好ましい。
値画像データは、ノイズ除去手段1300を用いて、細
かいノイズを除去することが好ましい。
第3図には、このようにして求められた2値画像データ
の一例が示されている。
の一例が示されている。
本発明の装置は、文字列領域検出手段1400を用いて
、この2値画像データから文字列の存在する小領域を検
出する。
、この2値画像データから文字列の存在する小領域を検
出する。
すなわち、この文字列領域検出手段1400は、第3図
に示す2値画像データに含まれる黒画素(文字部を表す
画素)を、文字列の並びに平行な方向に累積して分布図
を作り、この分布図から文字列の範囲を表す小領域を検
出する。第3図(a)には、この様子が示されている。
に示す2値画像データに含まれる黒画素(文字部を表す
画素)を、文字列の並びに平行な方向に累積して分布図
を作り、この分布図から文字列の範囲を表す小領域を検
出する。第3図(a)には、この様子が示されている。
そして、黒画素を累積した分布図において、変化の大き
な部分を文字列の範囲を表す境界線とし、文字の大きさ
の情報(この図では文字の高さ)を使って文字列の範囲
を表す小領域を確定する。
な部分を文字列の範囲を表す境界線とし、文字の大きさ
の情報(この図では文字の高さ)を使って文字列の範囲
を表す小領域を確定する。
文3」L1量M段
次に、本発明の装置は、文字領域検出手段1500を用
いて、文字列の存在する小領域から、個々の文字が存在
する小領域を逐次検出する。具体的には、検出した文字
列の範囲内において、文字列の並びに対し垂直方向に文
字部となる黒画素を累積し第3図<b)に示すような分
布図を作る。
いて、文字列の存在する小領域から、個々の文字が存在
する小領域を逐次検出する。具体的には、検出した文字
列の範囲内において、文字列の並びに対し垂直方向に文
字部となる黒画素を累積し第3図<b)に示すような分
布図を作る。
そして、この分布図において、変化の大きな部分・を文
字の範囲を表す境界線として、文字の大きさの情報(こ
の図では文字の幅)および文字間隔を用いて、文字の範
囲を表す小領域を確定する。
字の範囲を表す境界線として、文字の大きさの情報(こ
の図では文字の幅)および文字間隔を用いて、文字の範
囲を表す小領域を確定する。
このとき、文字領域検出手段1500から検出される文
字領域は、時として文字のとぎれや文字間の接触により
、必ずしも正確でない場合もある。
字領域は、時として文字のとぎれや文字間の接触により
、必ずしも正確でない場合もある。
このため、本発明においては、文字領域検出手段150
0から出力される文字領域を、文字領域修正検出手段に
入力し、文字のとぎれや文字間の接触を検出し補正する
よう形成することが好ましい。
0から出力される文字領域を、文字領域修正検出手段に
入力し、文字のとぎれや文字間の接触を検出し補正する
よう形成することが好ましい。
−12・
本発明の装置は、このようにして個々の文字毎の小領域
が検出されると、文字領域別2値化手段1700を用い
て、個々の文字が存在する小領域毎に最適な文字切出し
用2値化しきい値を計算により求める。そして、求めた
しきい値を用いて文字画像データ抽出手段1100から
出力される濃淡画像データを各小領域毎(文字領域毎)
に2値化することにより、文字画像データを出力してい
る。
が検出されると、文字領域別2値化手段1700を用い
て、個々の文字が存在する小領域毎に最適な文字切出し
用2値化しきい値を計算により求める。そして、求めた
しきい値を用いて文字画像データ抽出手段1100から
出力される濃淡画像データを各小領域毎(文字領域毎)
に2値化することにより、文字画像データを出力してい
る。
すなわち、この文字領域別2値化手段1700は、個々
の文字が存在する小領域毎に、画像データのヒストグラ
ムを作成し、各ヒストグラムから各画像領域毎に最適な
しきい値を計算により求める。そして、前記濃淡画像デ
ータを、各文字領域毎に2値化し、文字画像データとし
て出力している。
の文字が存在する小領域毎に、画像データのヒストグラ
ムを作成し、各ヒストグラムから各画像領域毎に最適な
しきい値を計算により求める。そして、前記濃淡画像デ
ータを、各文字領域毎に2値化し、文字画像データとし
て出力している。
このようにして、本発明の文字切出し装置によれば、撮
像手段1000から出力された濃淡画像データから個々
の文字の領域を正確に検出することができるばかりでな
く、検出文字領域から文字画像を良質な2値画像データ
として出力することができる。
像手段1000から出力された濃淡画像データから個々
の文字の領域を正確に検出することができるばかりでな
く、検出文字領域から文字画像を良質な2値画像データ
として出力することができる。
本発明の第2の特徴は、このように文字領域が検出され
、2値化された各文字の画像データに対し、さらに文字
のとぎれ、ノイズの除去、文字線幅の確認等を行うこと
により、より良質な文字画像データを得ることにある。
、2値化された各文字の画像データに対し、さらに文字
のとぎれ、ノイズの除去、文字線幅の確認等を行うこと
により、より良質な文字画像データを得ることにある。
このなめ、本発明の文字切出し装置は、文字領域別再2
値化手段1800を用い、文字領域別2値化手段170
0から出力された個々の文字領域毎の文字画像データの
良否を判定し、良質な文字画像の条件を満足するよう濃
淡画像データを再2値化し、各文字の良質な2値画像デ
ータを出力している。
値化手段1800を用い、文字領域別2値化手段170
0から出力された個々の文字領域毎の文字画像データの
良否を判定し、良質な文字画像の条件を満足するよう濃
淡画像データを再2値化し、各文字の良質な2値画像デ
ータを出力している。
すなわち、この文字領域別再2値化手段1800は、検
出され2値化された文字画像データを、各文字領域毎に
ラベリング処理する。ラベリング処理とは、連続した画
素の集りか否かを示すために、隣合う画素に同じラベル
をつける処理であり、例えば第4図(a)に示すrl、
Jを例にとると、この文字画像データはラベル1、ラベ
ル2、ラベル3の3つのラベルに分類される。
出され2値化された文字画像データを、各文字領域毎に
ラベリング処理する。ラベリング処理とは、連続した画
素の集りか否かを示すために、隣合う画素に同じラベル
をつける処理であり、例えば第4図(a)に示すrl、
Jを例にとると、この文字画像データはラベル1、ラベ
ル2、ラベル3の3つのラベルに分類される。
この「L」のように、文字領域内の黒画素(文字部の画
素)のラベル数が、2以上の場合には、文字線がとぎれ
ているか、ノイズが存在するか、その双方が同時に現れ
ているかである。
素)のラベル数が、2以上の場合には、文字線がとぎれ
ているか、ノイズが存在するか、その双方が同時に現れ
ているかである。
そこで、文字線がとぎれているかどうかを判定するため
に、文字切出し用しきい値を変えて濃淡濃淡画像データ
の文字領域を再2値化し、各文字の2値画像データを得
る。
に、文字切出し用しきい値を変えて濃淡濃淡画像データ
の文字領域を再2値化し、各文字の2値画像データを得
る。
第4図(b)は、黒画素が増加するようにしきい値を変
えた場合であり、このようにすることにより、ラベル1
とラベル2の文字線はつながり、この2つのラベルが1
つに統合される。しかし、この場合には、ノイズを表す
ラベル3はまだ残っており、さらに新たなノイズか生じ
てラベル4となった場合を示している。ここで、各ラベ
ルの画素の集りを「島」と呼ぶことにする。
えた場合であり、このようにすることにより、ラベル1
とラベル2の文字線はつながり、この2つのラベルが1
つに統合される。しかし、この場合には、ノイズを表す
ラベル3はまだ残っており、さらに新たなノイズか生じ
てラベル4となった場合を示している。ここで、各ラベ
ルの画素の集りを「島」と呼ぶことにする。
そして、前記ラベリング処理を行った後に、濃淡画像デ
ータに含まれる文字領域を再2値化するか否かの判断を
行う、この判断は、次のようにして行われる。
ータに含まれる文字領域を再2値化するか否かの判断を
行う、この判断は、次のようにして行われる。
まず、ラベリング処理の結果、2値化された文字画像デ
ータのラベル数が2以上である場合には、ラベル番号順
に画素の個数を計算し、最大の「島」、2番目の[島」
を選ぶ9次に、最大の「島」について、その「島」の高
さ、幅が文字の大きさとして適性がどうかを調べ、かつ
最大の「島」と2番目の「島」との画素数に充分な差が
あるかどうかを調べる。
ータのラベル数が2以上である場合には、ラベル番号順
に画素の個数を計算し、最大の「島」、2番目の[島」
を選ぶ9次に、最大の「島」について、その「島」の高
さ、幅が文字の大きさとして適性がどうかを調べ、かつ
最大の「島」と2番目の「島」との画素数に充分な差が
あるかどうかを調べる。
第4図(a)に示す「L」の場合には、ラベル数が2以
上で、最大の「島」と、2番目の[島」にあまり差がな
いため、画素数を増やすようにしきい値を変えて再2値
化し、同図(b)に示すような文字画像データを得る。
上で、最大の「島」と、2番目の[島」にあまり差がな
いため、画素数を増やすようにしきい値を変えて再2値
化し、同図(b)に示すような文字画像データを得る。
同図(b)では、最大の「島」 (ラベル1)は、文字
の大きさを満足し、しかも2番目の「島」(ラベル3)
との差が充分であるため、これ以上再2値化する必要は
ない、そこで、ラベル3と、ラベル4の「島」はノイズ
と判断して除去し、同図(c)に示すような文字画像デ
ータを得る。
の大きさを満足し、しかも2番目の「島」(ラベル3)
との差が充分であるため、これ以上再2値化する必要は
ない、そこで、ラベル3と、ラベル4の「島」はノイズ
と判断して除去し、同図(c)に示すような文字画像デ
ータを得る。
同図(a)に示す「5」も同様にして再2値化される。
また、同図(a>に示す他の文字は、そのラベル数が1
であるため、すぐに再2値化せず、まず「島」の総画素
数と輪郭線の長さとの比(これは平均の文字線幅に対応
する値となることが知られている)を計算し、この値が
適正であるかを判断する。この値が適正でない場合、例
えば°同図(a)に示す[0」のように文字線幅が細い
場合には、さらに文字線が太くなるようにしきい値を変
えて再2値化する。
であるため、すぐに再2値化せず、まず「島」の総画素
数と輪郭線の長さとの比(これは平均の文字線幅に対応
する値となることが知られている)を計算し、この値が
適正であるかを判断する。この値が適正でない場合、例
えば°同図(a)に示す[0」のように文字線幅が細い
場合には、さらに文字線が太くなるようにしきい値を変
えて再2値化する。
このようにして、本発明によれば、撮像手段1000か
ら出力された濃淡画像データから、個々の文字領域を正
確に検出することができ、しかも検出した文字画像デー
タは、適正な文字線幅でノイズを伴わない良質な2値画
像データとなる。
ら出力された濃淡画像データから、個々の文字領域を正
確に検出することができ、しかも検出した文字画像デー
タは、適正な文字線幅でノイズを伴わない良質な2値画
像データとなる。
そして、文字領域切出し手段は、このようにして検出さ
れた個々の文字を画像データから切り出し出力すること
となる。
れた個々の文字を画像データから切り出し出力すること
となる。
[発明の効果]
以上説明したように、本発明によれば、撮像手段100
0から出力される濃淡画像データをいくつかの小領域に
分割し、分割した小領域毎に、濃淡画像データ毎に対す
るfi13i!なしきい値を自動的に求めて2値化し、
さらにこのようにして求めた2値画像データがより良質
な2値画像データとなるように再度21ii化する処理
を繰り返して行う。
0から出力される濃淡画像データをいくつかの小領域に
分割し、分割した小領域毎に、濃淡画像データ毎に対す
るfi13i!なしきい値を自動的に求めて2値化し、
さらにこのようにして求めた2値画像データがより良質
な2値画像データとなるように再度21ii化する処理
を繰り返して行う。
このため、背景部の濃淡むらやノイズ、文字部と背景部
とのコントラストの変化、文字線毎の濃度の違いなどに
影響されることなく、濃淡画像データに含まれる各文字
を正確に検出し切出すことができるという効果がある。
とのコントラストの変化、文字線毎の濃度の違いなどに
影響されることなく、濃淡画像データに含まれる各文字
を正確に検出し切出すことができるという効果がある。
さらに、本発明によれば、濃淡画像データの分割の大き
さを最初に適宜定めておくことにより、fIi像条件や
光源の照度変化などがある場合にも、各しきい値をその
都度設定し直すことなく自動的に求めることができる。
さを最初に適宜定めておくことにより、fIi像条件や
光源の照度変化などがある場合にも、各しきい値をその
都度設定し直すことなく自動的に求めることができる。
このなめ9、各種生産現場において濃淡画像データから
各種文字を切り出す場合に、従来技術に比べ大幅な省力
化を果すことができるという効果がある。
各種文字を切り出す場合に、従来技術に比べ大幅な省力
化を果すことができるという効果がある。
[実施例]
次に本発明の好適な実施例を図面に基づき説明する。
第5図には、本発明が適用された文字認識装置10の好
適な実施例が示されており、同図において、自動車の車
体の構成部品である車体パネル12には、認識対象とな
る刻印文字Aが打刻されている。この刻印文字Aは、例
えば英数字および記号からなる19桁の文字列である。
適な実施例が示されており、同図において、自動車の車
体の構成部品である車体パネル12には、認識対象とな
る刻印文字Aが打刻されている。この刻印文字Aは、例
えば英数字および記号からなる19桁の文字列である。
実施例の文字認識装置10は、前記刻印文字Aを自動読
取りするためのものであって、刻印文字Aを撮影する撮
像手段100と、本発明に係る文字切出し装置200と
、文字識別装置300とから構成されている。
取りするためのものであって、刻印文字Aを撮影する撮
像手段100と、本発明に係る文字切出し装置200と
、文字識別装置300とから構成されている。
員」Ull
前記撮像装置100は、刻印文字Aを光源16で照明し
、テレビカメラ14で撮像している。刻印文字Aは、清
になっている文字部が影になり暗く、車体パネル12の
表面部分が明るい濃淡画像として促えられる。
、テレビカメラ14で撮像している。刻印文字Aは、清
になっている文字部が影になり暗く、車体パネル12の
表面部分が明るい濃淡画像として促えられる。
そして、テレビカメラ14から出力される濃淡画像デー
タはA/D変換回路18でデジタル信号に変換された後
、文字切出し装置200へ向は出力される。
タはA/D変換回路18でデジタル信号に変換された後
、文字切出し装置200へ向は出力される。
文ヱ」JLL鼠1
本実施例の文字切出し、装置200は、A/D変換回路
18から出力される濃淡画像データを、文字候補濃度抽
出回路20へ入力している。
18から出力される濃淡画像データを、文字候補濃度抽
出回路20へ入力している。
(イ)この文字候補濃度抽出回路20は、濃淡画像デー
タの背景部の濃淡むらを緩和し、文字部が強調された濃
淡画像データを抽出出力するよう形成されており、具体
的には第1の画像メモリ22、濃度置換回路24、第2
の画像メモリ26、差分回路28および第3の画像メモ
リ30から構成されている。
タの背景部の濃淡むらを緩和し、文字部が強調された濃
淡画像データを抽出出力するよう形成されており、具体
的には第1の画像メモリ22、濃度置換回路24、第2
の画像メモリ26、差分回路28および第3の画像メモ
リ30から構成されている。
そして、A/D変換回路18から出力される濃淡画像デ
ータは、第1の画像メモリ22に記憶された後、濃度置
換回路24により文字部の濃度が背景部の濃度に置き変
えられて第2の画像メモリ26に記憶される。
ータは、第1の画像メモリ22に記憶された後、濃度置
換回路24により文字部の濃度が背景部の濃度に置き変
えられて第2の画像メモリ26に記憶される。
そして、差分回路28は、第1の画像メモリ22に記憶
されている濃淡画像データから、第2の画像メモリ26
に記憶されている濃淡画像データを差分演算し、これを
第3の画像メモリ30に記憶する。
されている濃淡画像データから、第2の画像メモリ26
に記憶されている濃淡画像データを差分演算し、これを
第3の画像メモリ30に記憶する。
このようにすることにより、例えばA/D変換回路18
から、第6図(a)に示すように、背景部に濃淡むらが
ある濃淡画像データが出力されるような場合でも、第3
の画像メモリ30内には、第6図(、b)に示すように
、背景部の濃淡むらが緩和され、文字候補となる領域の
濃度が抽出された濃淡画像データを得ることができる。
から、第6図(a)に示すように、背景部に濃淡むらが
ある濃淡画像データが出力されるような場合でも、第3
の画像メモリ30内には、第6図(、b)に示すように
、背景部の濃淡むらが緩和され、文字候補となる領域の
濃度が抽出された濃淡画像データを得ることができる。
そして、第3の画像メモリ30に記憶された濃淡画像デ
ータは、分割領域別2値化回路32へ向は出力される。
ータは、分割領域別2値化回路32へ向は出力される。
(ロ)この分割領域別2値化回路32は、入力される濃
淡画像データを複数の小領域に分割し、この小領域毎に
最適な文字領域検出用2値化しきい値を演算し2値画像
化処理を施すことにより、第3の画像メモリ30から出
力される濃淡画像データ全体を211i画像データに変
換するよう形成されている。
淡画像データを複数の小領域に分割し、この小領域毎に
最適な文字領域検出用2値化しきい値を演算し2値画像
化処理を施すことにより、第3の画像メモリ30から出
力される濃淡画像データ全体を211i画像データに変
換するよう形成されている。
この分割領域別2値化回路32は、具体的には領域分割
回路34、濃度ヒストグラム作成回路36.2値化しき
い値演算回路38および2値化回路40から構成されて
いる。
回路34、濃度ヒストグラム作成回路36.2値化しき
い値演算回路38および2値化回路40から構成されて
いる。
そして、領域分割回路34では、予め定められた分割数
に従って、第3の画像メモリ30から入力される濃淡画
像データを複数の小領域に分割し、濃度ヒストグラム作
成回路36へ入力する。
に従って、第3の画像メモリ30から入力される濃淡画
像データを複数の小領域に分割し、濃度ヒストグラム作
成回路36へ入力する。
この濃度ヒストグラム作成回路36では、個々の小領域
毎に入力される濃淡画像データから、各小領域毎の濃度
ヒストグラムを作成し、2値化しきい値演算回路38へ
向は出力する。
毎に入力される濃淡画像データから、各小領域毎の濃度
ヒストグラムを作成し、2値化しきい値演算回路38へ
向は出力する。
2値化しきい値演算回路38は、入力される濃度ヒスト
グラムの濃度レベルのばらつき具合により、その小領域
が文字を含む領域か否かを判別し、文字を含む小領域の
場合には、例えば第2図(c)に示すように、文字の濃
度レベルを表す頻度の山と、背景濃度レベルを表す頻度
の山の間の谷の部分を、文字領域検出用の2値化しきい
値として求める。また、文字を含まない小領域の場合に
は、背景の濃度レベルの頻度の山より暗い濃度レベルを
求め、これを小領域の最適な2値化しきい値とする。
グラムの濃度レベルのばらつき具合により、その小領域
が文字を含む領域か否かを判別し、文字を含む小領域の
場合には、例えば第2図(c)に示すように、文字の濃
度レベルを表す頻度の山と、背景濃度レベルを表す頻度
の山の間の谷の部分を、文字領域検出用の2値化しきい
値として求める。また、文字を含まない小領域の場合に
は、背景の濃度レベルの頻度の山より暗い濃度レベルを
求め、これを小領域の最適な2値化しきい値とする。
そして、このようにして求めた各小領域の最適な2値化
しきい値を、2値化回路40へ出力し、2値化回路40
にて2値化した画像データをノイズ除去回路42へ向は
出力する。
しきい値を、2値化回路40へ出力し、2値化回路40
にて2値化した画像データをノイズ除去回路42へ向は
出力する。
このようにして、本発明によれば、各小領域毎に最適な
2値化しきい値を求めて2値画像化を行うため、濃淡画
像データの背景部に濃度むらがあったり、文字毎に背景
とのコントラストが異なる場合でも、文字のとぎれや文
字間の接触が少ない良質な2値画像データを得ることが
できる。
2値化しきい値を求めて2値画像化を行うため、濃淡画
像データの背景部に濃度むらがあったり、文字毎に背景
とのコントラストが異なる場合でも、文字のとぎれや文
字間の接触が少ない良質な2値画像データを得ることが
できる。
そして、前記ノイズ除去回路42は、入力された2値画
像データのうち、連続した黒画素数(文字部に相当する
画素数)が少ない領域をノイズとみなしてこれを消去し
た後、この2値画像データを文字列領域検出回路44へ
向は出力する。
像データのうち、連続した黒画素数(文字部に相当する
画素数)が少ない領域をノイズとみなしてこれを消去し
た後、この2値画像データを文字列領域検出回路44へ
向は出力する。
(ハ)文字列領域検出回路44は、このようにして入力
される2値画像データを、文字列の並びと平行方向に走
査して黒画素(文字部の画素)を累積した投影分布図を
作る。そして、この分布図の変化の大きな部分を文字列
の存在する範囲とすると共に、この範囲が文字の高さと
比べて妥当かどうかを確認した上で、これを文字列を表
す小領域として検出し、検出した文字列領域の2値画像
データを文字領域検出回路46へ向は出力する。
される2値画像データを、文字列の並びと平行方向に走
査して黒画素(文字部の画素)を累積した投影分布図を
作る。そして、この分布図の変化の大きな部分を文字列
の存在する範囲とすると共に、この範囲が文字の高さと
比べて妥当かどうかを確認した上で、これを文字列を表
す小領域として検出し、検出した文字列領域の2値画像
データを文字領域検出回路46へ向は出力する。
(ニ)文字領域検出回路46は、このようにして入力さ
れる文字列領域の2値画像データを、文字列の並びと垂
直方向に走査して、黒画素(文字部を表す画素)を累積
した投影分布図を作る。そして、この分布図の変化の大
きな部分を文字の左端および右端として組で見つけ、こ
の−組の左端および右端の幅が文字の幅と比較して妥当
か否かを確認する。そして、文字領域と確認された文字
の左端、右端座標およびその左端と右端とに囲まれた文
字画像データを、文字領域修正検出回路48へ向は出力
する。
れる文字列領域の2値画像データを、文字列の並びと垂
直方向に走査して、黒画素(文字部を表す画素)を累積
した投影分布図を作る。そして、この分布図の変化の大
きな部分を文字の左端および右端として組で見つけ、こ
の−組の左端および右端の幅が文字の幅と比較して妥当
か否かを確認する。そして、文字領域と確認された文字
の左端、右端座標およびその左端と右端とに囲まれた文
字画像データを、文字領域修正検出回路48へ向は出力
する。
(ホ)文字領域修正検出回路48は、゛このよう゛にし
て入力される文字の左端、右端座標から文字の中心座標
を求める。そして、隣合う個々の文字毎の文字中心座標
の差から文字ピッチを求め、これをあらかじめ定められ
ている文字ピッチと比較し、文字のとぎれや文字間の接
触によりうまく検出できなかった文字がないかどうかを
調べる。
て入力される文字の左端、右端座標から文字の中心座標
を求める。そして、隣合う個々の文字毎の文字中心座標
の差から文字ピッチを求め、これをあらかじめ定められ
ている文字ピッチと比較し、文字のとぎれや文字間の接
触によりうまく検出できなかった文字がないかどうかを
調べる。
第7図(a)には文字領域検出回路46により検出され
た文字の境界線、同図(b)には文字領域修正検出回路
48により修正して検出された文字の境界線の一例が示
されている。
た文字の境界線、同図(b)には文字領域修正検出回路
48により修正して検出された文字の境界線の一例が示
されている。
すなわち、検出された文字領域が定められた文字ピッチ
より小さい場合には、例えば第7図(a)に示す「v」
のように−文字がとぎれていると判断し、それを第7図
(b)に示すよう一文字とみなして新たに左端、右端座
標を求め、文字幅として妥当かどうか、さらには中心座
標を求め、隣合う文字とのピッチが妥当か否かを確認す
る。
より小さい場合には、例えば第7図(a)に示す「v」
のように−文字がとぎれていると判断し、それを第7図
(b)に示すよう一文字とみなして新たに左端、右端座
標を求め、文字幅として妥当かどうか、さらには中心座
標を求め、隣合う文字とのピッチが妥当か否かを確認す
る。
また、検出された文字領域が定められた文字ピッチより
大きい場合には、例えば第7図(a)示す「4」のよう
に、その間に文字のとぎれあるいは文字間の接触により
誤って検出された文字があると判断して、再びその範囲
での投影分布図を調べ直し、第7図(b)に示すごとく
、定められたピッチと文字幅に合うよう文字の左端と右
端座標を再検出する。
大きい場合には、例えば第7図(a)示す「4」のよう
に、その間に文字のとぎれあるいは文字間の接触により
誤って検出された文字があると判断して、再びその範囲
での投影分布図を調べ直し、第7図(b)に示すごとく
、定められたピッチと文字幅に合うよう文字の左端と右
端座標を再検出する。
そして、このように修正し検出した個々の文字毎の左端
と右端座標を、文字領域別2値化回路50へ向は出力す
る。
と右端座標を、文字領域別2値化回路50へ向は出力す
る。
(へ)文字領域別2値化回路50は、このようにして文
字領域修正検出回路48から入力されるデータに基づき
、個々の文字が存在する各小領域毎に最適な文字切出し
用2値化しきい値を演算する。そして、このようにして
求めた最適な文字切出し用2値化しきい値を用いて、前
記第3の画像メモリ30から出力される濃淡画像データ
から、各文字領域の2値画像データを作成する。
字領域修正検出回路48から入力されるデータに基づき
、個々の文字が存在する各小領域毎に最適な文字切出し
用2値化しきい値を演算する。そして、このようにして
求めた最適な文字切出し用2値化しきい値を用いて、前
記第3の画像メモリ30から出力される濃淡画像データ
から、各文字領域の2値画像データを作成する。
この文字領域別2値化回路50は、具体的には濃度ヒス
トグラム作成回路52.2値化しきい値演算回路54.
2値化回路56とから構成されている。
トグラム作成回路52.2値化しきい値演算回路54.
2値化回路56とから構成されている。
そして、濃度ヒストグラム作成回路52は、文字領域修
正検出回路48から入力される個々の文字領域を示す座
標と、第3の画像メモリから入力される個々の文字領域
を示す座標に対応する濃淡画像データに基づき、濃度ヒ
ストグラムを作成し、2値化しきい値演算回路54へ向
は出力する。
正検出回路48から入力される個々の文字領域を示す座
標と、第3の画像メモリから入力される個々の文字領域
を示す座標に対応する濃淡画像データに基づき、濃度ヒ
ストグラムを作成し、2値化しきい値演算回路54へ向
は出力する。
2値化しきい値演算回路54は、この濃度ヒストグラム
により、文字の濃度レベルの山と背景の濃度レベルの山
との間の谷の部分を求めて、これを2値化しきい値とし
て出力する。
により、文字の濃度レベルの山と背景の濃度レベルの山
との間の谷の部分を求めて、これを2値化しきい値とし
て出力する。
このようにして、2値化しきい値演算回路54は、各文
字毎の最適2値化しきい値を演算し、2値化回路56へ
向は出力する。
字毎の最適2値化しきい値を演算し、2値化回路56へ
向は出力する。
2値化回路56は、個々の文字領域を示す座標に対応す
る濃淡画像データを、前記最適しきい値を用いて2値画
像化し、このようにして求めた各文字毎の2値画像デー
タを文字領域別再2値化回路58へ向は出力する。
る濃淡画像データを、前記最適しきい値を用いて2値画
像化し、このようにして求めた各文字毎の2値画像デー
タを文字領域別再2値化回路58へ向は出力する。
第6図(e)には、このようにして求めた各文字毎の最
適21iaiiI像データが示されている。同図から明
らかなように、本実施例の回路を用いることにより、第
6図(a)に示すように背景部に濃淡むらがあるような
濃淡画像データから、第6図(e)に示すように、各文
字毎の良質な2値画像データを得ることができる。
適21iaiiI像データが示されている。同図から明
らかなように、本実施例の回路を用いることにより、第
6図(a)に示すように背景部に濃淡むらがあるような
濃淡画像データから、第6図(e)に示すように、各文
字毎の良質な2値画像データを得ることができる。
(ト)本実施例の装置は、このようにして求めた各文字
毎の2値画像データを文字領域別再2値化回路58へ入
力している。
毎の2値画像データを文字領域別再2値化回路58へ入
力している。
この文字領域別再2値化回路58は、個々の文字のとぎ
れや文字線幅の不適性を改善するために再度2値画像デ
ータ化(再2値化と記す)を繰り返して行い、良質な文
字画像を作成すると共に、文字領域内のノイズをも除去
するよう形成されている。具体的には、ラベリング回路
60、文字線判定回路62、再2値化しきい値設定回路
64、再2値化回路66およびノイズ除去回路68から
構成されている。
れや文字線幅の不適性を改善するために再度2値画像デ
ータ化(再2値化と記す)を繰り返して行い、良質な文
字画像を作成すると共に、文字領域内のノイズをも除去
するよう形成されている。具体的には、ラベリング回路
60、文字線判定回路62、再2値化しきい値設定回路
64、再2値化回路66およびノイズ除去回路68から
構成されている。
前記ラベリング回路60は、個々の文字毎の2値画像デ
ータに対し、黒画素(文字部に相当する画素)のまとま
りに同じラベルを付ける処理を行う。
ータに対し、黒画素(文字部に相当する画素)のまとま
りに同じラベルを付ける処理を行う。
そして、文字線判定回路62は、ラベル付された文字画
像データを評価して、これを再2値化する必要があるか
どうかを判断する。
像データを評価して、これを再2値化する必要があるか
どうかを判断する。
すなわち、各文字画像データのラベル数が1の場合は、
この黒画素の集りが文字の大きさとして妥当であり、し
かも文字線幅が適性か否かを判断する。そして、この条
件を満足しない場合には、再2値化しきい値設定回路6
4へ、文字画像データを出力し、満足する場合にはノイ
ズ除去回路68へ文字画像データを出力する。
この黒画素の集りが文字の大きさとして妥当であり、し
かも文字線幅が適性か否かを判断する。そして、この条
件を満足しない場合には、再2値化しきい値設定回路6
4へ、文字画像データを出力し、満足する場合にはノイ
ズ除去回路68へ文字画像データを出力する。
また、各文字画像データのラベル数が2以上の場合には
、最大の黒画素の集りと2番目の黒画素の集りとを比較
する。そして、最大の集りが2番目の集りの2倍以上の
画素数を有し、かつ最大の集りが文字の大きさおよび文
字線幅の許容値を満足する場合にのみ、文字画像データ
をノイズ除去回路68へ出力し、それ以外は再2値化し
きい値設定回路へ出力する。
、最大の黒画素の集りと2番目の黒画素の集りとを比較
する。そして、最大の集りが2番目の集りの2倍以上の
画素数を有し、かつ最大の集りが文字の大きさおよび文
字線幅の許容値を満足する場合にのみ、文字画像データ
をノイズ除去回路68へ出力し、それ以外は再2値化し
きい値設定回路へ出力する。
再2値化しきい値設定回路64は、各文字画像データの
ラベル数が1で、文字線幅が太すぎる場合には、しきい
値を下げ、それ以外は全てしきい値を上げ、再2値化の
ための新しいしきい値として用いる。そして、再2値化
回路66にて、文字領域に相当する第3の画像メモリ3
0の濃淡画像データを再2値化し、これをラベ゛リング
回路60ノ\向は出力する。
ラベル数が1で、文字線幅が太すぎる場合には、しきい
値を下げ、それ以外は全てしきい値を上げ、再2値化の
ための新しいしきい値として用いる。そして、再2値化
回路66にて、文字領域に相当する第3の画像メモリ3
0の濃淡画像データを再2値化し、これをラベ゛リング
回路60ノ\向は出力する。
文字線判定回FI/i62は、前述したラベリング処理
と再2値化処理とからなる一連の処理を最大何回繰り返
すかを予め決めておき、規定回数終了した場合には、文
字線の判定条件を満足しなくても、2値化された文字画
像データをノイズ除去回路68へ向は出力する。
と再2値化処理とからなる一連の処理を最大何回繰り返
すかを予め決めておき、規定回数終了した場合には、文
字線の判定条件を満足しなくても、2値化された文字画
像データをノイズ除去回路68へ向は出力する。
ノイズ除去回路68は、各文字領域の中で文字線以外の
ラベルをもつ黒画素の集りを消去し、文字抽出口#I7
0へ向は出力する。
ラベルをもつ黒画素の集りを消去し、文字抽出口#I7
0へ向は出力する。
文字抽出回路70は、ノイズ除去回路68から入力され
る文字領域の座標を伴った文字画像データを個別に切り
出し、文字識別装置300へ向は出力する。
る文字領域の座標を伴った文字画像データを個別に切り
出し、文字識別装置300へ向は出力する。
第6図(f)には、このようにして文字領域別再2値化
検出回路58で再2値化され、文字抽出回路70から引
き出される各文字の2値画像データが示されている。同
図に示すように、例えば文字領域別2値化回路50から
同図(e)に示すように、文字のとぎれや、文字線幅の
不均一な文字画像データが出力されるような場合でも、
この文字領域別再2値化回路58を用いることにより、
同図(f)に示すように、個々の文字のとぎれや文字線
幅の不適性を改善し、しかもノイズを除去した文字画像
データを得ることができる。
検出回路58で再2値化され、文字抽出回路70から引
き出される各文字の2値画像データが示されている。同
図に示すように、例えば文字領域別2値化回路50から
同図(e)に示すように、文字のとぎれや、文字線幅の
不均一な文字画像データが出力されるような場合でも、
この文字領域別再2値化回路58を用いることにより、
同図(f)に示すように、個々の文字のとぎれや文字線
幅の不適性を改善し、しかもノイズを除去した文字画像
データを得ることができる。
文ヱILL聚1
本実施例の文字識別装置300は、文字切出し装置20
0により切り出された個々の文字を、位置正規化回路7
2へ入力し、入力された文字の重心を求めて、その重心
を基準位置に合わせた後、類似度演算回路74へ向は出
力する。
0により切り出された個々の文字を、位置正規化回路7
2へ入力し、入力された文字の重心を求めて、その重心
を基準位置に合わせた後、類似度演算回路74へ向は出
力する。
類似度演算回路74は、標準パターンメモリ78に予め
登録されている各文字種の標準パターンと、位置正規化
回路72から出力される各文字画像データとを逐次重ね
合せながら、文字の種類とその一致の程度を表す類似度
を計算し、文字種判定回路76へ向は出力する。
登録されている各文字種の標準パターンと、位置正規化
回路72から出力される各文字画像データとを逐次重ね
合せながら、文字の種類とその一致の程度を表す類似度
を計算し、文字種判定回路76へ向は出力する。
文字種判定回路76は、各文字の類似度を所定の判定基
準に照し合せ、判定された文字が正確に識別されたか否
かを判断する。
準に照し合せ、判定された文字が正確に識別されたか否
かを判断する。
以上説明したように、本発明に係る文字切出し装置20
0を用いることにより、刻印文字Aを正確に切り出し、
その判読を正確に行うことができる。
0を用いることにより、刻印文字Aを正確に切り出し、
その判読を正確に行うことができる。
なお、本発明は前述した実施例に限定されるものではな
く、本発明の要管の範囲内で各種の変形実施が可能であ
る。
く、本発明の要管の範囲内で各種の変形実施が可能であ
る。
例えば、前記実権例においては、刻印文字を例にとり説
明したが、本発明はこれに限らず、必要に応じて他の種
類の文字の認識に用いることもできる。
明したが、本発明はこれに限らず、必要に応じて他の種
類の文字の認識に用いることもできる。
また、前記実施例においては、光学的なIl像手段を用
いた場合を甫1にとり説明したが、本発明はこれに限ら
ず、必要に応じて他のタイプのflil像手段全手段て
も良い。
いた場合を甫1にとり説明したが、本発明はこれに限ら
ず、必要に応じて他のタイプのflil像手段全手段て
も良い。
さらに、前記実施例においては、文字列が1つで横並び
の場合を例にとり説明したが、本発明はこれに限らず、
文字列が複数列である場合でも、また文字が縦並びの場
合でも、同様にして文字゛の切出しを行うことができる
。
の場合を例にとり説明したが、本発明はこれに限らず、
文字列が複数列である場合でも、また文字が縦並びの場
合でも、同様にして文字゛の切出しを行うことができる
。
【図面の簡単な説明】
第1図は、本発明に係るクレーム対応図、第2図は、本
発明に係る分割領域別の2値化動作を示す説明図、 第3図は、本発明に係る文字列領域検出動作および文字
領域検出動作を示す説明図、 第4図は、本発明に係る文字領域別再2値化動作を示す
説明図、 第5図は、本発明か適用された文字認識装置の好適な実
施例を示すブロック回路図、 第6図は第5図に示す文字認識装置の動作の一例を示す
説明図、 第7図は第5図に示す文字領域検出動作の一例を示す説
明図である。 14 ・・・ 20 ・・・ 32 ・・・ 42 ・・・ 44 ・・・ 46 ・・・ 48 ・・・ 50 ・・・ 58 ・・・ A ・・・ テレビカメラ 文字候補濃度検出回路 分割領域別2値化回路 ノイズ除去回路 文字列領域検出回路 文字領域検出回路 文字領域修正検出回路 文字領域別2値化回路 文字領域別再2値化回路 ・・・ 撮像装置 ・・・文字切出し装置 刻印文字 第4図 (b) (C) 第 図
発明に係る分割領域別の2値化動作を示す説明図、 第3図は、本発明に係る文字列領域検出動作および文字
領域検出動作を示す説明図、 第4図は、本発明に係る文字領域別再2値化動作を示す
説明図、 第5図は、本発明か適用された文字認識装置の好適な実
施例を示すブロック回路図、 第6図は第5図に示す文字認識装置の動作の一例を示す
説明図、 第7図は第5図に示す文字領域検出動作の一例を示す説
明図である。 14 ・・・ 20 ・・・ 32 ・・・ 42 ・・・ 44 ・・・ 46 ・・・ 48 ・・・ 50 ・・・ 58 ・・・ A ・・・ テレビカメラ 文字候補濃度検出回路 分割領域別2値化回路 ノイズ除去回路 文字列領域検出回路 文字領域検出回路 文字領域修正検出回路 文字領域別2値化回路 文字領域別再2値化回路 ・・・ 撮像装置 ・・・文字切出し装置 刻印文字 第4図 (b) (C) 第 図
Claims (10)
- (1)撮像手段を用いて画像化された文字を含む濃淡画
像データから、個々の文字を検出して切出す文字切出し
装置において、 濃淡画像データをいくつかの小領域に分割し、各小領域
毎に最適な文字領域検出用2値化しきい値を計算すると
共に濃淡画像データを各小領域毎に2値化する文字領域
検出用の分割領域別2値化手段と、 分割領域別2値化手段から出力される2値画像データに
基づき、文字列の存在する小領域を検出する文字列領域
検出手段と、 文字列領域検出手段で検出された文字列の存在する小領
域において、個々の文字が存在する小領域を逐次検出す
る文字領域検出手段と、 個々の文字が存在する小領域毎に最適な文字切出し用2
値化しきい値を計算し、濃淡画像データを各小領域毎に
2値化する文字領域別2値化手段と、 を含み、個々の文字画像データを切出し出力することを
特徴とする文字切出し装置。 - (2)特許請求範囲(1)に記載の装置において、前記
分割領域別2値化手段は、文字の大きさに対応して予め
定められた分割数で濃淡画像データ全体を分割し、分割
された各小領域毎に濃度ヒストグラムを作成して、ヒス
トグラムから最適なしきい値を求めて濃淡画像データを
各小領域毎に2値化することを特徴とする文字切出し装
置。 - (3)特許請求の範囲(1)、(2)のいずれかに記載
の装置において、 前記文字列領域検出手段は、2値化された画像データを
文字列の並びと平行に走査して投影分布を作り、投影分
布と文字の大きさとに基づき文字列が存在する領域を検
出するよう形成され、前記文字領域検出手段は、文字列
が存在する小領域の2値画像データを文字列の並びと垂
直な方向に走査して投影分布を作り、投影分布と文字の
大きさとに基づき個々の文字が存在する小領域を逐次検
出することを特徴とする文字切出し装置。 - (4)特許請求の範囲(1)〜(3)のいずれかに記載
の装置において、 前記文字領域別2値化手段は、個々の文字が存在する小
領域毎に濃淡画像データの濃度ヒストグラムを作成して
各ヒストグラムから各小領域毎に最適なしきい値を求め
濃淡画像データを2値化することを特徴とする文字切出
し装置。 - (5)特許請求の範囲(1)〜(4)のいずれかに記載
の装置において、 文字領域別2値化手段の後段に、文字領域別2値化手段
から出力された個々の文字領域毎の2値画像データの良
否を判定し、良質な文字画像の条件を満たすよう各文字
領域毎に濃淡画像データを再2値化し、文字画像を得る
文字領域別再2値化手段を設けたことを特徴とする文字
切出し装置。 - (6)特許請求の範囲(5)に記載の装置において、 前記文字領域別再2値化手段は、個々の文字領域毎に2
値画像データに対してラベリング処理を行い、文字線の
まとまりの程度および文字線幅の程度を判定することに
よりしきい値を増減して文字領域における濃淡画像デー
タを再2値化し、これをくりかえすことにより良質な文
字画像を得ることを特徴とする文字切出し装置。 - (7)特許請求の範囲(1)〜(6)のいずれかに記載
の装置において、 文字領域検出手段と文字領域別2値化手段との間に、1
つの文字の中での文字線のとぎれおよび2つ以上の文字
同士の接触を検出し、文字領域を修正して検出する文字
領域修正検出手段を設けたことを特徴とする文字切出し
装置。 - (8)特許請求の範囲(1)〜(7)のいずれかに記載
の装置において、 撮像手段と分割領域2値化手段との間に、撮像手段から
出力された濃淡画像データの背景部の濃淡むらを緩和し
て、文字部の候補となる濃度を抽出する文字候補濃度抽
出手段を設けたことを特徴とする文字切出し装置。 - (9)特許請求の範囲(8)に記載の装置において、 前記文字候補濃度抽出手段は、濃淡画像データの狭い範
囲で濃度が大きく変化する領域を、周りの背景と同じ濃
度で置換える処理を行い、処理を施した濃淡画像データ
と元の濃淡画像データとの差分画像データを求めること
により、濃淡画像データの背景部の濃淡むらを緩和して
文字候補となる領域の濃度を抽出するよう形成されたこ
とを特徴とする文字切出し装置。 - (10)特許請求の範囲(1)〜(9)のいずれかに記
載の装置において、 分割領域別2値化手段と文字列領域検出手段との間に、
分割領域別2値化手段から出力された2値画像データか
らノイズを除去するノイズ除去手段を設けたことを特徴
とする文字切出し装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63208892A JPH0256688A (ja) | 1988-08-23 | 1988-08-23 | 文字切出し装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63208892A JPH0256688A (ja) | 1988-08-23 | 1988-08-23 | 文字切出し装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0256688A true JPH0256688A (ja) | 1990-02-26 |
Family
ID=16563855
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63208892A Pending JPH0256688A (ja) | 1988-08-23 | 1988-08-23 | 文字切出し装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0256688A (ja) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03204791A (ja) * | 1990-01-05 | 1991-09-06 | Nippon Steel Corp | 打刻印の検出方法及び装置 |
| JPH04268989A (ja) * | 1991-02-25 | 1992-09-24 | Nippon Steel Corp | 文字認識方法及び装置 |
| US6883707B2 (en) | 2003-01-08 | 2005-04-26 | Glory Ltd. | Bill serial number reading device and bill serial number reading method |
| JP2006228232A (ja) * | 2005-02-18 | 2006-08-31 | Fujitsu Ltd | 文字分割プログラム、文字分割装置および文字分割方法 |
| KR100717674B1 (ko) * | 2002-11-15 | 2007-05-11 | 바스프 악티엔게젤샤프트 | 트리아졸로피리미딘 유도체 및 아미드 화합물 기재살진균성 혼합물 |
| US8160402B2 (en) | 2007-07-23 | 2012-04-17 | Sharp Kabushiki Kaisha | Document image processing apparatus |
| JP2013527513A (ja) * | 2010-03-10 | 2013-06-27 | マイクロソフト コーポレーション | 光学文字認識されるテキスト画像のテキスト解像度の改善方法及びシステム |
| JP2015028735A (ja) * | 2013-07-30 | 2015-02-12 | 富士ゼロックス株式会社 | 画像処理装置およびプログラム |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5148933A (en) * | 1974-07-26 | 1976-04-27 | Sulzer Morat Gmbh | Tashokupataanno sosakaraerareru johoo shorisuru hohooyobisochi |
| JPS59178872A (ja) * | 1983-03-30 | 1984-10-11 | Fujitsu Ltd | 濃淡画像の2値化方式 |
| JPS61141087A (ja) * | 1984-12-14 | 1986-06-28 | Hitachi Ltd | 画像処理方法及び装置 |
| JPS61193277A (ja) * | 1985-02-20 | 1986-08-27 | Mitsubishi Electric Corp | 文書読取装置 |
| JPS61210768A (ja) * | 1985-03-14 | 1986-09-18 | Murata Mach Ltd | 画信号の2値化方法 |
| JPS62175887A (ja) * | 1986-01-30 | 1987-08-01 | Hitachi Ltd | 画像処理方法 |
| JPS62259192A (ja) * | 1986-05-06 | 1987-11-11 | Toshiba Corp | リジエクト修正方式 |
-
1988
- 1988-08-23 JP JP63208892A patent/JPH0256688A/ja active Pending
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5148933A (en) * | 1974-07-26 | 1976-04-27 | Sulzer Morat Gmbh | Tashokupataanno sosakaraerareru johoo shorisuru hohooyobisochi |
| JPS59178872A (ja) * | 1983-03-30 | 1984-10-11 | Fujitsu Ltd | 濃淡画像の2値化方式 |
| JPS61141087A (ja) * | 1984-12-14 | 1986-06-28 | Hitachi Ltd | 画像処理方法及び装置 |
| JPS61193277A (ja) * | 1985-02-20 | 1986-08-27 | Mitsubishi Electric Corp | 文書読取装置 |
| JPS61210768A (ja) * | 1985-03-14 | 1986-09-18 | Murata Mach Ltd | 画信号の2値化方法 |
| JPS62175887A (ja) * | 1986-01-30 | 1987-08-01 | Hitachi Ltd | 画像処理方法 |
| JPS62259192A (ja) * | 1986-05-06 | 1987-11-11 | Toshiba Corp | リジエクト修正方式 |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03204791A (ja) * | 1990-01-05 | 1991-09-06 | Nippon Steel Corp | 打刻印の検出方法及び装置 |
| JPH04268989A (ja) * | 1991-02-25 | 1992-09-24 | Nippon Steel Corp | 文字認識方法及び装置 |
| KR100717674B1 (ko) * | 2002-11-15 | 2007-05-11 | 바스프 악티엔게젤샤프트 | 트리아졸로피리미딘 유도체 및 아미드 화합물 기재살진균성 혼합물 |
| US7335661B2 (en) | 2002-11-15 | 2008-02-26 | Basf Aktiengesellschaft | Fungicidal mixtures |
| US6883707B2 (en) | 2003-01-08 | 2005-04-26 | Glory Ltd. | Bill serial number reading device and bill serial number reading method |
| JP2006228232A (ja) * | 2005-02-18 | 2006-08-31 | Fujitsu Ltd | 文字分割プログラム、文字分割装置および文字分割方法 |
| US8160402B2 (en) | 2007-07-23 | 2012-04-17 | Sharp Kabushiki Kaisha | Document image processing apparatus |
| JP2013527513A (ja) * | 2010-03-10 | 2013-06-27 | マイクロソフト コーポレーション | 光学文字認識されるテキスト画像のテキスト解像度の改善方法及びシステム |
| JP2015028735A (ja) * | 2013-07-30 | 2015-02-12 | 富士ゼロックス株式会社 | 画像処理装置およびプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Yu et al. | An approach to Korean license plate recognition based on vertical edge matching | |
| US5784500A (en) | Image binarization apparatus and method of it | |
| CN103310211B (zh) | 一种基于图像处理的填注标记识别方法 | |
| CN110210440B (zh) | 一种表格图像版面分析方法及系统 | |
| JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
| US20050271275A1 (en) | Text character identification system and method thereof | |
| CN106326887A (zh) | 一种光学字符识别结果的校验方法及装置 | |
| CN103488986A (zh) | 自适应字符切分及提取方法 | |
| JPH0256688A (ja) | 文字切出し装置 | |
| IL98293A (en) | A method for distinguishing between text and graphics | |
| US8200016B2 (en) | Method and apparatus for character string recognition | |
| JP3416058B2 (ja) | 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体 | |
| JPH09311905A (ja) | 行検出方法および文字認識装置 | |
| CN112633289A (zh) | 一种粘连字符分割方法和系统 | |
| JPH08305795A (ja) | 文字認識方法 | |
| KR100295360B1 (ko) | 쉐이딩알고리즘을이용한영상처리방법 | |
| CN112200053A (zh) | 一种融合局部特征的表格识别方法 | |
| JP2004094427A (ja) | 帳票画像処理装置及び該装置を実現するためのプログラム | |
| JP4409713B2 (ja) | 文書画像認識装置及び記録媒体 | |
| JPH02116987A (ja) | 文字認識装置 | |
| JPH0916715A (ja) | 文字認識装置および方法 | |
| JPH01244587A (ja) | 文字切出し装置 | |
| JP3187894B2 (ja) | 文書画像傾き検出方法 | |
| JP3645403B2 (ja) | 文字読取装置および文字読取方法 | |
| CN119007227B (zh) | 档案数字化处理中的高精度ocr识别与自动纠错方法 |