[go: up one dir, main page]

JPH01237778A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH01237778A
JPH01237778A JP63063440A JP6344088A JPH01237778A JP H01237778 A JPH01237778 A JP H01237778A JP 63063440 A JP63063440 A JP 63063440A JP 6344088 A JP6344088 A JP 6344088A JP H01237778 A JPH01237778 A JP H01237778A
Authority
JP
Japan
Prior art keywords
pattern
recognition
character
value
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63063440A
Other languages
English (en)
Inventor
Kiyomichi Kurino
栗野 清道
Kazumi Suzuki
和美 鈴木
Takeyuki Sugimoto
杉本 建行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63063440A priority Critical patent/JPH01237778A/ja
Publication of JPH01237778A publication Critical patent/JPH01237778A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字認識方法にかかり、特に類似文字の識別に
好適な文字認識方法に関する。
[従来の技術] 従来の文字認識方法においては、帳票等に記入された文
字を認識する場合、認識すべき文字を標準パターンとし
て認識装置に登録しておき、未知の文字パターンを標準
パターンと比較し、!I合のとれた標準パターンを認識
結果として出力している。
近年の文字認識装置は、認識性能の向上により標準字形
の文字のみならず、例えば第6図に示すような類似文字
も認識できる装置が実現されている。この種の文字認識
装置は、文字の構造や特徴を詳細に分析し、字形によっ
て類似文字を識別するものである。
このような従来技術としては、例えば東芝レビュー 4
1巻12号(1986)の1014.1015頁に記載
された技術が知られている。
[発明が解決しようとする課題] 一般に、類似文字は記入者による文字の癖(特徴)が特
に激しく、上記した従来技術においては、文字の記入者
による類似文字の特徴について考慮されておらず、カテ
ゴリの異なる類似文字の認識に限界があるという問題点
があった。
この発明は上記した従来技術の問題点に鑑みなされたも
ので、文字の構造や特徴からの識別では限界のある類似
文字の識別を、記入者による文字字形の特徴を考慮する
ことにより可能にする文字認識方法を提供することを目
的とする。
[課題を解決するための手段] この発明の文字認識方法は、未知の入力パターンと標準
パターンとを比較して整合性の良い標準パターンを候補
文字パターンとして求め、求めた候補文字パターンの示
すカテゴリの中から認識結果を定めて出力する文字認識
方法に適用されるものであり、特に標準パターン毎に、
その標準パターンが認識結果として出力された回数を計
数して第1の値とし、更にその標準パターンが示すカテ
ゴリが認識結果として出力された回数を計数して第2の
値とし、第1の値を第2の値で除算して第3の値を求め
て記憶し、候補文字パターンとして選定された標準パタ
ーンが示すカテゴリについて、上記候補文字パターンを
除いた当該カテゴリを示す標準パターンの全てについて
上記第3の値を参照し、参照した結果上記第3の値が所
定の値を越えている場合、その候補文字パターンを候補
から削除することを特徴としている。
[作用コ この発明は、第2図(a)= (b)、 (c)に示す
ように、記入文字の書体は記入者によって大きく異なり
、逆に同一記入者の記入文字の書体は同一カテゴリの文
字ならばほぼ同一であることに注目してなされた。もの
である。
即ち、同一カテゴリ内において、ある標準パターンが認
識結果として出力された割合(上記第3の値)があらか
じめ定められた値を越えており、かつ候補文字としてこ
の標準パターンとは別の標準パターンが新たに選択され
たとき、この新たに選択された標準パターンを候補文字
パを一ンから削除するものである。
[実施例] 以下、添付の図、面に示す実施例により、更に詳細に本
発明について説明する。
第3図はこの発明の一実施例を示す光学文字読取装置の
ブロック図である。第3図において、1は帳票搬送機構
1,2は帳票、3は発光源、4は受光素子、5は2値化
回路、6はメモリ、7はマイクロプロセッサから成る切
出し/認識部である。
第3図において、帳票2は帳票搬送機構1によって発光
源3と受光素子4とからなる読取部に搬送される。受光
素子4は、順次入力されるパターンを電気信号に変換し
て出力する。受光素子4としては、−次元半導体CCD
センサ等が用いられる。2値化回路5は、受光素子4か
らの出力信号を所定の閾値によりII l 11.′0
″の2値化信号に変換して、メモリ6に出力する。メモ
リ6は、帳票上のパターンを′1″′、″′0″の2値
画像として記憶するもので、半導体メモリ等が用いられ
る。切出し/認識部7は、メモリ6から出力される2値
画像から文字パターンを一文字毎に切出し、標準パター
ンとの比較を行い、認識結果を出力するものである。
第4図は切出し/認識部7を構成するマイクロプロセッ
サのブロック図である。切出し/認識部7は、演算装置
8と内部ワークメモリ9と外部インタフェースアダプタ
10と共通バス11とからなる。
演算装置81よ、メモリ6内の2値化画像を内部プログ
ラムを実行することにより、切出し・認識し、結果を外
部インタフェースアダプタ11を介して外部へ出力する
。内部ワークメモリ9は、切出し・認識処理に必要なデ
ータや結果を格納すると共に、標準パターンを格納する
ための辞書メモリとしても使用される。
第1図は、切出し/認識部7における類似文字認識の動
作を示すフローチャー1−である、第5図(a)〜(f
)は、第1図に示す類似文字認識の動作の具体例を示す
図である。第1図のステップ100において、−文字と
して切出された文字パターンの認識処理を行う、認識処
理は、あらかじめ登録された標準パターンと未知の文字
パターンとを比較し、整合のとれた標準パターンを認識
結果として出力する。第5図(a)に示す具体例では、
文字パターンP0が数字の“1″ゝとも7 #lとも判
断がつかず、認識処理の結果として、第5図(b)に示
すように2つの候補文字パターンS 119 Stzが
出力される。ここで、候補文字パターンS 11はカテ
ゴリII 113に対して複数個準備された候補文字パ
ターンの一つであり、また候補文字パターンStXはカ
テゴリIt 7 ++に対して複数個準備された候補文
字パターンの一つである。従来技術ではこのような場合
、字形だけでは判断できないため、認識結果として認識
不能を示すコードが出力された。
しかし、この実施例においては、ステップ200におい
て、候補文字パターンが2つ以上あるか否か。
即ち候補文字パターンに類似候補パターンが存在するか
否かが判断される。候補文字パターンが一つであり、類
似候補パターンが存在しないと判断された場合には、ス
テップ600において直ちにこの候補文字パターンを認
識結果として出力する。
第5図(b)に示す実施例においては、候補文字パター
ンは2つであるため、類似候補パターンが存在すると判
断され、ステップ300に進む。
ステップ300においては、複数の候補文字パタ′−ン
の一つについて、その候補文字パターンの文字が別の候
補文字パターン(標準パターン)ですでに認識されてい
るか否か、認識されている場合にはそのa4パターンに
ついての認識出力値Nを参照し、認識出力値Nが一定の
基準値、例えば0.5を越えているか否かを判断する。
第5図(c)に示す具体例においては、文字゛′1”に
ついて、既に候補文字パターンS1を以外の候補文字パ
ターン(標準パターン)によって文字認識されたか否か
が判断され、この判断は第4図に示す切出し/認識部7
内の内部ワークメモリ9に記憶されている認識出力値N
を参照して行われる。ここで、認識出力値Nとは、その
標準パターンによって文字認識された回数をそのカテゴ
リが認識出力された合計回数で割った値である。第5図
(C)に示す具体例の場合、標準パターンS i 1に
ついての認識出力値Nは1/3である。ここで、認識出
力値Nの分母(3)は、カテゴリ′″1″が今までに認
識出力された合計回数を示し、分子(1)は標準パター
ンSユ、が今までにカテゴリat 1 ++として認識
出力された合計回数を示す。この場合には、カテゴリ1
11 ++が標準パターンS工、によって既に1回読み
出され、かつカテゴリIt 1 ++は合計3回読み出
されていることを意味する。従って、この場合には。
候補文字パターンS工、は、候補文字パターンS工。
の認識出力値Nが1/3であり、0.5を越えていない
。ステップ300において、認識出力値Nが0.5を越
えていないと判断された場合には、ステップ500に進
み、全ての候補文字パターンについてチエツクが終了し
たか否かが判断される。候補文字パターンの認識出力値
Nが0.5を越えていると判断された場合には、ステッ
プ400に進み、ステップ100で認識された当該候補
文字パターンを候補から削除する処理を行う。
この実施例においては、上記したように認識出力値Nが
0.5以上の場合、その候補文字バター゛ンを候補文字
から削除する処理を行うように設定していたが、この様
な場合には、その候補文字パターンは誤認識されている
可能性が大であるからである。即ち、同一記入者が記入
した同一文字は類似しており、同一の標準パターンで認
識されることが多いからである。
ステップ400における処理が終了した後、ステップ5
00に進み、全ての候補文字パターンについてチエツク
が終了したか否かが判断される。
ステップ500において、全ての候補文字パターンにつ
いて処理が終了していないと判断された場合には、ステ
ップ300へもどり、上記の処理を繰り返し行う、第5
図(c)に示す具体例の場合には、カテゴリ″′7″の
候補文字パータンS vtについてステップ300.4
00の処理が行われる1図示するように、候補文字パタ
ーンS fflの場合には、標準パターンst*の認t
im力値Nが8/8’t’あLJo、5をMえているた
め、第5図(d)に示すように、候補文字パターンSt
tはステップ400において候補から削除される。
ステップ500において全ての候補文字パターンについ
てチエツクが終了したと判断された場合には、ステップ
600に進み、ステップ400で削除されなかった候補
文字パターンに該当するカテゴリの文字を認識結果とし
て出力する。上記具体例の場合には、第5図(e)に示
すように、認識結果としてII 1 #lが出力される
次に、ステップ700において、第4図に示す切出し/
認識部7内の内部ワークメモリ9の認識出力値Nの後進
を行って処理を終了する。
尚、上記実施例において、認識出力値Nを新しい帳票を
処理する毎に0にクリアするように設定しても良いし、
またクリアする条件を書式情報等によってあらかじめ設
定するようにしても良い。
また、類似文字の判別は、帳票上の全ての文字を読み取
った後に行っても良い。
また、ステップ400において削除した候補文字の標準
パターン、又は認識出力値Nが所定値を越えた標準パタ
ーン以外の標準パターンを、ステップ100の認識処理
において読み取り無効とし、読み取り対象の候補文字か
ら除去するようにしても良い、この場合、記入者または
記入条件が変わった時点で無効とした標準パターンを有
効とすればよい、さらに、無効とする標準パターンは候
補文字パターンから選択しているが、認識結果として出
力されたa準パターンと別学形の同一カテゴリ内の標準
パターンとしてもよい。
このように本発明の実施例によれば、字形のみでは判別
不能な文字でも、記入者の文字出現傾向を知ることによ
って読み取りが可能となり、人間の能力に近い文字の認
識ができる。
[発明の効果] 本発明によれば、記入者の文字の傾向を認識出力された
標準パターンから判別し1字形のみでは識別できない類
似文字でも読み取りできるので。
記入文字の制限を一般伝票と同じレベルまで緩和するこ
とができる。
また、手書数字のように米国・西独規格等で字形が異な
るものでも、辞書構成を変えることなく(特に類似文字
について)読み取りが可能なため、米国等のように上記
の両規格が混用される地域での文字認識装置の普及が容
易となる効果がある。
さらに9字形の異なる印刷活字の読み取りのため多数の
標準パターンから構成した辞書により。
複数の活字フォントの読み取りを行うマルチフォント読
み取り等においても、各フォント間で類似文字になる字
形があっても、同一フォント内で類似する文字がなけれ
ば、ra、別が可能となる。この場合、無効な標準パタ
ーンを読取対象から除外すれば、読取時間についても高
速化できる。
【図面の簡単な説明】
第1図はこの発明の文字認識方法を実施する一例を示す
フローチャート、第2図(a)l Cb)* (c)及
び第6図は類似文字の記入例を示す図、第3図はこの発
明が適用される文字認識装置の一例を示す図、第4図は
第3図に示す切出し/認識部7の具体例を示すブロック
図、第5図(a)、 (b)、 (c)。 (d)、 (e)、 (f)は第1図に示すフローチャ
ートの処理の具体例を示す図である。 5・・・2値化回路、6・・・メモリ、7・・・切出し
/認識部、8・・・演算装置、9・・・内部ワークメモ
リ。 代理人 弁理士  秋 本 正 実 第1図 第2図 第3図 第4図 第 6 図 ”1”  ”7” 第5図

Claims (1)

  1. 【特許請求の範囲】 1、未知の入力パターンと標準パターンとを比較して整
    合性の良い標準パターンを候補文字パターンとして求め
    、求めた候補文字パターンの示すカテゴリの中から認識
    結果を定めて出力する文字認識方法において、標準パタ
    ーン毎に、その標準パターンが認識結果として出力され
    た回数を計数して第1の値とし、更にその標準パターン
    が示すカテゴリが認識結果として出力された回数を計数
    して第2の値とし、第1の値を第2の値で除算して第3
    の値を求めて記憶し、候補文字パターンとして選定され
    た標準パターンが示すカテゴリについて、上記候補文字
    パターンを除いた当該カテゴリを示す標準パターン毎に
    上記第3の値を参照し、参照した結果上記第3の値が所
    定の値を越えている場合、その候補文字パターンを候補
    から削除することを特徴とする文字認識方法。 2、前記削除された候補文字パターンが、次回以後の文
    字認識において、認識対象から除外されることを特徴と
    する請求項1記載の文字認識方法。 3、ある標準パターンについて、前記第3の値が所定値
    を越えたとき、当該標準パターンが示すカテゴリにおい
    て、当該標準パターンを除く全ての標準パターンを次の
    文字認識の認識対象から除外することを特徴とする請求
    項1記載の文字認識方法。
JP63063440A 1988-03-18 1988-03-18 文字認識方法 Pending JPH01237778A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63063440A JPH01237778A (ja) 1988-03-18 1988-03-18 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63063440A JPH01237778A (ja) 1988-03-18 1988-03-18 文字認識方法

Publications (1)

Publication Number Publication Date
JPH01237778A true JPH01237778A (ja) 1989-09-22

Family

ID=13229323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63063440A Pending JPH01237778A (ja) 1988-03-18 1988-03-18 文字認識方法

Country Status (1)

Country Link
JP (1) JPH01237778A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5459305A (en) * 1991-09-20 1995-10-17 Eriksson; Lennart Method and system for decentralized individual attendance data and control

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5459305A (en) * 1991-09-20 1995-10-17 Eriksson; Lennart Method and system for decentralized individual attendance data and control

Similar Documents

Publication Publication Date Title
US6834121B2 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
JPH01237778A (ja) 文字認識方法
JPH06290251A (ja) 電子ファイル装置の文書画像処理方法
JP3188154B2 (ja) 文字認識処理方法
JPH0256086A (ja) 文字認識の後処理方法
JPH01191992A (ja) 文字認識装置
JP2902694B2 (ja) 光学式文字読取装置
JP2868392B2 (ja) 手書き記号認識装置
JP2746345B2 (ja) 文字認識の後処理方法
JP3220226B2 (ja) 文字列方向判別方法
JPH0357509B2 (ja)
JPS6095689A (ja) 光学的文字読取装置
JP2871157B2 (ja) 指紋登録照合方法
JPH0475556B2 (ja)
JP2784004B2 (ja) 文字認識装置
JPS6111886A (ja) 文字認識方式
JP2972443B2 (ja) 文字認識装置
JPH01201789A (ja) 文字読取装置
JPS60138689A (ja) 文字認識方法
JPS63316288A (ja) 文字認識装置
JP2570311B2 (ja) 文字列認識装置
JPH0426153B2 (ja)
JPH03122786A (ja) 光学的文字読取装置
JPH0378892A (ja) 表形式文書の認識装置
JPH0746363B2 (ja) 図面読取装置