[go: up one dir, main page]

JPS63143685A - Recognition result display method in character recognition device - Google Patents

Recognition result display method in character recognition device

Info

Publication number
JPS63143685A
JPS63143685A JP61291301A JP29130186A JPS63143685A JP S63143685 A JPS63143685 A JP S63143685A JP 61291301 A JP61291301 A JP 61291301A JP 29130186 A JP29130186 A JP 29130186A JP S63143685 A JPS63143685 A JP S63143685A
Authority
JP
Japan
Prior art keywords
word
character
recognition
spell
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61291301A
Other languages
Japanese (ja)
Inventor
Toshiaki Morita
森田 敏昭
Minehiro Konya
峰弘 紺矢
Hideaki Tanaka
秀明 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP61291301A priority Critical patent/JPS63143685A/en
Publication of JPS63143685A publication Critical patent/JPS63143685A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は文字認識装置における認識結果表示方法に関
する。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a recognition result display method in a character recognition device.

(技術背景) 文書の文字情報をコンピュータ処理により認識する文字
認識装置として、認識しようとする文字情報、例えば英
数字を光電変換し、該光電変換された電気信号を1文字
型位で切り出し、認識部において所定の認識論理に従っ
て1文字ずつ認識を行う、光学式文字読取装置(OCR
)が知られている。
(Technical Background) As a character recognition device that recognizes character information in a document through computer processing, the character information to be recognized, for example, alphanumeric characters, is photoelectrically converted, and the photoelectrically converted electrical signal is cut out into one character type and recognized. The optical character reader (OCR) recognizes each character one character at a time according to predetermined recognition logic.
)It has been known.

この種の文字認識装置において、従来は認識された文字
の正続率が低くて疑わしいと判定、いわゆるリジェクト
(否定)された場合、陰極線管(CRT)等を用いた表
示部にリジェクトされた文字のみが点滅又は反転表示さ
れ、操作者は該表示を見ながら当該リジェクト文字を原
稿と照合して確認しつつキーボード等の修正手段を介し
てリジェクト文字の修正を行っていた。
In this type of character recognition device, conventionally, when a recognized character has a low correctness rate and is judged to be suspicious, so-called rejected, the rejected character is displayed on a display unit using a cathode ray tube (CRT), etc. The operator corrects the rejected characters using a correction means such as a keyboard while checking the display and comparing the rejected characters with the original.

しかしながら、上記従来の方法は、原理的に1文字型位
で認識処理した結果を表示するものであるから、一般に
認識率が低く、即ちリジェクト頻度も高く、したがって
修正に多大な手間を要し、認識作業能率がいま1つ不満
足なものであった。
However, since the above-mentioned conventional method basically displays the result of recognition processing for one character type, the recognition rate is generally low, that is, the rejection frequency is high, and therefore, a great deal of effort is required for correction. The recognition work efficiency was still unsatisfactory.

(解決しようとする課M) 本発明は上記問題点に鑑みてなされたもので、認識され
た文字列を単語単位でスペルチェックおよびスペルコレ
クト処理を行って認識結果の修正作業を有効に低減する
とともに該修正作業能率を向上させて認識作業の高能率
化を図ることが出来る、文字認識装置における認識結果
表示方法を提供することを目的とする。
(Section M to be solved) The present invention has been made in view of the above problems, and performs spell check and spell correct processing on recognized character strings word by word to effectively reduce the work of correcting recognition results. It is also an object of the present invention to provide a recognition result display method in a character recognition device, which can improve the efficiency of the correction work and make the recognition work highly efficient.

(構成) 上記目的を達成するために、本発明の認識結果表示方法
は認識部において一文字毎に認識された結果を表示部に
表示するに当たり、上記認識部からの認識された文字列
を単語毎に切り出し、切り出された単語毎にスペルチェ
ックおよびスペルコレクト処理を行い、上記スペルチェ
ック処理の結果、該当する単語の存在が否定されたとき
当該単語の全文字を反転表示し、スペルコレクト処理に
より修正された単語の全文字にアンダーラインを付して
表示することを特徴とするものである。
(Structure) In order to achieve the above object, the recognition result display method of the present invention displays the recognized character string from the recognition unit word by word when displaying the result recognized character by character in the recognition unit on the display unit. Spell check and spell correct processing are performed for each extracted word, and when the existence of the corresponding word is denied as a result of the spell check processing, all characters of the word are highlighted and corrected by spell correct processing. This feature is characterized by displaying all characters of the word with an underline.

以下に、本発明を添付図面とともに説明する。The present invention will be explained below with reference to the accompanying drawings.

(実施例) 第1図は本発明の認識結果表示方法を適用出来る光学式
文字読取装置(OCR)のブロック図を示す。
(Embodiment) FIG. 1 shows a block diagram of an optical character reader (OCR) to which the recognition result display method of the present invention can be applied.

第1図において、1は入力部で、この入力部1は例えば
C0D(電荷結合デバイス)を用いた光電変換式イメー
ジキャスナ−2と画像メモリ3を有する。このイメージ
キャスナ−2は図示しない原稿台に載置された文書の、
例えば英数文字画像を読み取って光電変換し、該文字画
像を表す電気信号を画像メモリ3に格納する。
In FIG. 1, reference numeral 1 denotes an input section, and this input section 1 has a photoelectric conversion type image caster 2 using, for example, a C0D (charge-coupled device) and an image memory 3. This image caster 2 can scan documents placed on a document table (not shown).
For example, an alphanumeric character image is read and photoelectrically converted, and an electrical signal representing the character image is stored in the image memory 3.

5は例えばマイクロコンピュータを用いた文字認識部で
、図示しないROM(リード・オンリー・メモリ)に格
納された認識論理式にしたがって人力部lからの文字情
報の認識を行う。
Reference numeral 5 denotes a character recognition section using, for example, a microcomputer, which recognizes character information from the human power section 1 according to a recognition logic formula stored in a ROM (read only memory), not shown.

文字認識部5の1行切り出し部6において、画像メモリ
3内の画像信号は公知の方法で1行革位で切り出し、い
わゆる、セグメンテーションが行なわれ、この切り出さ
れた文字情報が1行メモリ7に蓄積される。
In the one-line cutting section 6 of the character recognition section 5, the image signal in the image memory 3 is cut out at one-line intervals using a known method, so-called segmentation is performed, and this cut-out character information is stored in the one-line memory 7. be done.

この1行メモリ7に蓄積された文字情報は、1文字切り
出し部8において例えば画像濃淡ヒストグラム等を用い
て解析された各文字間の間隔情報に基づき1文字毎切り
出される。そしてこの切り出された各文字は、1文字認
識部9において所定の英数字を記憶した文字辞書10を
参照しつつ1文字単位で認識され、単語メモリ11へ送
られる。また、上記1行メモリ7からの文字情報出力は
同時に単語切り出し部12にも送られ、この単語切り出
し部■2において抽出された単語間の区切り情報に基づ
ぎ、上記1文字認識部9からの各文字が上記単語メモリ
11において単語単位で蓄積される。
The character information stored in the one-line memory 7 is extracted character by character by a character extraction unit 8 based on the interval information between each character analyzed using, for example, an image density histogram. Each of the extracted characters is then recognized character by character in the character recognition section 9 while referring to a character dictionary 10 storing predetermined alphanumeric characters, and sent to the word memory 11. Further, the character information output from the one-line memory 7 is simultaneously sent to the word segmentation unit 12, and based on the delimiter information between words extracted in the word segmentation unit 2, the character information output from the one-character recognition unit 9 Each character is stored in the word memory 11 in units of words.

15は単語のスペルチェックおよびスペルコレクト処理
を行う言語処理部で、スペルチェック部16、単語辞書
17およびスペルコレクト部18から構成される。
Reference numeral 15 denotes a language processing section that performs word spell checking and spell correcting processing, and is composed of a spell checking section 16, a word dictionary 17, and a spell correcting section 18.

上記単語メモリ11から言語処理部15のスペルチェッ
ク部16に逐次単語が読み出され、このスペルチェック
部16において読み出された単語に対するスペルチェッ
ク処理が行なわれる。このスペルチェック処理は単語メ
モリ11から読み出された単語が予め所定の英単語を記
憶した単語辞書17内に蓄積されたものと完全に一致し
たものが存在するかどうかを判定して行なわれる。
Words are sequentially read from the word memory 11 to the spell check section 16 of the language processing section 15, and the spell check section 16 performs spell check processing on the read words. This spell check processing is performed by determining whether or not a word read out from the word memory 11 completely matches a word stored in a word dictionary 17 that stores predetermined English words.

このスペルチェック部16における1回目のスペルチェ
ック結果が“ノー”と判定、即ちリジェクト(否定)さ
れると、スペルコレクト部18が作動する。
When the first spell check result in the spell check section 16 is determined to be "no", that is, it is rejected, the spell correct section 18 is activated.

このスペルコレクト部18は上記1文字認識部9におけ
る各文字の認識率データ等に基づいて当該リジェクトさ
れた単語を構成する文字のうち認識率の低い文字の修正
を行って複数の単語候補を選定する。例えば、正続率の
高い順に第1位から第5位までの5つの単語候補の選定
が行なわれる。この単語候補を選定する処理は本明細書
においてコレクト処理という。
This spell correcting unit 18 selects a plurality of word candidates by correcting characters with a low recognition rate among the characters that make up the rejected word based on the recognition rate data of each character in the single character recognition unit 9. do. For example, five word candidates are selected from first to fifth in order of successive success rates. This process of selecting word candidates is referred to as a collect process in this specification.

上記コレクト処理により選定された全ての単語候補がス
ペルチェック部16においてリジェクト(否定)される
と、当該認識結果を表す単語の存在する可能性がないと
して当該単語がリジェクトされ20は文字認識結果の表
示及び該結果データの出力を行う出力部である。この出
力部20の出力メモリ21に上記スペルチェック部16
における処理結果、即ち認識処理結果が記憶され、該認
識結果は例えば陰極線管(CRT)を用いた表示部22
に表示されるとともに、例えば翻訳機、ワードプロセッ
サ等の当該認識装置の外部の機器24に送出される。上
記出力メモリ21はキーボード等を用いたスペル修正手
段23と接続され、操作者は該スペル修正手段23を介
して上記表示部22の表示画面に映し出された単語の文
字画像を見ながらそのスペルを随意に修正できるように
なっている。
When all the word candidates selected by the above-mentioned correcting process are rejected by the spell check section 16, the word is rejected as there is no possibility that a word representing the recognition result exists, and the word 20 is rejected based on the character recognition result. This is an output unit that displays and outputs the result data. The spell check section 16 is stored in the output memory 21 of this output section 20.
The processing result, that is, the recognition processing result is stored, and the recognition result is displayed on the display section 22 using, for example, a cathode ray tube (CRT).
and is sent to a device 24 external to the recognition device, such as a translator or word processor. The output memory 21 is connected to a spelling correction means 23 using a keyboard or the like, and the operator spells the word while looking at the character image of the word displayed on the display screen of the display section 22 via the spelling correction means 23. It can be modified at will.

次に、本発明の認識結果表示方法を第2図の動作フロー
チャートとともに説明する。
Next, the recognition result display method of the present invention will be explained with reference to the operational flowchart of FIG.

ステップlにおいて、上記読取装置の図示しない原稿台
に読み取り対象の原稿、例えば、手書き英文書をセット
して認識操作を開始すると、イメージキ干スナ−2を介
して上記文書面の画像読み取りが行なわれ、読み取られ
た文字情報を表す信号が画像メモリ3に人力される。
In step 1, when a document to be read, for example, a handwritten English document, is set on the document table (not shown) of the reading device and a recognition operation is started, an image of the document surface is read through the image scanner 2. , a signal representing the read character information is manually input to the image memory 3.

ステップ2において、上記画像メモリ3内の画像情報が
読み出され、1行切り出し部6において公知の方法で1
行革位で切り出し又はセグメンテーションが行なわれ、
さらに文字情報の1文字単位での切り出しが行なわれる
。この1文字単位で切り出された各文字は公知の方法で
文字辞書10を参照しながら認識処理される。
In step 2, the image information in the image memory 3 is read out, and the one-line cutout unit 6 uses a known method to
Extraction or segmentation is performed at administrative reform level,
Further, the character information is cut out character by character. Each character cut out in single character units is recognized by a known method while referring to the character dictionary 10.

ステップ3において、上述したように1文字毎に認識さ
れた文字列が単語切り出し部12を介して公知の方法で
単語単位で切り出しが行なわれ、切り出された各単語は
単語メモリ11に格納される。
In step 3, the character string recognized character by character as described above is segmented word by word by a known method via the word segmentation unit 12, and each segmented word is stored in the word memory 11. .

ステップ4において、上記単語メモリ11から言語処理
部15のスペルチャック部16に1単語づつ読み出され
スペルチェック処理が行なわれる。このスペルチェック
処理は読み出された単語の全文字と完全に符合した単語
が単語辞書17内に存在するかどうかを判定することに
より行なわれる。このスペルチェック処理の結果、“有
”であれば、ステップ5において当該単語が正しく認識
されたとしてスペリングの修正を全く行うことなくその
イメージが表示部22に表示される。
In step 4, each word is read out from the word memory 11 to the spell check section 16 of the language processing section 15 and spell check processing is performed. This spell check processing is performed by determining whether a word that completely matches all the characters of the read word exists in the word dictionary 17. If the result of this spell check process is "Yes", the word is recognized correctly in step 5, and its image is displayed on the display unit 22 without any spelling correction.

一方、ステップ4におけるスペルチェック処理の結果、
“無”と判定されると、ステップ6においてコレクト処
理が行なわれ、可能性もしくは蓋然性の高い単語候補の
選定が行なわれる。このコレクト処理は言語処理部15
のスペルコレクト部18において実行される。
On the other hand, as a result of the spell check process in step 4,
If it is determined to be "absent", a collect process is performed in step 6, and word candidates with high possibility or probability are selected. This collection process is performed by the language processing unit 15.
This is executed in the spell correcting section 18 of.

上記スペルコレクト処理により選定された全単語候補は
ステップ7において上述したと同様にしてスペルチェッ
ク処理され、可能性のある単語の検索が実行される。こ
の検索の結果、可能性のある単語を発見、即ち、上記単
語辞書17内に登録されているいずれかの単語と完全に
符合した単語候補を発見した場合、ステップ8において
表示部22に該単語候補の全文字にアンダーラインを付
して表示される。一方、可能性のある単語を発見出来な
かった場合、ステップ9において表示部22に当該スペ
ルコレクト処理を行う前の単語の全文字即ち、当該単語
単位の認識結果が反転表示される。
All word candidates selected by the spell correcting process are spell checked in step 7 in the same manner as described above, and a search for possible words is performed. As a result of this search, if a possible word is found, that is, a word candidate that completely matches any of the words registered in the word dictionary 17, the word is displayed on the display section 22 in step 8. All candidate characters are displayed with an underline. On the other hand, if a possible word cannot be found, in step 9, all the characters of the word before the spell correcting process, that is, the recognition results for each word, are displayed in reverse on the display section 22.

上記ステップ8および9におけるアンダーラインを付し
た表示例(A)および反転表示例(B)を第3図に示す
FIG. 3 shows an underlined display example (A) and an inverted display example (B) in steps 8 and 9 above.

なお、上記実施例においては認識対象の文字は英数字と
したが適宜な認識論理式を用いることにより、漢字・か
な文字に対しても適用可能である。
In the above embodiment, the characters to be recognized are alphanumeric characters, but by using an appropriate recognition logical formula, the present invention can also be applied to kanji and kana characters.

(効果) 以上の説明から明らかなように、本発明によれば認識さ
れた文字列を単語単位でスペルチェックおよびスペルコ
レクト処理を行って略完全な誤認識の文字を含む単語と
自動的に修正された正続率の高い単語とに区別し、操作
者による修正作業を単語単位で行うようにしたから、従
来方法の文字単位で修正を行うものに比べ有効に修正作
業を軽減することが出来る。
(Effects) As is clear from the above description, according to the present invention, recognized character strings are spell-checked and spell-corrected word by word, and words containing almost completely misrecognized characters are automatically corrected. Since the operator is able to perform correction work on a word-by-word basis, the correction work can be effectively reduced compared to the conventional method, which corrects on a character-by-character basis. .

また、略完全な誤認識を含む単語を反転表示する一方、
自動的に修正された正続率の高い、換言すれば可能性の
ある単語にアンダーラインを付して表示するようにした
から、操作者は表示画面を一見するだけで所要の作業を
迅速に実行することが出来、したがって認識作業能率を
有効に高めることが出来る。
In addition, while highlighting words that include almost completely misrecognized words,
Words with a high success rate (in other words, words that are likely to be correct) are automatically corrected and displayed with an underline, allowing the operator to quickly perform the required tasks with just a glance at the display screen. Therefore, the efficiency of recognition work can be effectively increased.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の方法を適用できる光学式文字読取装置
のブロック図、 第2図は本発明の方法を使用した上記第1図の装置の動
作フローチャート、 第3図は本発明を使用した際の第1図の装置の表示部に
おける反転表示およびアンダーライン(−j記表示例を
示す。 1・・・人力部、5・・・認識部、 6・・1行切り出し部、8・・・・1文字切り出し部、
9・・・1文字認識部、10・・・文字辞書、12・・
・単語切り出し部、15・・・言語処理部、16・・・
スペルチェック部、I7・・・単語辞書、18・・・ス
ペルコレクト部、20・・・出力部、22・・・表示部
、23・・・修正手段、24・・・外部機器、A・・・
アンダーライン表示、B・・・反転表示。
Fig. 1 is a block diagram of an optical character reading device to which the method of the present invention can be applied, Fig. 2 is an operation flowchart of the device shown in Fig. 1 using the method of the present invention, and Fig. 3 is a block diagram of an optical character reading device to which the method of the present invention is applied. Examples of inverted display and underline (-j) display on the display section of the apparatus shown in FIG.・・1 character cutting part,
9...1 character recognition unit, 10...character dictionary, 12...
・Word extraction unit, 15...Language processing unit, 16...
Spell check section, I7... Word dictionary, 18... Spell correct section, 20... Output section, 22... Display section, 23... Correction means, 24... External device, A...・
Underline display, B...Reverse display.

Claims (1)

【特許請求の範囲】[Claims] (1)認識部において一文字毎に認識された結果を表示
部に表示するに当たり、 上記認識部からの認識された文字列を単語毎に切り出し
、 切り出された単語毎にスペルチェックおよびスペルコレ
クト処理を行い、 上記スペルチェック処理の結果、該当する単語の存在が
否定されたとき当該単語の全文字を反転表示し、スペル
コレクト処理により修正された単語の全文字にアンダー
ラインを付して表示することを特徴とする文字認識装置
における認識結果表示方法。
(1) In order to display the results recognized character by character in the recognition unit on the display unit, the recognized character string from the recognition unit is cut out word by word, and spell check and spell correction processing is performed for each word cut out. and when the existence of the corresponding word is denied as a result of the spell check process, all the letters of the word are displayed in reverse video, and all the letters of the word corrected by the spell correct process are displayed with an underline. A recognition result display method in a character recognition device characterized by:
JP61291301A 1986-12-05 1986-12-05 Recognition result display method in character recognition device Pending JPS63143685A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61291301A JPS63143685A (en) 1986-12-05 1986-12-05 Recognition result display method in character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61291301A JPS63143685A (en) 1986-12-05 1986-12-05 Recognition result display method in character recognition device

Publications (1)

Publication Number Publication Date
JPS63143685A true JPS63143685A (en) 1988-06-15

Family

ID=17767120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61291301A Pending JPS63143685A (en) 1986-12-05 1986-12-05 Recognition result display method in character recognition device

Country Status (1)

Country Link
JP (1) JPS63143685A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008065573A (en) * 2006-09-07 2008-03-21 Asuka Corporation:Kk Order card OCR reading result automatic correction system
US12429491B2 (en) 2020-11-23 2025-09-30 Roche Diagnostics Operations, Inc. Laboratory sample distribution system and laboratory automation system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008065573A (en) * 2006-09-07 2008-03-21 Asuka Corporation:Kk Order card OCR reading result automatic correction system
US12429491B2 (en) 2020-11-23 2025-09-30 Roche Diagnostics Operations, Inc. Laboratory sample distribution system and laboratory automation system

Similar Documents

Publication Publication Date Title
US7106905B2 (en) Systems and methods for processing text-based electronic documents
JP3427692B2 (en) Character recognition method and character recognition device
KR100412317B1 (en) Character recognizing/correcting system
KR20190123790A (en) Extract data from electronic documents
JP2713622B2 (en) Tabular document reader
JP3485020B2 (en) Character recognition method and apparatus, and storage medium
US5909509A (en) Statistical-based recognition of similar characters
JPH08180068A (en) Electronic filing equipment
JPS63143685A (en) Recognition result display method in character recognition device
JPS63146187A (en) Character recognizing device
JPS63143684A (en) How to correct recognition results in a character recognition device
JPH07182441A (en) Character recognition device
JP2001147990A (en) Image data processing apparatus and method, and storage medium used therefor
JPH05120471A (en) Character recognizing device
JP2746345B2 (en) Post-processing method for character recognition
JP2939945B2 (en) Roman character address recognition device
JPH05210635A (en) Input device
JP3243389B2 (en) Document identification method
JPH11232381A (en) Character reader
JP3064508B2 (en) Document recognition device
JPH06139277A (en) Electronic dictionary device
JP2000020638A (en) Character string direction discriminating method
JPH0713999A (en) Table recognition device
JPH0589279A (en) Character recognition device
JPS61198383A (en) Character correcting device