[go: up one dir, main page]

JP2003162689A - Similar character recognition program and similar character recognition method - Google Patents

Similar character recognition program and similar character recognition method

Info

Publication number
JP2003162689A
JP2003162689A JP2001360520A JP2001360520A JP2003162689A JP 2003162689 A JP2003162689 A JP 2003162689A JP 2001360520 A JP2001360520 A JP 2001360520A JP 2001360520 A JP2001360520 A JP 2001360520A JP 2003162689 A JP2003162689 A JP 2003162689A
Authority
JP
Japan
Prior art keywords
character
candidate
recognition
image
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001360520A
Other languages
Japanese (ja)
Inventor
Koji Kurokawa
浩司 黒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001360520A priority Critical patent/JP2003162689A/en
Publication of JP2003162689A publication Critical patent/JP2003162689A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 本発明は、認識対象の文字から読み取ったイ
メージをもとに文字を認識する類似文字認識プログラム
および文字認識方法に関し、認識対象の類似文字につい
て、基準線と矩形の位置情報や1文字を構成する矩形の
情報などをもとに変換候補にあるときに該当文字に変換
し、判定条件を多くして類似文字の認識率を向上させる
ことを目的とする。 【解決手段】 認識対象の文字から読み取ったイメージ
をもとに文字認識して候補を生成する手段と、読み取っ
た認識対象の文字イメージが基準線よりも下にあり、か
つ候補中に文字jが含まれていたときに文字jと判定す
る手段と、読み取った認識対象の、1つの文字に対応す
る文字イメージが2つ以上に分離し、かつ候補中に文字
iが含まれていたときに文字iと判定する手段としてコ
ンピュータに機能させるための類似文字認識プログラム
および類似文字認識方法である。
(57) Abstract: The present invention relates to a similar character recognition program and a character recognition method for recognizing a character based on an image read from a character to be recognized. It is an object of the present invention to convert a candidate character based on the position information, the information of a rectangle constituting one character, etc., into a corresponding character when the candidate is a conversion candidate, to increase the determination conditions, and to improve the recognition rate of similar characters. SOLUTION: A means for generating a candidate by performing character recognition based on an image read from a character to be recognized, and a method in which the read character image to be recognized is below a reference line and a character j is included in the candidate Means for determining a character j when the character is included, and a character when the character image corresponding to one character of the read recognition target is separated into two or more and the character i is included in the candidate. A similar character recognition program and a similar character recognition method for causing a computer to function as means for determining i.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、認識対象の文字か
ら読み取ったイメージをもとに文字を認識する類似文字
認識プログラムおよび類似文字認識方法に関するもので
ある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a similar character recognition program and a similar character recognition method for recognizing a character based on an image read from a character to be recognized.

【0002】[0002]

【従来の技術】従来、英宇類似文字識別は、図5の
(a)に示すように、文字矩形が基準線(文字の下接
線)の上にあるかどうか、一文字がいくつの矩形から構
成されているかなどの特徴により、類似文字の変換を行
っている。例えば、「i」と「j」の判別時には、文字
矩形が基準線(図5の(a−)参照)よりも下にあった
場合は、「j」とし、「i」と「1」(エル)の判別時
には,図5の(a−2)のように1文字矩形内で矩形が
分離している場合は「i」とし、図5の(a−3)のよ
うに1文字矩形が分離していない場合には「j」とす
る、などの単純な変換を行っていた。
2. Description of the Related Art Conventionally, as shown in FIG. 5 (a), the English-U similar character identification is made up of whether or not a character rectangle is on a reference line (bottom tangent line of a character) and how many rectangles each character is. Similar characters are converted according to the characteristics such as whether or not they are used. For example, when the character rectangle is below the reference line (see (a-) in FIG. 5) when determining “i” and “j”, it is set to “j”, and “i” and “1” ( At the time of discrimination of (ell), if the rectangles are separated within the one-character rectangle as shown in (a-2) of FIG. 5, it is set as “i”, and the one-character rectangle is changed as shown in (a-3) of FIG. When not separated, a simple conversion such as “j” was performed.

【0003】また、対象文字の周辺文字の属性を判定
し、周辺文字と同じ属性の文字に対象文字を変換する。
例えば、「1」(数字のイチ)「1」(エル)の判別時
には前後幾つかの文字が英字なのか数字なのかを調査
し、数字であつた場合は「1」(イチ)に、英字であつ
た場合は「1」(エル)に変換するようにしていた。
Further, the attribute of the peripheral character of the target character is determined, and the target character is converted into a character having the same attribute as the peripheral character.
For example, when discriminating "1" (number is right) or "1" (ell), it is checked whether some characters before and after are alphabetic or numeric, and if it is a number, it is changed to "1" (ichi). If so, it was converted to "1" (L).

【0004】[0004]

【発明が解決しようとする課題】このため、入力画像が
図5の(b)に示すような劣化画像であつた場合の文字
形状の変化には対応できないという問題があった。
Therefore, there is a problem that it is not possible to cope with the change in the character shape when the input image is a deteriorated image as shown in FIG. 5B.

【0005】また、一文字矩形の位置、数などの情報に
よる類似文字の変換では、ある程度良好な変換結果を得
られるが、誤変換が多く実用的ではないという問題があ
った。
In addition, conversion of similar characters based on information such as the position and number of one character rectangle gives a somewhat good conversion result, but there is a problem that many conversions are not practical.

【0006】また、従来の上述した手法では、判定条件
が少ないため、1文字矩形が同位置、同数の場合には変
換が行えないなどの問題があった。例えば英宇内での類
似文字は全て属性が英字となってしまい、英宇内の類似
文字識別には不向きであるという問題もあった。
Further, the above-mentioned conventional method has a problem that since the number of judgment conditions is small, conversion cannot be performed when one character rectangle has the same position and the same number. For example, there is a problem that all similar characters in Ei Uchi have an attribute of English, which is not suitable for identifying similar characters in Ei U.

【0007】本発明は、これらの問題を解決するため、
認識対象の類似文字について、基準線と矩形の位置情報
や1文字を構成する矩形の情報などをもとに変換候補に
あるときに該当文字に変換し、判定条件を多くして類似
文字の認識率を向上させることを目的としている。
The present invention solves these problems.
Regarding similar characters to be recognized, when they are candidates for conversion based on the position information of the reference line and the rectangle, the information of the rectangle that forms one character, etc., they are converted to the corresponding character, and the judgment conditions are increased to recognize similar characters. The purpose is to improve the rate.

【0008】[0008]

【課題を解決するための手段】図1を参照して課題を解
決するための手段を説明する。
[Means for Solving the Problems] Means for solving the problems will be described with reference to FIG.

【0009】図1において、文字認識システム1は、認
識対象の文字から読み取ったイメージをもとに文字を認
識するものであって、文字認識手段2および類似文字認
識手段3などから構成されるものである。
In FIG. 1, a character recognition system 1 recognizes a character based on an image read from a character to be recognized, and comprises a character recognition means 2 and a similar character recognition means 3. Is.

【0010】文字認識手段2は、認識対象の文字から読
み取ったイメージについて、文字認識辞書4を検索して
文字認識して候補を生成するものである。
The character recognition means 2 searches the character recognition dictionary 4 for the image read from the character to be recognized and recognizes the character to generate a candidate.

【0011】類似文字認識手段3は、読み取った1文字
に対応するイメージをもとに、類似文字を判定するもの
である。
The similar character recognizing means 3 determines a similar character based on the image corresponding to the read one character.

【0012】次に、動作を説明する。文字認識システム
1を構成する文字認識手段2が認識対象の文字から読み
取ったイメージについて文字認識辞書4を検索して文字
認識して候補を生成し、類似文字認識手段3は読み取っ
た認識対象の文字イメージが基準線よりも下にあり、か
つ候補中に文字jが含まれていたときに文字jと判定し
たり、読み取った認識対象の、1つの文字に対応する文
字イメージが2つ以上に分離し、かつ候補中に文字iが
含まれていたときに文字iと判定するようにしている。
Next, the operation will be described. The character recognition unit 2 included in the character recognition system 1 searches the character recognition dictionary 4 for an image read from a character to be recognized, recognizes the character, and generates a candidate. The similar character recognition unit 3 reads the recognized character to be recognized. When the image is below the reference line and the character j is included in the candidates, it is judged as the character j, or the character image corresponding to one character of the read recognition target is separated into two or more. In addition, when the candidate includes the character i, the character i is determined.

【0013】この際、読み取った認識対象の、1つの文
字に対応するイメージが分離していないのに、候補中に
文字l(エル)が含まれているときに文字l(エル)と
判定するようにしている。
At this time, when the image corresponding to one character of the read recognition target is not separated, but the character l (el) is included in the candidates, it is determined to be the character l (el). I am trying.

【0014】従って、認識対象の類似文字について、基
準線と矩形の位置情報や1文字を構成する矩形の情報な
どをもとに変換候補にあるときに該当文字に変換するこ
とにより、判定条件を多くして類似文字の認識率を向上
させることが可能となる。
Therefore, the similar character to be recognized is converted into the corresponding character when it is a conversion candidate based on the position information of the reference line and the rectangle, the information of the rectangle forming one character, etc. By increasing the number, it is possible to improve the recognition rate of similar characters.

【0015】[0015]

【発明の実施の形態】次に、図1から図4を用いて本発
明の実施の形態および動作を順次詳細に説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Next, embodiments and operations of the present invention will be sequentially described in detail with reference to FIGS.

【0016】図1は、本発明のシステム構成図を示す。
図1において、文字認識システム1は、プログラムに従
い各種処理を実行するものであって、ここでは、認識対
象の文字から読み取ったイメージをもとに文字を認識す
るものであり、文字認識手段2および類似文字認識手段
3などから構成されるものである。
FIG. 1 shows a system configuration diagram of the present invention.
In FIG. 1, a character recognition system 1 executes various processes according to a program, and here, recognizes a character based on an image read from a character to be recognized. It is composed of the similar character recognition means 3 and the like.

【0017】文字認識手段2は、画像入力装置6によっ
て書類などから読み取った認識対象の文字のイメージに
ついて、文字認識辞書4を検索して文字認識して候補を
生成するものである。
The character recognition means 2 searches the character recognition dictionary 4 for the image of the character to be recognized, which is read from the document by the image input device 6, and recognizes the character to generate a candidate.

【0018】類似文字認識手段3は、読み取った1文字
に対応するイメージをもとに、類似文字を判定するもの
である。
The similar character recognizing means 3 determines a similar character based on the image corresponding to the read one character.

【0019】文字認識辞書4は、文字認識する情報(イ
メージに対応する文字情報)を登録したものである。
The character recognition dictionary 4 is for registering character recognition information (character information corresponding to an image).

【0020】出力ファイル5は、認識結果を格納するも
のである。画像入力装置6は、書類に印刷された認識対
象の文字のイメージを読み取るものであって、スキャナ
などである。
The output file 5 stores the recognition result. The image input device 6 reads an image of characters to be recognized printed on a document, and is a scanner or the like.

【0021】出力装置7は、認識した結果を出力するも
のであって、表示装置や印刷装置などである。
The output device 7 outputs the recognition result, and is a display device, a printing device, or the like.

【0022】次に、図2のフローチャートの順番に従
い、図3および図4を用い、図1の構成について詳細に
説明する。
Next, the configuration of FIG. 1 will be described in detail with reference to FIGS. 3 and 4 in the order of the flow chart of FIG.

【0023】図2は、本発明の動作説明フローチャート
を示す。図2において、S1は、画像入力装置で読取
後、文字認識する。これは、図1の画像入力装置である
例えばスキャナが書類に印刷された認識対象の文字のイ
メージを読み取り、読み取ったイメージについて文字認
識辞書4を検索して文字認識を行う。この際、後の処理
で使う、文字イメージの基準線を求めて保存しておく。
これらにより、書類から認識対象の文字のイメージを読
み取り、当該イメージをもとに文字認識辞書4を検索し
て候補文字を生成できたこととなる。
FIG. 2 shows a flowchart for explaining the operation of the present invention. In FIG. 2, in step S1, characters are recognized after being read by the image input device. For example, a scanner, which is an image input device shown in FIG. 1, reads an image of a character to be recognized printed on a document, and the character recognition dictionary 4 is searched for the read image to perform character recognition. At this time, the reference line of the character image to be used in the subsequent processing is obtained and saved.
As a result, the image of the character to be recognized is read from the document, the character recognition dictionary 4 is searched based on the image, and the candidate character can be generated.

【0024】S2は、認識結果が ・I(アイ) ・1(エル) ・j ・i であった文字について以下の処理を行う。At S2, the recognition result is ・ I (eye) ・ 1 (L) ・ J ・ I The following processing is performed on the character that was.

【0025】S3は、基準線よりも下に文字矩形がある
か判別する。YESの場合には、S31に進む。NOの
場合には、S4に進む。
In step S3, it is determined whether or not there is a character rectangle below the reference line. If YES, the process proceeds to S31. If NO, the process proceeds to S4.

【0026】S31は、候補内に「j」があるか判別す
る。YESの場合には、S32で「j」と判定する。N
Oの場合には、S4に進む。
In step S31, it is determined whether "j" is present in the candidates. If YES, it is determined to be "j" in S32. N
If O, go to S4.

【0027】以上のS2、S3,S31,S32からな
る処理1で、基準線よりも下に文字矩形があり、かつ候
補内に「j」があったときに、文字「j」と判定し、認
識条件を多くして認識精度を向上させることが可能とな
る(詳細は、後述する図3の処理1詳細を参照)。
In the process 1 consisting of S2, S3, S31 and S32 described above, when there is a character rectangle below the reference line and there is "j" in the candidates, it is judged as the character "j", It is possible to increase the recognition accuracy by increasing the number of recognition conditions (for details, refer to details of processing 1 in FIG. 3 described later).

【0028】次に、S4は、認識結果が確からしいか判
別する。YESの場合には、確からしい文字と判定す
る。文字認識結果として、例えば正読率が80%以上の
場合に、このときの認識した文字と判定する。NOの場
合には、S5に進む。
Next, in S4, it is determined whether the recognition result is likely. In the case of YES, the character is determined to be probable. For example, when the correct reading rate is 80% or more as the character recognition result, it is determined that the character is recognized at this time. If NO, the process proceeds to S5.

【0029】以上のS4からなる処理2で、処理1の後
に認識結果が確からしい(正読率が例えば80%以上)
のときに当該認識結果と判定することが可能となる(詳
細は、後述する図3の処理2詳細を参照)。
In the process 2 consisting of the above S4, the recognition result is likely after the process 1 (correct reading rate is 80% or more, for example).
At this time, the recognition result can be determined (for details, refer to details of processing 2 in FIG. 3 described later).

【0030】S5は、認識結果の1文字矩形が2つ以上
に分離しているか判別する。YESの場合には、S51
に進む。NOの場合には、S6に進む。
In step S5, it is determined whether the one-character rectangle as the recognition result is separated into two or more. If YES, S51
Proceed to. If NO, the process proceeds to S6.

【0031】S51は、更に、候補内に「i」があるか
判別する。YESの場合には、S5で「i」と判定す
る。NOの場合には、S6に進む。
In step S51, it is further determined whether there is "i" in the candidates. If YES, it is determined to be "i" in S5. If NO, the process proceeds to S6.

【0032】以上のS5、S51,S52からなる処理
3で、認識結果の1文字矩形が2つ以上に分離し、かつ
候補内に「i」があったときに、文字「i」と判定し、
認識条件を多くして認識精度を向上させることが可能と
なる(詳細は、後述する図3の処理3詳細を参照)。
In the process 3 consisting of S5, S51, and S52 described above, when one character rectangle of the recognition result is separated into two or more and there is "i" in the candidate, it is judged as the character "i". ,
It is possible to increase the recognition accuracy by increasing the number of recognition conditions (for details, refer to details of processing 3 in FIG. 3 described later).

【0033】S6は、候補内に「f」または「t」があ
るか判別する。YESの場合には、S61で「f」また
は「t」と判定する。NOの場合には、S7に進む。
In step S6, it is determined whether there is "f" or "t" in the candidates. If YES, it is determined to be "f" or "t" in S61. If NO, the process proceeds to S7.

【0034】以上のS6、S61からなる処理4で、認
識結果内に「f」または「t」があったときに当該
「f」または「t」と判定することが可能となる。
In the process 4 consisting of S6 and S61 described above, it is possible to determine the "f" or "t" when the result is "f" or "t".

【0035】S7は、矩形は分離していないのに、認識
結果が「i」であるか判別する。YESの場合には、S
71に進む。NOの場合には、S8に進む。
In step S7, it is determined whether the recognition result is "i" although the rectangle is not separated. If YES, S
Proceed to 71. If NO, the process proceeds to S8.

【0036】S71は、更に、候補内に「l」(エル)
があるか判別する。YESの場合には、S72で「l」
(エル)と判定する。NOの場合には、S8に進む。
In step S71, "l" (L) is added to the candidates.
Determine if there is. If YES, in S72 "l"
Judge as (L). If NO, the process proceeds to S8.

【0037】以上のS7、S71、S72からなる処理
5で、1文字矩形が分離していないのに認識結果に
「l」(エル)がある場合に、「l」(エル)と判定す
ることが可能となる。
In the process 5 consisting of S7, S71, and S72 described above, if one character rectangle is not separated but "l" (el) is present in the recognition result, it is determined to be "l" (el). Is possible.

【0038】S8は、以上の処理1から処理5で判定し
た結果を出力する。以上のS1からS7などの手順を順
に実行することにより、認識した候補について、更に、
多くの条件を順次適用し、これら条件に適合した文字を
判定することにより、多くの条件で認識判定して認識精
度を向上させることが可能となる。
In step S8, the result determined in the above processing 1 to 5 is output. By sequentially executing the above steps S1 to S7, the recognized candidates are further
By sequentially applying many conditions and determining a character that meets these conditions, it is possible to perform recognition determination under many conditions and improve the recognition accuracy.

【0039】図3および図4は、本発明の説明図を示
す。これら図3および図4中の処理1詳細から処理5詳
細は、既述した図2のフローチャート中の処理1詳細か
ら処理5詳細の具体例をそれぞれ示す。
3 and 4 are explanatory views of the present invention. Details of processing 1 to processing 5 in FIGS. 3 and 4 show specific examples of processing 1 to processing 5 in the flowchart of FIG. 2 described above.

【0040】・処理1詳細:左側の文字矩形の場合であ
って、かつ、 ・図2のS31のYESの例は、 ・第1候補 i ・第2候補 j であり、S32で判定結果「j」となる。
-Details of processing 1: In the case of the character rectangle on the left side, and-Examples of YES in S31 of FIG. 2 are: -first candidate i-second candidate j, and judgment result "j It will be.

【0041】・図2のS31のNOの例は、 ・第1候補 i ・第2候補 l であり、S4へ進む。An example of NO in S31 of FIG. 2 is ・ First candidate i ・ Second candidate l And proceed to S4.

【0042】・処理2詳細:左側の文字矩形の場合であ
って、かつ、 ・図2のS4のYESの例は、 ・第1候補 i 正読確率80% ・第2候補 j 正読確率50% であり、判定結果「i」となる。
-Details of processing 2: In the case of the character rectangle on the left side, and-The example of YES in S4 of Fig. 2 is: -First candidate i correct reading probability 80% -Second candidate j correct reading probability 50 %, And the determination result is “i”.

【0043】・図2のS4のNOの例は、 ・第1候補 i 正読確率50% ・第2候補 j 正読確率40% であり、S5へ進む。An example of NO in S4 of FIG. ・ First candidate i 50% correct reading probability ・ Second candidate j correct reading probability 40% And proceed to S5.

【0044】・処理3詳細:左側の文字矩形の場合であ
って、かつ、 ・図2のS51のYESの例は、 ・第1候補 j 正読確率70% ・第2候補 i 正読確率50% であり、S52で判定結果「i」となる。
-Details of processing 3: In the case of the character rectangle on the left side, and-The example of YES in S51 of Fig. 2 is: -First candidate j correct reading probability 70% -Second candidate i correct reading probability 50 %, And the determination result is “i” in S52.

【0045】・図2のS51のNOの例は、 ・第1候補 j 正読確率70% ・第2候補 l 正読確率50% であり、候補に「i」ないので、S6へ進む。An example of NO in S51 of FIG. 2 is ・ First candidate j, correct reading probability 70% ・ Second candidate l Probability of 50% correct reading Since there is no “i” in the candidate, the process proceeds to S6.

【0046】・処理4詳細: ・図2のS6のYESの例は、 ・第1候補 i ・第2候補 t であり、S61で判定結果「t」となる。Process 4 details: -The example of YES in S6 of FIG. ・ First candidate i ・ Second candidate t And the determination result is "t" in S61.

【0047】・図2のS6のYESの例2は、 ・第1候補 i ・第2候補 f であり、S61で判定結果「f」となる。The example 2 of YES in S6 of FIG. ・ First candidate i ・ Second candidate f And the determination result is “f” in S61.

【0048】・図2のS6のNOの例は、 ・第1候補 i ・第2候補 l であり、t,fがなく、S7へ進む。An example of NO in S6 of FIG. ・ First candidate i ・ Second candidate l And there is no t or f, and the process proceeds to S7.

【0049】・処理5詳細:左側の文字矩形の場合であ
って、かつ、 ・図2のS71のYESの例は、 ・第1候補 i ・第2候補 l(エル) であり、S72で判定結果「l」(エル)となる。
-Details of processing 5: In the case of the character rectangle on the left side, and-Examples of YES in S71 of Fig. 2 are: -First candidate i-Second candidate l (ell), determined in S72 The result is "l".

【0050】・図2のS31のNOの例は、 ・第1候補 i ・第2候補 j であり、S8ヘ進む。An example of NO in S31 of FIG. 2 is ・ First candidate i ・ Second candidate j And proceed to S8.

【0051】[0051]

【発明の効果】以上説明したように、本発明によれば、
認識対象の類似文字について、基準線と矩形の位置情報
や1文字を構成する矩形の情報などをもとに変換候補に
あるときに該当文字に変換などする構成を採用している
ため、判定条件を多くして類似文字の認識率を向上させ
ることが可能となる。
As described above, according to the present invention,
As for the similar character to be recognized, a configuration is adopted in which it is converted to the corresponding character when it is a conversion candidate based on the position information of the reference line and the rectangle, the information of the rectangle forming one character, etc. It is possible to improve the recognition rate of similar characters by increasing the number of characters.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明のシステム構成図である。FIG. 1 is a system configuration diagram of the present invention.

【図2】本発明の動作説明フローチャートである。FIG. 2 is a flowchart explaining the operation of the present invention.

【図3】本発明の説明図(その1)である。FIG. 3 is an explanatory diagram (1) of the present invention.

【図4】本発明の説明図(その2)である。FIG. 4 is an explanatory view (No. 2) of the present invention.

【図5】従来技術の説明図である。FIG. 5 is an explanatory diagram of a conventional technique.

【符号の説明】[Explanation of symbols]

1:文字認識システム 2:文字認識手段 3:類似文字判定手段 4:文字認識辞書 5:出力ファイル 6:画像入力装置 7:出力装置 1: Character recognition system 2: Character recognition means 3: Similar character determination means 4: Character recognition dictionary 5: Output file 6: Image input device 7: Output device

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】認識対象の文字から読み取ったイメージを
もとに文字を認識する類似文字認識プログラムにおい
て、 認識対象の文字から読み取ったイメージをもとに文字認
識して候補を生成する手段と、 上記読み取った認識対象の文字イメージが基準線よりも
下にあり、かつ上記候補中に文字jが含まれていたとき
に文字jと判定する手段と、 上記読み取った認識対象の、1つの文字に対応する文字
イメージが2つ以上に分離し、かつ上記候補中に文字i
が含まれていたときに文字iと判定する手段としてコン
ピュータに機能させるための類似文字認識プログラム。
1. A similar character recognition program for recognizing a character based on an image read from a character to be recognized, and means for recognizing the character based on the image read from the character to be recognized to generate candidates. A unit for determining the read recognition target character image as a character j when the character image is below the reference line and the character j is included in the candidates; The corresponding character image is separated into two or more, and the character i is included in the above candidate.
A similar character recognition program for causing a computer to function as a means for determining a character i when a character is included.
【請求項2】上記読み取った認識対象の、1つの文字に
対応するイメージが分離していないのに、上記候補中に
文字l(エル)が含まれているときに文字l(エル)と
判定する手段を備えたことを特徴とする請求項1記載の
類似文字認識プログラム。
2. A character l (ell) is determined when the candidate includes a character l (el) even though the image corresponding to one character of the read recognition target is not separated. The similar character recognition program according to claim 1, further comprising:
【請求項3】認識対象の文字から読み取ったイメージを
もとに文字を認識する類似文字認識方法において、 認識対象の文字から読み取ったイメージをもとに文字認
識して候補を生成するステップと、 上記読み取った認識対象の文字イメージが基準線よりも
下にあり、かつ上記候補中に文字jが含まれていたとき
に文字jと判定するステップと、 上記読み取った認識対象の、1つの文字に対応する文字
イメージが2つ以上に分離し、かつ上記候補中に文字i
が含まれていたときに文字iと判定するステップとを有
する類似文字認識方法。
3. A similar character recognition method for recognizing a character based on an image read from a character to be recognized, wherein the character recognition is performed based on the image read from the character to be recognized to generate candidates. Determining the character j when the read character image of the recognition target is below the reference line and the character j is included in the candidates; The corresponding character image is separated into two or more, and the character i is included in the above candidate.
The method for recognizing similar characters including the step of determining the character i when the character is included.
JP2001360520A 2001-11-27 2001-11-27 Similar character recognition program and similar character recognition method Withdrawn JP2003162689A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001360520A JP2003162689A (en) 2001-11-27 2001-11-27 Similar character recognition program and similar character recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001360520A JP2003162689A (en) 2001-11-27 2001-11-27 Similar character recognition program and similar character recognition method

Publications (1)

Publication Number Publication Date
JP2003162689A true JP2003162689A (en) 2003-06-06

Family

ID=19171310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001360520A Withdrawn JP2003162689A (en) 2001-11-27 2001-11-27 Similar character recognition program and similar character recognition method

Country Status (1)

Country Link
JP (1) JP2003162689A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107516105A (en) * 2017-07-20 2017-12-26 阿里巴巴集团控股有限公司 Image processing method and device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107516105A (en) * 2017-07-20 2017-12-26 阿里巴巴集团控股有限公司 Image processing method and device
WO2019015645A1 (en) * 2017-07-20 2019-01-24 阿里巴巴集团控股有限公司 Imaging processing method and device
CN107516105B (en) * 2017-07-20 2020-06-16 阿里巴巴集团控股有限公司 Image processing method and device
US10769490B2 (en) 2017-07-20 2020-09-08 Alibaba Group Holding Limited Image processing methods and devices
US11093792B2 (en) 2017-07-20 2021-08-17 Advanced New Technologies Co., Ltd. Image processing methods and devices

Similar Documents

Publication Publication Date Title
KR100292098B1 (en) Character recognition device and method
EP3786814A1 (en) Intelligent extraction of information from a document
US20210073535A1 (en) Information processing apparatus and information processing method for extracting information from document image
JP2008204226A (en) Form recognition device and program thereof
CN111340020B (en) Formula identification method, device, equipment and storage medium
JP6611346B2 (en) Character string recognition apparatus, method, and program
Hussain et al. Nastalique segmentation-based approach for Urdu OCR
JP2018055255A (en) Information processing apparatus, information processing method, and program
JP5807342B2 (en) Character recognition device and program
CN112036304A (en) Medical bill layout identification method and device and computer equipment
JP2012190434A (en) Form defining device, form defining method, program and recording medium
JP2022095391A (en) Information processing equipment and information processing programs
CN112287763A (en) Image processing method, apparatus, device and medium
JP7604796B2 (en) Information processing device, information processing method, and computer program
JP7404625B2 (en) Information processing device and program
JP2003162689A (en) Similar character recognition program and similar character recognition method
JP2020047031A (en) Document retrieval device, document retrieval system and program
JP2020087112A (en) Document processing apparatus and document processing method
CN116682118A (en) An ancient character recognition method, system, terminal and medium
US9224040B2 (en) Method for object recognition and describing structure of graphical objects
JP2001022883A (en) Character recognition system and recording medium for realizing functions of the character recognition system
JP3484446B2 (en) Optical character recognition device
KR20090123523A (en) Optical character recognition system and method
JP2009182530A (en) Business process execution support device
JP2005275830A (en) Form recognition method

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050201