[go: up one dir, main page]

JPH05303663A - Character segmenting device - Google Patents

Character segmenting device

Info

Publication number
JPH05303663A
JPH05303663A JP4109441A JP10944192A JPH05303663A JP H05303663 A JPH05303663 A JP H05303663A JP 4109441 A JP4109441 A JP 4109441A JP 10944192 A JP10944192 A JP 10944192A JP H05303663 A JPH05303663 A JP H05303663A
Authority
JP
Japan
Prior art keywords
unit
value
character
input
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4109441A
Other languages
Japanese (ja)
Inventor
Koji Yamamoto
浩司 山本
Susumu Maruno
進 丸野
Shigeo Sakagami
茂生 阪上
泰治 〆木
Taiji Shimeki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4109441A priority Critical patent/JPH05303663A/en
Publication of JPH05303663A publication Critical patent/JPH05303663A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To provide a character segmenting device which is highly resistant to the pitch variance, the noises and the blurs of characters and can segment the characters at a high speed. CONSTITUTION:The function is minimized when the character segmenting position is optimum in a total character string with the parallel arithmetic carried out by a density smoothing network part 4 where the operator of the multi-input/single-output is connected to a network and a segmenting position estimating network part 5. Meanwhile the initial output value is decided by an initial value deciding part 7 so that a parameter control part 6 can process the processing parameter for each operator at a high speed.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字認識技術の前処理
として文書画像中の文字列画像から文字を一字毎に分離
する文字切り出し装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character slicing device for separating characters from a character string image in a document image character by character as a preprocessing of character recognition technology.

【0002】[0002]

【従来の技術】従来の文字切り出し装置としては、例え
ば”1990年電子情報通信学会秋季全国大会講演予稿集、
6-355、須田 正人 他、郵便物あて名自動読取区分機
の行・文字検出切出、”に示されている。
2. Description of the Related Art As a conventional character slicing device, for example, "Proceedings of the 1990 Autumn National Conference of the Institute of Electronics, Information and Communication Engineers,
6-355, Masato Suda et al., Line / Character detection cut-out for automatic mail address classification machine.

【0003】図11はこの従来の文字切り出し装置の構
成図を示すものであり、1は文字列画像入力部、2はメ
モリ、3は濃度ヒストグラム算出部、111は文字ピッ
チ推定部、112はガウスフィルタ部、113は閾値処
理部、114は区間メモリ、115は文字始点検出部、
116は文字終点検出部、11は文字パターン出力部で
ある。
FIG. 11 is a block diagram of this conventional character slicing device, in which 1 is a character string image input unit, 2 is a memory, 3 is a density histogram calculation unit, 111 is a character pitch estimation unit, and 112 is Gauss. A filter unit, a threshold processing unit 113, a section memory 114, a character start point detection unit 115,
Reference numeral 116 is a character end point detection unit, and 11 is a character pattern output unit.

【0004】従来の文字切り出し装置の動作を図に従っ
て説明する。メモリ2は文字列画像入力部1によって読
み込まれた文字列画像を記憶保持する。
The operation of the conventional character cutting device will be described with reference to the drawings. The memory 2 stores and holds the character string image read by the character string image input unit 1.

【0005】濃度ヒストグラム算出部3は入力された文
字列画像において入力文字列方向と垂直方向の黒画素数
をカウントし、文字列方向の各座標位置で得られた値を
濃度ヒストグラムとして文字ピッチ推定部111及び、
ガウスフィルタ部112に出力する。文字ピッチ推定部
111は入力された濃度ヒストグラムの値の中で、最大
値を規準として一定の範囲内にある値の平均値を文字ピ
ッチとし、文字終点検出部116に出力する。
The density histogram calculation unit 3 counts the number of black pixels in the input character string direction and the vertical direction in the input character string image, and estimates the character pitch using the values obtained at each coordinate position in the character string direction as the density histogram. Part 111 and
It is output to the Gaussian filter unit 112. The character pitch estimation unit 111 sets the average value of the values in the input density histogram within a certain range with the maximum value as a reference, and outputs the average value to the character end point detection unit 116.

【0006】ガウスフィルタ部112は入力された濃度
ヒストグラムに対し、ガウス型関数を畳み込みすること
によって濃度ヒストグラムの高周波成分を押え、ヒスト
グラムの谷部分を強調する。ガウスフィルタ部112の
出力は閾値処理部113に入力され、入力値がある一定
値以上の区間の始点と終点を求め、区間メモリ114に
出力する。閾値処理部113によって求められた始点と
終点の組は区間情報として区間メモリ114に順次記憶
保持される。
The Gaussian filter unit 112 suppresses the high frequency component of the density histogram by convolving the Gaussian function with respect to the inputted density histogram, and emphasizes the valley portion of the histogram. The output of the Gaussian filter unit 112 is input to the threshold value processing unit 113, and the start point and the end point of the section where the input value is a certain value or more are obtained and output to the section memory 114. The set of the start point and the end point obtained by the threshold processing unit 113 is sequentially stored and held in the section memory 114 as section information.

【0007】従来装置においては区間メモリ114に保
持されている区間をもとに逐次的に文字位置を決定す
る。次にこの文字位置の決定について説明する。
In the conventional apparatus, the character position is sequentially determined based on the section held in the section memory 114. Next, the determination of the character position will be described.

【0008】まず最初に文字始点検出部115は区間メ
モリ114に保持されている区間の中で座標原点に最も
近いものを読み出し、その始点を第一番目の文字の始点
として文字終点検出部116と文字パターン出力部9に
出力する。いま入力された始点をXstart、文字ピッチ推
定部4によって得られた文字ピッチの値をLとすると、
次に文字終点検出部116は区間メモリ114に保持さ
れている区間の中で(数1)を満たすような区間の終点
Xendを第一番目の文字の終点として文字パターン出力部
11と文字始点検出部115に出力する。
First, the character start point detection unit 115 reads out the one closest to the coordinate origin among the sections held in the section memory 114, and uses that start point as the start point of the first character and the character end point detection unit 116. It is output to the character pattern output unit 9. Letting Xstart be the input point just entered and L the value of the character pitch obtained by the character pitch estimation unit 4,
Next, the character end point detection unit 116 determines the end point of the section that satisfies (Equation 1) among the sections held in the section memory 114.
Xend is output to the character pattern output unit 11 and the character start point detection unit 115 as the end point of the first character.

【0009】[0009]

【数1】 [Equation 1]

【0010】なお文字終点検出部116における検出
は、終点が検出できるまでαの値を変化させて行なうも
のとする。
The detection by the character end point detection unit 116 is performed by changing the value of α until the end point can be detected.

【0011】文字始点検出部115は第1番目の文字の
終点が文字終点検出部116から入力されると、その終
点より大きい値を持ち、かつ座標原点に最も近い始点を
読み出し、第1番目の文字の場合と同様にその始点を第
2番目の文字の始点として文字終点検出部116と文字
パターン出力部11に出力する。以下同様にして、区間
メモリ114に保持されている全ての区間が文字位置と
対応するまで、第2番目の文字の終点、第3番目の文字
の始点、第3番目の文字の終点の順に逐次的に文字位置
が決定され、その文字位置の情報は文字パターン出力部
11に出力される。
When the end point of the first character is input from the character end point detecting section 116, the character starting point detecting section 115 reads out the starting point which has a value larger than the ending point and is closest to the coordinate origin point. Similar to the case of a character, the start point is output to the character end point detection unit 116 and the character pattern output unit 11 as the start point of the second character. In the same manner, the end point of the second character, the start point of the third character, and the end point of the third character are sequentially serialized until all the sections stored in the section memory 114 correspond to the character positions. The character position is determined, and the information on the character position is output to the character pattern output unit 11.

【0012】文字パターン出力部11は入力される文字
の始点から終点の範囲にある画像をメモリ2に保持され
ている入力文字列画像から読み出し、順次、文字パター
ンとして出力する。
The character pattern output unit 11 reads an image in the range from the start point to the end point of the input character from the input character string image held in the memory 2 and sequentially outputs it as a character pattern.

【0013】[0013]

【発明が解決しようとする課題】しかしながら上記のよ
うな構成では、逐次的に処理を進めて行く必要があるた
めに、その分、処理時間がかかる。また全体としての切
り出し結果の評価が行なうことができず、一旦切り出し
誤りが出るとそれ以降の切り出し結果に大きく影響する
ために処理精度が悪くなるという課題を有していた。
However, in the above-mentioned configuration, since it is necessary to sequentially proceed with the processing, the processing time is correspondingly increased. Further, there is a problem in that the cutout result cannot be evaluated as a whole, and once a cutout error occurs, the processing accuracy is deteriorated because it greatly affects the cutout results thereafter.

【0014】本発明はかかる点に鑑み、並列処理するこ
とよって処理時間が短く、かつ全体としての処理精度が
高い文字切り出し装置を提供することを目的とする。
In view of the above point, the present invention has an object to provide a character slicing device having a short processing time due to parallel processing and a high processing accuracy as a whole.

【0015】[0015]

【課題を解決するための手段】文字列画像を入力する文
字列画像入力部と、入力文字列を記憶保持するメモリ
と、入力された文字列方向と垂直方向の黒画素数をカウ
ントすることによって得られる濃度ヒストグラムを算出
する濃度ヒストグラム算出部と、前記濃度ヒストグラム
算出部からの入力を受け、濃度ヒストグラム分布をイン
デックスとするパラメータ辞書とのマッチングを行うこ
とで、最適なパラメータの値を決定するパラメータ制御
部と、前記濃度ヒストグラム算出部と前記パラメータ制
御部からの入力を受け、入力文字列方向の画素位置と対
応している多入力一出力の演算子を相互に結合させたネ
ットワークで構成され、文字部分の前記濃度ヒストグラ
ムの値がほぼ同じ値の場合に最小値をとる関数を最小化
することによって前記濃度ヒストグラムを平滑化し、入
力文字列内にあるノイズの影響を軽減する濃度平滑化ネ
ットワーク部と、前記濃度平滑化ネットワーク部と前記
パラメータ制御部からの入力を受け、入力文字列方向の
画素位置と対応している多入力一出力の演算子を相互に
結合させたネットワークで構成され、文字列全体での切
り出し位置が最適な場合に最小値をとる関数を最小化す
ることによって文字の切り出し位置を推定する切出位置
推定ネットワーク部と、前記切出位置推定ネットワーク
部からの入力値に基づいて文字位置の決定を行なう切出
位置決定部と、前記切出位置決定部が正しい出力を出す
ように前記パラメータ制御部内のパラメータ辞書の内容
を書き換える学習部と、前記切出位置決定部の出力結果
をユーザーが参照し、それが誤っている場合には正しい
出力を前記学習部に入力する正切出位置提示部と、前記
切出位置決定部からの入力に基づき前記メモリから一文
字毎の文字パターン出力する文字パターン出力部を備え
る。
By means of a character string image input section for inputting a character string image, a memory for storing and holding an input character string, and counting the number of black pixels in the input character string direction and in the vertical direction. A parameter that determines the optimum parameter value by matching the density histogram calculation unit that calculates the obtained density histogram and the input from the density histogram calculation unit and the parameter dictionary that uses the density histogram distribution as an index. A control unit, which receives inputs from the density histogram calculation unit and the parameter control unit, and is configured by a network in which multi-input one-output operators corresponding to pixel positions in the input character string direction are mutually coupled, By minimizing the function that takes the minimum value when the values of the density histogram of the character part are almost the same, A density smoothing network unit that smoothes the density histogram and reduces the influence of noise in the input character string, and a pixel position in the input character string direction that receives inputs from the density smoothing network unit and the parameter control unit. It consists of a network in which the corresponding multi-input and single-output operators are connected to each other, and the function that takes the minimum value when the cutting position in the entire character string is optimum minimizes the character cutting position. A cutout position estimation network unit to estimate, a cutout position determination unit that determines a character position based on an input value from the cutout position estimation network unit, and the cutout position determination unit to output a correct output. The user refers to the output results of the learning unit that rewrites the contents of the parameter dictionary in the parameter control unit and the cutout position determination unit, and it is incorrect. Case comprises correct positive clipping position presenting unit which outputs input to the learning section, a character pattern output unit for character pattern output of each character from the memory based on input from the cutting position determination unit.

【0016】[0016]

【作用】本発明は前記した構成により、全体的に最適な
切り出し結果が得られた時に最小値を取る評価関数を多
入力一出力の演算子を相互に結合したネットワークによ
って並列演算することで最小化でき、処理速度、処理精
度の向上を図ることができる。またユーザー個人の癖や
変動に合わせた処理パラメータ値を求めてパラメータ制
御部内のパラメータ辞書を書き換える学習部によって、
さらに各ユーザーに対する処理精度の向上が図れる。
According to the present invention, with the above-described configuration, the evaluation function that takes the minimum value when the optimum cutting result is obtained as a whole is operated in parallel by the network in which the operators having a large number of inputs and a single output are connected in parallel. The processing speed and processing accuracy can be improved. In addition, the learning unit that rewrites the parameter dictionary in the parameter control unit by obtaining the processing parameter value that matches the individual habits and fluctuations of the user,
Further, the processing accuracy for each user can be improved.

【0017】[0017]

【実施例】図1は本発明の実施例における文字切り出し
装置の構成図を示すものである。図1において、1は文
字列画像入力部、2はメモリ、3は濃度ヒストグラム算
出部、4は濃度平滑化ネットワーク部、5は切出位置推
定ネットワーク部、6はパラメータ制御部、7は初期値
決定部、8は切出位置決定部、9は学習部、10は正切
出位置提示部、11は文字パターン出力部である。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 is a block diagram of a character slicing device according to an embodiment of the present invention. In FIG. 1, 1 is a character string image input unit, 2 is a memory, 3 is a density histogram calculation unit, 4 is a density smoothing network unit, 5 is a cutout position estimation network unit, 6 is a parameter control unit, and 7 is an initial value. A determination unit, 8 is a cutout position determination unit, 9 is a learning unit, 10 is a normal cutout position presentation unit, and 11 is a character pattern output unit.

【0018】以上のように構成された本実施例の文字切
り出し装置について、以下にその動作を説明する。
The operation of the character slicing device of the present embodiment constructed as described above will be described below.

【0019】メモリ2は文字列画像入力部1によって読
み込まれた文字列画像を記憶保持する。
The memory 2 stores and holds the character string image read by the character string image input unit 1.

【0020】濃度ヒストグラム算出部3は入力された文
字列画像において入力文字列方向と垂直方向の黒画素数
をカウントし、文字列方向の各座標位置で得られた値を
濃度ヒストグラムとして濃度平滑化ネットワーク部4、
パラメータ制御部6、初期値決定部7に出力する。
The density histogram calculator 3 counts the number of black pixels in the input character string image in the input character string direction and in the vertical direction, and smoothes the density obtained by using the values obtained at each coordinate position in the character string direction as a density histogram. Network part 4,
It is output to the parameter control unit 6 and the initial value determination unit 7.

【0021】図2は濃度平滑化ネットワーク部4と切出
位置推定ネットワーク部5の具体的な構成図であり、2
1は濃度値算出ユニット、22は切出位置算出ユニット
である。図2では簡単のために濃度値算出ユニット2
1、切出位置算出ユニット22の各1つだけの出力の状
態を示している。
FIG. 2 is a specific configuration diagram of the density smoothing network unit 4 and the cut-out position estimation network unit 5, and 2
Reference numeral 1 is a density value calculation unit, and 22 is a cutout position calculation unit. In FIG. 2, the density value calculation unit 2 is shown for simplicity.
1, the output state of only one each of the cutout position calculation unit 22 is shown.

【0022】図2に示すように濃度値算出ユニット21
及び、切出位置算出ユニット22は文字列方向の座標と
対応付られており、濃度ヒストグラム算出部3の出力は
対応する濃度値算出ユニット21への初期入力となる。
As shown in FIG. 2, the concentration value calculation unit 21
The cutout position calculation unit 22 is associated with the coordinates in the character string direction, and the output of the density histogram calculation unit 3 becomes an initial input to the corresponding density value calculation unit 21.

【0023】各濃度値算出ユニット21、切出位置算出
ユニット22の出力は、他の濃度値算出ユニット21、
切出位置算出ユニット22の入力及び、自分自身へのフ
ィードバック入力となる。また切出位置算出ユニット2
2の出力は切出位置決定部8に入力される。
The output of each density value calculation unit 21 and the cut-out position calculation unit 22 is output by another density value calculation unit 21,
It serves as an input to the cutout position calculation unit 22 and a feedback input to itself. The cutout position calculation unit 2
The output of 2 is input to the cutout position determination unit 8.

【0024】濃度値算出ユニット21、切出位置算出ユ
ニット22の動作を説明するためにまず、本発明におけ
る文字の切り出し処理の原理を説明する。
In order to explain the operations of the density value calculation unit 21 and the cutout position calculation unit 22, first, the principle of the character cutout process in the present invention will be explained.

【0025】一般に濃度ヒストグラムに基づく文字の切
り出し位置に関する知識として以下の項目を仮定するこ
とができる。 (1)濃度ヒストグラムの値が小さく、ヒストグラム分
布が下に凸な部分に切り出し位置がある可能性が高い。 (2)切り出し位置は大体一定の幅で分布する。 (3)切り出される文字の数は文字列の高さによる制限
がある。
In general, the following items can be assumed as knowledge about the character cutting position based on the density histogram. (1) There is a high possibility that the value of the density histogram is small and the cutout position is located in a portion where the histogram distribution is convex downward. (2) The cutout positions are distributed with a substantially constant width. (3) The number of characters to be cut out is limited by the height of the character string.

【0026】これらの仮定が満たされた場合に最小値を
とるような関数を各々の仮定について(数2)、(数
3)、(数4)のように表わす。
A function that takes the minimum value when these assumptions are satisfied is expressed as (Equation 2), (Equation 3), (Equation 4) for each assumption.

【0027】ここで説明のために文字列方向の座標上に
おけるi番目の濃度値算出ユニット21の出力値をF
(i)、同じくi番目の切出位置算出ユニット22の出力
値をL(i)とする。但し、L(i)の値は文字の切り出し位置
である可能性が高いほど1に近く、低いほど0に近いも
のとする。
For the sake of explanation, the output value of the i-th density value calculation unit 21 on the coordinate in the character string direction is F
(i) Similarly, let the output value of the i-th cut-out position calculation unit 22 be L (i). However, it is assumed that the value of L (i) is closer to 1 as the possibility of a character cutout position is higher, and closer to 0 as it is lower.

【0028】[0028]

【数2】 [Equation 2]

【0029】[0029]

【数3】 [Equation 3]

【0030】[0030]

【数4】 [Equation 4]

【0031】各関数中のパラメータの意味を次に説明す
る。(数2)のAは、F(i)の値がどれぐらい小さい時に
どれぐらいL(i)の値を1に近づけるのかという割合を表
わす。
The meaning of the parameters in each function will be described below. A in (Equation 2) represents the ratio of how small the value of F (i) is and how close the value of L (i) is to 1.

【0032】(数2)のNaは、i番目を中心とする濃度
ヒストグラム値が小さい度合を算出する際に考慮する範
囲を表わす。
Na in (Equation 2) represents a range to be considered when calculating the degree to which the density histogram value centered on the i-th is small.

【0033】(数2)のNfは、i番目を中心とする濃度
ヒストグラム値の分布が下に凸である割合を算出する際
に考慮する範囲を表わす。
Nf in (Equation 2) represents a range to be considered when calculating the ratio in which the distribution of the density histogram value centered on the i-th is convex downward.

【0034】(数3)の関数Cは、正の値をとる単調減
少関数である。これは、ある切り出し位置に近い位置に
別の切り出し位置がくる可能性は、その位置が近ければ
近いほど小さいことを表わし、関数Cのとる値はその割
合を表わす。
The function C of (Equation 3) is a monotonically decreasing function having a positive value. This means that the possibility that another cutout position will be closer to a certain cutout position is smaller as the position is closer, and the value taken by the function C represents the ratio.

【0035】(数3)のNiは、i番目を中心として、関
数Cで表わされる仮定を考慮すべき範囲を表わす。
Ni in (Equation 3) represents a range in which the assumption represented by the function C is to be considered, with the i-th centered.

【0036】(数4)のNnは、切り出し位置の制限数を
表わす。これらのパラメータの値はパラメータ制御部6
によって濃度ヒストグラム算出部3の出力に基づいて決
定されるが、これについては後のパラメータ制御部6の
動作のところで説明する。
Nn in (Equation 4) represents a limited number of cutout positions. The values of these parameters are set by the parameter control unit 6
Is determined based on the output of the density histogram calculation unit 3, which will be described later in the operation of the parameter control unit 6.

【0037】文字の切り出し位置の決定は上記の関数の
線形和で表わされる関数を最小にすることによって達成
できるが、本発明においてはL(i)のとる値が0から1の
範囲であるための制限としてさらに、(数5)と(数
6)で表わされる関数を加える。
The character cutting position can be determined by minimizing the function represented by the linear sum of the above functions, but in the present invention, the value of L (i) is in the range of 0 to 1. Furthermore, the functions expressed by (Equation 5) and (Equation 6) are added as the restriction of.

【0038】[0038]

【数5】 [Equation 5]

【0039】[0039]

【数6】 [Equation 6]

【0040】但し、(数6)の関数Sは(数7)を満た
し、m(i)はi番目の切出位置算出ユニット22に濃度値
算出ユニット21、切出位置算出ユニット22から入力
される入力値の総和である。またλは前もって適当な値
に設定されているものとする。
However, the function S of (Equation 6) satisfies (Equation 7), and m (i) is input to the i-th cutout position calculation unit 22 from the density value calculation unit 21 and the cutout position calculation unit 22. Is the sum of the input values. Further, λ is assumed to be set to an appropriate value in advance.

【0041】[0041]

【数7】 [Equation 7]

【0042】また文字列画像のかすれや孤立点ノイズの
影響をなくするために濃度ヒストグラムを平滑化しなが
ら切り出し処理を進める必要がある。これを上記と同様
な関数で表わす場合、(数8)のように書ける。
Further, in order to eliminate the influence of the blur of the character string image and the noise of isolated points, it is necessary to proceed with the clipping process while smoothing the density histogram. If this is expressed by a function similar to the above, it can be written as (Equation 8).

【0043】[0043]

【数8】 [Equation 8]

【0044】次にこれらの関数を最小化する原理につい
て説明する。いま、説明のためにある変数xについて微
分可能な関数をE(x)とすると変数xの変化量△xが△x→
0の場合、(数9)が成り立つ。
Next, the principle of minimizing these functions will be described. For the purpose of explanation, let E (x) be a differentiable function with respect to a variable x.
In the case of 0, (Equation 9) is established.

【0045】[0045]

【数9】 [Equation 9]

【0046】(数10)を仮定すると(数11)が成り
立つ。但し、εは十分に小さな正の数。
Assuming (Equation 10), (Equation 11) is established. However, ε is a sufficiently small positive number.

【0047】[0047]

【数10】 [Equation 10]

【0048】[0048]

【数11】 [Equation 11]

【0049】(数11)からも明らかなように(数1
0)に従って変数xを変化させてやることでE(x)を最小
にするxを求めることができる。さらに変数xがベクト
ルであっても同様のことが言え、各ベクトル次元毎にま
ったく独立に変化させてもよいことは明かである。
As is clear from (Equation 11) (Equation 1)
By changing the variable x according to 0), x that minimizes E (x) can be obtained. Further, even if the variable x is a vector, the same thing can be said, and it is obvious that it may be changed completely independently for each vector dimension.

【0050】濃度値算出ユニット21は、このような原
理によって、文字列方向の各座標点において独立に濃度
ヒストグラムの平滑化として(数12)に示す関数の最
小化を行う。同様に切出位置算出ユニット22は、文字
列方向の各座標点において独立に文字切り出し位置の推
定として(数13)に示す関数の最小化を行なう。但
し、(数12)、(数13)における係数は各関数を考
慮する割合を表わすものであり、前もって適当な値に設
定されているものとする。
Based on such a principle, the density value calculating unit 21 independently minimizes the function shown in (Equation 12) as smoothing of the density histogram at each coordinate point in the character string direction. Similarly, the cutout position calculation unit 22 independently minimizes the function shown in (Equation 13) as the estimation of the character cutout position at each coordinate point in the character string direction. However, the coefficients in (Equation 12) and (Equation 13) represent the ratios in which each function is considered, and are assumed to be set to appropriate values in advance.

【0051】[0051]

【数12】 [Equation 12]

【0052】[0052]

【数13】 [Equation 13]

【0053】これらの関数の最小化により(数2)、
(数3)、(数4)からも明かなように切出位置算出ユ
ニット22の出力は、濃度値算出部21及び、他の切出
位置算出ユニット22の出力との相互作用によって決定
されるため、文字列全体でみて最適な切り出し位置の推
定が行え、文字のピッチ変動やノイズ、かすれに強い並
列処理による文字切り出しが達成される。
By minimizing these functions (Equation 2),
As is clear from (Equation 3) and (Equation 4), the output of the cutout position calculation unit 22 is determined by the interaction between the density value calculation unit 21 and the outputs of other cutout position calculation units 22. Therefore, the optimum cutout position can be estimated for the entire character string, and the character cutout can be achieved by parallel processing that is resistant to pitch variation, noise, and blurring of characters.

【0054】次に濃度値算出ユニット21及び、切出位
置算出ユニット22の具体的な動作を図に従って説明す
る。
Next, specific operations of the density value calculation unit 21 and the cutout position calculation unit 22 will be described with reference to the drawings.

【0055】図3は濃度値算出ユニット21の具体的な
構成図であり、31は濃度偏微分部、32は濃度乗算
部、33は加算部、34は出力値メモリ、35は出力部
である。
FIG. 3 is a concrete configuration diagram of the density value calculation unit 21, in which 31 is a density partial differentiation unit, 32 is a density multiplication unit, 33 is an addition unit, 34 is an output value memory, and 35 is an output unit. ..

【0056】いま説明のために文字列方向の座標上のi
番目の濃度値算出ユニット21であるとする。
For the sake of explanation, i on the coordinate in the character string direction
It is assumed that it is the th density value calculation unit 21.

【0057】まず処理の最初に出力値メモリの内容は濃
度ヒストグラム算出部3からの入力値に初期化される。
その後は、各時刻毎の加算部33の出力値に従って記憶
保持している内容を書き換えられる。
First, at the beginning of the process, the contents of the output value memory are initialized to the input values from the density histogram calculating section 3.
After that, the stored contents are rewritten according to the output value of the adding unit 33 for each time.

【0058】濃度偏微分部31は、パラメータ制御部
6、濃度算出ユニット21、切出位置算出ユニット22
からの入力値に基づいて(数14)で表わされるdF(i)
を濃度乗算部32に出力する。
The density partial differentiation unit 31 includes a parameter control unit 6, a density calculation unit 21, and a cutout position calculation unit 22.
DF (i) expressed by (Equation 14) based on the input value from
Is output to the density multiplication unit 32.

【0059】[0059]

【数14】 [Equation 14]

【0060】濃度乗算部32は、濃度偏微分部31から
の入力値に対して十分に小さな正の数εfを乗算し、加
算部33に出力する。
The density multiplication unit 32 multiplies the input value from the density partial differentiation unit 31 by a sufficiently small positive number εf, and outputs it to the addition unit 33.

【0061】加算部33は、濃度乗算部32と出力部3
5からの入力を受け、各入力値の和を算出し、出力部3
5にトリガ信号を送った後、出力部35からのトリガ信
号を受けると出力値メモリ34の内容を書き換える。
The adding unit 33 includes a density multiplying unit 32 and an output unit 3.
5, the sum of each input value is calculated, and the output unit 3
After sending the trigger signal to 5, when the trigger signal from the output unit 35 is received, the contents of the output value memory 34 are rewritten.

【0062】出力部35は加算部33からのトリガ信号
を受けると、出力値メモリ34に記憶保持されている内
容を読みだし、濃度算出ユニット21の出力とするとと
もに加算部33にトリガ信号を送る。
When the output section 35 receives the trigger signal from the addition section 33, the output section 35 reads out the content stored and held in the output value memory 34, outputs it as the concentration calculation unit 21, and sends the trigger signal to the addition section 33. ..

【0063】図4は切出位置算出ユニット22の具体的
な構成図であり、41は位置偏微分部、42は位置乗算
部、43は非線形関数部、33は加算部、34は出力値
メモリ、35は出力部である。
FIG. 4 is a concrete configuration diagram of the cutout position calculating unit 22. 41 is a position partial differentiation unit, 42 is a position multiplication unit, 43 is a non-linear function unit, 33 is an addition unit, and 34 is an output value memory. , 35 are output units.

【0064】いま説明のために文字列方向の座標上のi
番目の切出位置算出ユニット22であるとする。
For the sake of explanation, i on the coordinate in the character string direction
It is assumed that the cutout position calculation unit 22 is the th.

【0065】まず処理の最初に出力値メモリ34の内容
は初期値決定部7によって濃度ヒストグラム算出部の出
力に基づいて初期化されるが、これについては後で初期
値決定部7の動作のところで説明する。その後は、各時
刻毎の加算部33の出力値に従って記憶保持している内
容を書き換えられる。
First, at the beginning of the process, the contents of the output value memory 34 are initialized by the initial value determination unit 7 based on the output of the density histogram calculation unit. This will be described later in the operation of the initial value determination unit 7. explain. After that, the stored contents are rewritten according to the output value of the adding unit 33 for each time.

【0066】位置偏微分部41は、パラメータ制御部
6、濃度算出ユニット21、切出位置算出ユニット22
からの入力値に基づいて(数15)で表わされるdm(i)
を位置乗算部42に出力する。
The position partial differentiation unit 41 includes a parameter control unit 6, a density calculation unit 21, and a cutout position calculation unit 22.
Dm (i) expressed by (Equation 15) based on the input value from
Is output to the position multiplication unit 42.

【0067】[0067]

【数15】 [Equation 15]

【0068】濃度乗算部32は、濃度偏微分部31から
の入力値に対して十分に小さな正の数εlを乗算し、加
算部33に出力する。
The density multiplication unit 32 multiplies the input value from the density partial differentiation unit 31 by a sufficiently small positive number εl, and outputs it to the addition unit 33.

【0069】加算部33は、位置乗算部32と出力部3
5からの入力を受け、各入力値の和を算出し、出力部3
5にトリガ信号を送った後、出力部35からのトリガ信
号を受けると出力値メモリ34の内容を書き換える。
The adder 33 includes a position multiplier 32 and an output unit 3.
5, the sum of each input value is calculated, and the output unit 3
After sending the trigger signal to 5, when the trigger signal from the output unit 35 is received, the contents of the output value memory 34 are rewritten.

【0070】出力部35は加算部33からのトリガ信号
を受けると、出力値メモリ34に記憶保持されている内
容を読みだし、非線形関数部43に出力するとともに加
算部33にトリガ信号を送る。
Upon receiving the trigger signal from the adder 33, the output unit 35 reads the contents stored and held in the output value memory 34, outputs the contents to the non-linear function unit 43, and sends the trigger signal to the adder 33.

【0071】非線形関数部43は、入力値に対して(数
7)で表わされる非線形関数Sによる変換を行い、切出
位置算出ユニット22の出力とする。
The non-linear function section 43 transforms the input value by the non-linear function S represented by (Equation 7) and outputs it as the output of the cutout position calculating unit 22.

【0072】以上の処理を繰り返すことにより、さきに
述べた関数の最小化による切り出し位置の推定が達成さ
れる。
By repeating the above processing, the estimation of the cut-out position by minimizing the function described above is achieved.

【0073】次にパラメータ制御部6の動作を図に従っ
て説明する。図5はパラメータ制御部6の具体的な構成
図であり、51はパラメータ標準値算出部、52はパラ
メータ辞書、53はマッチング部、54はパラメータ値
出力部である。
Next, the operation of the parameter controller 6 will be described with reference to the drawings. FIG. 5 is a specific configuration diagram of the parameter control unit 6, 51 is a parameter standard value calculation unit, 52 is a parameter dictionary, 53 is a matching unit, and 54 is a parameter value output unit.

【0074】パラメータ制御部6が制御するパラメータ
は(数2)、(数3)、(数4)、(数12)、(数1
3)におけるA、Na、Nf、Ni、C(x)、Nn、Cf、Ci、Cn、
Cv、Cgである。パラメータ標準値算出部51は、まず各
パラメータの値の標準的値を以下のようにして求める。
The parameters controlled by the parameter control unit 6 are (Equation 2), (Equation 3), (Equation 4), (Equation 12), (Equation 1).
3) A, Na, Nf, Ni, C (x), Nn, Cf, Ci, Cn,
Cv and Cg. The parameter standard value calculation unit 51 first obtains the standard value of the value of each parameter as follows.

【0075】図6はパラメータ標準値算出部51の具体
的な構成図であり、61は最大値検出部、62は文字高
さ推定部、63は方形度推定部、64は標準値算出部で
ある。
FIG. 6 is a concrete configuration diagram of the parameter standard value calculating unit 51. 61 is a maximum value detecting unit, 62 is a character height estimating unit, 63 is a squareness estimating unit, and 64 is a standard value calculating unit. is there.

【0076】最大値検出部61は濃度ヒストグラム算出
部3からの入力を受けて、入力値の一定の区間毎の最大
値を検出し、標準値算出部64に出力する。文字高さ推
定部62は濃度ヒストグラム算出部3からの入力値を文
字列方向の一定の区間毎に、最大値を規準として一定の
範囲内にある値の平均値をその区間における文字高さと
して標準値算出部64に出力する。
The maximum value detection unit 61 receives the input from the density histogram calculation unit 3, detects the maximum value of the input value for each constant section, and outputs it to the standard value calculation unit 64. The character height estimation unit 62 uses the input value from the density histogram calculation unit 3 for each constant section in the character string direction as an average value of values within a certain range based on the maximum value as a character height in that section. It is output to the standard value calculation unit 64.

【0077】方形度推定部63は、文字列方向の一定の
区間毎に、濃度ヒストグラム算出部3からの入力値が一
定値よりも大きい部分の長さの平均値を文字高さ推定部
62から入力値で割った値を文字の方形度として標準値
算出部64に出力する。
From the character height estimating unit 62, the squareness estimating unit 63 obtains the average value of the length of the portion where the input value from the density histogram calculating unit 3 is larger than the constant value for each constant section in the character string direction. The value divided by the input value is output to the standard value calculation unit 64 as the squareness of the character.

【0078】なお、「濃度ヒストグラム算出部3からの
入力値が一定値よりも大きい部分の長さの平均値」の代
わりに「濃度ヒストグラム算出部3からの入力値が一定
値よりも大きい部分の長さのヒストグラムが最も大きい
ところの長さ」としても良い。
It should be noted that instead of "the average value of the length of the portion where the input value from the density histogram calculation unit 3 is larger than a fixed value", "the input value from the density histogram calculation unit 3 is larger than the fixed value" The length at which the length histogram is the largest "may be used.

【0079】いま説明のために最大値検出部61からの
入力値をM、文字高さ推定部62からの入力値をT、方
形度推定部63からの入力値をH、文字列方向の一定区
間の長さをDとする。
For the purpose of explanation, the input value from the maximum value detecting unit 61 is M, the input value from the character height estimating unit 62 is T, the input value from the squareness estimating unit 63 is H, and the character string direction is constant. Let the length of the section be D.

【0080】標準値算出部64は、文字列方向の一定区
間毎にパラメータA、Nf、Ni、Nnの値及び、関数Cを以
下のようにして決定する。
The standard value calculation unit 64 determines the values of the parameters A, Nf, Ni, Nn and the function C for each constant section in the character string direction as follows.

【0081】処理がF(i)がとる値の範囲に影響されない
ようにパラメータAは、F(i)の最大値であるMを規準と
して(数16)に従って決定される。但し、βは正数で
あり、前もって適当な値に設定されているものとする。
The parameter A is determined according to (Equation 16) with M being the maximum value of F (i) as a criterion so that the processing is not affected by the range of values taken by F (i). However, β is a positive number and is set to an appropriate value in advance.

【0082】[0082]

【数16】 [Equation 16]

【0083】Naの値は最大でも1文字分の範囲があれば
良く、推定された文字の高さTを規準として(数17)
に従って決定される。但し、γ1は1以下の正数であ
り、前もって適当な値に設定されているものとする。
It is sufficient for the value of Na to have a range of one character at the maximum, and the estimated character height T is used as a criterion (Equation 17).
Determined according to. However, γ1 is a positive number less than or equal to 1 and is set to an appropriate value in advance.

【0084】[0084]

【数17】 [Equation 17]

【0085】Nfの値も同様であり、最大でも1文字分の
範囲があれば良く、推定された文字の高さTを規準とし
て(数18)に従って決定される。但し、γ2は1以下
の正数であり、前もって適当な値に設定されているもの
とする。
The same applies to the value of Nf, as long as there is a range for one character at the maximum, it is determined according to (Equation 18) using the estimated height T of the character as a criterion. However, γ2 is a positive number less than or equal to 1 and is set to an appropriate value in advance.

【0086】[0086]

【数18】 [Equation 18]

【0087】Niの値は区間に含まれる文字の方形度が小
さければ、小さい値にする必要があり、推定された文字
の方形度Hをもとに文字高さTを規準として(数19)
に従って決定される。但し、関数Iは値域が0から1の
単調増加関数である。
The value of Ni needs to be set to a small value if the squareness of the characters included in the section is small. Based on the estimated squareness H of the character, the character height T is used as a criterion (Equation 19).
Determined according to. However, the function I is a monotonically increasing function with a range of 0 to 1.

【0088】[0088]

【数19】 [Formula 19]

【0089】Nnの値は区間に含まれる文字数によって決
まる値であり、区間の長さを文字幅で割った値を規準と
して(数20)に従って決定される。但し、δは正数で
あり、前もって適当な値に設定されているものとする。
The value of Nn is a value determined by the number of characters included in the section, and is determined according to (Equation 20) with the value obtained by dividing the length of the section by the character width as a criterion. However, δ is a positive number and is set to an appropriate value in advance.

【0090】[0090]

【数20】 [Equation 20]

【0091】関数C(x)のとる値はx=Niで0、x=1で
最大値をとり、その意味するところからAの値を規準と
して(数21)に従って決定される。但し、x≠0、θ
は正数であり、前もって適当な値に設定されているもの
とする。
The value of the function C (x) is 0 when x = Ni and has the maximum value when x = 1, and from the meaning thereof, the value of A is determined according to (Equation 21). However, x ≠ 0, θ
Is a positive number and is set to an appropriate value in advance.

【0092】[0092]

【数21】 [Equation 21]

【0093】標準値算出部64は以上のようにして求め
た各パラメータの標準値をパラメータ辞書52に出力す
る。
The standard value calculation unit 64 outputs the standard value of each parameter obtained as described above to the parameter dictionary 52.

【0094】図7はパラメータ辞書52の具体的な構成
図であり、71はパラメータ標準値メモリ、72は濃度
ヒストグラム分布メモリ、73はパラメータ値メモリで
ある。パラメータ標準値算出部51内の標準値算出部6
4からの入力はパラメータ標準値メモリ71に記憶保持
される。
FIG. 7 is a specific configuration diagram of the parameter dictionary 52. Reference numeral 71 is a parameter standard value memory, 72 is a density histogram distribution memory, and 73 is a parameter value memory. Standard value calculation unit 6 in parameter standard value calculation unit 51
The input from 4 is stored and held in the parameter standard value memory 71.

【0095】各濃度ヒストグラム分布メモリ72毎に1
つのパラメータ値メモリが対応している。
1 for each density histogram distribution memory 72
One parameter value memory corresponds.

【0096】濃度ヒストグラム分布メモリ72は、学習
部9から入力される濃度ヒストグラム分布を記憶保持す
る。またパラメータ値メモリは、対応する濃度ヒストグ
ラム分布メモリ72に対して学習部9によって決定され
た各パラメータの値を記憶保持する。
The density histogram distribution memory 72 stores and holds the density histogram distribution input from the learning section 9. The parameter value memory stores and holds the value of each parameter determined by the learning unit 9 in the corresponding density histogram distribution memory 72.

【0097】また濃度ヒストグラム分布メモリ72及
び、パラメータ値メモリ73の内容はいま説明したよう
に学習部9の出力によって決定されるが、具体的な内容
については後の学習部9の動作の説明の際に述べる。
The contents of the density histogram distribution memory 72 and the parameter value memory 73 are determined by the output of the learning unit 9 as just described, but the specific contents will be described later in the operation of the learning unit 9. I will tell you when.

【0098】マッチング部53は予め定められた一定長
の区間毎に濃度ヒストグラム算出部3からの入力と各濃
度ヒストグラム分布メモリ72に記憶保持されている濃
度ヒストグラム分布とのマッチングを(数22)に従っ
て行い、(数22)の類似度Rが最大となる濃度ヒスト
グラム分布メモリ72を求め、その類似度Rの値及び濃
度ヒストグラム分布メモリ72のアドレスをパラメータ
値出力部54に出力する。但し、濃度ヒストグラム算出
部3からの入力を{x1, x2, ・・・, xn}、濃度ヒストグラ
ム分布メモリ72の内容を{v1, v2, ・・・, vn}とする。
The matching unit 53 performs matching between the input from the density histogram calculation unit 3 and the density histogram distribution stored and held in each density histogram distribution memory 72 for each section of a predetermined fixed length according to (Equation 22). Then, the density histogram distribution memory 72 having the maximum similarity R of (Equation 22) is obtained, and the value of the similarity R and the address of the density histogram distribution memory 72 are output to the parameter value output unit 54. However, the input from the density histogram calculation unit 3 is {x1, x2, ..., Xn}, and the content of the density histogram distribution memory 72 is {v1, v2, ..., Vn}.

【0099】[0099]

【数22】 [Equation 22]

【0100】パラメータ値出力部54は、マッチング部
53から入力された類似度Rが(数23)を満たす場合
には、その濃度ヒストグラム分布メモリ72のアドレス
を参照し、対応するパラメータ値メモリ73の内容をパ
ラメータ制御部6の出力として、濃度平滑化ネットワー
ク部4と切出位置推定ネットワーク部5に出力する。
(数23)を満たさない場合には、パラメータ辞書52
内のパラメータ標準値メモリ71の内容をパラメータ制
御部6の出力とする。但し、μは予め適当な値に設定さ
れているものとする。
When the similarity R input from the matching unit 53 satisfies (Equation 23), the parameter value output unit 54 refers to the address of the density histogram distribution memory 72, and stores the corresponding parameter value memory 73. The content is output to the density smoothing network unit 4 and the cutout position estimation network unit 5 as an output of the parameter control unit 6.
If (Equation 23) is not satisfied, the parameter dictionary 52
The content of the parameter standard value memory 71 therein is output from the parameter control unit 6. However, μ is set to an appropriate value in advance.

【0101】[0101]

【数23】 [Equation 23]

【0102】以上説明したようにパラメータ制御部6
は、各区間毎のパラメータの値を決定し、濃度平滑化ネ
ットワーク部4内の対応する濃度算出ユニット21及
び、切出位置推定ネットワーク部5内の対応する切出位
置算出ユニット22に出力する。
As described above, the parameter control unit 6
Determines the parameter value for each section and outputs it to the corresponding density calculation unit 21 in the density smoothing network unit 4 and the corresponding cutout position calculation unit 22 in the cutout position estimation network unit 5.

【0103】次に切出位置決定部8は一定時刻の後に文
字列方向の各座標に対応する切出位置推定ネットワーク
部5内の切出位置算出ユニット22の出力値のうち、あ
る一定値より大きい値を持つ切出位置算出ユニット22
に対応する座標を文字の切り出し位置とし、正切出位置
提示部10と文字パターン出力部11に出力する。な
お、この一定値は前もって1に近い値に設定されている
ものとする。
Next, the cut-out position determining unit 8 determines a certain fixed value among the output values of the cut-out position calculating unit 22 in the cut-out position estimating network unit 5 corresponding to each coordinate in the character string direction after a certain time. Cutting position calculation unit 22 having a large value
The coordinate corresponding to is set as the character cutout position and is output to the normal cutout position presentation unit 10 and the character pattern output unit 11. It should be noted that this constant value is set to a value close to 1 in advance.

【0104】次に学習部9と正切出位置提示部10の具
体的な動作を図に従って説明する。図8は学習部9の構
成図であり、81はパラメータ変化部、82は活性度算
出部、83はパラメータ修正部である。
Next, specific operations of the learning unit 9 and the normal cutout position presenting unit 10 will be described with reference to the drawings. FIG. 8 is a configuration diagram of the learning unit 9, where 81 is a parameter changing unit, 82 is an activity calculating unit, and 83 is a parameter correcting unit.

【0105】パラメータ変化部81は、正切出位置提示
部10あるいはパラメータ修正部83からの入力を受け
て、パラメータ制御部6内のパラメータ標準値メモリ7
1に記憶保持されているA、Na、Nf、Ni、C(x)、Nn、C
f、Ci、Cn、Cv、Cgの標準値を各々順に読みだし、各パ
ラメータの値を各々のパラメータ毎に予め決められてい
る値だけ増減させる。次にその新しいパラメータ値の組
を活性度算出部82に出力する。
The parameter changing unit 81 receives an input from the normal cut-out position presenting unit 10 or the parameter correcting unit 83, and receives the parameter standard value memory 7 in the parameter control unit 6.
A, Na, Nf, Ni, C (x), Nn, C stored in 1
The standard values of f, Ci, Cn, Cv, and Cg are read in order, and the value of each parameter is increased or decreased by a value that is predetermined for each parameter. Then, the new set of parameter values is output to the activity calculation section 82.

【0106】活性度算出部82は、濃度ヒストグラム算
出部3からの入力を受け、正切出位置提示部10から入
力される区間における(数15)のdm(i)の値を算出
し、パラメータ修正部83に出力する。なお正切出位置
提示部10から入力される区間は、外部より指示された
切り出し誤り区間であり、このことは後の正切出位置提
示部10の説明において述べる。
The activity calculating section 82 receives the input from the density histogram calculating section 3, calculates the value of dm (i) of (Equation 15) in the section input from the normal extraction position presenting section 10, and corrects the parameters. It is output to the unit 83. The section input from the normal cutout position presentation unit 10 is a cutout error section specified from the outside, and this will be described later in the description of the normal cutout position presentation unit 10.

【0107】パラメータ修正部83は、活性度算出部8
2から入力される各座標位置における値を参照し、正切
出位置提示部10から入力される座標位置における値が
他の座標位置における値よりも大きい場合には、入力さ
れた区間における濃度ヒストグラム分布をパラメータ制
御部6内の濃度ヒストグラムメモリ72へ出力し、この
時のパラメータの値の組を対応するパラメータ制御部6
内のパラメータ値メモリ73に出力する。また正切出位
置提示部10から入力される座標位置における値が他の
座標位置における値よりも小さい場合には、パラメータ
変化部81に信号を送り、パラメータ変化部81は新し
いパラメータ値の組を出力し、再び処理を繰り返し、大
きくなるようなパラメータ値の組を探索する。なお正切
出位置提示部10から入力される座標位置は、外部より
指示された正しい切り出し位置であり、このことは後の
正切出位置提示部10の説明において述べる。
The parameter correction unit 83 has the activity calculation unit 8
When the value at the coordinate position input from the normal-cut-out position presentation unit 10 is larger than the value at the other coordinate position by referring to the value at each coordinate position input from 2, the density histogram distribution in the input section Is output to the density histogram memory 72 in the parameter control unit 6, and the set of parameter values at this time is output to the corresponding parameter control unit 6
It is output to the parameter value memory 73 therein. If the value at the coordinate position input from the normal cut-out position presenting unit 10 is smaller than the values at other coordinate positions, a signal is sent to the parameter changing unit 81, and the parameter changing unit 81 outputs a new set of parameter values. Then, the process is repeated again to search for a larger set of parameter values. The coordinate position input from the normal cutout position presentation unit 10 is a correct cutout position instructed from the outside, which will be described later in the description of the normal cutout position presentation unit 10.

【0108】図9は正切出位置提示部10の構成図であ
り、91はイメージ表示部、92は正切出位置指示部、
93は正切出位置出力部である。
FIG. 9 is a block diagram of the normal-cut-out position presenting section 10, in which 91 is an image display section, 92 is a normal-cut-out position instruction section,
Reference numeral 93 is a normal cutting position output unit.

【0109】イメージ表示部91はメモリ2から入力文
字列画像を読みだし、イメージとしてユーザーに提示す
るとともに、切出位置決定部8からの入力を受けてその
切り出し結果を同様にイメージ上に提示する。
The image display unit 91 reads the input character string image from the memory 2 and presents it to the user as an image, and also receives the input from the cutout position determining unit 8 and presents the cutout result on the image in the same manner. ..

【0110】次にイメージ表示部91に提示された結果
を見たユーザーは、もしその結果が誤っている場合に、
その誤り部分の区間位置及び、正しい切り出し位置を正
切出位置指示部92によって指示し、正切出位置出力部
93に出力する。 正切出位置出力部93は正切出位置
指示部92からの入力を受けて、誤り部分の区間位置を
学習部9内の活性度算出部82に、正しい切り出し位置
の座標位置を学習部9内のパラメータ値修正部83に出
力する。なお正切り出し位置を与えるのは、個々ではユ
ーザーとしたが、文字認識処理とさらに言語処理を行い
文法的におかしい部分を処理パラメータを変えて、再び
切り出し処理し、文法的に正しくなった部分とその切り
出し位置を正切り出し位置としてもよい。
Next, the user who sees the result presented on the image display section 91, if the result is wrong,
The section position of the erroneous portion and the correct cut-out position are designated by the normal cut-out position instruction unit 92, and output to the normal cut-out position output unit 93. The normal cut-out position output unit 93 receives the input from the normal cut-out position instruction unit 92, the section position of the error portion to the activity calculation unit 82 in the learning unit 9, and the correct cut-out position coordinate position in the learning unit 9. It is output to the parameter value correction unit 83. Although it is the user who individually gives the normal cut-out position, character recognition processing and further language processing are performed, the processing parameters are changed for the grammatically incorrect part, and the cut-out processing is performed again, and the grammatically correct part is given. The cutout position may be the normal cutout position.

【0111】次に初期値決定部7の動作を図に従って説
明する。初期値決定部7は、濃度ヒストグラム算出部3
からの入力値に従って、確実に切り出し位置である座
標、切り出し位置である可能性が低い座標、その他の座
標を判断し、各座標における切出位置算出ユニット22
内の出力値メモリ34の内容を各々の場合よって初期化
する。
Next, the operation of the initial value determination unit 7 will be described with reference to the drawings. The initial value determination unit 7 includes the density histogram calculation unit 3
According to the input value from, the cutout position, the coordinate that is unlikely to be the cutout position, and other coordinates are surely determined, and the cutout position calculation unit 22 at each coordinate is determined.
The contents of the output value memory 34 therein are initialized in each case.

【0112】図10は初期値決定部7の具体的な構成図
であり、101は文字列端検出部、102は高濃度座標
検出部、103は初期値算出部、61は最大値検出部で
ある。
FIG. 10 is a concrete configuration diagram of the initial value determination unit 7, 101 is a character string edge detection unit, 102 is a high density coordinate detection unit, 103 is an initial value calculation unit, and 61 is a maximum value detection unit. is there.

【0113】文字列端検出部101は濃度ヒストグラム
算出部3からの文字列方向の座標に対応している各入力
のうちある値以上を持ち、最も小さい座標を文字列始
点、最も大きい座標を文字列終点としてその情報を初期
値算出部103に送る。
The character string end detection unit 101 has a value greater than or equal to a certain value among the respective inputs corresponding to the coordinates in the character string direction from the density histogram calculation unit 3, the smallest coordinate is the character string start point, and the largest coordinate is the character. The information is sent to the initial value calculation unit 103 as the end point of the column.

【0114】最大値検出部61は濃度ヒストグラム算出
部3からの入力を受けて、入力値の一定の区間毎の最大
値を検出し、高濃度座標検出部102に出力する。
The maximum value detecting section 61 receives the input from the density histogram calculating section 3, detects the maximum value of the input value for each constant section, and outputs it to the high density coordinate detecting section 102.

【0115】高濃度座標検出部101は濃度ヒストグラ
ム算出部3から入力のうち、最大値検出部61からの入
力値で決定される値より大きい値を持つ座標を初期値算
出部103に出力する。
The high density coordinate detecting section 101 outputs, to the initial value calculating section 103, coordinates having a value larger than the value determined by the input value from the maximum value detecting section 61 among the inputs from the density histogram calculating section 3.

【0116】初期値算出部103は、文字列端検出部1
01からの入力値に対応する切出位置算出ユニット22
内の出力値メモリ34の内容をL1、高濃度座標検出部1
02からの入力値に対応する切出位置算出ユニット22
内の出力値メモリ34の内容をL2、その他の出力値メモ
リ34の内容をL3に初期設定する。但し、L1、L2、L3は
(数24)を満たすものとする。
The initial value calculation unit 103 includes a character string end detection unit 1
Cutout position calculation unit 22 corresponding to the input value from 01
The content of the output value memory 34 is L1, the high-density coordinate detection unit 1
Cutout position calculation unit 22 corresponding to the input value from 02
The contents of the output value memory 34 therein are initially set to L2, and the contents of the other output value memory 34 are initially set to L3. However, L1, L2, and L3 satisfy (Equation 24).

【0117】[0117]

【数24】 [Equation 24]

【0118】このようにして明らかに切り出し位置では
ない座標位置には、最も小さい値(0に近い値)を、ま
た元々、切り出し位置の可能性が高い座標位置には大き
い値(1に近い値)を初期値として与えることにより、
一律に同じ値を初期値とするよりも正しい切り出し位置
を高速に、また正確に推定することができる。
In this way, the smallest value (value close to 0) is given to the coordinate position which is obviously not the cutout position, and the large value (value close to 1 is originally given to the coordinate position where the possibility of the cutout position is originally high. ) As an initial value,
The correct clipping position can be estimated at high speed and accurately as compared with the case where the same value is uniformly used as the initial value.

【0119】最後に文字パターン出力部9は入力される
切り出し位置のうち、隣合うものの間にある画像をメモ
リ2に保持されている入力文字列画像から読み出し、順
次、文字パターンとして出力する。
Finally, the character pattern output unit 9 reads out the image between the adjacent cutout positions from the input character string image held in the memory 2 and sequentially outputs it as a character pattern.

【0120】以上のように本実施例によれば、濃度平滑
化ネットワーク部4が射影ヒストグラム分布の平滑化を
行い、その結果を参照しながら切出位置推定ネットワー
ク部5が並列的に文字切り出し位置の推定を行なうこと
によって、文字列全体として最適な切り出し位置を求め
ることができる。これにより文字のピッチ変動やノイ
ズ、かすれに強い文字切り出し処理が達成され、さらに
並列処理によって高速な処理が行える。
As described above, according to this embodiment, the density smoothing network unit 4 smoothes the projection histogram distribution, and the cutout position estimation network unit 5 refers to the result and parallelizes the character cutout positions. The optimum cut-out position for the entire character string can be obtained by estimating the. As a result, character segmentation processing that is resistant to pitch variation, noise, and blurring of characters is achieved, and high-speed processing can be performed by parallel processing.

【0121】また正切出位置提示部10によって正しい
切り出し位置の情報を学習部9にフィードバックする。
そして学習部9がユーザー個人の処理パラメータの変動
を求め、それによって処理パラメータを最適化する。次
に各ユーザーに対して最適化された処理パラメータをパ
ラメータ制御部6が記憶保持し、濃度ヒストグラム分布
に基づいて、現在処理している文字列に対して最適な処
理パラメータを決定する。これにより、ユーザー毎、文
書毎の処理パラメータの最適化が行え、処理精度がさら
に向上する。
Further, the normal cut-out position presentation unit 10 feeds back information on the correct cut-out position to the learning unit 9.
Then, the learning unit 9 finds the fluctuation of the processing parameter of each user, and optimizes the processing parameter accordingly. Next, the parameter control unit 6 stores and holds the processing parameter optimized for each user, and determines the optimum processing parameter for the character string currently processed based on the density histogram distribution. As a result, the processing parameters for each user and each document can be optimized, and the processing accuracy is further improved.

【0122】また初期値決定部7を設けることで、正し
い切り出し位置の大体の位置を反映させることにより処
理のさらなる高速化と高精度化が達成される。
Further, by providing the initial value determination unit 7, the processing speed and accuracy can be further improved by reflecting the approximate position of the correct clipping position.

【0123】[0123]

【発明の効果】本発明によれば、濃度平滑化ネットワー
ク部と切出位置推定ネットワーク部との並列処理による
相互作用によって切り出し位置を推定すること、パラメ
ータ制御部による相互作用のパラメータを設定すること
及び、相互作用のための初期値をあらかじめ初期値決定
部で設定することで文字のピッチ変動やノイズ、かすれ
に強く、高速に文字の切り出し処理ができる。また一律
の処理パラメータ設定では対処できないユーザー個人の
変動に対しても処理パラメータを学習によって最適化
し、辞書として持つことにより対応することができ、そ
の実用的効果は大きい。
According to the present invention, the cutout position is estimated by the interaction of the density smoothing network unit and the cutout position estimation network unit by parallel processing, and the parameter of the interaction is set by the parameter control unit. Also, by setting the initial value for the interaction in advance by the initial value determination unit, the character can be cut out at a high speed, which is resistant to pitch variation, noise, and blurring of the character. Further, it is possible to deal with the fluctuation of individual users, which cannot be dealt with by uniformly setting the processing parameters, by optimizing the processing parameters by learning and having them as a dictionary, which has a great practical effect.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明における実施例の文字切り出し装置の構
成図
FIG. 1 is a configuration diagram of a character cutting device according to an embodiment of the present invention.

【図2】本発明における濃度平滑化ネットワーク部4と
切出位置推定ネットワーク部5の構成図
FIG. 2 is a configuration diagram of a density smoothing network unit 4 and a cutout position estimation network unit 5 according to the present invention.

【図3】本発明における濃度値算出ユニット21の構成
FIG. 3 is a configuration diagram of a density value calculation unit 21 according to the present invention.

【図4】本発明における切出位置算出ユニット22の構
成図
FIG. 4 is a configuration diagram of a cutout position calculation unit 22 according to the present invention.

【図5】本発明におけるパラメータ制御部6の構成図FIG. 5 is a configuration diagram of a parameter control unit 6 in the present invention.

【図6】本発明におけるパラメータ標準値算出部51の
構成図
FIG. 6 is a configuration diagram of a parameter standard value calculation unit 51 according to the present invention.

【図7】本発明におけるパラメータ辞書52の構成図FIG. 7 is a configuration diagram of a parameter dictionary 52 according to the present invention.

【図8】本発明における学習部9の構成図FIG. 8 is a configuration diagram of a learning unit 9 in the present invention.

【図9】本発明における正切出位置提示部10の構成図FIG. 9 is a configuration diagram of a normal cutout position presentation unit 10 according to the present invention.

【図10】本発明における初期値決定部7の構成図FIG. 10 is a configuration diagram of an initial value determination unit 7 in the present invention.

【図11】従来例における文字切り出し装置の構成図FIG. 11 is a configuration diagram of a character cutting device in a conventional example.

【符号の説明】[Explanation of symbols]

1 文字列画像入力部 2 メモリ 3 濃度ヒストグラム算出部 4 濃度平滑化ネットワーク部 5 切出位置推定ネットワーク部 6 パラメータ制御部 7 初期値決定部 8 切出位置決定部 9 学習部 10 正切出位置提示部 11 文字パターン出力部 21 濃度値算出ユニット 22 切出位置推定ユニット 31 濃度偏微分部 32 濃度乗算部 33 加算部 34 出力値メモリ 35 出力部 41 位置偏微分部 42 位置乗算部 43 非線形関数部 51 パラメータ標準値算出部 52 パラメータ辞書 53 マッチング部 54 パラメータ値出力部 61 最大値検出部 62 文字高さ推定部 63 方形度推定部 64 パラメータ算出部 71 パラメータ標準値メモリ 72 濃度ヒストグラム分布メモリ 73 パラメータ値メモリ 81 パラメータ変化部 82 活性度算出部 83 パラメータ修正部 91 イメージ表示部 92 正切出位置指示部 93 正切出位置出力部 101 文字列端検出部 102 高濃度座標検出部 103 初期値算出部 111 文字ピッチ推定部 112 ガウスフィルタ部 113 閾値処理部 114 区間メモリ 115 文字始点検出部 116 文字終点検出部 1 character string image input unit 2 memory 3 density histogram calculation unit 4 density smoothing network unit 5 cutout position estimation network unit 6 parameter control unit 7 initial value determination unit 8 cutout position determination unit 9 learning unit 10 normal cutout position presentation unit 11 Character pattern output unit 21 Density value calculation unit 22 Cutting position estimation unit 31 Density partial differentiation unit 32 Density multiplication unit 33 Addition unit 34 Output value memory 35 Output unit 41 Position partial differentiation unit 42 Position multiplication unit 43 Non-linear function unit 51 Parameter Standard value calculation unit 52 Parameter dictionary 53 Matching unit 54 Parameter value output unit 61 Maximum value detection unit 62 Character height estimation unit 63 Squareness estimation unit 64 Parameter calculation unit 71 Parameter standard value memory 72 Density histogram distribution memory 73 Parameter value memory 81 Parameter change part 82 Activity calculation Output section 83 Parameter correction section 91 Image display section 92 Normal cut-out position instruction section 93 Normal cut-out position output section 101 Character string end detection section 102 High density coordinate detection section 103 Initial value calculation section 111 Character pitch estimation section 112 Gaussian filter section 113 Threshold Processing unit 114 Section memory 115 Character start point detection unit 116 Character end point detection unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 〆木 泰治 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Taiji Yuki, 1006 Kadoma, Kadoma City, Osaka Prefecture Matsushita Electric Industrial Co., Ltd.

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】文字列画像を入力する文字列画像入力部
と、入力文字列を記憶保持するメモリと、入力された文
字列方向と垂直方向の黒画素数をカウントすることによ
って得られる濃度ヒストグラムを算出する濃度ヒストグ
ラム算出部と、前記濃度ヒストグラム算出部からの入力
を受け、濃度ヒストグラム分布をインデックスとするパ
ラメータ辞書とのマッチングを行うことで、最適なパラ
メータの値を決定するパラメータ制御部と、前記濃度ヒ
ストグラム算出部と前記パラメータ制御部からの入力を
受け、入力文字列方向の画素位置と対応している多入力
一出力の演算子を相互に結合させたネットワークで構成
され、文字部分の前記濃度ヒストグラムの値がほぼ同じ
値の場合に最小値をとる関数を最小化することによって
前記濃度ヒストグラムを平滑化し、入力文字列内にある
ノイズの影響を軽減する濃度平滑化ネットワーク部と、
前記濃度平滑化ネットワーク部と前記パラメータ制御部
からの入力を受け、入力文字列方向の画素位置と対応し
ている多入力一出力の演算子を相互に結合させたネット
ワークで構成され、文字列全体での切り出し位置が最適
な場合に最小値をとる関数を最小化することによって文
字の切り出し位置を推定する切出位置推定ネットワーク
部と、前記切出位置推定ネットワーク部からの入力値に
基づいて文字位置の決定を行なう切出位置決定部と、前
記切出位置決定部が正しい出力を出すように前記パラメ
ータ制御部内のパラメータ辞書の内容を書き換える学習
部と、前記切出位置決定部の出力結果を参照し、それが
誤っている場合には正しい出力を前記学習部に入力する
正切出位置提示部と、前記切出位置決定部からの入力に
基づき前記メモリから一文字毎の文字パターン出力する
文字パターン出力部を備えたことを特徴とする文字切り
出し装置。
1. A character string image input section for inputting a character string image, a memory for storing and holding an input character string, and a density histogram obtained by counting the number of black pixels in the input character string direction and in the vertical direction. A density histogram calculation unit for calculating, and a parameter control unit that receives an input from the density histogram calculation unit and performs matching with a parameter dictionary having a density histogram distribution as an index, and a parameter control unit that determines an optimum parameter value, It is composed of a network that receives inputs from the density histogram calculation unit and the parameter control unit and mutually connects multi-input one-output operators corresponding to pixel positions in the input character string direction, The density histogram is minimized by minimizing the function that takes the minimum value when the values in the density histogram are almost the same. The smooth, and the density smoothing network unit to reduce the effect of noise present in the input string,
An input of the density smoothing network unit and the parameter control unit, and a network in which multi-input and one-output operators corresponding to pixel positions in the input character string direction are mutually connected, and the entire character string is formed. A clipping position estimation network unit that estimates the clipping position of a character by minimizing the function that takes the minimum value when the clipping position is optimal, and a character based on the input value from the clipping position estimation network unit. A cutout position determination unit that determines the position, a learning unit that rewrites the contents of the parameter dictionary in the parameter control unit so that the cutout position determination unit outputs a correct output, and an output result of the cutout position determination unit. Refer to the normal cut-out position presenting unit for inputting a correct output to the learning unit if it is incorrect, and the memory based on the input from the cut-out position determining unit. Character segmentation apparatus comprising the character pattern output unit for character pattern output of each Luo character.
【請求項2】濃度ヒストグラム算出部からの入力に基づ
き、切出位置推定ネットワーク部内の演算子の出力初期
値を決定する初期値決定部を備えたことを特徴とする請
求項1記載の文字切り出し装置。
2. The character cutout according to claim 1, further comprising an initial value determination unit that determines an output initial value of an operator in the cutout position estimation network unit based on an input from the density histogram calculation unit. apparatus.
JP4109441A 1992-04-28 1992-04-28 Character segmenting device Pending JPH05303663A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4109441A JPH05303663A (en) 1992-04-28 1992-04-28 Character segmenting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4109441A JPH05303663A (en) 1992-04-28 1992-04-28 Character segmenting device

Publications (1)

Publication Number Publication Date
JPH05303663A true JPH05303663A (en) 1993-11-16

Family

ID=14510329

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4109441A Pending JPH05303663A (en) 1992-04-28 1992-04-28 Character segmenting device

Country Status (1)

Country Link
JP (1) JPH05303663A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014081938A (en) * 2012-10-17 2014-05-08 Cognex Corp System and method for selecting and displaying segmentation parameter for optical character recognition
US9317767B2 (en) 2012-10-17 2016-04-19 Cognex Corporation System and method for selecting segmentation parameters for optical character recognition

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014081938A (en) * 2012-10-17 2014-05-08 Cognex Corp System and method for selecting and displaying segmentation parameter for optical character recognition
US9286534B2 (en) 2012-10-17 2016-03-15 Cognex Corporation System and method for selecting and displaying segmentation parameters for optical character recognition
US9317767B2 (en) 2012-10-17 2016-04-19 Cognex Corporation System and method for selecting segmentation parameters for optical character recognition
CN103778422B (en) * 2012-10-17 2017-05-24 柯耐克斯公司 System and method for selecting and displaying segmentation parameters for optical character recognition

Similar Documents

Publication Publication Date Title
US6385338B1 (en) Image processing method and apparatus
JP4517633B2 (en) Object detection apparatus and method
US7054485B2 (en) Image processing method, apparatus and system
EP1950705B1 (en) Varying hand-drawn line width for display
EP0807297B1 (en) Method and apparatus for separating foreground from background in images containing text
US5001767A (en) Image processing device
US7609847B2 (en) Methods and systems for determining object layouts
JPH08307665A (en) Method for highlighting text region
JP4553044B2 (en) Group learning apparatus and method
US7317829B2 (en) Background color estimation for scanned images
US6618097B1 (en) Image display apparatus and contour detecting circuit provided therein
JPH10116340A (en) Bit map comparing device and method therefor
EP0750415A2 (en) Image processing method and apparatus
EP0457534A2 (en) Image processing method and apparatus
EP0949580B1 (en) Classification-driven thresholding of a normalized grayscale image
US20110222772A1 (en) Resolution adjustment of an image that includes text undergoing an ocr process
JPH05303663A (en) Character segmenting device
EP0471472A2 (en) Image processing method and apparatus therefor
JPH07220023A (en) Table recognition method and apparatus thereof
CN116595213B (en) Search methods, devices, electronic equipment, and storage media for geometry problems
JP2001222683A (en) Image processing method, image processing device, character recognition method, character recognition device, and storage medium
WO2015114021A1 (en) Image capture using client device
JPH05266253A (en) Character extraction device
JP3074981B2 (en) Character segmentation device
KR100719942B1 (en) Pattern recognition