[go: up one dir, main page]

JPS6325391B2 - - Google Patents

Info

Publication number
JPS6325391B2
JPS6325391B2 JP55126845A JP12684580A JPS6325391B2 JP S6325391 B2 JPS6325391 B2 JP S6325391B2 JP 55126845 A JP55126845 A JP 55126845A JP 12684580 A JP12684580 A JP 12684580A JP S6325391 B2 JPS6325391 B2 JP S6325391B2
Authority
JP
Japan
Prior art keywords
area
image memory
dimensional image
density
field separator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55126845A
Other languages
Japanese (ja)
Other versions
JPS5752971A (en
Inventor
Teruo Akyama
Isao Masuda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP55126845A priority Critical patent/JPS5752971A/en
Publication of JPS5752971A publication Critical patent/JPS5752971A/en
Publication of JPS6325391B2 publication Critical patent/JPS6325391B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 本発明は、2次元文字領域抽出装置、特に紙面
上の文字を読み取る光学的文字読取装置(OCR
装置)などにおいて、文字の位置、大きさ等の事
前情報が全く与えられない自由な書式の紙面に対
しても紙面の傾き補正を行ない、その上で紙面の
中から文字領域を濃度値累積結果を用いて自動的
に抽出することの出来る文字領域抽出装置に関す
るものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a two-dimensional character area extraction device, particularly an optical character reading device (OCR) that reads characters on a paper surface.
(device), etc., the inclination of the paper surface is corrected even for free-format paper surfaces for which no prior information such as character position, size, etc. This invention relates to a character area extracting device that can automatically extract character areas using.

OCRを用いて文字を読取る場合には、まず最
初に入力用紙の傾き補正を行ない、読み取るべき
文字を切り出しておく必要がある。従来、用紙の
傾き補正の手法として、用紙にガイドマークを印
刷しておき、そのガイドマークを基準に補正する
もの、また用紙枠を検出してそれを基準に補正す
るもの等があつた。しかし前者の場合は予め用紙
にガイドマークを印刷しておかなければならず、
また後者の場合は切り抜きや、或いは複写する際
に傾いて複写されたものに対しては傾き補正が出
来ないという欠点があつた。また文字の切り出し
に関しては従来、用紙内の文字の位置大きさ等を
予め決めておき、ガイドマーク或は用紙端からの
距離等によつて各文字を切り出しているため、通
常我々の扱つている自由な書式のもとに作成され
た文書に対しては文字領域の抽出が全く出来ない
という欠点を持つていた。
When reading characters using OCR, it is first necessary to correct the tilt of the input paper and cut out the characters to be read. Conventionally, as methods for correcting the inclination of paper, there have been methods such as printing guide marks on the paper and correcting the paper using the guide marks as a reference, and methods that detect the paper frame and correct the paper using it as a reference. However, in the former case, guide marks must be printed on the paper in advance,
Furthermore, in the latter case, there is a drawback in that it is not possible to correct the skew of a copy that is skewed during cutting or copying. In addition, conventionally, when it comes to cutting out characters, the position and size of the characters on the paper are determined in advance, and each character is cut out based on guide marks or the distance from the edge of the paper. This method had the disadvantage that it was not possible to extract character areas at all for documents created using free formatting.

本発明は、これらの欠点を解決するために、傾
き補正や文字切り出しのための事前情報の全くな
い任意の書式の文書に対してもその傾きを補正し
その上で文書に含まれる文字領域を濃度値累積結
果を用いて抽出することを目的としており、以下
図面に従つて詳細に説明する。
In order to solve these drawbacks, the present invention corrects the skew even for documents in arbitrary formats that do not have any prior information for skew correction or character extraction, and then corrects the skew of the text areas included in the document. The purpose is to perform extraction using the density value accumulation results, and will be described in detail below with reference to the drawings.

第1図は本発明のブロツク図であつて1は入力
信号を量子化する量子化回路、2は量子化された
画像を記憶する2次元画像メモリ、3は傾き補正
装置、4は領域分割装置、5はフイールドセパレ
ータ検出装置、6は領域追加分割装置、7は領域
分割結果記憶装置、8は非空白領域検出装置、9
は非空白領域長方矩形化装置、10は領域ラベリ
ング装置である。以下それぞれの装置について詳
細に説明していく。
FIG. 1 is a block diagram of the present invention, in which 1 is a quantization circuit that quantizes an input signal, 2 is a two-dimensional image memory that stores the quantized image, 3 is a tilt correction device, and 4 is a region dividing device. , 5 is a field separator detection device, 6 is an area addition/division device, 7 is an area division result storage device, 8 is a non-blank area detection device, 9
1 is a non-blank region rectangularization device, and 10 is a region labeling device. Each device will be explained in detail below.

量子化回路1は、原画像を光電変換装置等によ
り走査し、得られる電気信号を複数個のレベルに
量子化するもので、量子化されたデータはそのま
ま2次元画像メモリ2に記憶される。
The quantization circuit 1 scans an original image using a photoelectric conversion device or the like and quantizes the obtained electrical signal into a plurality of levels, and the quantized data is stored as is in the two-dimensional image memory 2.

第2図は傾き補正装置3によつて行なわれる傾
き補正の原理について説明したものである。aは
2次元画像メモリ2に記憶されている画像データ
の一例である。ここでb1は画面中に含まれる見出
しの文字、b2は本文の1つの文字列を示す。2次
元画像メモリ2に対して複数方向にラスター走査
し、各走査線上にある画素の濃度値の和である濃
度累積値を求め、その結果をヒストグラムで示し
たのが第2図e,fである。eは方向cの方向に
ラスター走査した場合、fは方向dの方向にラス
ター走査した場合に得られるヒストグラムであ
る。原画面を0、1の2値に量子化した場合、濃
度累積値は走査線上の黒画素数と等しい。第2図
から明らかな様に文字の並んでいる方向と走査方
向が一致した場合はヒストグラム上にピークが明
確に現われるので(f参照)、この性質を利用し
て傾きを補正する。具体的にはたとえば互いに隣
接する走査線における濃度累積値の差分(e′,f′)
をとり、全走査又は一部分の走査についての和で
ある濃度累積値差分絶体値和を用いる。2次元画
像メモリー内のデータに対し、濃度累積値差分絶
体値和を複数方向からのラスター走査について求
め、その中で最大の値を取る走査の方向を画面の
主方向とする。すなわち max {θ}{o-1i=1 |f(li+1)−f(li)|} となるθ0を求める。ここでf(li)は第i走査線上
にある画素の濃度累積値である。2次元画像デー
タに−θ0だけ回転を加えることにより傾きの補正
が実現出来る。
FIG. 2 explains the principle of tilt correction performed by the tilt correction device 3. a is an example of image data stored in the two-dimensional image memory 2. Here, b 1 represents a heading character included in the screen, and b 2 represents one character string of the main text. The two-dimensional image memory 2 is raster-scanned in multiple directions to obtain the cumulative density value, which is the sum of the density values of pixels on each scanning line, and the results are shown in a histogram as shown in Figures 2e and f. be. e is a histogram obtained when raster scanning is performed in the direction c, and f is a histogram obtained when raster scanning is performed in the direction d. When the original screen is quantized into binary values of 0 and 1, the cumulative density value is equal to the number of black pixels on the scanning line. As is clear from FIG. 2, when the direction in which the characters are lined up and the scanning direction match, a peak clearly appears on the histogram (see f), and this property is used to correct the inclination. Specifically, for example, the difference (e′, f′) in density cumulative values in mutually adjacent scanning lines
, and use the sum of the absolute values of the cumulative density value differences, which is the sum of the entire scan or a portion of the scan. For the data in the two-dimensional image memory, the sum of the absolute values of cumulative density value differences is determined for raster scanning from a plurality of directions, and the direction of scanning that takes the largest value among them is determined as the main direction of the screen. That is, θ 0 such that max {θ} { o-1i=1 |f(l i+1 )−f(l i )|} is determined. Here, f(l i ) is the cumulative density value of the pixel on the i-th scanning line. Correction of the tilt can be realized by adding rotation by −θ 0 to the two-dimensional image data.

回路構成例を第3図に示す。ラスター走査中に
画素の濃度値がレジスタ11に加算され、一本の
ラスター走査が終了すると差分絶体値回路13を
用いてレジスタ11と1走査前の濃度累積値が保
持されているバツフアメモリ12との差分絶体値
を取り、レジスタ14の内容に加算すると同時に
レジスタ11の内容をバツフアメモリ12に書
き、レジスタ11の内容をクリアする。画面全体
のラスター走査が終了した時にレジスタ14の内
容をメモリ15に記憶しレジスタ14をクリアす
る。16はメモリ15の内容を見て2次元画像デ
ータの傾き補正をする傾き補正回路である。画面
をθ度時計方向に回転させる時、原データの座標
(x、y)に対応する傾き補正後のデータの座標
(x、y)は x′=xcosθ−ysinθ y′=xsinθ+ycosθ で求められる。
An example of the circuit configuration is shown in FIG. During raster scanning, the density value of a pixel is added to the register 11, and when one raster scan is completed, the difference absolute value circuit 13 is used to add the density value of the pixel to the register 11 and the buffer memory 12, which holds the density cumulative value from one scan before. The absolute value of the difference is taken and added to the contents of the register 14, and at the same time the contents of the register 11 are written to the buffer memory 12, and the contents of the register 11 are cleared. When raster scanning of the entire screen is completed, the contents of the register 14 are stored in the memory 15 and the register 14 is cleared. Reference numeral 16 denotes a tilt correction circuit that looks at the contents of the memory 15 and corrects the tilt of the two-dimensional image data. When the screen is rotated clockwise by θ degrees, the coordinates (x, y) of the tilt-corrected data corresponding to the coordinates (x, y) of the original data are determined as follows: x′=xcosθ−ysinθ y′=xsinθ+ycosθ.

第4図は第1図中の領域分割装置4を用いて行
なう領域分割の原理について述べたものである。
領域分割装置4では傾き補正装置3で得られた傾
き補正画面の濃度累積値を用いる。傾き補正後の
画面に対して水平、垂直方向にラスター走査して
得られる濃度累積値を用いるのが一番効果的であ
る。濃度累積値は画面内に存在する文字列の位置
を反映する。すなわち、濃度累積値をヒストグラ
ムで表わすと文字列に対応してヒストグラム上に
ピークが現われるので、棒状ヒストグラムの立ち
上り、立ち下りの位置の座標を利用して文字列を
切り出す(第4図)。g1〜g6、h1〜h6は領域分割
線である。第5図は走査した画面内に文字列が存
在する場合に生ずる濃度ヒストグラムのピークの
一例である。ここでi1とi2の部分を検出出来れば
1つの文字列を切り出すことが可能である。ここ
で、i1、i2の部分を安定に検出するために第5図
i1〜i5に示される様な細かい凹凸を削除しておく
必要があるのでヒストグラムに対して以下に述べ
る修正を加える。第i走査における濃度累積値を
f(li)とした時 f(li)<f(i+1)ならば f(li)<f(li+a)かつf(li)≧f(li+a+1) となる最小の正の整数aを見つけ、aの値がある
一定値よりも小さければ第i+1走査から第i+
a走査までの濃度累積値を第i走査における濃度
累積値に置き換える。そしてこの処理を全ての走
査線における濃度累積値について行なう。この処
理によつて第5図上のi1、i2の立ち上り、立ち下
りの部分をなまらせずに細かい凹凸を削除するこ
とが出来る(第6図)。ヒストグラム上の幅の狭
い谷を埋めるにはヒストグラムに対しこれと逆の
処理とすれば良い。すなわち f(li)>f(li+1)ならば f(li)>f(li+1)ならば f(li)<f(li+a′)かつf(li)≦f(li+a
+1) となる最小の正の整数a′を見つけ、a′の値がある
一定値よりも小さければ第i+1走査から第i+
a走査までの濃度累積値を第i走査における濃度
累積値に置き換える。領域分割線の位置を決定す
るために、例えば濃度累積値f(li)とf(li+1)の
差分の符号を用いることが出来る。第6図で範囲
mを符号(+)の部分とする。その左端の濃度累
積値f(ls)と右端の濃度累積値f(le)の差があ
る一定値θ′以上であれば、その範囲の中にヒスト
グラムの立ち上りの部分があると考える。さらに
適当な値θ″を決め f(ls+1)−f(ls)<θ″ 〓 f(ls+j)−f(ls+j-1)<θ″ f(ls+j+1)−f(l+j)≧θ″ となる正の整数jを見つけ、ls+jとls+j-1の間を領
域分割線n1を引くための位置とする。ヒストグラ
ムの立ち下りの部分についても同様の処理をす
る。領域分割装置4で得られた結果は領域分割結
果記憶装置7に格納される。
FIG. 4 describes the principle of region division performed using the region division device 4 in FIG. 1.
The area dividing device 4 uses the cumulative density value of the tilt corrected screen obtained by the tilt correcting device 3. It is most effective to use cumulative density values obtained by raster scanning the screen after tilt correction in the horizontal and vertical directions. The density cumulative value reflects the position of the character string existing within the screen. That is, when the density cumulative value is expressed in a histogram, peaks appear on the histogram corresponding to character strings, so the character strings are cut out using the coordinates of the rising and falling positions of the bar-shaped histogram (FIG. 4). g 1 to g 6 and h 1 to h 6 are area dividing lines. FIG. 5 is an example of a peak in a density histogram that occurs when a character string exists within a scanned screen. Here, if parts i 1 and i 2 can be detected, it is possible to extract one character string. Here, in order to stably detect the i 1 and i 2 parts, Fig. 5 is used.
Since it is necessary to remove small irregularities such as those shown in i 1 to i 5 , the following modifications are made to the histogram. When the cumulative density value in the i-th scan is f(l i ), if f(l i ) < f( i+1 ), then f(l i ) < f(l i+a ) and f(l i ) ≥ Find the smallest positive integer a that satisfies f(l i+a+1 ), and if the value of a is smaller than a certain value, the
The density cumulative value up to the a scan is replaced with the density cumulative value in the i-th scan. This process is then performed for the density cumulative values in all scanning lines. By this process, fine irregularities can be removed without dulling the rising and falling portions of i 1 and i 2 in FIG. 5 (FIG. 6). To fill in narrow valleys on the histogram, the histogram may be processed in the opposite way. That is, if f(l i )>f(l i+1 ), then f(l i )>f(l i+1 ), then f(l i )<f(l i+a ′) and f(l i )≦f(l i+a
+1 ), and if the value of a' is smaller than a certain value, the
The density cumulative value up to the a scan is replaced with the density cumulative value in the i-th scan. In order to determine the position of the area dividing line, for example, the sign of the difference between the density cumulative values f(l i ) and f(l i+1 ) can be used. In FIG. 6, the range m is indicated by the sign (+). If the difference between the left end cumulative density value f( ls ) and the right end cumulative density value f( le ) is greater than or equal to a certain value θ', it is considered that there is a rising portion of the histogram within that range. Furthermore, determine an appropriate value θ″, f(l s+1 )−f(l s )<θ″ 〓 f(l s+j )−f(l s+j-1 )<θ″ f(l s+ Find a positive integer j that satisfies j+1 )−f(l +j )≧θ″, and set the position between l s+j and l s+j-1 to draw the area dividing line n 1 . Similar processing is performed for the falling portion of the histogram. The results obtained by the region dividing device 4 are stored in the region dividing result storage device 7.

フイールドセパレータ検出装置5は2次元画像
メモリー2内に存在するフイールドセパレータの
位置、長さ等を検出する装置である。フイールド
セパレータは画面を区切るために用いられる図形
の総称であり、通常直線状のものが用いられ、そ
の殆んどが画面に対して水平、垂直方向に存在す
る(第7図、Q1,Q2,R)。従つてある一定の濃
度値以上を持つ画素が水平、垂直方向に連続して
存在している部分を検出すればフイールドセパレ
ータの抽出が可能である。各画素の量子化レベル
が3以上の場合には適当なしきい値を与え、その
しきい値以上の濃度値を持つた画素がある決まつ
た数以上連続して存在する場所をフイールドセパ
レータとして検出する。直線状のフイールドセパ
レータであれば原理的にはこの手法で検出が可能
であるが印刷の状態、或はフイールドセパレータ
の種類によつて、かすれていたり、場合によつて
は正確な直線ではないものもあるので、フイール
ドセパレータを安定に検出するためにデータをぼ
かした状態にする。水平方向のフイールドセパレ
ータを検出する場合には縦方向のぼかしを加える
と効果的である。たとえば画素(i、j)の濃度
値がフイールドセパレータ検出のためのしきい値
を越えている場合には画素(i−1、j)、(i+
1、j)も計数の対象とする。さらにある一定の
距離以内にあるフイールドセパレータ同士を連結
するブリツジング操作を行なう。
The field separator detection device 5 is a device that detects the position, length, etc. of the field separator existing in the two-dimensional image memory 2. Field separators are a general term for shapes used to separate screens, and are usually linear, and most of them are horizontal or vertical to the screen (Fig. 7, Q 1 , Q 2 , R). Therefore, it is possible to extract a field separator by detecting a portion where pixels having a certain density value or more are continuously present in the horizontal and vertical directions. If the quantization level of each pixel is 3 or higher, an appropriate threshold value is given, and a location where a certain number or more of pixels with a density value higher than the threshold value continuously exists is detected as a field separator. do. In principle, it is possible to detect a straight field separator using this method, but depending on the printing condition or type of field separator, the field separator may be blurred or may not be an exact straight line. In order to stably detect the field separator, the data is blurred. When detecting field separators in the horizontal direction, it is effective to add blur in the vertical direction. For example, if the density value of pixel (i, j) exceeds the threshold for field separator detection, pixels (i-1, j), (i+
1, j) are also counted. Furthermore, a bridging operation is performed to connect field separators that are within a certain distance.

領域追加分割装置6では領域分割結果記憶装置
7の内容を見てフイールドセパレータ検出装置5
で検出されたフイールドセパレータが、領域分割
装置4で既に検出されていたかどうかを調べ、検
出されていない時は新たに領域を分割する。具体
的にはフイールドセパレータから幅方向に見てあ
る一定距離α以内に領域分割線があればそのフイ
ールドセパレータは装置4によつて検出されてい
るものとする。そうでない場合はフイールドセパ
レータを完全に含む最小の領域において検出され
たフイールドセパレータから距離αを持つて分割
線を加え装置7の内容を修正する。
The area additional division device 6 reads the contents of the area division result storage device 7 and uses the field separator detection device 5.
It is checked whether the field separator detected in is already detected by the area dividing device 4, and if it has not been detected, a new area is divided. Specifically, if there is a region dividing line within a certain distance α from the field separator in the width direction, it is assumed that the field separator has been detected by the device 4. If this is not the case, the contents of the device 7 are modified by adding a dividing line at a distance α from the detected field separator in the smallest area that completely includes the field separator.

第7図においてフイールドセパレータRは領域
分割線t5,t6により検出されていると考えられる
が、フイールドセパレータQ1,Q2はいずれも検
出されていない。そこでQ1全体を含む領域w1
w2,w3においてフイールドセパレータからαの
距離をもつて新しい分割線u1,u2を引く。Q2
ついても同様である。
In FIG. 7, field separator R is considered to be detected by area dividing lines t 5 and t 6 , but field separators Q 1 and Q 2 are not detected. Therefore, the area w 1 that includes the entire Q 1 ,
At w 2 and w 3 , new dividing lines u 1 and u 2 are drawn at a distance of α from the field separator. The same applies to Q2 .

非空白領域検出装置8は、領域分割装置4及び
領域追加分割装置6によつて分割され、その結果
が領域分割結果記憶装置7に格納されている個々
の領域に対して、そこに含まれる画素の濃度値の
総和を求め、面積に対するその値の割合が一定値
以下の場合にはその領域を空白領域とし、そうで
ないものを非空白領域とする。
The non-blank area detection device 8 detects the pixels included in each area divided by the area division device 4 and the area addition division device 6 and whose results are stored in the area division result storage device 7. The sum of the density values is determined, and if the ratio of the value to the area is less than a certain value, the area is determined to be a blank area, and if not, the area is determined to be a non-blank area.

非空白領域長方矩形化装置9は非空白領域検出
装置8によつて検出された非空白領域のうち互い
に連結した非空白領域をまとまつた1つの領域と
し、その領域全体を含む最小の長方矩形領域を切
り出し、その結果を領域分割結果記憶装置7にわ
たすものである(第8図)。第8図aでy11〜y15
y21,y25,y31,y34,y41,y43〜y44は空白領域、
y22〜y24,y32〜y33,y42は非空白領域である。こ
こにおいて非空白領域を1つにまとめ、非空白領
域全部を含む最小の長方矩形領域である第8図Z
を切り出し結果を装置7に格納する。2次元画像
メモリ2の中で装置7で非空白領域として登録さ
れている領域に対してさらに領域分割装置4を用
いた分割を行ない、最初の分割では分割し得なか
つた領域を分割する。第7図において領域x1
x2,x3は非空白領域として統合され、新たな分割
線v1によつて分割される。分割線v2についても同
様である。この操作をそれ以上分割線が引けなく
なるまで反復する。
The non-blank area rectangularization device 9 converts the connected non-blank areas detected by the non-blank area detection device 8 into one unified area, and converts the non-blank areas detected by the non-blank area detection device 8 into a minimum rectangular rectangle that includes the entire area. A rectangular area is cut out and the result is passed to the area division result storage device 7 (FIG. 8). In Figure 8a, y 11 ~ y 15 ,
y 21 , y 25 , y 31 , y 34 , y 41 , y 43 to y 44 are blank areas,
y 22 to y 24 , y 32 to y 33 , and y 42 are non-blank areas. Here, the non-blank areas are combined into one, and the minimum rectangular area containing all the non-blank areas is shown in FIG.
The result is stored in the device 7. The region registered as a non-blank region in the two-dimensional image memory 2 by the device 7 is further divided using the region dividing device 4, and the region that could not be divided in the first division is divided. In Fig. 7, the area x 1 ,
x 2 and x 3 are integrated as a non-blank area and divided by a new dividing line v 1 . The same applies to the dividing line v2 . Repeat this operation until no more dividing lines can be drawn.

領域ラベリング装置10では領域分割結果記憶
装置7の中に記憶されている個々の非空白領域に
対してその位置の座標、大きさ、カテゴリをテー
ブルにして出力する。
The region labeling device 10 outputs the coordinates, size, and category of each non-blank region stored in the region division result storage device 7 in the form of a table.

以上説明した様に、本発明によれば、OCR等
を用いて文書を入力する際に文書中に傾き補正用
のマークが印刷されていなくても、また複写等の
際に原稿が傾いて複写されたものでも、読み取る
ものが切り抜きの様なものであつても、また文字
の位置大きさ等が予め決められていない自由書式
のものでも、ラスタ走査を行なつた際の濃度値累
積を行なうようにして、比較的容易に文字領域を
切り出すことが出来る。なお本発明は、主に印刷
物に対して大きな効果をもつが、手書きの書類に
対しても有効であり、また文字以外の表、グラフ
等を含む紙面からの文字領域抽出にも有効であ
る。
As explained above, according to the present invention, when inputting a document using OCR etc., even if there is no skew correction mark printed in the document, or when copying, etc., the original is skewed and copied. Even if the object to be read is a cutout, or a free-format object in which the position and size of characters are not determined in advance, density values are accumulated during raster scanning. In this way, character areas can be cut out relatively easily. Although the present invention is largely effective for printed matter, it is also effective for handwritten documents, and is also effective for extracting character areas from sheets of paper that include tables, graphs, etc. other than characters.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明装置の一実施例ブロツク図、第
2図は角度補正の手法を説明する原理説明図、第
3図は第1図図示の傾き補正装置の一実施例回路
構成図、第4図は領域分割の原理を示す説明図、
第5図は濃度累積値ヒストグラムの一例、第6図
は該ヒストグラムに修正を加えて領域分割線の位
置を決定する手法を説明する説明図、第7図は領
域分割と文字領域の抽出とに関する説明図、第8
図は第1図図示の非空白領域長方矩形化装置の動
作を説明する説明図を示す。 図中、1は量子化回路、2は画像メモリ、3は
傾き補正装置、4は領域分割装置、5はフイール
ド・セパレータ検出装置、6は領域追加分割装
置、7は領域分割結果記憶装置、8は非空白領域
検出装置、9は非空白領域長方矩形化装置、10
は領域ラベリング装置を表わす。
FIG. 1 is a block diagram of an embodiment of the device of the present invention, FIG. 2 is a principle explanatory diagram illustrating the method of angle correction, and FIG. 3 is a circuit diagram of an embodiment of the tilt correction device shown in FIG. 1. Figure 4 is an explanatory diagram showing the principle of area division.
FIG. 5 is an example of a density cumulative value histogram, FIG. 6 is an explanatory diagram illustrating a method for determining the position of area dividing lines by modifying the histogram, and FIG. 7 is related to area division and character area extraction. Explanatory diagram, No. 8
The figure shows an explanatory diagram for explaining the operation of the non-blank area rectangularization device shown in FIG. In the figure, 1 is a quantization circuit, 2 is an image memory, 3 is a tilt correction device, 4 is an area division device, 5 is a field separator detection device, 6 is an area addition division device, 7 is an area division result storage device, 8 9 is a non-blank area detection device, 9 is a non-blank area rectangularization device, and 10 is a non-blank area detection device.
represents a region labeling device.

Claims (1)

【特許請求の範囲】 1 2次元画面を画素に分解し各画素の濃度に応
じて出力される電気信号を量子化する量子化回路
と、 量子化されたデータを格納する2次元画像メモ
リとをそなえ、 2次元画像メモリに対してラスタ走査を行なつ
て文字領域を抽出する2次元文字領域抽出装置に
おいて、 当該2次元画像メモリに対して複数方向からの
ラスタ走査を行ない、走査線上の画素について量
子化濃度値を累積し、当該濃度値累積結果が最も
急激に変化する走査方向を求めることにより入力
画面の傾きの検出を行ない、当該検出結果に基づ
いて傾きの補正を行なう傾き補正装置と、 該補正を行なつた結果の2次元画像メモリに対
して複数方向からラスタ走査を行なうことによつ
て得られる濃度値累積結果が急激に変化する部分
を検出して領域分割を行う装置と、 該領域分割装置を用いて得られた結果を格納す
る装置と、 上記2次元画像メモリにおいて所定の値以上の
画素の連続量からフイールド・セパレータを検出
するフイールド・セパレータ検出装置と、 該フイールド・セパレータ検出装置によつて検
出されたフイールド・セパレータにもとづいて上
記既に得られている領域分割結果を補正する領域
追加分割装置とをそなえ、 文字領域を抽出するようにした ことを特徴とする2次元文字領域抽出装置。
[Claims] 1. A quantization circuit that decomposes a two-dimensional screen into pixels and quantizes an electrical signal output according to the density of each pixel, and a two-dimensional image memory that stores the quantized data. In preparation, in a two-dimensional character area extraction device that performs raster scanning on a two-dimensional image memory to extract a character area, raster scanning is performed on the two-dimensional image memory from multiple directions, and pixels on a scanning line are extracted. a tilt correction device that detects the tilt of an input screen by accumulating quantized density values and determining the scanning direction in which the density value accumulation results change most rapidly, and corrects the tilt based on the detection result; a device that performs region segmentation by detecting a portion where the density value cumulative result obtained by raster scanning the two-dimensional image memory resulting from the correction from multiple directions changes rapidly; a device for storing results obtained using a region dividing device; a field separator detecting device for detecting a field separator from a continuous amount of pixels having a predetermined value or more in the two-dimensional image memory; A two-dimensional character area, characterized in that it is equipped with an area additional dividing device that corrects the already obtained area dividing result based on the field separator detected by the device, and extracts a character area. Extraction device.
JP55126845A 1980-09-12 1980-09-12 Two-dimensional character area extracting device Granted JPS5752971A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55126845A JPS5752971A (en) 1980-09-12 1980-09-12 Two-dimensional character area extracting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55126845A JPS5752971A (en) 1980-09-12 1980-09-12 Two-dimensional character area extracting device

Publications (2)

Publication Number Publication Date
JPS5752971A JPS5752971A (en) 1982-03-29
JPS6325391B2 true JPS6325391B2 (en) 1988-05-25

Family

ID=14945286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55126845A Granted JPS5752971A (en) 1980-09-12 1980-09-12 Two-dimensional character area extracting device

Country Status (1)

Country Link
JP (1) JPS5752971A (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5966783A (en) * 1982-10-08 1984-04-16 Fuji Electric Co Ltd String inspection device
JPH0648501B2 (en) * 1984-04-17 1994-06-22 富士通株式会社 Character position detection circuit
JP2644724B2 (en) * 1985-07-12 1997-08-25 株式会社日立製作所 Document image skew correction method
JPH0833306B2 (en) * 1988-07-23 1996-03-29 富士重工業株式会社 Vehicle diagnostic device and analog display method for vehicle diagnostic device
JPH0383188A (en) * 1989-08-28 1991-04-09 Fujitsu Ltd Document inclination detecting system
JPH09120430A (en) * 1996-10-18 1997-05-06 Hitachi Ltd Image processing device
JP4738469B2 (en) 2008-10-29 2011-08-03 株式会社東芝 Image processing apparatus, image processing program, and image processing method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5437540A (en) * 1977-08-30 1979-03-20 Ricoh Co Ltd Pre-processing system of scanning-type character pattern recognition device

Also Published As

Publication number Publication date
JPS5752971A (en) 1982-03-29

Similar Documents

Publication Publication Date Title
US5418865A (en) Mark sensing on a form
JP2930612B2 (en) Image forming device
US5613016A (en) Area discrimination system for text image
JPH03201866A (en) Decision of picture skew angle from data including data of compressed form
Bhattacharjya et al. Data embedding in text for a copier system
JP2000200321A (en) Method for detecting and reading a two-dimensional bar code
JPH05233873A (en) Area dividing method
JPH08202815A (en) Method and device for detecting vertical direction of document
JPS6325391B2 (en)
JP4275973B2 (en) Retouched image extraction apparatus, program, storage medium, and retouched image extraction method
Lehal et al. A range free skew detection technique for digitized Gurmukhi script documents
JP4281236B2 (en) Image recognition apparatus, image recognition method, and computer-readable recording medium storing image recognition program
JPH0410087A (en) Base line extracting method
JPH07230525A (en) Ruled line recognition method and table processing method
Fan et al. A comprehensive image processing suite for book re-mastering
JPH0250513B2 (en)
Gayashan et al. Old sinhala newspaper article segmentation for content recognition using image processing
Wijaya et al. Staff line restoration
JP2877548B2 (en) Document image attribute discrimination method
JP4439054B2 (en) Character recognition device and character frame line detection method
JPS6252337B2 (en)
JP3142950B2 (en) Line segment recognition method
JP3381803B2 (en) Tilt angle detector
JP2010218106A (en) Image processing apparatus, image processing method and program
JPS5949671A (en) Optical character reader