[go: up one dir, main page]

KR100205599B1 - How to Binarize Text Documents - Google Patents

How to Binarize Text Documents Download PDF

Info

Publication number
KR100205599B1
KR100205599B1 KR1019970004639A KR19970004639A KR100205599B1 KR 100205599 B1 KR100205599 B1 KR 100205599B1 KR 1019970004639 A KR1019970004639 A KR 1019970004639A KR 19970004639 A KR19970004639 A KR 19970004639A KR 100205599 B1 KR100205599 B1 KR 100205599B1
Authority
KR
South Korea
Prior art keywords
pixel
interest
binarization
continuity
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1019970004639A
Other languages
Korean (ko)
Other versions
KR19980068157A (en
Inventor
김지형
Original Assignee
윤종용
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자주식회사 filed Critical 윤종용
Priority to KR1019970004639A priority Critical patent/KR100205599B1/en
Publication of KR19980068157A publication Critical patent/KR19980068157A/en
Application granted granted Critical
Publication of KR100205599B1 publication Critical patent/KR100205599B1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

가. 청구범위에 기재된 발명이 속한 기술분야end. The technical field to which the invention described in the claims belongs

화상입력장치에서 문서를 스캔하여 얻어진 화상을 이치화하는 방법에 관한 것이다.A method of binarizing an image obtained by scanning a document in an image input apparatus.

나. 발명이 해결하고자 하는 기술적 과제I. The technical problem to be solved by the invention

노이즈 성분이 존재하는 화상에 대하여도 화질 및 압축율을 향상시킬 수 있는 문자 문서화상의 이치화방법을 제공한다.Provided are a binarization method of a character document image that can improve image quality and compression ratio even for an image having a noise component.

다. 발명의 해결방법의 요지All. Summary of Solution of the Invention

스캔 화상의 주목화소가 문자의 경계부분인 경우 방향성에 따른 연속성 여부를 조사하여, 연속성이 있는 경우에는 같은 방향의 이전 화소에 대한 이치화값과 동일한 값으로 이치화하고, 연속성이 없는 경우에는 국부 역치를 적용하여 이치화한다.If the pixel of interest in the scanned image is the boundary of the character, it is examined for continuity according to the directionality. If there is continuity, it is binarized to the same value as the binarization value for the previous pixel in the same direction. Apply and binarize.

라. 발명의 중요한 용도la. Important uses of the invention

문자 문서화상을 이치화하는데 이용한다.Used to binarize text document images.

Description

문자 문서화상의 이치화방법How to Binarize Text Documents

본 발명은 화상입력장치에 관한 것으로, 특히 문서를 스캔(scan)하여 얻어진 화상을 이치화하는 방법에 관한 것이다.The present invention relates to an image input device, and more particularly, to a method for binarizing an image obtained by scanning a document.

통상적으로 팩시밀리(facsimile), 스캐너(scanner), 디지털 복사기등에 채용되는 화상입력장치는 문서를 스캔하여 얻어진 아나로그 화상신호를 디지털 화상데이터로 변환한후 처리한다. 이때 아나로그 화상신호는 화소마다 원래의 문서에 대응하는 계조를 가지는 디지털 화상데이터로 변환되는데, 계조를 가지게 되므로 데이터량이 아주 많게 된다. 예를들어 256단계의 계조를 가지는 경우 각 화소는 8비트로 표현된다. 이에따라 통상적으로 스캔에 따른 화상데이터를 이치화하므로써 데이터량을 대폭적으로 줄인 다음에 부호화한후 송신하거나 복사 문서를 출력한다. 상기 이치화는 계조를 가지는 각 화소를 "백"화소 또는 "흑"화소로 결정하는 것으로, "백"화소와 "흑"화소는 상대적으로 "1" 또는 "0"의 1비트 데이터로 표현된다.BACKGROUND ART Image input devices employed in facsimile, scanner, digital copier, and the like are typically processed after converting an analog image signal obtained by scanning a document into digital image data. At this time, the analog image signal is converted to digital image data having a gradation corresponding to the original document for each pixel. Since the gradation has a gradation, the amount of data becomes very large. For example, in the case of 256 gray levels, each pixel is represented by 8 bits. Accordingly, by binarizing the image data according to the scan, the amount of data is drastically reduced and then encoded and transmitted or a copy document is output. The binarization determines each pixel having a gradation as a "white" pixel or a "black" pixel, and the "white" pixel and the "black" pixel are relatively represented by 1-bit data of "1" or "0".

이러한 이치화는 문서화상의 종류에 따라 각각 다른 방법을 채용한다. 상기 문서화상의 종류는 문자로 이루어진 문자 문서, 그림(또는 사진)으로 이루어진 그림 문서, 그리고 문자와 그림이 혼재된 문서로 구분되어 진다. 이들중 문자를 이치화하는 방법으로는 전역 역치(global threshold)를 사용하는 방법과 국부 역치(local threshold)를 사용하는 방법이 대표적이다. 이 중에서 국부 역치를 이용하는 방법이 문서의 특성을 잘 반영하기 때문에 더욱 우수한 결과를 얻는다. 국부 역치를 적용할 때는 화상의 전체 영역에 대하여 할 수도 있고, 에지(edge)부분에서만 할 수도 있다.This binarization adopts a different method depending on the type of document image. The document image is classified into a text document consisting of text, a picture document consisting of a picture (or a picture), and a document in which text and pictures are mixed. Among these, the method of binarizing characters is a method of using a global threshold and a method of using a local threshold. Among them, the method using the local threshold reflects the characteristics of the document better, so the result is better. When applying a local threshold, this may be done for the entire area of the image or only at the edge part.

이전부터 사용되어 왔었던 문자 이치화방법에서 대표적인 것으로는 현재 이치화 처리할 화소인 주목화소의 주변화소값 중에서 최대값과 최소값을 구하여 이 값의 차이가 미리 설정된 역치보다 크면 에지로 인식하여 국부 역치로써 이치화하고,역치보다 작으면 배경으로 인식하여 전역 역치로써 이치화하는 방법이 있다. 이러한 방법을 통상적으로 최소-최대(minimum-maximum)방법이라 한다. 이 방법은 전역 역치를 사용하는 방법과 국부 역치를 사용하는 방법의 장점을 결합한 것으로서 일반 문서화상에서 좋은 결과를 보여준다.The typical character binarization method that has been used before is the maximum and minimum values of the surrounding pixel values of the pixel of interest, which are the pixels to be binarized, and if the difference is greater than the preset threshold, the edge is recognized as a local threshold. If it is smaller than the threshold, it is recognized as a background and binarized as a global threshold. This method is commonly referred to as a minimum-maximum method. This method combines the advantages of using a global threshold and a local threshold, and shows good results in general documentation.

그러나 상기한 최소-최대방법에서 문제되는 것은 에지의 방향성 및 연속성을 고려하지 않고 에지를 검출하기 때문에 실제 문자의 경계부분인 에지가 아닌 노이즈 성분까지 추출한다는 것이다. 이러한 결과로써 노이즈 성분이 존재하는 화상에 대하여 좋지 않은 결과를 나타내며, 추출된 에지 역시 직선화되지 못한다는 단점이 있다. 이와같이 에지가 직선화되지 못하면 런장(run-length) 부호화와 같은 데이터 압축 부호화를 할 때 압축율이 떨어지므로 데이터 전송시 전송효율이 떨어지고 화질이 저하된다.However, a problem in the above-described minimum-maximum method is that since edges are detected without considering the directionality and continuity of the edges, the noise components are extracted, not the edges of the actual character. As a result of this, a bad result is obtained for an image in which a noise component exists, and there is a disadvantage in that the extracted edge is also not straightened. As such, if the edge is not straightened, the compression rate is lowered during data compression coding such as run-length coding, so that the transmission efficiency is lowered and the image quality is degraded during data transmission.

상술한 바와 같이 종래의 문자 문서화상의 이치화방법은 에지의 방향성 및 연속성을 고려하지 않고 에지를 검출하여 이치화함에 따라 노이즈 성분이 존재하는 화상에 대하여는 화질이 저하될 뿐만아니라 에지가 직선화되지 못하므로 압축율이 떨어지는 단점이 있었다.As described above, the conventional method of binarizing a text document image detects and binarizes edges without considering the directionality and continuity of the edges. There was a downside to this falling.

따라서 본 발명의 목적은 노이즈 성분이 존재하는 화상에 대하여도 화질 및 압축율을 향상시킬 수 있는 문자 문서화상의 이치화방법을 제공함에 있다.Accordingly, an object of the present invention is to provide a binarization method of a character document image that can improve image quality and compression ratio even for an image having a noise component.

도 1은 본 발명이 적용되는 통상적인 스캐너의 블록구성도,1 is a block diagram of a conventional scanner to which the present invention is applied;

도 2는 본 발명의 실시예에 따른 처리 흐름도.2 is a process flow diagram in accordance with an embodiment of the present invention.

도 3은 통상적인 에지의 크기 및 방향성을 검출하는 윈도우 예시도,3 is an exemplary window for detecting the size and direction of a typical edge;

도 4는 본 발명에서 방향성에 따른 연속성을 조사하는 방법을 보인 예시도,Figure 4 is an exemplary view showing a method for investigating continuity according to the direction in the present invention,

도 5는 본 발명에서 국부 역치를 결정하는 방법을 보인 예시도,5 is an exemplary view showing a method for determining a local threshold in the present invention,

상술한 목적을 달성하기 위한 본 발명은 스캔 화상의 주목화소가 문자의 경계부분인 경우 방향성에 따른 연속성 여부를 조사하여, 연속성이 있는 경우에는 같은 방향의 이전 화소에 대한 이치화값과 동일한 값으로 이치화하고, 연속성이 없는 경우에는 국부 역치를 적용하여 이치화함을 특징으로 한다.According to the present invention for achieving the above object, if the pixel of interest in the scanned image is the boundary portion of the character, the continuity according to the directionality is examined, and if there is continuity, it is binarized to the same value as the binarization value for the previous pixel in the same direction. And if there is no continuity, it is binarized by applying a local threshold.

이하 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명 및 첨부 도면에서 구체적인 처리 흐름이나 윈도우(window)와 같은 많은 특정 상세들이 본 발명의 보다 전반적인 이해를 제공하기 위해 나타나 있다. 이들 특정 상세들없이 본 발명이 실시될 수 있다는 것은 이 기술분야에서 통상의 지식을 가진 자에게 자명할 것이다. 그리고 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the following description and the annexed drawings, numerous specific details are set forth in order to provide a more thorough understanding of the present invention, such as specific processing flows or windows. It will be apparent to those skilled in the art that the present invention may be practiced without these specific details. And a detailed description of known functions and configurations that may unnecessarily obscure the subject matter of the present invention will be omitted.

도 1은 본 발명이 적용되는 통상적인 스캐너의 블록구성도를 보인 것이다. 중앙처리장치(100)는 원고감지센서(112)에 의해 원고 장착을 감지하고 조작 패널(operational panel)(110)로부터 스캔 시작명령이 입력될 때 이미지 프로세서(104)를 제어하여 원고를 스캔한다. 스캔 유니트(102)는 원고를 스캔하기 위한 광학계를 포함하며 원고를 스캔하여 아나로그 화상신호를 발생한다. 이미지 프로세서(104)는 스캔 유니트(102)를 구동하며 스캔 유니트(102)로부터 출력되는 화상신호를 디지털 데이터로 변환하고 이미지 처리 및 이치화한다. 롬(ROM: Read Only Memory)(106)에는 중앙처리장치(100)의 동작 프로그램과 각종 참조데이터가 미리 저장된다. 램(RAM: Random Access Memory)(108)은 중앙처리장치(100)의 동작 수행에 따른 데이터가 일시 저장된다. 조작패널(110)은 중앙처리장치(100)에 사용자에 의한 키입력을 제공한다. 원고감지센서(112)는 원고가 장착되는 것을 감지하여 중앙처리장치(100)에 알린다.Figure 1 shows a block diagram of a conventional scanner to which the present invention is applied. The central processing unit 100 detects the document mounting by the document detection sensor 112 and controls the image processor 104 to scan the document when a scan start command is input from the operation panel 110. The scanning unit 102 includes an optical system for scanning an original and scans the original to generate an analog image signal. The image processor 104 drives the scan unit 102 to convert the image signal output from the scan unit 102 into digital data, and to process and binarize the image. The ROM (Read Only Memory) 106 stores the operation program of the CPU 100 and various reference data in advance. The random access memory (RAM) 108 temporarily stores data according to an operation of the CPU 100. The operation panel 110 provides a key input by the user to the CPU 100. The document detection sensor 112 detects that the document is mounted and notifies the central processing unit 100.

본 발명은 상기한 스캐너와 같은 화상입력장치에 있어서 전술한 종래의 단점을 해결하기 위해 에지의 방향성 및 연속성을 고려하여 에지부분을 이치화한다. 즉, 에지의 연속성이 존재할 경우 이치화 결과가 직선화되도록 한다.The present invention binarizes the edge portion in consideration of the directionality and continuity of the edge in order to solve the above-mentioned disadvantages in the image input apparatus such as the scanner. In other words, if the continuity of the edge is present, the binarization result is straightened.

도 2는 이를 위한 본 발명의 실시예에 따른 처리 흐름도로서, 편의상 1화소를 이치화하는 예를 보인 것으로, 모든 화소들에 대해 동일하게 적용된다. 이러한 도 2의 흐름도에 따른 동작은 상기한 도 1의 이미지 프로세서(104)에 의해 수행되도록 프로그램한다.2 is a flowchart illustrating a process of binarizing one pixel for convenience, according to an exemplary embodiment of the present invention. The same applies to all pixels. The operation according to the flowchart of FIG. 2 is programmed to be performed by the image processor 104 of FIG.

상기와 같은 상태에서 원고감지센서(112)에 의해 원고 장착이 감지되고 조작 패널(110)로부터 스캔 시작명령이 입력됨에 따라 중앙처리장치(100)의 제어에 의해 이미지 프로세서(104)가 스캔 유니트(102)에 의해 원고를 스캔하기 시작하면, 스캔 유니트(102)로부터 원고 스캔에 따른 화상신호가 출력된다. 그러면 이미지 프로세서(104)는 스캔 유니트(102)로부터 출력되는 화상신호를 디지털 화상데이터로 변환한후, 스캔하는 라인단위로 화소값을 램(108)에 저장하고 도 2의 흐름도에 따른 이치화를 수행한다. 이하의 설명에서 스캔 화상을 저장하는 라인수는 3라인을 기본값으로 하는 것으로 가정한다.As the document is detected by the document detection sensor 112 and the scan start command is input from the operation panel 110 in the above state, the image processor 104 is controlled by the central processing unit 100 under the control of the scanning unit ( When the original is scanned by 102, an image signal corresponding to the original scan is output from the scanning unit 102. Then, the image processor 104 converts the image signal output from the scan unit 102 into digital image data, stores the pixel value in the RAM 108 in units of lines scanned, and binarizes according to the flowchart of FIG. 2. do. In the following description, it is assumed that the number of lines for storing the scanned image is based on three lines as a default.

먼저 이미지 프로세서(104)는 도 2의 (200)단계에서 이치화할 주목화소를 지정한후, (202)단계에서 에지의 크기 및 방향성을 검출한다. 이때 도 3(a)∼도 3(d)에 보인 바와 같이 방향성을 결정할 수 있는 4개의 윈도우를 사용하여 에지의 크기 및 방향성을 검출한다. 상기 도 3(a)는 0˚방향의 윈도우를 보인 것이고, 도 3(b)는 45˚방향의 윈도우를 보인 것이며, 도 3(c)는 90˚방향의 윈도우를 보인 것이며, 도 3(d)는 135˚방향의 윈도우를 보인 것이다. 상기 도 3(a)∼도 3(d)의 윈도우는 3개의 라인, 즉 i번째 라인의 j열의 화소를 주목화소라 할 때 i-1번째 라인과 i번째 라인과 i+1번째 라인 각각의 j-1열, j열, j+1열의 화소에 대해 해당하는 가중치를 주는 것으로, 이러한 에지검출방법은 기존에 이미 공지된 Kirsch방법을 보인 것이다. 그러므로 이에 대한 상세한 설명은 생략한다.First, the image processor 104 designates the pixel of interest to be binarized in operation 200 of FIG. 2, and then detects the size and direction of the edge in operation 202. At this time, as shown in Figs. 3A to 3D, the size and the direction of the edge are detected using four windows that can determine the direction. FIG. 3 (a) shows a window in the direction of 0 °, FIG. 3 (b) shows a window in the direction of 45 °, and FIG. 3 (c) shows a window in the direction of 90 °, and FIG. 3 (d). ) Shows the window at 135˚. 3 (a) to 3 (d) show three lines, i.e., the pixel of column j of the i-th line as the pixel of interest, the i-1th line, the i-th line and the i + 1th line, respectively. By giving the corresponding weights to the pixels of the j-1 column, the j column, and the j + 1 column, the edge detection method is a known Kirsch method. Therefore, detailed description thereof will be omitted.

상기와 같이 4가지 윈도우를 사용하는 에지검출방법에 의해 에지의 크기 및 방향성을 검출한후 이미지 프로세서(104)는 (204)단계에서 에지의 크기, 즉 4개의 윈도우를 사용하여 얻은 4개의 크기값 중에 가장 큰 값을 미리 설정된 역치와 비교한다. 이때 에지의 크기가 역치보다 크면 주목화소가 문자의 경계부분임을 의미하고, 역치보다 작으면 주목화소가 경계부분이 아닌 문자 내부나 배경임을 의미한다.After detecting the size and orientation of the edge by the edge detection method using four windows as described above, the image processor 104 determines the size of the edge, that is, four size values obtained by using four windows in step 204. Value is compared with the preset threshold. If the size of the edge is larger than the threshold, the pixel of interest is the boundary of the character. If the edge is smaller than the threshold, the pixel of interest is the inside or background of the character, not the boundary.

이때 만일 에지의 크기가 역치보다 크지 않으면 주목화소가 문자의 경계부분이 아니고 문자 내부나 배경이므로 종래의 최소-최대방법과 동일하게 이치화하여도 된다. 이에따라 이미지 프로세서(104)는 (206)∼(210)단계에서 최소-최대방법에서와 마찬가지로 전역 역치를 적용하여 이치화한다. 즉, 이미지 프로세서(104)는 (206)단계에서 주목화소값을 전역 역치와 비교하여, 전역 역치보다 크면 (208)단계에서 주목화소를 "백"으로 이치화하고 전역 역치보다 작으면 (210)단계에서 주목화소를 "흑"으로 이치화한다. 이때 전역 역치로서는 예를 들어 입력 화상의 최대계조값의 반으로 설정한다.At this time, if the size of the edge is not larger than the threshold value, the pixel of interest may be binarized in the same way as the conventional minimum-maximum method because the pixel of interest is not the boundary of the character but the inside or the background. Accordingly, the image processor 104 binarizes the global thresholds in steps 206 to 210 as in the min-max method. That is, the image processor 104 compares the pixel of interest value with the global threshold in step 206, binarizes the pixel of interest to “white” if it is greater than the global threshold in step 208 and 210 if it is smaller than the global threshold in step 208. The pixel of interest is binarized to "black." At this time, the global threshold value is set to, for example, half of the maximum gradation value of the input image.

이와달리 상기 (204)단계에서 에지의 크기가 역치보다 크면, 주목화소가 일단은 문자의 경계부분으로 볼 수 있으나, 노이즈 성분으로 인한 화질 저하나 에지가 직선화되지 못하게 되는 것을 방지하기 위해 (212)∼(222)단계에서 에지의 방향성 및 연속성을 고려하여 에지부분을 이치화한다.On the other hand, if the size of the edge is larger than the threshold in step 204, the pixel of interest may be viewed as the boundary of the character. However, in order to prevent the deterioration of the image quality or the straightening of the edge due to noise components (212). In step 222, the edge portion is binarized in consideration of the directionality and continuity of the edge.

상기 (212)단계에서 이미지 프로세서(104)는 상기 (202)단계에서 검출된 에지의 방향성에 따라 이전에 검출된 에지와의 연속성 여부를 결정한다. 이때 전술한 바와 같은 도 3(a)∼3(d)의 윈도우에 의해 0˚, 45˚, 90˚, 135˚중에 한 방향으로 결정된 에지의 방향성에 따라 도 4(a)∼4(d)중에 하나를 적용하여 연속성을 조사한다. 상기 도 4(a)∼4(d)는 에지로 검출된 주목화소를 x라 할 때 빗금친 화소와 연속성을 조사하는 것을 보인 것이다. 즉, 주목화소가 0˚의 방향성을 가지는 에지인 것으로 검출된 경우에는 도 4(a)와 같이 빗금친 부분에 주목화소와 같은 0˚의 에지가 있는가를 조사한다. 이와 마찬가지로 주목화소가 45˚의 방향성을 가지는 에지인 것으로 검출된 경우에는 도 4(b)와 같이 빗금친 부분에 주목화소와 같은 45˚의 에지가 있는가를 조사하고, 주목화소가 90˚의 방향성을 가지는 에지인 것으로 검출된 경우에는 도 4(c)와 같이 빗금친 부분에 주목화소와 같은 90˚의 에지가 있는가를 조사하며, 주목화소가 135˚의 방향성을 가지는 에지인 것으로 검출된 경우에는 도 4(d)와 같이 빗금친 부분에 주목화소와 같은 135˚의 에지가 있는가를 조사한다. 이와 같이 연속성을 조사하므로써 에지의 직선화를 이룰 수 있게 된다.In step 212, the image processor 104 determines whether the image processor 104 is continuity with a previously detected edge according to the direction of the edge detected in step 202. At this time, according to the directionality of the edge determined in one direction among 0 °, 45 °, 90 °, and 135 ° by the windows of FIGS. 3A to 3D as described above, FIGS. 4A to 4D. Examine the continuity by applying one of them. 4 (a) to 4 (d) show that the pixel of interest detected as an edge is examined for continuity with the shaded pixel. That is, when it is detected that the pixel of interest is an edge having a directionality of 0 °, it is checked whether there is an edge of 0 ° like the pixel of interest in the hatched portion as shown in Fig. 4A. Similarly, when the pixel of interest is detected to be an edge having a directionality of 45 °, it is checked whether the pixel of interest has an edge of 45 ° like the pixel of interest as shown in FIG. 4 (b). If it is detected that the branch is an edge, as shown in Fig. 4 (c), it is examined whether there is an edge of 90 degrees, such as the pixel of interest, and if it is detected that the pixel of interest is an edge having directionality of 135 degrees, Fig. 4 Investigate whether there are 135 ° edges, such as the pixel of interest, in the hatched areas as shown in (d). By examining the continuity in this way, the edge can be straightened.

상기 (212)단계에서 연속성을 조사한후, 이미지 프로세서(104)는 (214)단계에서 조사 결과가 연속성이 있는가를 검사한다. 이때 연속성이 있다면 주목화소를 같은 방향의 이전 화소와 동일하게 이치화하면 에지가 직선화될 것이다. 이와 같이 에지의 직선화를 위해 이미지 프로세서(104)는 (216)단계에서 주목화소를 같은 방향의 이전 화소와 동일한 값으로 이치화한다. 이때 이전 화소는 주목화소의 방향에 따라 상기한 도 4(a)∼4(d)중에 하나에 있는 빗금친 화소가 된다.After checking the continuity in step 212, the image processor 104 checks whether the irradiation result is continuity in step 214. If there is continuity, the edge will be straightened if the pixel of interest is binarized with the previous pixel in the same direction. In order to straighten the edges, the image processor 104 binarizes the pixel of interest to the same value as the previous pixel in the same direction in step 216. At this time, the previous pixel becomes the hatched pixel in one of Figs. 4 (a) to 4 (d) according to the direction of the pixel of interest.

이와달리 상기 (214)단계에서 연속성이 없다면 주목화소에 대해 이전 화소를 고려할 필요가 없으므로 종래의 최소-최대방법과 마찬가지로 국부 역치를 적용하여 이치화한다. 이에따라 이미지 프로세서(104)는 (218)∼(222)단계에서 최소-최대방법에서와 마찬가지로 국부 역치를 적용하여 이치화한다. 즉, 이미지 프로세서(104)는 (218)단계에서 주목화소값을 국부 역치와 비교하여, 국부 역치보다 크면 (220)단계에서 주목화소를 "백"으로 이치화하고 국부 역치보다 작으면 (222)단계에서 주목화소를 "흑"으로 이치화한다.On the other hand, if there is no continuity in step 214, it is not necessary to consider the previous pixel with respect to the pixel of interest, so that it is binarized by applying a local threshold as in the conventional minimum-maximum method. Accordingly, the image processor 104 applies and localizes local thresholds as in the minimum-maximum method in steps 218 to 222. That is, the image processor 104 compares the pixel value of interest with the local threshold in step 218, binarizes the pixel of interest to “white” in step 220 if it is greater than the local threshold, and in step 222 if it is smaller than the local threshold. The pixel of interest is binarized to "black."

여기서 국부 역치를 결정하는 방법을 예를들어 보이면 도 5(a)∼5(d)와 같다. 도 5(a)는 주목화소의 에지가 0˚의 방향성을 가지는 경우, 빗금친 부분의 평균값을 국부역치로 설정하는 것을 보이고 있다. 이와 마찬가지로 도 5(b), 5(c), 5(d)는 각각 주목화소의 에지가 45˚, 90˚, 135˚의 방향성을 가지는 경우, 빗금친 부분의 평균값을 국부역치로 설정하는 것을 보인다. 이때 특별히 "▩"로 표시한 부분은 가중치를 부여할 수도 있다.Herein, a method of determining the local threshold is shown in Figs. 5 (a) to 5 (d). FIG. 5A shows that when the edge of the pixel of interest has a direction of 0 °, the average value of the hatched portion is set as the local threshold. Similarly, in FIGS. 5B, 5C, and 5D, when the edges of the pixel of interest have directivity of 45 °, 90 °, and 135 °, the average value of the hatched portion is set to the local threshold. see. At this time, the portion marked with "▩" may be given a weight.

상술한 하나의 화소에 대한 이치화과정을 종료하면 리턴하여 전체 화상에 대한 이치화를 완료할때까지 다시 다음의 화소를 주목화소로 지정하고 이치화하는 동일한 동작이 반복적으로 이루어진다.When the above-mentioned binarization process for one pixel is finished, the same operation is repeated until the next pixel is designated and binarized again until the binarization of the entire image is completed.

따라서 에지의 방향성 및 연속성을 고려하여 이치화하므로 에지의 직선화가 이루어질 수 있고 노이즈로 인한 고립점 생성을 방지할 수 있다. 그러므로 노이즈 성분이 존재하는 화상에 대하여도 실제 문자의 에지만을 우수하게 추출할 수 있다.Therefore, since the binarization is performed in consideration of the directionality and continuity of the edge, straightening of the edge can be achieved and generation of an isolated point due to noise can be prevented. Therefore, only the edges of the actual characters can be excellently extracted even for an image having a noise component.

한편 상술한 본 발명의 설명에서는 구체적인 실시예에 관해 설명하였으나, 여러가지 변형이 본 발명의 범위에서 벗어나지 않고 실시할 수 있다. 특히 본 발명의 실시예에서 보인 전역 역치나 국부 역치를 결정하는 방법은 필요에 따라 얼마든지 달라질 수 있다. 따라서 발명의 범위는 설명된 실시예에 의하여 정할 것이 아니고 특허 청구의 범위와 특허 청구의 범위의 균등한 것에 의해 정하여져야 한다.Meanwhile, in the above description of the present invention, specific embodiments have been described, but various modifications can be made without departing from the scope of the present invention. In particular, the method of determining the global threshold or the local threshold shown in the embodiment of the present invention may vary as needed. Therefore, the scope of the invention should not be defined by the described embodiments, but should be defined by the equivalents of the claims and the claims.

상술한 바와 같이 본 발명은 문자 문서화상의 이치화방법에 있어서 에지의 연속성이 존재할 경우 이치화 결과가 직선화됨으로써 압축 부호화할 때 압축율을 높일 수 있는 잇점이 있다. 또한 노이즈 성분이 존재하는 화상에 대하여도 실제 문자의 에지만을 우수하게 추출함으로써 화질을 향상시킬 수 있다.As described above, in the binarization method of a character document image, the edge continuity is linearized when the continuity of edges is present. In addition, the image quality can be improved by extracting only the edges of the actual characters with respect to an image having a noise component.

Claims (8)

문자 문서를 스캔하여 얻어진 화상을 이치화하는 방법에 있어서,In the method for binarizing an image obtained by scanning a text document, 상기 스캔 화상의 주목화소가 문자의 경계부분인 경우 방향성에 따른 연속성 여부를 조사하여, 연속성이 있는 경우에는 같은 방향의 이전 화소에 대한 이치화값과 동일한 값으로 이치화하고, 연속성이 없는 경우에는 국부 역치를 적용하여 이치화함을 특징으로 하는 이치화방법.If the pixel of interest of the scanned image is the boundary of the character, the continuity according to the direction is examined. If there is continuity, the pixel is binarized to the same value as the binarization value for the previous pixel in the same direction. Binarization method characterized in that the binarization by applying. 문자 문서를 스캔하여 얻어진 화상을 이치화하는 방법에 있어서,In the method for binarizing an image obtained by scanning a text document, 상기 스캔 화상의 주목화소에 대한 에지의 크기 및 방향성을 검출하는 크기 및 방향성 검출과정과,A size and directionality detection process of detecting the size and directionality of an edge of the pixel of interest of the scanned image; 상기 에지의 크기를 미리 설정된 역치와 비교하여 상기 주목화소가 문자의 경계부분인지 여부를 결정하는 과정과,Comparing the size of the edge with a preset threshold to determine whether the pixel of interest is a boundary of a character; 상기 주목화소가 상기 경계부분이 아닌 것으로 검출될 경우 상기 주목화소를 전역 역치를 적용하여 이치화하는 제1이치화과정과,A first binarization process of binarizing the pixel of interest by applying a global threshold when the pixel of interest is detected to be not the boundary; 상기 주목화소가 상기 경계부분인 것으로 검출될 경우 상기 방향성에 따른 에지의 연속성 여부를 조사하는 연속성 조사과정과,A continuity investigation process for investigating whether the pixel of interest is the boundary portion and whether the edge according to the orientation is continuity; 상기 에지의 연속성이 있는 경우에는 상기 주목화소를 같은 방향의 이전 화소에 대한 이치화값과 동일한 값으로 이치화하는 제2이치화과정과,A second binarization process of binarizing the pixel of interest to a value equal to a binarization value for the previous pixel in the same direction when the edge is continuous; 상기 에지의 연속성이 없는 경우에는 국부 역치를 적용하여 상기 주목화소를 이치화하는 제3이치화과정을 구비함을 특징으로 하는 이치화방법.And a third binarizing process for binarizing the pixel of interest by applying a local threshold when there is no continuity of the edge. 제2항에 있어서, 상기 크기 및 방향성을 검출하는 과정이, 상기 주목화소에 대해 0˚, 45˚, 90˚, 135˚의 4가지 방향으로 크기 및 방향성을 검출함을 특징으로 하는 이치화방법.The binarization method according to claim 2, wherein the detecting of the size and the directionality detects the size and the directionality in four directions of 0 °, 45 °, 90 °, and 135 ° with respect to the pixel of interest. 제2항에 있어서, 상기 연속성 조사과정이, 상기 주목화소의 방향성과 같은 방향의 이전 화소를 확인하여, 이전 화소가 동일한 방향성의 에지인 경우에는 연속성이 있는 것으로 검출하고 그렇지 않은 경우에는 연속성이 없는 것으로 검출함을 특징으로 하는 이치화방법.3. The method of claim 2, wherein the continuity checking process checks the previous pixel in the same direction as the directionality of the pixel of interest and detects that there is continuity if the previous pixel is the same directional edge, otherwise there is no continuity. Binarization method characterized by the above-mentioned. 제4항에 있어서, 상기 제1이치화과정이, 상기 주목화소값을 상기 전역 역치와 비교하여, 상기 주목화소값이 상기 전역 역치보다 크면 상기 주목화소를 "백"화소로 이치화하고 상기 전역 역치보다 작으면 상기 주목화소를 "흑"화소로 이치화함을 특징으로 하는 이치화방법.5. The method of claim 4, wherein the first binarization process compares the pixel of interest value with the global threshold, and if the pixel of interest value is greater than the global threshold, binarizes the pixel of interest to a “white” pixel and is greater than the global threshold. If smaller, the pixel of interest is binarized to "black" pixels. 제5항에 있어서, 상기 제3이치화과정이, 상기 주목화소값을 상기 국부 역치와 비교하여, 상기 주목화소값이 상기 국부 역치보다 크면 상기 주목화소를 "백"화소로 이치화하고 상기 국부 역치보다 작으면 상기 주목화소를 "흑"화소로 이치화함을 특징으로 하는 이치화방법.6. The method of claim 5, wherein the third binarization step compares the pixel value of interest with the local threshold, and if the pixel value of interest is greater than the local threshold, binarizes the pixel of interest to a " white " If smaller, the pixel of interest is binarized to "black" pixels. 제6항에 있어서, 상기 전역 역치가, 상기 입력 화상의 최대 계조값의 반으로 설정함을 특징으로 하는 이치화방법.7. The binarization method according to claim 6, wherein the global threshold is set to half of the maximum gradation value of the input image. 제7항에 있어서, 상기 국부 역치가, 상기 주목화소의 방향성에 따라 인접 화소들에 대하여 선택적으로 평균값을 취하여 설정함을 특징으로 하는 이치화방법.8. The binarization method according to claim 7, wherein the local threshold is set by selectively taking an average value with respect to adjacent pixels according to the directionality of the pixel of interest.
KR1019970004639A 1997-02-17 1997-02-17 How to Binarize Text Documents Expired - Fee Related KR100205599B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970004639A KR100205599B1 (en) 1997-02-17 1997-02-17 How to Binarize Text Documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970004639A KR100205599B1 (en) 1997-02-17 1997-02-17 How to Binarize Text Documents

Publications (2)

Publication Number Publication Date
KR19980068157A KR19980068157A (en) 1998-10-15
KR100205599B1 true KR100205599B1 (en) 1999-07-01

Family

ID=19497144

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970004639A Expired - Fee Related KR100205599B1 (en) 1997-02-17 1997-02-17 How to Binarize Text Documents

Country Status (1)

Country Link
KR (1) KR100205599B1 (en)

Also Published As

Publication number Publication date
KR19980068157A (en) 1998-10-15

Similar Documents

Publication Publication Date Title
US6044179A (en) Document image thresholding using foreground and background clustering
US4862283A (en) Image discrimination with continuous tone area thinning
JPH0879517A (en) Method for identifying type of image
KR100206338B1 (en) Binary coding method of letter image having both character and picture
JPH0787313A (en) Image processing method and image processing apparatus
KR100205599B1 (en) How to Binarize Text Documents
US6014465A (en) Method for transforming a gray-level image into a black-and-white image
JP2616386B2 (en) Image processing device
US6750986B1 (en) Color image processing method with thin-line detection and enhancement
GB2302470A (en) Pixel binarization
KR100242298B1 (en) Image data binarization method of text document
US6411735B1 (en) Method and apparatus for distinguishing between noisy continuous tone document types and other document types to maintain reliable image segmentation
JPH0370433B2 (en)
JPS5888969A (en) Image sharpening processing method
JP3466655B2 (en) Image processing device
JP3212339B2 (en) Image magnification device
JP2541937B2 (en) Image processing device
US6778296B1 (en) Color imaging processing method with boundary detection and enhancement
KR930007984B1 (en) Two-tone picture method for fax
KR930003482B1 (en) Simple identification method of mixed video and text documents
KR930003484B1 (en) Transmission method for fax
KR100229028B1 (en) Binarization method based on continuity
KR930008774B1 (en) Method of data compression of text image
JPH02305068A (en) Image reader
JPH06225122A (en) Image forming device

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

R17-X000 Change to representative recorded

St.27 status event code: A-3-3-R10-R17-oth-X000

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

PN2301 Change of applicant

St.27 status event code: A-3-3-R10-R13-asn-PN2301

St.27 status event code: A-3-3-R10-R11-asn-PN2301

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

St.27 status event code: A-1-2-D10-D22-exm-PE0701

GRNT Written decision to grant
PR0701 Registration of establishment

St.27 status event code: A-2-4-F10-F11-exm-PR0701

PR1002 Payment of registration fee

St.27 status event code: A-2-2-U10-U11-oth-PR1002

Fee payment year number: 1

PG1601 Publication of registration

St.27 status event code: A-4-4-Q10-Q13-nap-PG1601

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 4

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 5

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 6

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 7

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PN2301 Change of applicant

St.27 status event code: A-5-5-R10-R13-asn-PN2301

St.27 status event code: A-5-5-R10-R11-asn-PN2301

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 8

FPAY Annual fee payment

Payment date: 20070329

Year of fee payment: 9

PR1001 Payment of annual fee

St.27 status event code: A-4-4-U10-U11-oth-PR1001

Fee payment year number: 9

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

St.27 status event code: A-4-4-U10-U13-oth-PC1903

Not in force date: 20080403

Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

PC1903 Unpaid annual fee

St.27 status event code: N-4-6-H10-H13-oth-PC1903

Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE

Not in force date: 20080403

R18-X000 Changes to party contact information recorded

St.27 status event code: A-5-5-R10-R18-oth-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000

P22-X000 Classification modified

St.27 status event code: A-4-4-P10-P22-nap-X000