[go: up one dir, main page]

WO2000075869A1 - Image processing method - Google Patents

Image processing method Download PDF

Info

Publication number
WO2000075869A1
WO2000075869A1 PCT/JP2000/003641 JP0003641W WO0075869A1 WO 2000075869 A1 WO2000075869 A1 WO 2000075869A1 JP 0003641 W JP0003641 W JP 0003641W WO 0075869 A1 WO0075869 A1 WO 0075869A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
function
contour
approximation
image processing
Prior art date
Application number
PCT/JP2000/003641
Other languages
French (fr)
Japanese (ja)
Inventor
Kazuo Toraichi
Kouichi Wada
Kouichi Mori
Original Assignee
Fluency Research & Development Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fluency Research & Development Co., Ltd. filed Critical Fluency Research & Development Co., Ltd.
Publication of WO2000075869A1 publication Critical patent/WO2000075869A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/40Filling a planar surface by adding surface attributes, e.g. colour or texture

Definitions

  • the present invention relates to an image processing method for converting an image printed on paper or the like into a high-definition digital image, and storing, displaying, and transmitting the image.
  • the change in the resolution of the output device is not taken into account, but the resolution of the output device actually changes depending on the usage.
  • the transmitted document will be viewed on the receiving side by enlarging or reducing it, or that output will be suitable for devices with various resolutions, from low-resolution displays to high-resolution printers.
  • separate image files for each resolution will make it difficult to manage the data overnight, and saving at the highest possible resolution at any time will waste resources. there were.
  • Considering the features of document images most of document images are different from natural images, It can be expressed with a small number of colors, and the boundaries of colors are clear. Therefore, an image can be perceived as a set of closed contours in each color gamut.
  • the present invention has been made in view of the above points, and an object of the present invention is to provide an image processing method capable of converting a content of a paper document into a high-definition digital image for display and printing. Is to do.
  • a content drawn on a paper document is read to create a binarized pixel image
  • a contour point sequence included in the pixel image Is extracted in a second step, a contour point sequence included in the pixel image Is extracted
  • the function of image data is generated by approximating the shape of the contour point sequence by a function.
  • an approximate function is obtained based on the functionalized image data, and a closed contour of the color gamut is generated using the approximate function.
  • Painting is performed to generate a drawing data
  • display processing or printing processing is performed based on the drawing data. Since the contours are approximated by functions, high-resolution digital images can be generated for display and printing.
  • the generation of the closed contour in the fourth step described above is performed by generating a sequence of contour points at intervals corresponding to the resolution of the display processing and the print processing in the sixth step. Since the contour point sequence is generated at intervals according to the resolution of the display screen and the resolution of printing, a high-definition digital image suitable for display and printing can be obtained.
  • the function approximation in the third step be performed by dividing the contour point sequence extracted in the second step into a plurality of pieces and determining an optimum approximation function for each of the divided portions.
  • the division position of the contour point sequence be determined by an optimization method based on dynamic programming. Since the optimal function approximation is performed for each divided part, a more accurate function approximation is possible.
  • FIG. 1 is a diagram for explaining an outline of an image processing system according to an embodiment to which the image processing method of the present invention is applied,
  • FIG. 2 is a diagram illustrating a function approximation expression of a contour
  • FIG. 3 is a diagram for explaining the section division of the contour line and the approximation function determination process.
  • FIG. 5 is a diagram illustrating a contour reconstruction method in an arc section
  • FIG. 6 is a diagram illustrating a contour reconstruction method in a free curve section
  • FIG. 7 is a diagram illustrating an experimental system
  • Figure 8 shows a document image (CCITT test image or part of it) prepared to evaluate the performance of the implemented encoder and view II.
  • Figure 9 shows the statements provided to evaluate the performance of the implemented encoder and view II.
  • Figure 9 shows the document image (CCITT test image or part of it)
  • Figure 10 is a diagram showing a document image (paper document scanned by a scanner) prepared to evaluate the performance of the implemented encoder and view II.
  • Fig. 11 shows the result of comparing the size of the functionalized image file output with the images shown in Figs. 8 to 10 as input and the size of the GIF file of the same image.
  • a diagram showing an example of an execution screen using a Java application
  • FIG. 13 is a diagram showing an example of an execution screen using the Java application
  • FIG. 14 is a diagram showing an example of displaying on a web browser using the Ja Va applet
  • Figure 15 shows an enlarged view of the original pixel image.
  • FIG. 16 is a diagram showing experimental results regarding the processing speed. BEST MODE FOR CARRYING OUT THE INVENTION
  • an image processing system based on these specifications is provided.
  • the image processing system according to the present embodiment is roughly divided into an encoder that outputs functionalized image data by inputting the contents drawn in a paper document and a document image that is reconstructed from image data and displayed. It consists of two parts (see Figure 1). Use an encoder and viewer to operate on a personalized system, and transmit image files using network services such as mail services and web services to display and print images on a remote system. It is assumed that the usage is simple.
  • a document or figure drawn on a paper document is captured by a scanner or a digital camera, and a binarized pixel image is used as an input image. Encoder Then, the edge of a black pixel is traced to obtain a sequence of closed contour points. Function approximation is performed for all closed contour points, and functionalized image data is output based on the information of the approximation function. In View II, an approximate function is obtained from the image of the functionalized image, and a closed contour of the color region is generated using the approximate function. Display 'To print, fill all closed areas and output.
  • the document image which is the target image, has a clear outline, and if it is binarized and its edges are followed, a closed outline can be easily obtained.
  • the obtained contour point sequence is discrete, but if it is approximated by a continuous function, it is possible to output a contour line at any resolution.
  • all of one round of the closed contour line is approximated by a combination of straight lines or a spline function (Bézier function).
  • the line is divided and each section is approximated using the optimal function.
  • appropriate approximation can be performed for the approximated section, so that the approximate data can be reduced.
  • the contour is represented by a combination of a straight line, a quadratic B-spline curve, and an arc.
  • the contour is divided into three sections, which are approximated by B-splines, arcs, and straight lines, respectively.
  • the contour can be approximated using multiple classes of continuous functions as described above.
  • the approximation function for the relevant section is not appropriate, the data required for approximation will increase.Therefore, the process of segmentation and determination of the approximation function is an important process that greatly affects the approximation accuracy and the amount of data. . However, if humans give hints on the division of contour lines, the required automatic processing cannot be achieved. In many existing methods, extraction of angles using curvature, etc., determination of approximation functions, determination of approximate approximation functions using local fitting, and segmentation and post-processing are performed in appropriate sections. You are trying to achieve a split.
  • DP Dynamic Programming
  • the fitting error is determined between the approximation function and the divided section, and the obtained error value is added for each divided section to determine the optimal fitting state for the entire contour line.
  • this is i i 0, ii, ⁇ i h , ⁇ ⁇
  • d (i h - 1; i h ) be the cost of approximating with a function, and express the overall cost as the sum of the approximate costs of the intervals.
  • n is the minimum interval length.
  • Fig. 3 shows a case where the above process is divided into three by appropriate two points.
  • the approximation cost function for each section is set not only to reduce the approximation error, but also to make the approximation section as long as possible. If the only purpose is to reduce the approximation error, it is conceivable to use the fitting error as it is as a cost function. However, the error can be reduced by increasing the coefficient of the spline curve, so if you judge only by the fitting error, all sections will be free curve sections. Therefore, in the image processing system of the present embodiment, a straight line and a circular arc are preferentially determined, and a cost function is set such that a section that is neither of them is a free curve section. The cost function used here is shown in equation (2) below.
  • is the mean square error of the partial point sequence with the approximate circle. If the end point of the section to be approximated is symmetrically located on the X-axis as shown in Fig. 4 (b), the center coordinates (b, 0) of the approximate circle can be obtained by the following equation. Where ⁇ arc 2 is the distance from the center of the arc to the contour point minus the radius,
  • the cost of a section is calculated based on the approximation error and the section length in that section, and is calculated independently of the state of the preceding and following sections. Therefore, this optimization calculation can be performed efficiently using DP.
  • the feature of using DP is that if the optimal interval division up to H is calculated, the optimal division below H is also calculated at the same time.
  • the maximum value of H is the largest integer less than or equal to LZ 1 m: n because the minimum length of the section is l min .
  • the cost functions for each H are compared, and the H with the least cost is selected, and the data is output using the interval division and the approximation function at that time.
  • the interval division and the determination of the approximation function can be performed theoretically based on the optimization method, but the DP calculation amount increases in proportion to the square of the length. I get it.
  • the amount of calculation for fitting increases in proportion to the length, it is practically problematic to apply DP as it is when the contour is long.
  • long contour lines are processed separately.
  • the structure of the functionalized image file and the playback / display method will be described.
  • the outline point sequence is divided into sections by the above-described method, and the class of the function that approximates each section is determined.
  • the minimum data that can reproduce the approximate contour line based on the information of the approximate function should be stored.
  • the number of contour lines constituting the image is required.
  • information on each contour includes information on the entire contour and information on an approximation function for each approximation section.
  • Information on the entire contour requires the color of the area, the number of sections, and the start point coordinates.
  • Information about the approximation function for each approximation interval differs depending on the class of the approximation function, and the following information is stored for each.
  • the start point is the end point of the previous approximation section, so only the end point coordinates of the straight line are needed.
  • start point end point
  • center coordinates and drawing direction (clockwise or counterclockwise)
  • drawing direction clockwise or counterclockwise)
  • start point is the end point of the previous section just like a straight section, so there is no need to save it.
  • the coordinates, end point, and drawing direction flag may be stored.
  • the center coordinates are known from the fitting result, so this is used.
  • the free curve section it is approximated by the B-spline function.
  • the number of nodes In order to approximate with the B-spline function, the number of nodes must be determined. However, since this cannot be determined analytically, fitting is performed stepwise, and the error is within an allowable range (here, within 1 pixel). To find the minimum number of nodes. As the data, the spline coefficient at the time of fitting to obtain the number of nodes may be stored. Same as the score.
  • the end point may be added as the vertex of the polygon.
  • the center and the end point are known from the data, so the start point is added to this, and the radius, start angle, and end angle of the arc are calculated from that, and the point sequence on the arc is calculated.
  • the density of contour points can be changed by adjusting the step angle (see Fig. 5).
  • the approximate contour is obtained by calculating the convolution of the spline coefficient and the B spline in the X and y directions, respectively.
  • contour points with different densities can be constructed (see Figure 6).
  • Figures 8 (a), 8 (b), and 9 are CCITT test images or parts of them
  • Figures 10 (a) and 10 (b) are paper documents scanned by a scanner.
  • Each image is a black and white binary image with a resolution of about 300 dpi.
  • FIG. 12 to FIG. 15 are diagrams showing comparison results between the example of the embodiment screen and the pixel images.
  • Figs. 12 and 13 are screen examples of implementation using the Java application
  • Fig. 14 is an example of display using the Java applet.
  • FIG. 15 is an enlarged view of the original pixel image for comparison with the image processing system of the present embodiment. From FIGS. 12 to 15, it can be seen that in the image processing system of the present embodiment, both the reduced image and the enlarged image are reproduced with high accuracy.
  • FIG. 16 is a diagram showing experimental results regarding the processing speed.
  • the experimental results shown in Fig. 16 measured the time required to read the function image file and reconstruct the contours, and the time required to display all the contours.
  • the time required for the contour reconstruction processing is 0.16 seconds to 1.47 seconds, indicating that the processing is performed at a very high speed.
  • the drawing time is between 0.04 and 1.32 seconds. It can be said that the responsiveness of the application is sufficient at such a rendering speed.
  • the entire image is displayed. However, when the image is enlarged, the number of unnecessary contours that do not appear on the screen increases, and the drawing time is greatly reduced.
  • JaVa2 runs on a virtual machine and is inferior in execution speed compared to the native execution environment.
  • the graphic library used this time is a standard one, so it is not optimized for the latest graphic model. Nevertheless, the results of the experiment shown in Fig. 16 show that high-speed drawing is possible. If a library that takes advantage of the performance of Graphic Xerare is introduced in the future, higher-speed drawing will be achieved. Can be expected.
  • the image processing system uses a function image to generate a document image.
  • the paper document can be digitized with high definition.
  • the contour is approximated by a continuous function of a plurality of classes, it is possible to output a single image file at an arbitrary resolution.
  • the functionalized image file used in the present embodiment is configured by extracting the minimum data necessary for reproduction by approximating each contour part with an optimal function, so that the file size is small.
  • the playback and display are very fast. Industrial applicability

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

An image processing method for converting the contents of a paper document to a high-resolution digital image and displaying and printing the image. After a scanner or digital camera captures a paper document and outputs a binarized pixel image to an encoder, the encoder traces an edge of a black pixel forms closed outline point strings, subjects all the closed outline point strings to function approximation, and outputs function-conversion image data on the basis of information of an approximation function. The viewer determines an approximation function from function-conversion image data and generates closed outlines of a color area by using the approximation function. The viewer fills all the closed areas with colors to output the image for display/printing.

Description

明 細 書 画像処理方法 技術分野  Description Image processing method Technical field
本発明は、 紙面等に印刷された画像を高精細なデジタル画像に変換して保存、 表示、 伝送する画像処理方法に関する。 背景技術  The present invention relates to an image processing method for converting an image printed on paper or the like into a high-definition digital image, and storing, displaying, and transmitting the image. Background art
近年のコンピュータネットワークとパーソナルコンピュータの発展により、 デ ジ夕ル文書の利用が活発化している。 デジタル文書の利点は、 ネットワークを通 じて瞬時に転送できること、 保存に場所を取らないこと、 拡大 ·縮小 · トリミン グなどの操作を施して別の文書に容易に貼り付けられことなどが挙げられる。 デ ジ夕ル文書は、 テキス卜エディタゃヮ一ドプロセッサを用いて容易に作成できる が、 新聞、 雑誌、 地図、 図面など紙媒体の文書も依然数多く存在している。 また、 コンピュータ上のファイルも一度印刷されればそれは紙文書であるといえる。 こ れら紙文書をデジタル化してデジタル文書としての利点を活かすシステムへの要 求が高まっている。 システムの例としては、 文書伝送にはファクシミリ、 文書の 保存 ·再利用にはフアイリングシステムなどがある。 紙文書はスキャナや C C D (Charge Coup l ed Dev i ce ) カメラで読み込まれ、 ピクセル表現の画像ファイル として扱われる。  With the development of computer networks and personal computers in recent years, the use of digital documents has become active. The advantages of digital documents are that they can be transferred instantly over a network, take up little space, and can be easily pasted to another document by performing operations such as enlargement, reduction, and trimming. . Digital documents can be easily created using a text editor-based processor, but there are still many paper-based documents such as newspapers, magazines, maps, and drawings. Also, once a file on a computer is printed, it can be said that it is a paper document. There is a growing demand for systems that digitize these paper documents and take advantage of the advantages of digital documents. Examples of systems include facsimile for document transmission and filing systems for storage and reuse of documents. Paper documents are read by a scanner or a CCD (Charge Coupled Device) camera, and are treated as pixel-format image files.
ところで、 既存のシステムの多くでは、 出力デバイスの解像度の変化は、 あま り考慮されていないが、 実際には利用形態により出力デバイスの解像度は変化す る。 例えば、 伝送した文書を受信側で拡大 ·縮小して閲覧したり、 低解像度のデ イスプレイから高解像度のプリン夕まで様々な解像度のデバイスに適した出力を 行うことを想定しなくてはならない。 しかし、 解像度毎に別々の画像ファイルに なっていてはデ一夕の管理に困難をきたしてしまうし、 いつでも想定しうる最高 の解像度で保存していてはリソースの無駄を生じてしまうという問題があった。 ここで文書画像の特徴を考えると、 文書画像の多くは自然画像と異なり、 非常 に少ない色数で表現できる上に色の境界が明確である。 そこで、 それぞれの色領 域の閉輪郭線の集合として画像を捉えることができる。 このような輪郭線をもと にした画像表現方式は、 従来では主にアウトラインフォント、 図形、 図面のデ一 夕のように比較的単純な画像を対象に用いられてきたが、 文書画像への適用例は ほとんどみられなかった。 その理由としては、 ピクセル表現画像から自動変換さ れた画像の品質が高くないために人間の手による修正が必要となり、 輪郭線の量 が多く複雑な文書画像には適用が難しいためである。 また、 自動変換された画像 の品質が低下してしまう理由の一つとして、 直線近似かスプライン近似のみを用 いて輪郭線を表現していることが挙げられる。 発明の開示 By the way, in many existing systems, the change in the resolution of the output device is not taken into account, but the resolution of the output device actually changes depending on the usage. For example, it must be assumed that the transmitted document will be viewed on the receiving side by enlarging or reducing it, or that output will be suitable for devices with various resolutions, from low-resolution displays to high-resolution printers. However, separate image files for each resolution will make it difficult to manage the data overnight, and saving at the highest possible resolution at any time will waste resources. there were. Considering the features of document images, most of document images are different from natural images, It can be expressed with a small number of colors, and the boundaries of colors are clear. Therefore, an image can be perceived as a set of closed contours in each color gamut. Conventionally, image representation methods based on such contour lines have been used mainly for relatively simple images, such as outline fonts, figures, and drawings, but are not suitable for document images. There were few applications. The reason for this is that the quality of the image automatically converted from the pixel representation image is not high and requires manual correction, and it is difficult to apply it to complex document images with a large amount of contour lines. One of the reasons why the quality of the automatically converted image is reduced is that the outline is expressed using only the linear approximation or the spline approximation. Disclosure of the invention
本発明は、 このような点に鑑みて創作されたものであり、 その目的は、 紙文書 の内容を高精細なデジタル画像に変換して表示や印刷を行うことができる画像処 理方法を提供することにある。  The present invention has been made in view of the above points, and an object of the present invention is to provide an image processing method capable of converting a content of a paper document into a high-definition digital image for display and printing. Is to do.
本発明の画像処理方法は、 第 1のステップにおいて、 紙文書に描かれた内容を 読み込んで 2値化されたピクセル画像を作成し、 第 2のステップにおいて、 この ピクセル画像に含まれる輪郭点列を抽出し、 第 3のステップにおいて、 輪郭点列 の形状を関数近似して関数化画像データを生成する。 また、 第 4のステップにお いて、 関数化画像データに基づいて近似関数を求め、 この近似関数を使って色領 域の閉輪郭線を生成し、 第 5のステップにおいて、 この閉輪郭線を塗りつぶして 描画用デ一夕を生成し、 第 6のステップにおいて、 この描画用デ一夕に基づいて 表示処理あるいは印刷処理を行っている。 輪郭線を関数近似しているため、 表示 や印刷の際に高精細なデジタル画像を生成することができる。  According to the image processing method of the present invention, in a first step, a content drawn on a paper document is read to create a binarized pixel image, and in a second step, a contour point sequence included in the pixel image Is extracted, and in a third step, the function of image data is generated by approximating the shape of the contour point sequence by a function. Further, in the fourth step, an approximate function is obtained based on the functionalized image data, and a closed contour of the color gamut is generated using the approximate function. Painting is performed to generate a drawing data, and in the sixth step, display processing or printing processing is performed based on the drawing data. Since the contours are approximated by functions, high-resolution digital images can be generated for display and printing.
特に、 上述した第 4のステップにおける閉輪郭線の生成は、 第 6のステップに おける表示処理、 印刷処理の解像度に対応した間隔で輪郭点列を発生させること により行うことが望ましい。 表示画面の解像度や印刷の解像度に合わせて間隔で 輪郭点列が生成されるため、 表示や印刷用に適した高精細なデジタル画像を得る ことができる。  In particular, it is desirable that the generation of the closed contour in the fourth step described above is performed by generating a sequence of contour points at intervals corresponding to the resolution of the display processing and the print processing in the sixth step. Since the contour point sequence is generated at intervals according to the resolution of the display screen and the resolution of printing, a high-definition digital image suitable for display and printing can be obtained.
また、 上述した第 6のステップにおいて表示処理を行う場合に、 使用者によつ て表示倍率の変更が指示されたときに、 第 4のステップにおいて、 この表示倍率 に対応した間隔で輪郭点列を発生させることにより閉輪郭線の生成を行うことが 望ましい。 一般に、 表示画面は解像度が低いため、 再構成された画像を表示させ る場合に、 利用者が表示倍率を指定することができる場合も多い。 このような場 合に、 表示倍率に合わせた間隔で輪郭点列を発生させることにより、 どのような 表示倍率であっても高精細なデジタル画像を表示することができる。 In addition, when performing the display processing in the sixth step described above, When a change in display magnification is instructed, it is preferable to generate a closed outline by generating a sequence of outline points at intervals corresponding to the display magnification in the fourth step. In general, since the display screen has a low resolution, the user can often specify the display magnification when displaying the reconstructed image. In such a case, a high-definition digital image can be displayed at any display magnification by generating the contour point sequence at intervals according to the display magnification.
また、 上述した第 3のステップにおける関数近似は、 第 2のステップにおいて 抽出された前記輪郭点列を複数に分割し、 それぞれの分割部分に最適な近似関数 を決定することにより行うことが望ましい。 輪郭点列を分割して処理することに より、 関数近似する際のデ一夕処理量を低減することができる。 特に、 この輪郭 点列の分割位置は、 ダイナミック · プログラミングによる最適化手法によって決 定することが望ましい。 各分割部分毎に最適な関数近似が行われるため、 より精 度の高い関数近似が可能になる。  Further, it is desirable that the function approximation in the third step be performed by dividing the contour point sequence extracted in the second step into a plurality of pieces and determining an optimum approximation function for each of the divided portions. By dividing and processing the contour point sequence, it is possible to reduce the amount of data processing at the time of function approximation. In particular, it is desirable that the division position of the contour point sequence be determined by an optimization method based on dynamic programming. Since the optimal function approximation is performed for each divided part, a more accurate function approximation is possible.
また、 上述した分割部分と近似関数との対応付けは、 直線、 円弧、 2次 Bスプ ライン曲線の順で行うことが望ましい。 これらの順に近似関数を対応づけること により、 関数近似された後のデータ量を削減することができる。 図面の簡単な説明  In addition, it is desirable that the above-described division and the approximation function be associated in the order of a straight line, an arc, and a quadratic B-spline curve. By associating the approximation functions in these orders, the amount of data after function approximation can be reduced. BRIEF DESCRIPTION OF THE FIGURES
図 1は、 本発明の画像処理方法を適用した一実施形態の画像処理システムの概 要を説明する図、  FIG. 1 is a diagram for explaining an outline of an image processing system according to an embodiment to which the image processing method of the present invention is applied,
図 2は、 輪郭の関数近似表現について説明する図、  FIG. 2 is a diagram illustrating a function approximation expression of a contour,
図 3は、 輪郭線の区間分割と近似関数決定処理について説明する図、 図 4は、 近似誤差について説明する図、  FIG. 3 is a diagram for explaining the section division of the contour line and the approximation function determination process. FIG.
図 5は、 円弧区間における輪郭再構成手法について説明する図、  FIG. 5 is a diagram illustrating a contour reconstruction method in an arc section,
図 6は、 自由曲線区間における輪郭再構成手法について説明する図、 図 7は、 実験システムについて説明する図、  FIG. 6 is a diagram illustrating a contour reconstruction method in a free curve section, FIG. 7 is a diagram illustrating an experimental system,
図 8は、 実装したエンコーダとビューヮの性能を評価するために用意された文 書画像 (C C I T Tのテスト画像またはその一部) を示す図、  Figure 8 shows a document image (CCITT test image or part of it) prepared to evaluate the performance of the implemented encoder and view II.
図 9は、 実装したエンコーダとビューヮの性能を評価するために用意された文 書画像 (C C I T Tのテスト画像またはその一部) を示す図、 Figure 9 shows the statements provided to evaluate the performance of the implemented encoder and view II. Figure showing the document image (CCITT test image or part of it)
図 1 0は、 実装したエンコーダとビューヮの性能を評価するために用意された 文書画像 (紙の文書をスキャナで取り込んだもの) を示す図、  Figure 10 is a diagram showing a document image (paper document scanned by a scanner) prepared to evaluate the performance of the implemented encoder and view II.
図 1 1は、 図 8〜図 1 0に示した画像を入力として出力される関数化画像ファ ィルのサイズと、 同じ画像の G I Fファイルのサイズを比較した結果を示す図、 図 1 2は、 J a V aアプリケーションを用いた実行画面例を示す図、  Fig. 11 shows the result of comparing the size of the functionalized image file output with the images shown in Figs. 8 to 10 as input and the size of the GIF file of the same image. , A diagram showing an example of an execution screen using a Java application,
図 1 3は、 J a V aアプリケーションを用いた実行画面例を示す図、  FIG. 13 is a diagram showing an example of an execution screen using the Java application,
図 1 4は、 J a V aァプレツトを用いて w e bブラウザ上に表示した例を示す 図、  FIG. 14 is a diagram showing an example of displaying on a web browser using the Ja Va applet,
図 1 5は、 もとのピクセル画像を拡大表示した図、  Figure 15 shows an enlarged view of the original pixel image.
図 1 6は、 処理速度に関する実験結果を示す図である。 発明を実施するための最良の形態  FIG. 16 is a diagram showing experimental results regarding the processing speed. BEST MODE FOR CARRYING OUT THE INVENTION
以下、 本発明の画像処理方法を適用した一実施形態の画像処理システムについ て図面を参照しながら詳細に説明する。 本実施形態の画像処理システムを構築す る上で重要となる仕様は次の 4項目である。  Hereinafter, an image processing system according to an embodiment to which the image processing method of the present invention is applied will be described in detail with reference to the drawings. The following four items are important specifications for constructing the image processing system of the present embodiment.
( 1 ) 一つのデータファイルで様々な解像度の画像を高品位に出力できること。  (1) Able to output images of various resolutions with high quality using one data file.
( 2 ) ファイルサイズが小さいこと。  (2) The file size is small.
( 3 ) ファイル生成は完全に自動処理で十分な画質が得られること。  (3) Sufficient image quality can be obtained by completely automatic file generation.
( 4 ) ィン夕ラクティブ性を高めるために再構成 ·表示が高速であること。  (4) Reconstruction and display must be fast in order to enhance the interactive nature.
本実施形態では、 これらの仕様を踏まえた画像処理システムを提供する。 本実 施形態の画像処理システムは、 大きく分けて、 紙文書に描かれた内容を入力とし て関数化画像データを出力するエンコーダと、 画像データから文書画像を再構成 し表示 '印刷するビューヮの 2つの部分からなる (図 1参照) 。 エンコーダとビ ユーヮを口一カルなシステム上で動作させるような利用形態と、 メールサービス、 w e bサービスなどのネッ トワークサービスを用いて画像ファイルを伝送してリ モートシステムで画像を表示 ·印刷するような利用形態を想定している。  In the present embodiment, an image processing system based on these specifications is provided. The image processing system according to the present embodiment is roughly divided into an encoder that outputs functionalized image data by inputting the contents drawn in a paper document and a document image that is reconstructed from image data and displayed. It consists of two parts (see Figure 1). Use an encoder and viewer to operate on a personalized system, and transmit image files using network services such as mail services and web services to display and print images on a remote system. It is assumed that the usage is simple.
本実施形態では、 紙文書に描かれた文書や図形等をスキャナやデジタルカメラ などで取り込み、 2値化したピクセル画像を入力画像として用いる。 エンコーダ では、 黒画素のエッジを追跡し閉輪郭点列を得る。 全ての閉輪郭点列に対し関数 近似を行い、 近似関数の情報を元に関数化画像データを出力する。 ビューヮでは、 関数化画像デ一夕から近似関数を求め、 その近似関数を使って色領域の閉輪郭線 を生成する。 表示 '印刷するには、 全ての閉領域を塗りつぶして出力する。 In the present embodiment, a document or figure drawn on a paper document is captured by a scanner or a digital camera, and a binarized pixel image is used as an input image. Encoder Then, the edge of a black pixel is traced to obtain a sequence of closed contour points. Function approximation is performed for all closed contour points, and functionalized image data is output based on the information of the approximation function. In View II, an approximate function is obtained from the image of the functionalized image, and a closed contour of the color region is generated using the approximate function. Display 'To print, fill all closed areas and output.
次に、 関数化図形を用いて文書画像を表現する手法について説明する。 対象と する画像である文書画像では明確に輪郭が存在しており、 2値化してそのエッジ を追跡すれば容易に閉輪郭線が得られる。 ここでは、 すでに提案されている高速 かつメモリ効率に優れた輪郭抽出手法を用いている。 得られた輪郭点列は、 P i = ( x i , y i ) , i = l, ……, Lで表されており、 前後の点との距離は 1以下 である。  Next, a method of expressing a document image using a functionalized figure will be described. The document image, which is the target image, has a clear outline, and if it is binarized and its edges are followed, a closed outline can be easily obtained. Here, we use the already proposed high-speed and memory-efficient contour extraction method. The obtained contour point sequence is represented by P i = (xi, y i), i = l, ..., L, and the distance between the preceding and following points is 1 or less.
得られた輪郭点列は離散的であるが、 連続関数で近似すれば任意の解像度での 輪郭線出力が可能となる。 既存の多くの輪郭線を近似する手法では、 閉輪郭線 1 周分の全てを直線の組合わせやスプライン関数 (ベジエ関数) などで近似してい るが、 本実施形態の画像処理システムでは、 輪郭線を分割しそれぞれの区間で最 適な関数を用いて近似している。 複数のクラスの関数を用いることで近似区間に 対して適切な近似が行えるので、 近似データを低減できる。 本実施形態の画像処 理システムでは、 直線、 2次 Bスプライン曲線、 円弧の組み合わせで輪郭線を表 現している。 図 2の例では輪郭線が 3つの区間に分割されており、 それぞれ Bス プライン、 円弧、 直線で近似されている。  The obtained contour point sequence is discrete, but if it is approximated by a continuous function, it is possible to output a contour line at any resolution. In the existing method for approximating many contour lines, all of one round of the closed contour line is approximated by a combination of straight lines or a spline function (Bézier function). The line is divided and each section is approximated using the optimal function. By using functions of a plurality of classes, appropriate approximation can be performed for the approximated section, so that the approximate data can be reduced. In the image processing system of the present embodiment, the contour is represented by a combination of a straight line, a quadratic B-spline curve, and an arc. In the example of Fig. 2, the contour is divided into three sections, which are approximated by B-splines, arcs, and straight lines, respectively.
次に、 近似関数を決定する手法について説明する。 区間が分かっていればこれ まで述べてきたように複数クラスの連続関数を用いて輪郭線を近似することが可 能となる。 しかも該当区間に対する近似関数が適当でないときには近似に要する データの増加を招いてしまうので、 区間分割と近似関数を決定する処理は近似の 精度ゃデ一夕量に大きく関わる重要な処理であるといえる。 しかし、 輪郭線の区 分に関するヒントを人間が与えていては要求仕様である自動処理が達成できない。 既存の多くの手法では曲率などを用いた角の抽出や近似関数の決定、 局所的なフ ィッテングを用いて大まかな近似関数を決定し、 後処理で区間の結合や分割を行 つて適切な区間分割を達成しょうとしている。 処理が複数段になるのは、 曲率や 局所的なフィッティングでは全体的に整合性の取れた区間分割が行えないからで ある。 このような 1次元系列の信号の区間分割には最適化手法の一つである DP (Dynamic Programming ) が有効である。 本実施形態の画像処理システムでは、 近似関数と分割区間との間でフィッティングの誤差を求め、 各分割区間について この求めた誤差の値を加算することにより、 輪郭線全体で最適なフィッティング 状態を決定している。 以下では、 DPを用いた輪郭線の区間分割と近似関数決定 処理について説明する。 Next, a method for determining the approximate function will be described. If the interval is known, the contour can be approximated using multiple classes of continuous functions as described above. In addition, if the approximation function for the relevant section is not appropriate, the data required for approximation will increase.Therefore, the process of segmentation and determination of the approximation function is an important process that greatly affects the approximation accuracy and the amount of data. . However, if humans give hints on the division of contour lines, the required automatic processing cannot be achieved. In many existing methods, extraction of angles using curvature, etc., determination of approximation functions, determination of approximate approximation functions using local fitting, and segmentation and post-processing are performed in appropriate sections. You are trying to achieve a split. The reason that the processing is performed in multiple stages is that curvature division and local fitting cannot perform overall consistent section division. is there. DP (Dynamic Programming), which is one of the optimization methods, is effective for segmentation of such one-dimensional sequence signals. In the image processing system of this embodiment, the fitting error is determined between the approximation function and the divided section, and the obtained error value is added for each divided section to determine the optimal fitting state for the entire contour line. are doing. In the following, a description will be given of the section division of the contour line using the DP and the approximation function determination processing.
輪郭点列を P i= (X i, y ( 1≤ i≤L :輪郭線長) としたとき、 これを i = i 0 , i i , ······ i h, ······ i Hで H個の区間に分割することを考える。 If the contour point sequence is P i = ( X i , y (1 ≤ i ≤ L: contour line length), this is i = i 0, ii, ··· i h , ··· · Consider dividing into H sections by i H.
をある関数で近似したときのコストを d ( i h-1; i h) とし、 全体のコストを区 間の近似コス卜の和で表すと、 Let d (i h - 1; i h ) be the cost of approximating with a function, and express the overall cost as the sum of the approximate costs of the intervals.
(1)
Figure imgf000008_0001
(1)
Figure imgf000008_0001
となる。 1 mi nは最小の区間長である。 例として、 図 2の輪郭点列の Becomes 1 mi n is the minimum interval length. As an example,
までを適当な 2点で 3分割した場合を図 3に図示する。 区間毎の近似コスト関数 は、 近似誤差を減らすことだけでなく、 なるべく長い近似区間にするということ を目標に設定されている。 近似誤差を減らすということだけが目的なら、 フイツ ティングの誤差をそのままコスト関数として用いることも考えられる。 しかし、 スプライン曲線は係数を増やすことで誤差を減らすことができてしまうので、 フ イツティングの誤差だけで判断すると全ての区間が自由曲線区間となってしまう。 そこで、 本実施形態の画像処理システムでは、 直線と円弧を優先的に決定し、 ど ちらでもない区間を自由曲線区間とするようなコスト関数の設定にしている。 こ こで用いるコスト関数を以下の (2) 式に示す。
Figure imgf000009_0001
Fig. 3 shows a case where the above process is divided into three by appropriate two points. The approximation cost function for each section is set not only to reduce the approximation error, but also to make the approximation section as long as possible. If the only purpose is to reduce the approximation error, it is conceivable to use the fitting error as it is as a cost function. However, the error can be reduced by increasing the coefficient of the spline curve, so if you judge only by the fitting error, all sections will be free curve sections. Therefore, in the image processing system of the present embodiment, a straight line and a circular arc are preferentially determined, and a cost function is set such that a section that is neither of them is a free curve section. The cost function used here is shown in equation (2) below.
Figure imgf000009_0001
C spl > otherwise  C spl> otherwise
ただし、 L i= l i h— i I は区間長、 ε は円弧近似誤差、 ε seg 2は線分 近似誤差、 rは近似円弧の半径、 をそれぞれ示している。 ここで、 d thdは許容最 大コストを表す定数であり、 これを超える場合にはその近似関数を用いないよう にしている。 現在は実験的に d t hd= 0. 0 1 8としている。 ^!はスプライ ン曲線近似に対するコス卜で、 直線や円弧に対して優先的に選択されないように 比較的大きな定数として CS P 1= 0. 0 2に設定している。 線分で近似したとき の誤差 ε se は端点 Where L i = li h — i I is the section length, ε is the arc approximation error, ε seg 2 is the segment approximation error, and r is the radius of the approximate arc. Here, d thd is a constant indicating the maximum allowable cost, and if it exceeds this, the approximation function is not used. At present, d t hd = 0.018 is set experimentally. ^! Is a cost for spline curve approximation, and CSP 1 = 0.02 is set as a relatively large constant so that it is not preferentially selected for a straight line or an arc. The error ε se when approximating by a line segment is the end point
P P' Ά— P P 'Ά—
を結ぶ直線との平均 2乗誤差であり、 近似直線を a x + b y + c 0とするとそ の値は、 Is the mean square error with the straight line connecting .If the approximate straight line is ax + by + c0, the value is
Sseg = (3) S seg = (3)
2+ ] となる (図 4 (a) 参照) 。 円弧近似誤差 ε は、 部分点列に対する近似円と の平均 2乗誤差である。 近似すべき区間の端点が図 4 (b) のように X軸上で対 称に位置していれば、 近似円の中心座標 (b, 0) は次式で求められる。
Figure imgf000010_0001
のとき、 ε arc 2は円弧の中心から輪郭点への距離から半径を引いたもので表し,
2+] (see Fig. 4 (a)). The arc approximation error ε is the mean square error of the partial point sequence with the approximate circle. If the end point of the section to be approximated is symmetrically located on the X-axis as shown in Fig. 4 (b), the center coordinates (b, 0) of the approximate circle can be obtained by the following equation.
Figure imgf000010_0001
Where ε arc 2 is the distance from the center of the arc to the contour point minus the radius,
(5)
Figure imgf000010_0002
となる。 しかし、 実際の輪郭点列は両端点が X軸上にのることは非常に稀なので、 計算する際には両端点がそのような位置関係になるように点列を移動 ·回転させ る必要がある。
(Five)
Figure imgf000010_0002
Becomes However, in the actual contour point sequence, it is very rare that both end points are on the X axis, so when calculating, it is necessary to move and rotate the point sequence so that both end points have such a positional relationship There is.
最適な区間分割は、 i H=Lとなるときの全体のコスト g (H) を最小化する ことで得られる。 漸化式で表すと、
Figure imgf000010_0003
The optimal interval division is obtained by minimizing the total cost g (H) when i H = L. Expressed as a recurrence formula,
Figure imgf000010_0003
(g( ) = 0) となる。 これまで示したように、 ある区間のコストはその区間での近似誤差と区 間長をもとに計算されており、 前後の区間の状態とは無関係に計算される。 した がって、 この最適化計算は DPを用いて効率的に計算することが可能となる。 D Pを用いたときの特徴は、 Hまでの最適な区間分割を計算すれば、 H未満の最適 な分割も同時に計算されることである。 Hの最大値は、 区間の最低長さが l min なので LZ 1 m: n以下の最大の整数となる。 最終的には、 各 Hにおけるコスト関 数を比較し最もコス卜の少なくなる Hを選択し、 そのときの区間分割と近似関数 を用いてデ一夕を出力する。 (g () = 0). As shown above, the cost of a section is calculated based on the approximation error and the section length in that section, and is calculated independently of the state of the preceding and following sections. Therefore, this optimization calculation can be performed efficiently using DP. The feature of using DP is that if the optimal interval division up to H is calculated, the optimal division below H is also calculated at the same time. The maximum value of H is the largest integer less than or equal to LZ 1 m: n because the minimum length of the section is l min . Finally, the cost functions for each H are compared, and the H with the least cost is selected, and the data is output using the interval division and the approximation function at that time.
このように D Pを用いた近似関数決定手法では、 最適化手法に基づいて理論的 に区間分割と近似関数の決定が行えるが、 D P計算量は長さの 2乗に比例して増 えてしまう。 さらに、 フィッティングの計算は長さに比例して計算量が増えるた め、 輪郭線が長くなつた場合、 そのまま D Pを適用するのは実用上問題がある。 計算量を低減するために、 本実施形態の画像処理システムでは、 長い輪郭線の場 合は区切って処理している。 Thus, in the approximation function determination method using DP, the interval division and the determination of the approximation function can be performed theoretically based on the optimization method, but the DP calculation amount increases in proportion to the square of the length. I get it. In addition, since the amount of calculation for fitting increases in proportion to the length, it is practically problematic to apply DP as it is when the contour is long. In order to reduce the amount of calculation, in the image processing system of the present embodiment, long contour lines are processed separately.
次に、 関数化画像ファイルの構成と再生 ·表示手法について説明する。 初めに、 関数化画像ファイルの構成について説明する。 上述した手法によって輪郭点列は 区間に分けられ、 それぞれの区間を近似する関数のクラスが決定される。 画像フ アイルとしては、 近似関数の情報をもとにして近似輪郭線が再生可能な最低限の データを保存するべきである。 画像全体に共通の情報としては、 画像を構成する 輪郭線数が必要となる。 一方、 個々の輪郭線に関する情報には、 輪郭線全体に関 する情報と近似区間毎の近似関数に関する情報がある。 輪郭線全体に関する情報 としては、 領域の色、 区間数、 開始点座標が必要となる。 近似区間毎の近似関数 に関する情報は近似関数のクラスによって異なり、 それぞれ下記の情報が保存さ れる。  Next, the structure of the functionalized image file and the playback / display method will be described. First, the structure of the functionalized image file will be described. The outline point sequence is divided into sections by the above-described method, and the class of the function that approximates each section is determined. As an image file, the minimum data that can reproduce the approximate contour line based on the information of the approximate function should be stored. As information common to the entire image, the number of contour lines constituting the image is required. On the other hand, information on each contour includes information on the entire contour and information on an approximation function for each approximation section. Information on the entire contour requires the color of the area, the number of sections, and the start point coordinates. Information about the approximation function for each approximation interval differs depending on the class of the approximation function, and the following information is stored for each.
( 1 ) 直線区間  (1) Straight section
直線を再現するには端点が必要だが、 開始点は一つ前の近似区間の終点である ので直線の終点座標のみが必要となる。  Although an end point is required to reproduce a straight line, the start point is the end point of the previous approximation section, so only the end point coordinates of the straight line are needed.
( 2 ) 円弧区間  (2) Arc section
開始点、 終点、 中心座標、 描画方向 (右回りか左回り) がわかっていれば円弧 は再現できるが、 直線区間と同じく開始点は一つ前の区間の終点なので保存する 必要はなく、 中心座標と終点と描画方向のフラグを保存すればよい。 保存データ を生成する時点ではフィッティングの結果から中心座標がわかっているのでこれ を用いる。  If the start point, end point, center coordinates, and drawing direction (clockwise or counterclockwise) are known, the arc can be reproduced. However, the start point is the end point of the previous section just like a straight section, so there is no need to save it. The coordinates, end point, and drawing direction flag may be stored. At the time of generating the stored data, the center coordinates are known from the fitting result, so this is used.
( 3 ) 自由曲線区間  (3) Free curve section
自由曲線区間では Bスプライン関数で近似する。 Bスプライン関数で近似する には節点数を決めなくてはならないが、 これを解析的に求めることはできないの で、 段階的にフィッティングを行い、 誤差が許容範囲内 (ここでは 1ピクセル以 内) となる最小の節点数を見つけ出している。 データとしては節点数を求めるた めにフィッティングしたときのスプライン係数を保存すればよく、 データ数は節 点数と同じである。 In the free curve section, it is approximated by the B-spline function. In order to approximate with the B-spline function, the number of nodes must be determined. However, since this cannot be determined analytically, fitting is performed stepwise, and the error is within an allowable range (here, within 1 pixel). To find the minimum number of nodes. As the data, the spline coefficient at the time of fitting to obtain the number of nodes may be stored. Same as the score.
次に、 関数化画像の再構成手法について説明する。 関数化画像を出力するには ファイルに格納されたデータから輪郭線を再構成すればよいが、 出力デバイスの 多くがピクセル画像を出力する仕組みになっているので最終的にはピクセル画像 に変換しなければならない。 ここでは、 直接近似関数データから高精度なポリゴ ンとして閉輪郭点列を再構成し、 中を塗りつぶすことで画像を出力する。 このと き、 出力デバイスの解像度に合わせた密度で輪郭点列を再構成すれば出力デバィ スの解像度を十分に活用することができる。 ポリゴンを再構成する処理は近似関 数によって異なるので、 以下ではそれぞれの近似関数別の再構成手法を説明する。 Next, a method for reconstructing a functionalized image will be described. To output a functionalized image, it is necessary to reconstruct the outline from the data stored in the file, but since most output devices are designed to output pixel images, they are ultimately converted to pixel images. There must be. Here, the closed contour point sequence is reconstructed from the direct approximation function data as a highly accurate polygon, and the image is output by filling the inside. At this time, if the contour point sequence is reconstructed at a density corresponding to the resolution of the output device, the resolution of the output device can be fully utilized. Since the process of reconstructing a polygon differs depending on the approximation function, a reconstruction method for each approximation function will be described below.
( 1 ) 直線区間: (1) Straight section:
直線区間では終点をポリゴンの頂点として加えればよい。  In the straight section, the end point may be added as the vertex of the polygon.
( 2 ) 円弧区間:  (2) Arc section:
円弧区間では、 データから中心と終点がわかるのでこれに開始点を加え、 そこ から円弧の半径、 開始角、 終了角を算出し円弧上の点列を算出する。 このときに ステップ角を調節することで輪郭点の密度を変えることができる (図 5参照) 。 In the arc section, the center and the end point are known from the data, so the start point is added to this, and the radius, start angle, and end angle of the arc are calculated from that, and the point sequence on the arc is calculated. At this time, the density of contour points can be changed by adjusting the step angle (see Fig. 5).
( 3 ) 自由曲線区間: (3) Free curve section:
自由曲線区間では X方向および y方向のそれぞれにおいてスプライン係数と B スプラインとの畳み込みを計算して近似輪郭を得る。 畳み込みを計算するときに Bスプラインの密度を変えることで異なる密度の輪郭点列を構成できる (図 6参 照) 。  In the free curve section, the approximate contour is obtained by calculating the convolution of the spline coefficient and the B spline in the X and y directions, respectively. By changing the density of the B-spline when calculating the convolution, contour points with different densities can be constructed (see Figure 6).
次に、 ビューヮに実装すべき機能について説明する。 ビューヮの機能として優 先される仕様は出力デバイスの種類によって異なるので、 出力デバイスに合わせ た画像出力処理が必要となる。 ここではプリン夕とディスプレイに関して実装上 優先される仕様を考える。  Next, the functions to be implemented in view II will be described. Since the specifications that are prioritized as View II functions differ depending on the type of output device, image output processing that matches the output device is required. Here, we consider the specifications that are prioritized in implementation for the printer and display.
( 1 ) プリン夕  (1) Pudding evening
プリン夕の場合、 多少出力に時間をかけてもプリン夕の解像度を最大限生かし た出力結果が要求される。 したがって、 デバイスの解像度に合わせて高精度なポ リゴンを生成しそれを出力すればよいことになる。  In the case of pudding, an output result that makes full use of the pudding's resolution is required even if it takes some time to output. Therefore, a high-precision polygon can be generated and output according to the resolution of the device.
( 2 ) ディスプレイ 解像度の低いデイスプレイでは高い表示品質はあまり望めないためプレビュー 的な表示が主目的となり、 表示品質よりも高いィン夕ラクティブ性が要求される ので、 描画は高速に行われなくてならない。 表示アプリケーションについて考え ると、 ディスプレイではプリンタと異なり、 利用者からの表示倍率の変更指示に 応じて、 画像の詳細を見るためには拡大表示し、 全体の概要を見るには画像を縮 小表示する必要がある。 (2) Display Since high display quality is not so much expected in low resolution displays, the main purpose is to provide a preview-like display. Since higher interactive performance than display quality is required, drawing must be performed at high speed. When considering the display application, unlike a printer, the display is enlarged in order to see the details of the image in response to an instruction from the user to change the display magnification, and the image is reduced in size to see the overall overview. There is a need to.
次に、 本実施形態の画像処理システムについて評価を行った結果を説明する。 実験は、 紙文書をスキャナで読み込み、 それを入力画像として関数化画像フアイ ルを生成するエンコーダに関する実験と、 関数化画像ファイルを読み込んで画像 を表示 ·印刷させるビューヮに関する実験を行った。 ビューヮはマウスのみの簡 単なオペレーションで画像を自在に拡大 ·縮小できるようになつている。 実装に は、 エンコーダに関しては C + +を用い、 関数化画像ビューヮは J a V a 2を用 いている。 ビューヮでは、 ローカルに存在するファイルを表示 ·印刷するだけで なく、 ネットワークを介したシステムを想定し、 w e bブラウザ上に J a V aァ ブレットを用いたビューヮも作成した (図 7参照) 。 また、 実装したエンコーダ とビューヮの性能を評価するために図 8〜図 1 0に示す 5つの文書画像を用意し た。 図 8 ( a ) 、 図 8 ( b ) 、 図 9は C C I T Tのテスト画像またはその一部で、 図 1 0 ( a ) および図 1 0 ( b ) は紙の文書をスキャナで取り込んだものである。 いずれの画像も 3 0 0 d p i程度の解像度の白黒 2値画像である。  Next, the result of evaluating the image processing system of the present embodiment will be described. In the experiments, we performed an experiment on an encoder that reads a paper document with a scanner and uses it as an input image to generate a functionalized image file, and an experiment on a view that reads a functionalized image file and displays and prints the image. View II allows you to freely enlarge and reduce images with simple mouse-only operations. For implementation, C ++ is used for the encoder, and JaVa2 is used for the functionalized image view ヮ. In view II, in addition to displaying and printing files that exist locally, a view II was created using a Java applet on a web browser, assuming a system via a network (see Fig. 7). In addition, five document images shown in Figs. 8 to 10 were prepared to evaluate the performance of the implemented encoder and view II. Figures 8 (a), 8 (b), and 9 are CCITT test images or parts of them, and Figures 10 (a) and 10 (b) are paper documents scanned by a scanner. . Each image is a black and white binary image with a resolution of about 300 dpi.
初めに、 エンコーダに関する実験結果について説明する。 エンコーダへの要求 仕様には画像ファイルのサイズの大きさが挙げられているので、 ここではフアイ ルサイズに注目して実験を行った。 実験では図 8〜図 1 0の画像を入力として出 力される関数化画像ファイルのサイズと同じ画像の G I Fファイルのサイズを比 較した。 同時に、 画像中の領域の個数と関数化画像ファイルのサイズとの関係を 調べた。 この実験の結果を図 1 1に示す。 実験の結果から元のビッ トマップ画像 と比べると 1 . 7 %〜 1 9 %程度の圧縮率であり、 G I Fと比べると 0 . 2倍〜 1 . 3倍程度のファイルサイズであった。 G I Fよりファイルサイズの大きくな つた図 8 ( b ) の画像は細かい文字が多いために、 細かく複雑な輪郭線が増加し ファイルサイズの増加を招いている。 その他の画像では、 G I Fと比べて十分に 小さいファイルサイズであるといえる。 領域数とファイルサイズとの相関を計算 すると 0 . 9 7となり、 領域数が関数化画像ファイルのサイズに大きな影響を及 ぼしていることがわかる。 First, experimental results on the encoder will be described. Since the required specifications for the encoder include the size of the image file, we conducted an experiment focusing on the file size. In the experiment, we compared the size of the GIF file of the same image with the size of the functionalized image file output using the images in Figs. At the same time, the relationship between the number of regions in the image and the size of the functionalized image file was examined. The results of this experiment are shown in FIG. Based on the results of the experiment, the compression ratio was about 1.7% to 19% compared to the original bitmap image, and the file size was about 0.2 to 1.3 times that of the GIF. The image shown in Fig. 8 (b), which has a larger file size than GIF, has many fine characters, so the number of fine and complex outlines increases, which leads to an increase in file size. For other images, it is enough compared to GIF It can be said that the file size is small. When the correlation between the number of areas and the file size is calculated, the result is 0.97, which indicates that the number of areas has a large effect on the size of the functionalized image file.
次に、 表示アプリケーションに関する実験結果について説明する。 ここでは、 関数化画像表示アプリケーションであるビューヮの出力画像の精度、 輪郭再構成 速度、 描画速度などに関する実験を行った。 図 1 2〜図 1 5は、 実施画面例とピ クセル画像との比較結果を示す図である。 図 1 2および図 1 3は J a V aアプリ ケーションを用いた実装の画面例で、 図 1 4は J a v aァプレツトを用いて表示 した例である。 また、 図 1 5は本実施形態の画像処理システムと比較するために、 もとのピクセル画像を拡大表示したものである。 図 1 2〜図 1 5から、 本実施形 態の画像処理システムでは、 縮小画像、 拡大画像とも高精度に再現されているこ とがわかる。  Next, experimental results regarding the display application will be described. Here, we performed experiments on the accuracy, contour reconstruction speed, drawing speed, etc. of the output image of View II, which is a functionalized image display application. FIG. 12 to FIG. 15 are diagrams showing comparison results between the example of the embodiment screen and the pixel images. Figs. 12 and 13 are screen examples of implementation using the Java application, and Fig. 14 is an example of display using the Java applet. FIG. 15 is an enlarged view of the original pixel image for comparison with the image processing system of the present embodiment. From FIGS. 12 to 15, it can be seen that in the image processing system of the present embodiment, both the reduced image and the enlarged image are reproduced with high accuracy.
これまでは表示精度について注目してきたが、 次に処理速度に関する実験の結 果を示す。 図 1 6は、 処理速度に関する実験結果を示す図である。 図 1 6に示す 実験結果は、 関数化画像のファイルを読み込んで輪郭線を再構成する時間と全て の輪郭線を表示するのに要する時間を計測したものである。 図 1 6に示すように、 輪郭線再構成処理に要する時間は 0 . 1 6秒から 1 . 4 7秒であり、 非常に高速 に処理されていることがわかる。 描画時間に関しては、 0 . 0 4〜 1 . 3 2秒か かっている。 この程度の描画速度であればアプリケーションとしての応答性は十 分であるといえる。 この実験では、 画像全体を表示しているが、 拡大した場合に は画面上に現れない描画不要な輪郭が増加するので描画時間は大きく短縮される。 これらのビューヮは J a V a 2で実装されているが、 J a V a 2は仮想マシン 上で動いておりネィティブな実行環境に比べてどうしても実行速度の面で劣る。 さらに、 今回用いたグラフィックライブラリは標準のものなので、 最新のグラフ ィックァクセラレー夕に合わせて最適化されたものではない。 それにもかかわら ず、 高速に描画できていることが図 1 6に示す実験結果から示されており、 今後 グラフィックァクセラレ一夕の性能を生かすようなライブラリが導入されればよ り高速な描画が期待できる。  So far, we have focused on display accuracy. Next, we show the results of experiments on processing speed. FIG. 16 is a diagram showing experimental results regarding the processing speed. The experimental results shown in Fig. 16 measured the time required to read the function image file and reconstruct the contours, and the time required to display all the contours. As shown in FIG. 16, the time required for the contour reconstruction processing is 0.16 seconds to 1.47 seconds, indicating that the processing is performed at a very high speed. The drawing time is between 0.04 and 1.32 seconds. It can be said that the responsiveness of the application is sufficient at such a rendering speed. In this experiment, the entire image is displayed. However, when the image is enlarged, the number of unnecessary contours that do not appear on the screen increases, and the drawing time is greatly reduced. These views are implemented in JaVa2, but JaVa2 runs on a virtual machine and is inferior in execution speed compared to the native execution environment. In addition, the graphic library used this time is a standard one, so it is not optimized for the latest graphic model. Nevertheless, the results of the experiment shown in Fig. 16 show that high-speed drawing is possible. If a library that takes advantage of the performance of Graphic Xerare is introduced in the future, higher-speed drawing will be achieved. Can be expected.
このように、 本実施形態の画像処理システムは、 関数化画像を用いて文書画像 を表現することによって紙文書を高精細にデジタル化することができる。 本実施 形態では、 輪郭線を複数のクラスの連続関数で近似表現しているので一つの画像 ファイルから任意の解像度で出力することができる。 また、 本実施形態で用いる 関数化画像ファイルは、 輪郭線の部分毎に最適な関数で近似して再生に必要な最 低限のデータを抽出することにより構成されているので、 ファイルサイズが小さ くて済む上、 その再生 ·表示も非常に高速である。 産業上の利用可能性 As described above, the image processing system according to the present embodiment uses a function image to generate a document image. By expressing, the paper document can be digitized with high definition. In the present embodiment, since the contour is approximated by a continuous function of a plurality of classes, it is possible to output a single image file at an arbitrary resolution. In addition, the functionalized image file used in the present embodiment is configured by extracting the minimum data necessary for reproduction by approximating each contour part with an optimal function, so that the file size is small. In addition, the playback and display are very fast. Industrial applicability
上述したように、 本発明によれば、 紙文書から読み取った図形等の輪郭線を関 数近似しているため、 表示や印刷の際に高精細なデジタル画像を生成することが できる。  As described above, according to the present invention, since contour lines of figures and the like read from a paper document are approximated by functions, a high-definition digital image can be generated at the time of display or printing.

Claims

請 求 の 範 囲 The scope of the claims
1 . 紙文書に描かれた内容を読み込んで、 2値化されたピクセル画像を作成する 前記ピクセル画像に含まれる輪郭点列を抽出する第 2のステップと、 前記輪郭点列の形状を関数近似して関数化画像データを生成する第 3のステツ プと、  1. The contents drawn on the paper document are read, and a binarized pixel image is created. A second step of extracting a contour point sequence included in the pixel image, and a function approximation of the shape of the contour point sequence A third step of generating functionalized image data by
前記第 3のステップにおいて生成された関数化画像データに基づいて近似関数 を求め、 この近似関数を使って色領域の閉輪郭線を生成する第 4のステップと、 前記閉輪郭線を塗りつぶして描画用データを生成する第 5のステップと、 前記描画用データに基づいて、 表示処理あるいは印刷処理を行う第 6のステツ プと、  A fourth step of obtaining an approximate function based on the functionalized image data generated in the third step, and generating a closed contour of the color region using the approximate function; and drawing the closed contour by filling the closed contour A fifth step of generating display data, and a sixth step of performing display processing or print processing based on the drawing data.
を有することを特徴とする画像処理方法。  An image processing method comprising:
2 . 前記第 4のステップにおける前記閉輪郭線の生成は、 前記第 6のステップに おける表示処理、 印刷処理の解像度に対応した間隔で輪郭点列を発生させること により行うことを特徴とする請求の範囲第 1項記載の画像処理方法。  2. The generation of the closed contour in the fourth step is performed by generating a sequence of contour points at intervals corresponding to the resolution of the display processing and the printing processing in the sixth step. 2. The image processing method according to claim 1, wherein
3 . 前記第 6のステップにおいて表示処理を行う場合に、 使用者によって表示倍 率の変更が指示されたときに、 前記第 4のステップにおいて、 この表示倍率に対 応した間隔で輪郭点列を発生させることにより前記閉輪郭線の生成を行うことを 特徴とする請求の範囲第 1項記載の画像処理方法。  3. When performing the display processing in the sixth step, when the user instructs to change the display magnification, in the fourth step, the outline point sequence is formed at intervals corresponding to the display magnification. The image processing method according to claim 1, wherein the closed contour is generated by generating the closed contour.
4 . 前記第 3のステップにおける関数近似は、 前記第 2のステップにおいて抽出 された前記輪郭点列を複数に分割し、 それぞれの分割部分に最適な近似関数を決 定することにより行われることを特徴とする請求の範囲第 1項記載の画像処理方 法。  4. The function approximation in the third step is performed by dividing the contour point sequence extracted in the second step into a plurality of pieces and determining an optimal approximation function for each divided part. The image processing method according to claim 1, wherein the image processing method is characterized in that:
5 . 前記輪郭点列の分割位置は、 ダイナミック · プログラミングによる最適化手 法によって決定することを特徴とする請求の範囲第 4項記載の画像処理方法。  5. The image processing method according to claim 4, wherein a division position of the outline point sequence is determined by an optimization method based on dynamic programming.
6 . 前記分割部分と前記近似関数との対応付けは、 直線、 円弧、 2  6. The correspondence between the segment and the approximation function is straight line, circular arc, 2
ン曲線の順で行うことを特徴とする請求の範囲第 4項記載の画像処理方法。 5. The image processing method according to claim 4, wherein the image processing is performed in the order of the curve.
PCT/JP2000/003641 1999-06-03 2000-06-05 Image processing method WO2000075869A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP15717199 1999-06-03
JP11/157171 1999-06-03

Publications (1)

Publication Number Publication Date
WO2000075869A1 true WO2000075869A1 (en) 2000-12-14

Family

ID=15643753

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2000/003641 WO2000075869A1 (en) 1999-06-03 2000-06-05 Image processing method

Country Status (1)

Country Link
WO (1) WO2000075869A1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002035472A3 (en) * 2000-10-24 2002-11-21 Starlab Nv Sa Creating cartoons
CN101192307B (en) * 2006-11-17 2012-05-23 鸿富锦精密工业(深圳)有限公司 Point cloud triangular topological relations construction method
US9453716B2 (en) 2010-10-22 2016-09-27 Makino Milling Machine Co., Ltd. Method of measurement and apparatus for measurement of tool dimensions

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03234559A (en) * 1990-02-09 1991-10-18 Fuji Xerox Co Ltd Pattern deformation system
JPH05282440A (en) * 1992-03-30 1993-10-29 Alps Electric Co Ltd Approximating method for position data
JPH0785268A (en) * 1993-06-30 1995-03-31 Kazuo Toraichi Character graphic communication device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03234559A (en) * 1990-02-09 1991-10-18 Fuji Xerox Co Ltd Pattern deformation system
JPH05282440A (en) * 1992-03-30 1993-10-29 Alps Electric Co Ltd Approximating method for position data
JPH0785268A (en) * 1993-06-30 1995-03-31 Kazuo Toraichi Character graphic communication device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KOUICHI HATA ET AL.: "Fukuzatsuna rinkaku no jidou chuushitsu tsuisekihou", TRANSACTIONS ON THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, vol. J81-D-II, no. 4, April 1998 (1998-04-01), (JAPAN), pages 706 - 715, XP002945887 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002035472A3 (en) * 2000-10-24 2002-11-21 Starlab Nv Sa Creating cartoons
CN101192307B (en) * 2006-11-17 2012-05-23 鸿富锦精密工业(深圳)有限公司 Point cloud triangular topological relations construction method
US9453716B2 (en) 2010-10-22 2016-09-27 Makino Milling Machine Co., Ltd. Method of measurement and apparatus for measurement of tool dimensions

Similar Documents

Publication Publication Date Title
JP5180670B2 (en) Image processing apparatus and image processing method
JPH11232378A (en) Digital camera, document processing system using the digital camera, computer-readable storage medium, and program code transmission device
US20070279705A1 (en) Image processing apparatus and control method thereof, and program
JP2010279038A (en) Method and system for electronic image real-time personalization
WO2007064851A2 (en) System to print artwork containing transparency
JP4582204B2 (en) Image processing apparatus, image conversion method, and computer program
JPH07131634A (en) Image processing device
US7809199B2 (en) Image processing apparatus
JP2009171563A (en) Image processing apparatus, image processing method, program for executing image processing method, and storage medium
CN101346981A (en) Image processing apparatus, image processing method and image processing program product
JP5111242B2 (en) Image processing apparatus and method
JP3009525B2 (en) Vector image drawing equipment
WO2000075869A1 (en) Image processing method
JP2008042345A (en) Image processing method and image processing apparatus
CN117573048A (en) Automatic document watermark generation method and terminal
JP3912971B2 (en) Image processing apparatus and method
JP4646703B2 (en) Image processing apparatus, control method therefor, and program
JP2003087558A (en) Apparatus and method for processing image
JP2008042346A (en) Image processing method and image processing apparatus
JP4710508B2 (en) Image processing program and image processing apparatus
JP4379571B2 (en) Image processing apparatus and image processing method
JP3060569B2 (en) Printing equipment
JP3741183B2 (en) Image data interpolation apparatus, image data interpolation method, and medium on which image data interpolation program is recorded
JP3359361B2 (en) Enlargement printing device
JP2000076430A5 (en)

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref country code: JP

Ref document number: 2001 502067

Kind code of ref document: A

Format of ref document f/p: F

AK Designated states

Kind code of ref document: A1

Designated state(s): CN JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE

121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase