[go: up one dir, main page]

JP2000112995A - Document search method, document search device, and recording medium - Google Patents

Document search method, document search device, and recording medium

Info

Publication number
JP2000112995A
JP2000112995A JP11252503A JP25250399A JP2000112995A JP 2000112995 A JP2000112995 A JP 2000112995A JP 11252503 A JP11252503 A JP 11252503A JP 25250399 A JP25250399 A JP 25250399A JP 2000112995 A JP2000112995 A JP 2000112995A
Authority
JP
Japan
Prior art keywords
document
information describing
structural information
target document
electronic documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11252503A
Other languages
Japanese (ja)
Inventor
Pearse Mark
ピアース マーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2000112995A publication Critical patent/JP2000112995A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 文書中の図表ような視覚的構造を利用して文
書を効率的に検索する方法及び装置を実現する。 【解決手段】 ターゲット文書を解析して、その視覚的
構造を記述する構造情報を生成する(351)。例え
ば、文書のラスタ画像からテキストを削除し、残存成分
に対応した点集合を生成する。あるいは、ページ記述言
語ファイル中のコマンドにより生成される線分の端点の
集合を生成する。生成した構造情報と保存電子文書の集
合を記述する構造情報とを比較し(352)、構造情報
が一致したとみなされる保存電子文書を取り出す(35
3)。構造情報の一致判定にハウスドルフ法を利用す
る。
(57) [Summary] [PROBLEMS] To realize a method and an apparatus for efficiently searching a document using a visual structure such as a chart in the document. A target document is analyzed to generate structural information describing a visual structure of the target document (351). For example, text is deleted from the raster image of the document, and a point set corresponding to the remaining components is generated. Alternatively, a set of endpoints of line segments generated by a command in the page description language file is generated. The generated structure information is compared with the structure information describing the set of stored electronic documents (352), and the stored electronic document that is considered to have the same structure information is extracted (35).
3). The Hausdorff method is used to determine the coincidence of structural information.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文書検索技術に係
り、特に、文書の視覚的体裁をベースにした文書検索技
術に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document search technique, and more particularly, to a document search technique based on a visual appearance of a document.

【0002】[0002]

【従来の技術】文書の検索者によって定義されたパラメ
ータに合致した文書を検索するための方式は、数多く存
在している。その最も一般的な検索方法は、テキスト・
ベースの検索方法である。例えば、文書検索者は、所望
の文書に含まれている1つ以上のキーワードからなる文
字列を定義することにより、もしくは「論理検索式」を
定義することにより、所望のもしくは指定した内容に合
致する文書を見つけることができる。
2. Description of the Related Art There are many methods for searching for a document that matches parameters defined by a document searcher. The most common search methods are text,
This is the base search method. For example, a document searcher can match desired or specified contents by defining a character string consisting of one or more keywords contained in a desired document, or by defining a "logical search expression". You can find a document to do.

【0003】文書画像の検索方法も存在する。例えば、
文書の線構造を利用する画像検索方式がある。このよう
な検索方式は一般に、図面、地図、フローチャート等に
利用されている。もう一つの画像検索手法の例が、Nibl
ack, W.,et al.,"The QBIC Project: Querying Images
By Content Using Color, Textureand Shape" SPIE Pro
ceedings, Vol. 1908, pp.173-187 (February, 1993)に
見られる。
There is also a method for retrieving a document image. For example,
There is an image search method that uses the line structure of a document. Such a search method is generally used for drawings, maps, flowcharts, and the like. Another example of an image search technique is Nibl
ack, W., et al., "The QBIC Project: Querying Images
By Content Using Color, Textureand Shape "SPIE Pro
ceedings, Vol. 1908, pp.173-187 (February, 1993).

【0004】人間はしばしば物理文書を検索するが、そ
れは人間が文書をその視覚的な体裁に基づいて認識でき
るからである。例えば、プレゼンテーション用スライド
一式中に特定の図表が含まれていたことを知っている場
合、素速く保存文書からその図表を検索し、それに関連
したスライドを取り出すことができる。しかし、所望の
図表が入っている特定の文書を思い出すことができない
ときには、もっと多くの文書を調べる必要があろう。コ
ンピュータ・システムに保存されている文書の場合、あ
るファイルのことを考え、それを開いて十分に調べよう
とすると、殊に検索対象となるファイル数が多いとき、
非常に時間がかかるであろう。
[0004] Humans often search for physical documents because humans can recognize documents based on their visual appearance. For example, if you know that a particular chart was included in a set of presentation slides, you can quickly search for that chart from a stored document and retrieve the slides associated with it. However, when the particular document containing the desired diagram cannot be remembered, more documents may need to be consulted. In the case of documents stored on computer systems, thinking about a file, opening it and examining it thoroughly, especially when the number of files to be searched is large,
Will be very time consuming.

【0005】[0005]

【発明が解決しようとする課題】よって、本発明の目的
は、文書中の図や表のような視覚的構造を利用して文書
を自動検索する方法及び装置を提供することにある。本
発明のもう1つの目的は、文書のテキスト内容に影響さ
れにくい、そのような文書検索方法及び装置を提供する
ことにある。
SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide a method and apparatus for automatically retrieving a document using a visual structure such as a diagram or table in the document. It is another object of the present invention to provide such a document search method and apparatus that is less affected by the text content of the document.

【0006】[0006]

【課題を解決するための手段】前記目的を達成するため
の本発明の主たる特徴は、ターゲット文書の視覚的構造
を記述する構造情報を生成し、生成したターゲット文書
を記述する構造情報を保存電子文書の集合を記述する構
造情報の集合と比較し、保存文書を記述する構造情報が
ターゲット文書を記述する構造情報と所定の許容誤差の
範囲内で一致したときに保存電子文書の集合から1つ以
上の保存電子文書を取り出すことである。本発明のもう
1つの特徴は、ターゲット文書のラスタ画像からテキス
トを削除し、その残存成分に対応した点集合を、ターゲ
ット文書の構造情報として生成することである。本発明
のもう1つの特徴は、ターゲット文書のページ記述言語
ファイル中のコマンドに関し線を記述する端点を求め、
求めた端点に対応した点集合をターゲット文書の構造情
報として生成することである。
A main feature of the present invention to achieve the above object is to generate structural information describing a visual structure of a target document and store the structural information describing the generated target document. One of the stored electronic documents is compared with a set of structural information describing a set of documents, and when the structural information describing the stored document matches the structural information describing the target document within a predetermined tolerance. This is to retrieve the stored electronic document. Another feature of the present invention is that text is deleted from a raster image of a target document, and a point set corresponding to the remaining components is generated as structure information of the target document. Another feature of the present invention is to determine an endpoint that describes a line for a command in a page description language file of a target document;
A point set corresponding to the obtained end point is generated as structure information of the target document.

【0007】本発明の前記特徴及びその他の特徴につい
て、以下の説明において具体的に説明する。
The above and other features of the present invention will be specifically described in the following description.

【0008】[0008]

【発明の実施の形態】以下の記述中に、説明のために様
々な具体例が示される。しかし、当業者には、そのよう
な具体例によらずに本発明を実施し得ることは明白であ
ろう。他方、本発明をいたずらに難解にしないため、周
知の構造やデバイスはブロック図で示される。
DETAILED DESCRIPTION In the following description, various examples are set forth for purposes of explanation. However, it will be apparent to one skilled in the art that the present invention may be practiced without such an embodiment. On the other hand, well-known structures and devices are shown in block diagram form in order to not unnecessarily obscure the present invention.

【0009】以下の詳細説明で、コンピュータ・メモリ
内のデータビットに対する操作のアルゴリズム及び記号
表現によって表された部分がある。このようなアルゴリ
ズム記述及び表現は、データ処理技術分野の当業者が、
その研究内容を他の当業者に対し最も効率的に伝えるた
めに用いる手段である。あるアルゴリズムがあり、それ
が概して所望の結果に至る筋の通ったステップの系列だ
と理解されるとする。これらステップは、物理量を物理
的に操作する必要があるものである。必ずという訳では
ないが、通常、これらの物理量は記憶、転送、結合、比
較、その他操作が可能な電気的または磁気的信号の形を
とる。これらの信号をビット、数値、要素、記号、文
字、用語、番号等で呼ぶのが、主に慣用上の理由から便
利な場合があることが分かっている。
In the following detailed description, there are portions represented by algorithms and symbolic representations of operations on data bits in computer memory. Such algorithm descriptions and representations will be readily apparent to those skilled in the data processing arts,
It is the means used to most effectively convey the contents of the research to other persons skilled in the art. Suppose we have an algorithm, which is generally understood to be a sequence of reasonable steps leading to a desired result. These steps require physical manipulation of physical quantities. Usually, but not necessarily, these physical quantities take the form of electrical or magnetic signals that can be stored, transferred, combined, compared, and otherwise manipulated. It has been found convenient to refer to these signals by bits, numbers, elements, symbols, characters, terms, numbers, and the like, which may be convenient mainly for reasons of convention.

【0010】しかしながら、このような用語や同様の用
語は、適切な物理量と対応付けられるべきであり、ま
た、これら物理量につけた便宜上のラベルに過ぎないと
いうことに留意すべきである。以下の説明から明らかな
ように、特に断わらない限り、「処理」「演算」「計
算」「判定」「表示」等の用語を用いて論じることは、
コンピュータシステムのレジスタやメモリの内部の物理
的(電子的)な量として表現されたデータを処理して、
コンピュータシステムのメモリやレジスタ、その他同様
の情報記憶装置、情報伝送装置又は表示装置の内部の同
様に物理量として表現された他のデータへ変換する、コ
ンピュータシステムや同様の電子演算装置の作用及びプ
ロセスを指すものである。
It should be noted, however, that these and similar terms should be associated with appropriate physical quantities and are merely convenient labels attached to these physical quantities. As will be apparent from the following description, discussions using terms such as “processing”, “calculation”, “calculation”, “judgment”, “display”, etc.
Processing data expressed as physical (electronic) quantities inside registers and memories of computer systems,
The operation and process of a computer system or similar electronic computing device that converts to other data, also expressed as physical quantities, inside a memory or register of a computer system or other similar information storage device, information transmission device or display device. It points.

【0011】また、本発明を実施するための装置は、所
望の目的のために専用に作られてもよいし、汎用コンピ
ュータを内蔵のコンピュータ・プログラムにより選択駆
動もしくは再構成してなるものでもよい。そのようなコ
ンピュータ・プログラムは、コンピュータが読み取り可
能な記憶媒体、限定するわけではないが例えば、フロッ
ピーディスク、光ディスク、CD−ROM、光磁気ディ
スクなどの任意の種類のディスク、リードオンリーメモ
リ(ROM)、ランダムアクセスメモリ(RAM)、E
PROM、EEPROM、磁気カード又は光カード、す
なわち電子的命令の格納に適しコンピュータのシステム
バスに接続される任意種類の媒体に格納してよい。ここ
に提示するアルゴリズムは、本質的に、いかなる特定の
コンピュータ、その他の装置とも関わりがない。様々な
汎用マシンを、ここに述べる内容に従ったプログラムと
一緒に使用し得るが、所要の方法のためのステップを実
行するために、より特化した装置を作るほうが好都合で
あるかもしれない。これら多様なマシンに要求される構
造は以下の説明から明らかになろう。さらに、どのよう
な特定のプログラミング言語とも関連付けることなく本
発明を説明する。ここに述べる本発明の内容を実現する
ために、様々なプログラミング言語を利用し得ることが
理解されよう。
An apparatus for carrying out the present invention may be made exclusively for a desired purpose, or may be a general-purpose computer selectively driven or reconfigured by a built-in computer program. . Such a computer program can be a computer readable storage medium, any type of disk, such as, but not limited to, a floppy disk, optical disk, CD-ROM, magneto-optical disk, read only memory (ROM) , Random access memory (RAM), E
It may be stored on a PROM, EEPROM, magnetic or optical card, any type of medium suitable for storing electronic instructions and connected to a computer system bus. The algorithms presented here are essentially irrelevant to any particular computer or other device. Various general-purpose machines may be used with programs in accordance with the teachings herein, but it may be advantageous to make more specialized apparatus to perform the steps for the required method. The required structure for a variety of these machines will appear from the description given. Furthermore, the present invention is described without association with any particular programming language. It will be appreciated that a variety of programming languages may be utilized to implement the subject matter described herein.

【0012】本発明は、文書の視覚的構造を利用して文
書マッチングを行うが、本発明の対象となる文書は情報
を伝達する任意の電子ファイルでよく、例えば、論文、
プレゼンテーション、リポート等々であるが、それに限
定されるわけではない。ある文書(ターゲット文書)を
記述する構造情報を利用し、一群の保存電子文書から、
それらの構造情報とのマッチングによって所望の文書を
検索する。
In the present invention, document matching is performed using the visual structure of a document. The document targeted by the present invention may be any electronic file that transmits information.
Presentations, reports, etc., but are not limited to them. Using structural information that describes a certain document (target document), from a group of stored electronic documents,
A desired document is searched by matching with the structure information.

【0013】一般的には、構造情報は、例えば、図形、
線画、パーツや線分の配列、それらの部分のような1つ
以上の図形特徴をどのように表現もしくは記述したもの
でもよい。図形特徴に線分を含めてもよい。画像におい
て、線分はハフ(Hough)変換のような演算子によって削
除し得る。PostScript のようなページ記述言語におい
ては、線分は”lineto”のようなコマンドによって明示
的に表現される。画像中の線分及びPostScriptプログラ
ムによって生成された線分は、ハフ変換配列のセルに写
像される。画像中の位置毎にハフ空間をパラメータ表示
することによって精度を向上させることができる。ハフ
配列間の類似度が高いということは、それらハフ配列が
同一の図形画像を表していることを意味する。ハフ配列
間の類似度は、点乗積のような単純な距離関数によって
計量することができる。それよりも複雑な距離関数で
は、線分位置の不正確性が考慮されるであろう。同じ位
置で検出された線分がハフ空間上のいくつかの近接位置
へ写像されることがあり、それによってノイズに対し頑
健になり、また、2つの画像中の類似した線分が検出さ
れる可能性が増える。
In general, structural information includes, for example, a figure,
Any representation or description of one or more graphic features, such as a line drawing, an array of parts or line segments, or portions thereof, may be used. The graphic feature may include a line segment. In an image, line segments can be deleted by operators such as the Hough transform. In page description languages such as PostScript, line segments are explicitly represented by commands such as "lineto". Line segments in the image and those generated by the PostScript program are mapped to cells in the Hough transform array. Accuracy can be improved by displaying the Hough space as a parameter for each position in the image. A high degree of similarity between Hough arrays means that the Hough arrays represent the same graphic image. The similarity between Hough arrays can be measured by a simple distance function such as a dot product. For more complex distance functions, the inaccuracy of the line segments will be taken into account. Line segments detected at the same location may be mapped to several nearby locations in Hough space, thereby making them robust against noise and detecting similar line segments in the two images The possibilities increase.

【0014】エッジを特徴として用いて、同様の方法を
利用することもできる。エッジの検出は、一般的に利用
可能な多くの方法、例えばCanny演算子を用いて行うこ
とができる。そして、エッジに線分をあてはめたのち、
前記手順を踏んで2つの画像のマッチングをすることが
できる。しかし、PostScriptプログラムは、直線エッジ
を生成するどの演算子もエッジの出力もするように修正
されるかもしれない。例えば、linto コマンドが、線の
各側に1つずつ、計2つのエッジを生成するかもしれな
い。1つの塗りつぶし矩形を生成したコマンドが、その
矩形の各辺に1つずつ、計4つの線を生成するかもしれ
ない。
A similar method can be used, using edges as features. Edge detection can be performed using many commonly available methods, for example, using the Canny operator. And after applying a line segment to the edge,
According to the above procedure, two images can be matched. However, PostScript programs may be modified so that any operator that produces a straight edge also outputs an edge. For example, a linto command may generate two edges, one on each side of the line. A command that generated one fill rectangle may generate four lines, one on each side of the rectangle.

【0015】一実施例では、構造情報は点集合であり、
ターゲット文書の点集合と検索対象の保存電子文書の点
集合とが比較され、その保存電子文書がターゲット文書
と一致するか否か判断される。文書(又は文書の一部)
の画像は点集合に変換される。点集合が所定の許容誤差
の範囲内で一致した場合に、それら文書は一致したとみ
なされる。一実施例では、点集合の比較のためにハウス
ドルフ(Hausdorff)測度が用いられる。要するに、そ
れら点集合が、文書データベース中の図形及びその他の
構造を検索するための問い合わせになる。
In one embodiment, the structure information is a point set,
The point set of the target document is compared with the point set of the stored electronic document to be searched, and it is determined whether or not the stored electronic document matches the target document. Document (or part of document)
Is converted to a point set. If the point sets match within a predetermined tolerance, the documents are considered matched. In one embodiment, a Hausdorff measure is used for comparing point sets. In short, these point sets become queries for searching for figures and other structures in the document database.

【0016】図1は、本発明を実施可能な文書処理装置
の一例を示すブロック図である。文書処理装置100
は、情報伝達のためのバス101又はその他通信装置を
有し、また、バス101に接続された情報処理のための
プロセッサ102を有する。文書処理装置100はさら
に、情報及びプロセッサ102により実行される命令を
格納するためのランダムアクセスメモリ(RAM)又は
その他の動的記憶装置104(メインメモリと呼ぶ)
が、バス101に接続されている。メインメモリ104
は、プロセッサ102による命令実行中に、一時的な変
数やその他の中間情報の記憶にも利用可能である。文書
処理装置100は、プロセッサ102のための固定情報
及び命令を格納するためのリードオンリーメモリ(RO
M)106もバス101に接続されている。情報及び命
令を格納するためのハードディスク装置等のデータ記憶
装置107もバス101に接続されている。磁気ディス
ク、CD−ROM、DVDのような記録媒体108の読
み書きのためのドライブ109もバス101に接続され
ている。文書処理装置100には、情報をユーザに表示
するための液晶ディスプレイ(LCD)ようなディスプ
レイ装置121もバス101を介し接続されている。入
力装置125もバス101に接続されており、この入力
装置125を利用してユーザは文書処理装置100に対
する入力及び制御が可能である。入力装置125は、例
えばキーボード、キーパッド、マウス、トラックボー
ル、トラックパッド、タッチスクリーン等である。図1
には示さないが、文書処理装置100は通信回線やネッ
トワークとのインターフェースを具備してもよい。
FIG. 1 is a block diagram showing an example of a document processing apparatus capable of implementing the present invention. Document processing device 100
Has a bus 101 for information transmission or other communication devices, and has a processor 102 connected to the bus 101 for information processing. The document processing device 100 further includes a random access memory (RAM) or other dynamic storage device 104 (called main memory) for storing information and instructions executed by the processor 102.
Are connected to the bus 101. Main memory 104
Can also be used to store temporary variables and other intermediate information while the processor 102 is executing instructions. The document processing apparatus 100 includes a read-only memory (RO) for storing fixed information and instructions for the processor 102.
M) 106 is also connected to the bus 101. A data storage device 107 such as a hard disk device for storing information and instructions is also connected to the bus 101. A drive 109 for reading and writing a recording medium 108 such as a magnetic disk, a CD-ROM, and a DVD is also connected to the bus 101. A display device 121 such as a liquid crystal display (LCD) for displaying information to a user is also connected to the document processing apparatus 100 via a bus 101. The input device 125 is also connected to the bus 101, and the user can input and control the document processing device 100 using the input device 125. The input device 125 is, for example, a keyboard, a keypad, a mouse, a trackball, a trackpad, a touch screen, or the like. FIG.
Although not shown, the document processing apparatus 100 may include an interface with a communication line or a network.

【0017】本発明は、このような文書処理装置100
を、構造画像データに基づいた文書マッチングに利用す
る方法に関わる。一実施例によれば、メインメモリ10
4に格納された命令シーケンスをプロセッサ102が実
行することにより、文書処理装置100で本発明による
文書マッチングが遂行される。メインメモリ104内の
命令シーケンスを実行することにより、プロセッサ10
2が構造画像データを利用した文書マッチングを遂行す
る。
The present invention provides such a document processing apparatus 100.
Is used for document matching based on structural image data. According to one embodiment, the main memory 10
When the processor 102 executes the instruction sequence stored in the document processing apparatus 4, the document matching is performed in the document processing apparatus 100 according to the present invention. By executing the instruction sequence in the main memory 104, the processor 10
2 performs document matching using the structural image data.

【0018】本発明を実施するための命令シーケンスの
メインメモリ104への取り込み方法は、磁気ディス
ク、CD−ROM、DVDのような記録媒体108から
読み込む、データ記憶装置107から読み込む、遠隔接
続経由(例えばネットワーク経由)で取り込む、等々で
ある。他の実施例としては、ソフトウェアの命令に代え
て、あるいは、それと組み合わせて布線回路を使用し本
発明を実施してもよい。このように、本発明は、ハード
ウェア回路とソフトウエアのどのような特定の組み合わ
せにも限定されない。
The method of loading the instruction sequence into the main memory 104 for carrying out the present invention includes reading from a recording medium 108 such as a magnetic disk, CD-ROM, or DVD, reading from a data storage device 107, and via a remote connection ( For example, via a network). As another embodiment, the present invention may be implemented using a wired circuit instead of, or in combination with, software instructions. Thus, the present invention is not limited to any particular combination of hardware circuits and software.

【0019】文書処理装置100はコンピュータ・シス
テムであってもよく、この場合、文書はアプリケーショ
ン・プログラム、例えばワープロ・プログラム、電子メ
ールプログラム、表計算プログラム等によって生成され
る。文書処理装置100は、処理した文書のコピーを記
憶するコピア、ファックス(fax)装置あるいはプリ
ンタであってもよい。例えば、あるコピアは複写した文
書の画像を記憶できる。あるファックス装置は送信又は
受信した文書の画像を記憶できる。あるプリンタは、印
刷した文書のコピーを記憶できる。
The document processing apparatus 100 may be a computer system. In this case, the document is generated by an application program, for example, a word processing program, an e-mail program, a spreadsheet program, and the like. Document processing device 100 may be a copier, fax device, or printer that stores a copy of the processed document. For example, a copier can store an image of a copied document. Some fax machines can store images of transmitted or received documents. Some printers can store copies of printed documents.

【0020】一実施例では、文書処理装置100は、紙
の文書を電子文書の形でデジタル記憶する画像ベースの
ファイルシステムである。紙文書をファイル画像に変換
すると、キャビネットや書庫等の手動のシステムに比
べ、情報へのアクセスがより容易になる。
In one embodiment, document processing device 100 is an image-based file system that digitally stores paper documents in the form of electronic documents. Converting paper documents to file images makes access to information easier than manual systems such as cabinets and archives.

【0021】図2は、複数の文書処理装置を有する文書
処理システムの一実施例である。この文書処理システム
は、複数の文書処理装置がネットワークで相互に接続さ
れた形で表されている。しかしながら、そのような装置
が1つだけでも文書処理システムを構成可能である。
FIG. 2 shows an embodiment of a document processing system having a plurality of document processing devices. This document processing system is shown in a form in which a plurality of document processing apparatuses are interconnected by a network. However, a document processing system can be configured with only one such device.

【0022】一実施例では、ネットワーク200は、複
数の文書処理装置及び他の演算装置を相互に接続するロ
ーカルエリアネットワークである。しかし、それ以外の
種類のネットワークを利用してもよい。例えば、ネット
ワーク200は、インターネットやそれ以外の広域ネッ
トワークでもよい。
In one embodiment, network 200 is a local area network interconnecting a plurality of document processing devices and other computing devices. However, other types of networks may be used. For example, the network 200 may be the Internet or another wide area network.

【0023】コピア210は、データベース240又は
その他の内部もしくは外部の記憶装置に文書を格納でき
る文書複写装置である。コピア210は、複写した文書
画像並びに制御情及びその他の情報の通信のためにネッ
トワーク200に接続される。文書は、さらに処理する
ため、又はそれ以外の目的のために、ネットワーク20
0に接続された他の装置へ伝送することができる。一実
施例では、コピア210によって複写された文書は、あ
とで検索できるようにデータベース240に格納され
る。処理した文書を格納することによって、その文書の
紙原稿はもう必要ではない。その文書が必要になったと
きには、その文書の電子文書をデータベース240から
取り出すことができる。
Copier 210 is a document copying device that can store documents in database 240 or other internal or external storage. Copier 210 is connected to network 200 for communication of copied document images and control information and other information. The document is stored on the network 20 for further processing or other purposes.
0 can be transmitted to other devices. In one embodiment, documents copied by copier 210 are stored in database 240 for later retrieval. By storing the processed document, the paper manuscript of that document is no longer needed. When the document is needed, an electronic document of the document can be retrieved from the database 240.

【0024】ファックス装置220もネットワーク20
0に接続されている。ファックス装置220は、送受信
文書のコピーをデータベース240、あるいは、内部も
しくは外部の記憶装置に格納する。例えば、文書をデー
タベース240から直接取り出し、それをファックス装
置220によって送信することができ、紙の文書を必要
としない。同様に、プリンタ250は、ネットワーク2
00に接続された装置により生成された文書、あるい
は、データベース240又は他の記憶装置から取り出さ
れた文書を印刷できる。
The fax machine 220 is also connected to the network 20
Connected to 0. The fax device 220 stores a copy of the transmitted / received document in the database 240 or an internal or external storage device. For example, a document can be retrieved directly from the database 240 and sent by the fax device 220 without the need for a paper document. Similarly, the printer 250 is connected to the network 2
00, or documents retrieved from the database 240 or other storage device.

【0025】コンピュータ・システム230は、どのよ
うな種類のものでもよく、本発明による文書マッチング
のために使用できる。コンピュータ・システム230
に、物理文書を電子文書へ変換するためのスキャナ(図
2には示されていない)が接続されてもよい。プリンタ
250は、例えば、データベース240に文書を格納し
又はデータベース240から文書を取り出すプリンタで
あってもよい。一実施例では、単一の装置がコピア21
0、ファックス装置220及びプリンタ250の機能を
提供する。
The computer system 230 can be of any type and can be used for document matching according to the present invention. Computer system 230
Alternatively, a scanner (not shown in FIG. 2) for converting a physical document into an electronic document may be connected. Printer 250 may be, for example, a printer that stores documents in database 240 or retrieves documents from database 240. In one embodiment, a single device is copier 21
0, the functions of the fax device 220 and the printer 250 are provided.

【0026】本発明による文書マッチングの遂行のため
に、図2に示す文書処理装置のどれを利用してもよい。
例えば、コンピュータ・システム230は、ある文書に
基づいて構造情報を生成し、一致する文書を見つけるた
めにデータベース240を検索することができる。それ
以外の装置も文書マッチングのために同様に利用でき
る。
For performing the document matching according to the present invention, any of the document processing apparatuses shown in FIG. 2 may be used.
For example, computer system 230 can generate structural information based on a document and search database 240 for a matching document. Other devices can be used for document matching as well.

【0027】図3は、本発明による文書検索システムの
一例を示すブロック図である。図3において、300は
ターゲット文書、310は文書検索装置、320はデー
タベース、330は出力装置である。図3に示すブロッ
ク図は、物理文書と電子文書間のマッチングと電子文書
間のマッチングの両方を行うシステムを示している。文
書マッチングに文書の図形特徴又は成分を使用して、同
一又は類似の図形成分又は特徴を持つ1つ以上の保存電
子文書を検索することができる。そのような特徴として
は、図形、線、形状、テクスチャ、サイズ、その他の特
徴があるが、それのみに限定されるものではない。
FIG. 3 is a block diagram showing an example of the document search system according to the present invention. In FIG. 3, reference numeral 300 denotes a target document, 310 denotes a document search device, 320 denotes a database, and 330 denotes an output device. The block diagram shown in FIG. 3 shows a system that performs both matching between a physical document and an electronic document and matching between electronic documents. Using document graphic features or components for document matching, one or more stored electronic documents having the same or similar graphic components or features can be retrieved. Such features include, but are not limited to, graphics, lines, shapes, textures, sizes, and other features.

【0028】ターゲット文書300は物理文書であるこ
とも電子文書であることもある。ターゲット文書300
は、検索しようとする電子文書と共通した何らかの図形
特徴を持っている。例えば、ターゲット文書300に、
ある特定のシステムのブロック図が入っていることがあ
る。このターゲット文書300中のそのブロック図を、
同じブロック図又は類似のブロック図を含む他の文書、
例えば、技術リポート、プレゼンテーション用スライ
ド、特許出願書類などを検索するために利用できる。
The target document 300 can be a physical document or an electronic document. Target document 300
Has some graphic features in common with the electronic document to be searched. For example, in the target document 300,
It may contain a block diagram of a particular system. The block diagram in this target document 300 is
Other documents containing the same or similar block diagrams,
For example, it can be used to search for technical reports, presentation slides, patent application documents, and the like.

【0029】ターゲット文書300が物理文書である場
合、文書検索装置310は、その物理文書を電子文書に
変換できる装置、例えばスキャナやファックス装置など
を具備している。文書検索装置310は、例えば、コン
ピュータ・システム、スキャナ、コピア等々であってよ
い。ターゲット文書300は、文書検索装置310によ
って作成された電子文書であるか、それとは別の電子文
書である。ターゲット文書300は文書マッチングのた
めに処理されるが、その処理について以下に詳述する。
When the target document 300 is a physical document, the document search device 310 includes a device capable of converting the physical document into an electronic document, for example, a scanner or a facsimile device. The document search device 310 may be, for example, a computer system, a scanner, a copier, and the like. The target document 300 is an electronic document created by the document search device 310 or another electronic document. The target document 300 is processed for document matching, and the processing will be described in detail below.

【0030】図4は、文書検索装置310の処理の概略
を示す流れ図である。文書検索装置310は、ターゲッ
ト文書300を取り込み(処理ブロック350)、その
ターゲット文書300を記述する、あるいはそれに含ま
れている構造情報を求めるため、ターゲット文書300
の構造を解析する(処理ブロック351)。一実施例で
は、生成される構造情報はターゲット文書300を特徴
づける点集合である。文書検索装置300は、ターゲッ
ト文書300から生成した構造情報を、データベース3
20に保存されている電子文書の集合を記述する同様の
構造情報の集合と比較する(処理ブロック352)。こ
の比較すなわち文書の構造情報のマッチングで一致した
と判定した1つ又は2つ以上の保存電子文書をデータベ
ース320より取り出し、それを出力装置330によっ
て出力させる(処理ブロック353)。
FIG. 4 is a flowchart showing an outline of the processing of the document search apparatus 310. The document retrieval device 310 fetches the target document 300 (processing block 350), and describes the target document 300 or obtains the target document 300 to determine the structural information contained therein.
Is analyzed (processing block 351). In one embodiment, the generated structural information is a set of points characterizing target document 300. The document search device 300 stores the structure information generated from the target document 300 in the database 3
A comparison is made with a similar set of structural information describing the set of electronic documents stored in 20 (processing block 352). The comparison, that is, one or more stored electronic documents that are determined to match in the document structure information matching are retrieved from the database 320 and output by the output device 330 (processing block 353).

【0031】一実施例では、構造情報としての点集合間
のマッチングのためにハウスドルフ(Hausdorff)法が
用いられるが、その詳細は後述する。ハウスドルフ法に
関するより詳細な情報を得るには、Huttenlocher, Klan
derman & Rucklidge,”Comparing Images Using the H
ausdorff Distance,”IEEE Transactionson Pattern An
alysis and Machine Intelligence, V. 15, September
1993,pgs. 8,50-863を参照されたい。
In one embodiment, the Hausdorff method is used for matching between point sets as structural information, the details of which will be described later. For more information on the Hausdorff Act, see Huttenlocher, Klan
derman & Rucklidge, ”Comparing Images Using the H
ausdorff Distance, ”IEEE Transactionson Pattern An
alysis and Machine Intelligence, V. 15, September
1993, pgs. 8,50-863.

【0032】構造情報が一致した文書は出力装置330
によって出力される。出力装置330は、例えば、液晶
ディスプレイやCRT等の電子式ディスプレイ装置であ
ってよい。出力装置330は、例えばプリンタやファッ
クス装置のような物理文書を出力する装置であってもよ
い。もう一つの実施例では、出力装置330は電子文書
を通信路で送信する装置である。
The document whose structure information matches is output to the output device 330.
Output by The output device 330 may be, for example, an electronic display device such as a liquid crystal display or a CRT. The output device 330 may be a device that outputs a physical document, such as a printer or a fax device. In another embodiment, output device 330 is a device that sends an electronic document over a communication channel.

【0033】図5は、ターゲット文書が物理文書として
与えられる場合の構造情報の生成プロセスの一例を示す
流れ図である。図5に示す処理は処理ロジックによって
実行され、ターゲット文書と保存電子文書とのマッチン
グのために利用可能な構造情報を生成する。一実施例で
は、その処理ロジックは、専用もしくは汎用のコンピュ
ータ・システムもしくはコンピュータで実行されるソフ
トウェア、専用ハードウェア、あるいは、それらの組み
合わせから構成される。
FIG. 5 is a flowchart showing an example of a structure information generating process when a target document is provided as a physical document. The processing shown in FIG. 5 is executed by processing logic to generate structural information that can be used for matching between the target document and the stored electronic document. In one embodiment, the processing logic comprises software running on a dedicated or general-purpose computer system or computer, dedicated hardware, or a combination thereof.

【0034】図5を参照して説明する。処理ロジック
は、ある物理文書をターゲット電子文書に変換する(処
理ブロック410)。この変換は、例えば、スキャナを
使用して当該分野で周知の方法で行ってよい。この変換
を、コピアでコピーをとったり、ファックス装置でファ
ックスを受信又は送信することによって行ってもよく、
この場合はコピー又はファックスされた文書の電子文書
が自動的に保存される。一実施例では、物理文書を電子
文書へ変換するために利用される装置は、その電子文書
のコピーを、同装置内のデータベース、あるいは、バス
又はネットワーク接続を通してアクセスされる他の装置
内のデータベースに格納する(図5には示されていな
い)。
A description will be given with reference to FIG. Processing logic converts a physical document into a target electronic document (processing block 410). This conversion may be performed, for example, using a scanner in a manner well known in the art. This conversion may be performed by making a copy at the copier or receiving or sending a fax at a fax machine,
In this case, the electronic document of the copied or faxed document is automatically saved. In one embodiment, the device utilized to convert the physical document to an electronic document uses a copy of the electronic document in its own database or in a database in another device accessed through a bus or network connection. (Not shown in FIG. 5).

【0035】次に、処理ロジックは、そのターゲット電
子文書からテキストを削除する(処理ブロック42
0)。テキストが削除されることにより構造情報だけが
残るため、その文書の図形特徴に基づいた、かつ、その
文書のテキスト内容に影響されない検索が可能になる。
一実施例では、ターゲット電子文書はテキスト削除後に
ダウンサンプルされる(図5には示されていない)。一
実施例では、このダウンサンプルは144dpiで行わ
れる。
Next, processing logic deletes text from the target electronic document (processing block 42).
0). Since only the structural information remains after the text is deleted, a search based on the graphic characteristics of the document and not affected by the text content of the document becomes possible.
In one embodiment, the target electronic document is downsampled after text deletion (not shown in FIG. 5). In one embodiment, this downsampling is performed at 144 dpi.

【0036】次に、処理ロジックは接続成分又は他の図
形特徴を検出する(処理ブロック430)。なお、一実
施例では、1まとまりの接続成分又は非接続成分だけ
が、検索対象文書の識別に利用される。多数の成分を同
時に探索してもよい。図形のこれら特徴は、類似図形の
検索のために利用される。
Next, processing logic detects connected components or other graphical features (processing block 430). In one embodiment, only one set of connected components or non-connected components is used for identifying a search target document. Multiple components may be searched simultaneously. These features of the figure are used for searching for similar figures.

【0037】接続成分は、ターゲット電子文書の特徴成
分として利用される。着目する構造を1つの大きな接続
成分だけに限定しないで、文書マッチングを実行しても
よい。1つの成分だけを利用すれば、マッチングに要す
る処理量を減らすことができるため、システムのマッチ
ング速度が上がる。一実施例では、ターゲット電子文書
は、接続成分の検出後にダウンサンプルされる(図5に
は示されていない)。一実施例では、ダウンサンプリン
グ・レートは72dpiである。
The connection component is used as a characteristic component of the target electronic document. Document matching may be performed without limiting the structure of interest to only one large connected component. If only one component is used, the amount of processing required for matching can be reduced, thereby increasing the matching speed of the system. In one embodiment, the target electronic document is downsampled after detecting a connected component (not shown in FIG. 5). In one embodiment, the downsampling rate is 72 dpi.

【0038】次に処理ロジックは、線分の端点を検出す
る(処理ブロック440)。端点検出の方法の1つは、
Smith, S. M and Brady, J.M.,”SUSAN-A New Approach
toLow Level Image Processing,” International Jou
rnal of Computer Vision,23(1), pp. 45-78, May 1997
に詳細に述べられている。他の端点検出方法を用いても
よい。例えば、画像をマスクデザインを用いて畳み込
み、線の端点を検出する方法を利用してもよい。その畳
み込みの結果は閾値処理され、その閾値を超えたか否か
によって一致が判定される。その他、多くの特徴抽出方
法を利用し得る。
Next, processing logic detects the endpoint of the line segment (processing block 440). One of the end point detection methods is
Smith, S.M and Brady, JM, ”SUSAN-A New Approach
toLow Level Image Processing, ”International Jou
rnal of Computer Vision, 23 (1), pp. 45-78, May 1997
Is described in detail. Other end point detection methods may be used. For example, a method of convolving an image using a mask design and detecting the end point of a line may be used. The result of the convolution is subjected to threshold processing, and a match is determined based on whether or not the threshold has been exceeded. Many other feature extraction methods can be used.

【0039】処理ロジックは、図形特徴である端点に基
づいて構造情報を生成する(処理ブロック450)。一
実施例では、構造情報は線分の端点に対応する点集合で
ある。しかし、例えば、それに限定するものではない
が、線分、曲線等の他の構造情報を用いてもよい。
Processing logic generates structural information based on endpoints that are graphic features (processing block 450). In one embodiment, the structure information is a set of points corresponding to the endpoints of the line segment. However, for example, but not limited to, other structure information such as line segments and curves may be used.

【0040】生成されたターゲット電子文書の構造情報
を、ターゲット電子文書と保存電子文書とのマッチング
に利用できる。一実施例では、保存電子文書を記述する
構造特徴が、ターゲット電子文書を記述する構造情報と
比較される。保存電子文書の構造情報は、文書マッチン
グ処理に先だって保存しておいてもよいし、リアルタイ
ムで生成してもよい。それら構造情報が所定の許容誤差
の範囲内で一致したときに、対応の保存電子文書が一致
文書とみなされる、その一致文書を取り出してユーザが
利用することができる。
The generated structure information of the target electronic document can be used for matching between the target electronic document and the stored electronic document. In one embodiment, structural features describing the stored electronic document are compared to structural information describing the target electronic document. The structure information of the stored electronic document may be stored prior to the document matching process, or may be generated in real time. When the structural information matches within a predetermined allowable range, the corresponding stored electronic document is regarded as a matching document. The matching document can be extracted and used by the user.

【0041】一実施例では、ハウスドルフ法によりマッ
チングが行われる。2つの点集合 A = {a1,...,am} B = {b1,...,bn} を仮定すると、そのハウスドルフ距離は
In one embodiment, matching is performed by the Hausdorff method. Assuming two point sets A = {a1, ..., am} B = {b1, ..., bn}, the Hausdorff distance is

【数1】 である。ここで、(Equation 1) It is. here,

【数2】 関数h(A,B)は、AからBまでの有向ハウスドルフ距離
であり、Bの全ての点から最も遠い点a∈Aを割り出
し、aから、それに最も近いB中の点までの距離を計量
する。このハウスドルフ距離H(A,B)は、Bの全ての点
から最も遠いAの点、及び、Aの全ての点から最も遠い
Bの点に関する距離を表すから、2つの集合間の不一致
度合の尺度である。
(Equation 2) The function h (A, B) is the directed Hausdorff distance from A to B, finds the point a∈A farthest from all points in B, and the distance from a to the nearest point in B Weigh The Hausdorff distance H (A, B) represents the distance between the point A farthest from all points of B and the point B farthest from all points of A. Is a measure of

【0042】すなわち、ハウスドルフ距離がdであれ
ば、Aのどの点もBのある点から距離dの範囲内にあ
り、同様にBのどの点もaのある点から距離dの範囲内
にある。一実施例では、ハウスドルフ距離が、ある許容
誤差値以下のときに、一致したと判定する。この方法に
代えて、他のマッチング法を利用してもよい。
That is, if the Hausdorff distance is d, every point of A is within a distance d from a point of B, and similarly, every point of B is within a distance d of a point of a. is there. In one embodiment, when the Hausdorff distance is equal to or smaller than a certain allowable error value, it is determined that they match. Instead of this method, another matching method may be used.

【0043】図6は、ターゲット文書がPostScriptのよ
うなページ記述言語のファィルとして与えられる場合の
構造情報の生成プロセスの一例を示す流れ図である。前
述したような処理ロジックが、この構造情報生成プロセ
スを実行する。図6に例示したプロセスは、電子文書の
1ページに関する構造情報の生成を表している。一実施
例では、文書の各ページが同様の方法で解析される。ま
た、このプロセスは、ターゲット文書と比較される保存
電子文書に対しても適用し得る。
FIG. 6 is a flowchart showing an example of a structure information generation process when a target document is provided as a file in a page description language such as PostScript. The processing logic as described above executes this structure information generation process. The process illustrated in FIG. 6 represents generation of structural information for one page of an electronic document. In one embodiment, each page of the document is analyzed in a similar manner. This process may also be applied to stored electronic documents that are compared to target documents.

【0044】処理ロジックは最初に、ターゲット電子文
書をページ毎に分割する(処理ブロック510)。一実
施例では、各ページ毎に構造情報が生成される。そうで
はなく、複数のページを用いてターゲット電子文書を記
述する構造情報を生成してもよい。一実施例では、複数
ページにまたがった図形を扱い得る。一実施例では、Po
stScriptファイル中に明示的な改ページコマンドが入れ
られる。これらコマンドによって、複数ページにまたが
った図形を1ページずつ処理可能になる。しかし、他の
PostScriptインプリメンテーションや他のページ記述言
語では、ページの区切りにまたがった図形を検出し、そ
のような図形を1まとまりとして特徴マッチングを行う
ことができる場合があろう。
Processing logic first splits the target electronic document into pages (processing block 510). In one embodiment, structure information is generated for each page. Instead, structure information describing the target electronic document may be generated using a plurality of pages. In one embodiment, graphics that span multiple pages may be handled. In one embodiment, Po
An explicit page break command is included in the stScript file. With these commands, figures spanning a plurality of pages can be processed one page at a time. But other
PostScript implementations and other page description languages may be able to detect graphics that span page breaks and perform feature matching on such graphics as a group.

【0045】次に、処理ロジックは、個々のコマンドが
線分を生成するか否か判定する(処理ブロック52
0)。一実施例では、ページ記述言語(例えばPostScri
pt)のそれぞれのコマンドを解析して線分の生成の有無
を判定する。一例としてPostScriptを用いる時には、li
neto,rlineto,moveto等のコマンドが、線分を生成す
るコマンドであると判定される。
Next, processing logic determines whether each command generates a line segment (processing block 52).
0). In one embodiment, a page description language (eg, PostScri
pt) is analyzed to determine whether a line segment is generated. When using PostScript as an example, li
Commands such as neto, rlineto, and moveto are determined to be commands for generating line segments.

【0046】コマンドが線分を生成する場合には、処理
ロジックは、その線分の端点を検出する(処理ブロック
530)。コマンドが線分を生成しない場合には、その
コマンドは無視される(処理ブロック540)。処理ロ
ジックは、この解析プロセスをページの終わりに達する
まで繰り返す(処理ブロック550)。同様のプロセス
が、ターゲット電子文書の各ページに対して実行される
(図6に示されていない)。
If the command generates a line segment, processing logic detects the endpoint of the line segment (processing block 530). If the command does not generate a line segment, the command is ignored (processing block 540). Processing logic repeats the parsing process until the end of the page is reached (processing block 550). A similar process is performed for each page of the target electronic document (not shown in FIG. 6).

【0047】なお、この解析プロセスは完全には静的プ
ロセスではないかもしれない。PostScriptはプログラム
言語である。一実施例では、PostScriptインタプリタが
特別に修正されたロジックで実行されることにより、li
netoコマンドが実行される度に端点が出力される。その
理由は、(x,y)から(x+日,y)まで線を引くよ
うなコマンド(日付は実行時にならないと定まらない)
がPostScript命令に含まれることがあるからである。こ
うすることによって、そのような特徴を画像から検出し
た時に、存在するデジタル化ノイズに影響されない”完
全な”特徴集合が生成される。
Note that this analysis process may not be completely static. PostScript is a programming language. In one embodiment, the PostScript interpreter is executed with specially modified logic, which allows
The end point is output each time the neto command is executed. The reason is that a command that draws a line from (x, y) to (x + day, y) (the date cannot be determined until execution)
May be included in the PostScript instruction. This produces a "perfect" feature set that is not affected by existing digitizing noise when such features are detected from the image.

【0048】処理ロジックは、検出した端点に基づいて
構造情報を生成する(処理ブロック560)。一実施例
では、構造情報は、ページ中の線の端点の点集合であ
る。いうまでもなく、これとは異なった種類の構造情報
を、ページ上の線の端点に基づいて生成してもよい。
Processing logic generates structural information based on the detected endpoint (processing block 560). In one embodiment, the structural information is a point set of the endpoints of the line in the page. Of course, different types of structural information may be generated based on line endpoints on the page.

【0049】電子文書から生成された構造特徴は、物理
文書から生成された構造情報と同様に利用される。生成
された構造情報は、1つ以上の保存電子文書を記述する
構造情報と比較される。容認可能な一致が得られた場合
には、対応した保存文書を取り出してユーザに提示する
ことができる。
The structural features generated from the electronic document are used in the same manner as the structural information generated from the physical document. The generated structural information is compared to structural information describing one or more stored electronic documents. If an acceptable match is obtained, the corresponding stored document can be retrieved and presented to the user.

【0050】図7は文書のラスタ画像の一例を示す。図
8は、図7に示したラスタ画像のテキストを削除するこ
とによって抽出された図形を示す。図9は、図8に示し
た図形から図形特徴の構造情報として生成された点集合
を示す。図9と図8を対照すれば明らかなように、構造
情報として生成される点集合には、図8に示された矩形
の角点、水平方向及び垂直方向の直線の端点、矢印の輪
郭エッジに当てはめられた線分の端点が含まれる。な
お、矩形の角点だけからなる点集合を生成することも許
される。
FIG. 7 shows an example of a raster image of a document. FIG. 8 shows a graphic extracted by deleting the text of the raster image shown in FIG. FIG. 9 shows a point set generated as the structure information of the graphic feature from the graphic shown in FIG. As is clear from a comparison between FIG. 9 and FIG. 8, the point set generated as the structure information includes the corner points of the rectangle, the end points of the horizontal and vertical lines, and the outline edge of the arrow shown in FIG. Includes the end points of the line segment fitted to. Note that it is also allowed to generate a point set consisting only of rectangular corner points.

【0051】以上、本発明をその実施例に関連して説明
した。しかし、それら実施例に対する様々な修正及び変
更が可能であることは明白である。よって、本明細書及
び図面は、本発明を限定するためではなく説明するため
のものと理解されるべきである。
The present invention has been described with reference to the embodiments. However, it is clear that various modifications and changes to the embodiments are possible. Therefore, the specification and drawings are to be understood as being illustrative rather than limiting on the present invention.

【0052】[0052]

【発明の効果】請求項1、2、3、7、8又は9記載の
発明によれば、文書中の図や表のような視覚的構造が同
一又は類似した文書を効率的に検索することが可能であ
り、また、文書中のテキスト内容に影響されない、その
ような文書検索が可能である。請求項4、5又は6記載
の発明によれば、そのような文書検索を一般的なコンピ
ュータを利用して容易に実行可能である、等々の効果を
得られる。
According to the first, second, third, seventh, eighth or ninth aspect of the present invention, it is possible to efficiently retrieve documents having the same or similar visual structure such as figures and tables in the documents. And such a document search that is not affected by the text content in the document is possible. According to the fourth, fifth, or sixth aspect of the invention, it is possible to obtain such effects that such a document search can be easily executed using a general computer.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明を実施するための文書処理装置の一例を
示すブロック図である。
FIG. 1 is a block diagram illustrating an example of a document processing apparatus for implementing the present invention.

【図2】複数の文書処理装置を有する文書処理システム
の一例を示す図である。
FIG. 2 is a diagram illustrating an example of a document processing system having a plurality of document processing apparatuses.

【図3】本発明による文書検索システムの一例を示すブ
ロック図である。
FIG. 3 is a block diagram showing an example of a document search system according to the present invention.

【図4】本発明による文書検索処理の概略を示す流れ図
である。
FIG. 4 is a flowchart showing an outline of a document search process according to the present invention.

【図5】物理文書として与えられたターゲット文書の構
造情報の生成プロセスの一例を示す流れ図である。
FIG. 5 is a flowchart illustrating an example of a process of generating structure information of a target document provided as a physical document.

【図6】ページ記述言語のファィルとして与えられたタ
ーゲット文書の構造情報の生成プロセスの一例を示す流
れ図である。
FIG. 6 is a flowchart illustrating an example of a process of generating structure information of a target document given as a file in a page description language.

【図7】ターゲット文書のラスタ画像の一例を示す図で
ある。
FIG. 7 is a diagram illustrating an example of a raster image of a target document.

【図8】図7のラスタ画像からテキストを削除すること
によって抽出された図形の一例を示す図である。
8 is a diagram illustrating an example of a graphic extracted by deleting text from the raster image of FIG. 7;

【図9】図8の図形から生成された点集合の一例を示す
図である。
FIG. 9 is a diagram illustrating an example of a point set generated from the graphic in FIG. 8;

【符号の説明】[Explanation of symbols]

100 文書処理装置 101 バス 102 プロセッサ 104 メインメモリ 106 ROM 107 データ記憶装置 108 記録媒体 109 ドライブ 121 ディスプレイ装置 125 入力装置 200 ネットワーク 210 コピア 220 ファックス装置 230 コンピュータ・システム 240 データベース 250 プリンタ 300 ターゲット文書 310 文書検索装置 320 データベース 330 出力装置 REFERENCE SIGNS LIST 100 document processing device 101 bus 102 processor 104 main memory 106 ROM 107 data storage device 108 recording medium 109 drive 121 display device 125 input device 200 network 210 copier 220 fax device 230 computer system 240 database 250 printer 300 target document 310 document search device 320 Database 330 Output device

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 ターゲット文書のラスタ画像からテキス
トを削除し、その残存成分に対応した点集合を、前記タ
ーゲット文書を記述する構造情報として生成し、 生成した前記ターゲット文書を記述する構造情報を、保
存電子文書の集合を記述する構造情報の集合と比較し、 前記保存文書を記述する構造情報が前記ターゲット文書
を記述する構造情報と所定の許容誤差の範囲内で一致し
たときに前記保存電子文書の集合から1つ以上の保存電
子文書を取り出すことを特徴とする文書検索方法。
1. A method for deleting text from a raster image of a target document, generating a point set corresponding to the remaining components as structure information describing the target document, and generating structure information describing the generated target document, The stored electronic document is compared with a set of structural information describing a set of stored electronic documents, and when the structural information describing the stored document matches the structural information describing the target document within a predetermined tolerance. Extracting one or more stored electronic documents from a set of documents.
【請求項2】 ターゲット文書のページ記述言語ファイ
ル中のコマンドに関し線を記述する端点を求め、求めた
端点に対応した点集合を、前記ターゲット文書を記述す
る構造情報として生成し、 生成した前記ターゲット文書を記述する構造情報を保存
電子文書の集合を記述する構造情報の集合と比較し、 前記保存文書を記述する構造情報が前記ターゲット文書
を記述する構造情報と所定の許容誤差の範囲内で一致し
たときに前記保存電子文書の集合から1つ以上の保存電
子文書を取り出すことを特徴とする文書検索方法。
2. An end point that describes a line for a command in a page description language file of the target document is determined, and a point set corresponding to the determined end point is generated as structure information describing the target document. The structural information describing the document is compared with a set of structural information describing a set of stored electronic documents, and the structural information describing the stored document matches the structural information describing the target document within a predetermined tolerance. Extracting one or more stored electronic documents from the set of stored electronic documents.
【請求項3】 ハウスドルフ法によって構造情報を比較
することを特徴とする請求項1又は2記載の文書検索方
法。
3. The document search method according to claim 1, wherein the structural information is compared by the Hausdorff method.
【請求項4】 ターゲット文書のラスタ画像からテキス
トを削除し、その残存成分に対応した点集合を前記ター
ゲット文書を記述する構造情報として生成する処理、 前記ターゲット文書を記述する構造情報を、保存電子文
書の集合を記述する構造情報の集合と比較する処理、 前記保存文書を記述する構造情報が前記ターゲット文書
を記述する構造情報と所定の許容誤差の範囲内で一致し
たときに前記保存電子文書の集合から1つ以上の保存電
子文書を取り出す処理をコンピュータに実行させるため
のプログラムが記録されたことを特徴とするコンピュー
タ読み取り可能記録媒体。
4. A process for deleting text from a raster image of a target document and generating a point set corresponding to the remaining components as structure information describing the target document. A process of comparing with a set of structural information describing a set of documents, when the structural information describing the stored document matches with the structural information describing the target document within a predetermined allowable error range, A computer-readable recording medium on which a program for causing a computer to execute a process of extracting one or more stored electronic documents from a set is recorded.
【請求項5】 ターゲット文書のページ記述言語ファイ
ル中のコマンドに関し線を記述する端点を求め、求めた
端点に対応した点集合を前記ターゲット文書を記述する
構造情報として生成する処理、 前記ターゲット文書を記述する構造情報を保存電子文書
の集合を記述する構造情報の集合と比較する処理、 前記保存文書を記述する構造情報が前記ターゲット文書
を記述する構造情報と所定の許容誤差の範囲内で一致し
たときに前記保存電子文書の集合から1つ以上の保存電
子文書を取り出す処理をコンピュータに実行させるため
のプログラムが記録されたことを特徴とするコンピュー
タ読み取り可能記録媒体。
5. A process for obtaining an end point for describing a line for a command in a page description language file of a target document, and generating a point set corresponding to the obtained end point as structure information for describing the target document. A process of comparing the described structural information with a set of structural information describing a set of stored electronic documents, wherein the structural information describing the stored document matches the structural information describing the target document within a predetermined tolerance. A computer-readable recording medium having recorded thereon a program for causing a computer to execute a process of extracting one or more stored electronic documents from the set of stored electronic documents.
【請求項6】 ハウスドルフ法によって構造情報を比較
することを特徴とする請求項4又は5記載のコンピュー
タ読み取り可能記録媒体。
6. The computer-readable recording medium according to claim 4, wherein the structural information is compared by the Hausdorff method.
【請求項7】 ターゲット文書のラスタ画像を受け取
り、このラスタ画像からテキストを削除し、その残存成
分に対応した点集合を前記ターゲット文書を記述する構
造情報として生成する手段、 前記ターゲット文書を記述する構造情報を、保存電子文
書の集合を記述する構造情報の集合と比較する手段、 前記保存文書を記述する構造情報が前記ターゲット文書
を記述する構造情報と所定の許容誤差の範囲内で一致し
たときに前記保存電子文書の集合から1つ以上の保存電
子文書を取り出す手段を具備することを特徴とする文書
検索装置。
7. A means for receiving a raster image of a target document, deleting text from the raster image, and generating a point set corresponding to the remaining components as structural information describing the target document, describing the target document. Means for comparing the structure information with a set of structure information describing a set of stored electronic documents; and when the structure information describing the stored document matches within a predetermined tolerance a structure information describing the target document. A means for extracting one or more stored electronic documents from the set of stored electronic documents.
【請求項8】 ターゲット文書のページ記述言語ファイ
ルを受け取り、このファイル中のコマンドに関し線を記
述する端点を求め、求めた端点に対応した点集合を前記
ターゲット文書を記述する構造情報として生成する手
段、 前記ターゲット文書を記述する構造情報を保存電子文書
の集合を記述する構造情報の集合と比較する手段、 前記保存文書を記述する構造情報が前記ターゲット文書
を記述する構造情報と所定の許容誤差の範囲内で一致し
たときに前記保存電子文書の集合から1つ以上の保存電
子文書を取り出す手段を具備することを特徴とする文書
処検索装置。
8. A means for receiving a page description language file of a target document, obtaining an endpoint describing a line for a command in the file, and generating a point set corresponding to the determined endpoint as structure information describing the target document. Means for comparing the structural information describing the target document with a set of structural information describing a set of stored electronic documents, wherein the structural information describing the stored document is different from the structural information describing the target document by a predetermined allowable error. A document processing search device, comprising: means for extracting one or more stored electronic documents from the set of stored electronic documents when they match within the range.
【請求項9】 前記構造情報を比較する手段がハウスド
ルフ法によって構造情報を比較することを特徴とする請
求項7又は8記載の文書検索装置。
9. The document search apparatus according to claim 7, wherein said means for comparing structural information compares structural information by the Hausdorff method.
JP11252503A 1998-09-30 1999-09-07 Document search method, document search device, and recording medium Pending JP2000112995A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/164,091 US6446099B1 (en) 1998-09-30 1998-09-30 Document matching using structural information
US09/164091 1998-09-30

Publications (1)

Publication Number Publication Date
JP2000112995A true JP2000112995A (en) 2000-04-21

Family

ID=22592941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11252503A Pending JP2000112995A (en) 1998-09-30 1999-09-07 Document search method, document search device, and recording medium

Country Status (2)

Country Link
US (1) US6446099B1 (en)
JP (1) JP2000112995A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005092879A (en) * 2003-09-12 2005-04-07 Ricoh Co Ltd A method of accessing information captured during a presentation using a paper document distribution for the presentation
US8281230B2 (en) 2003-04-11 2012-10-02 Ricoh Company, Ltd. Techniques for storing multimedia information with source documents
CN102722729A (en) * 2011-03-22 2012-10-10 柯尼卡美能达美国研究所有限公司 Method of detection document alteration by comparing characters using shape features of characters
US8923625B2 (en) 2008-09-04 2014-12-30 Fuji Xerox Co., Ltd. Original image searching device, original image searching method, and computer readable medium

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6910184B1 (en) * 1997-07-25 2005-06-21 Ricoh Company, Ltd. Document information management system
US7152031B1 (en) * 2000-02-25 2006-12-19 Novell, Inc. Construction, manipulation, and comparison of a multi-dimensional semantic space
US7062456B1 (en) * 1999-02-09 2006-06-13 The Chase Manhattan Bank System and method for back office processing of banking transactions using electronic files
US6880122B1 (en) * 1999-05-13 2005-04-12 Hewlett-Packard Development Company, L.P. Segmenting a document into regions associated with a data type, and assigning pipelines to process such regions
US6990628B1 (en) * 1999-06-14 2006-01-24 Yahoo! Inc. Method and apparatus for measuring similarity among electronic documents
US7672952B2 (en) * 2000-07-13 2010-03-02 Novell, Inc. System and method of semantic correlation of rich content
US7653530B2 (en) * 2000-07-13 2010-01-26 Novell, Inc. Method and mechanism for the creation, maintenance, and comparison of semantic abstracts
US20090234718A1 (en) * 2000-09-05 2009-09-17 Novell, Inc. Predictive service systems using emotion detection
US20100122312A1 (en) * 2008-11-07 2010-05-13 Novell, Inc. Predictive service systems
JP3778136B2 (en) * 2002-06-13 2006-05-24 ブラザー工業株式会社 Printing control apparatus, printing apparatus, and program
US8090678B1 (en) * 2003-07-23 2012-01-03 Shopping.Com Systems and methods for extracting information from structured documents
US7424672B2 (en) * 2003-10-03 2008-09-09 Hewlett-Packard Development Company, L.P. System and method of specifying image document layout definition
US20050088711A1 (en) * 2003-10-24 2005-04-28 Daniel Stuart W. Scanning device with preview
JP4921202B2 (en) * 2006-03-15 2012-04-25 キヤノン株式会社 Job history management system, control method therefor, program, and storage medium
JP2008009572A (en) * 2006-06-27 2008-01-17 Fuji Xerox Co Ltd Document processing system, document processing method, and program
US8760401B2 (en) * 2008-04-21 2014-06-24 Ron Kimmel System and method for user object selection in geographic relation to a video display
US8059861B2 (en) * 2008-11-17 2011-11-15 Lockheed Martin Corporation Method and system for identifying and recognizing products for sorting/sequencing operations
US8386475B2 (en) * 2008-12-30 2013-02-26 Novell, Inc. Attribution analysis and correlation
US8296297B2 (en) * 2008-12-30 2012-10-23 Novell, Inc. Content analysis and correlation
US8301622B2 (en) * 2008-12-30 2012-10-30 Novell, Inc. Identity analysis and correlation
US8452791B2 (en) * 2009-01-16 2013-05-28 Google Inc. Adding new instances to a structured presentation
US8615707B2 (en) 2009-01-16 2013-12-24 Google Inc. Adding new attributes to a structured presentation
US8977645B2 (en) * 2009-01-16 2015-03-10 Google Inc. Accessing a search interface in a structured presentation
US8412749B2 (en) 2009-01-16 2013-04-02 Google Inc. Populating a structured presentation with new values
US20100250479A1 (en) * 2009-03-31 2010-09-30 Novell, Inc. Intellectual property discovery and mapping systems and methods
CA3180335A1 (en) * 2020-05-29 2021-12-02 Camelot Uk Bidco Limited Method, non-transitory computer-readable storage medium, and apparatus for searching an image database

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5221830A (en) 1989-10-10 1993-06-22 Unisys Corp. Method of ordering displayed document images in an image based document processing system
US5305200A (en) 1990-11-02 1994-04-19 Foreign Exchange Transaction Services, Inc. Financial exchange system having automated recovery/rollback of unacknowledged orders
US5297032A (en) 1991-02-01 1994-03-22 Merrill Lynch, Pierce, Fenner & Smith Incorporated Securities trading workstation
FR2681454B1 (en) 1991-09-16 1995-08-18 Aerospatiale METHOD AND DEVICE FOR PROCESSING ALPHANUMERIC AND GRAPHICAL INFORMATION FOR THE CONSTITUTION OF A DATABASE.
JP3210102B2 (en) 1992-11-17 2001-09-17 松下電器産業株式会社 Electronic document filing apparatus and filing document search method
US5748780A (en) 1994-04-07 1998-05-05 Stolfo; Salvatore J. Method and apparatus for imaging, image processing and data compression
US5465353A (en) 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
US5822454A (en) 1995-04-10 1998-10-13 Rebus Technology, Inc. System and method for automatic page registration and automatic zone detection during forms processing
US5896252A (en) 1995-08-11 1999-04-20 Fujitsu Limited Multilayer spin valve magneto-resistive effect magnetic head with free magnetic layer including two sublayers and magnetic disk drive including same
EP0794581A4 (en) 1995-09-21 1999-10-06 Tdk Corp Magnetic transducer
US6032184A (en) 1995-12-29 2000-02-29 Mci Worldcom, Inc. Integrated interface for Web based customer care and trouble management
US5933823A (en) 1996-03-01 1999-08-03 Ricoh Company Limited Image database browsing and query using texture analysis
KR100262282B1 (en) 1996-04-30 2000-10-02 니시무로 타이죠 Magnetoresistive effect element
US5758062A (en) 1996-04-30 1998-05-26 Oracle Corporation Method and apparatus for regression testing of application logic
US5696961A (en) 1996-05-22 1997-12-09 Wang Laboratories, Inc. Multiple database access server for application programs
US5881230A (en) 1996-06-24 1999-03-09 Microsoft Corporation Method and system for remote automation of object oriented applications
US6104834A (en) 1996-08-01 2000-08-15 Ricoh Company Limited Matching CCITT compressed document images
JP2871670B1 (en) 1997-03-26 1999-03-17 富士通株式会社 Ferromagnetic tunnel junction magnetic sensor, method of manufacturing the same, magnetic head, and magnetic recording / reproducing device
US6023684A (en) 1997-10-01 2000-02-08 Security First Technologies, Inc. Three tier financial transaction system with cache memory
US6128602A (en) 1997-10-27 2000-10-03 Bank Of America Corporation Open-architecture system for real-time consolidation of information from multiple financial systems
US5999664A (en) 1997-11-14 1999-12-07 Xerox Corporation System for searching a corpus of document images by user specified document layout components
US6049664A (en) 1997-11-25 2000-04-11 Alphablox Corporation Tier-neutral development mechanism for hypertext based applications

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8281230B2 (en) 2003-04-11 2012-10-02 Ricoh Company, Ltd. Techniques for storing multimedia information with source documents
JP2005092879A (en) * 2003-09-12 2005-04-07 Ricoh Co Ltd A method of accessing information captured during a presentation using a paper document distribution for the presentation
US8923625B2 (en) 2008-09-04 2014-12-30 Fuji Xerox Co., Ltd. Original image searching device, original image searching method, and computer readable medium
CN102722729A (en) * 2011-03-22 2012-10-10 柯尼卡美能达美国研究所有限公司 Method of detection document alteration by comparing characters using shape features of characters

Also Published As

Publication number Publication date
US6446099B1 (en) 2002-09-03

Similar Documents

Publication Publication Date Title
JP2000112995A (en) Document search method, document search device, and recording medium
CN1332341C (en) Information processing apparatus, method, storage medium and program
US5854854A (en) Skew detection and correction of a document image representation
US8320019B2 (en) Image processing apparatus, image processing method, and computer program thereof
JP4366108B2 (en) Document search apparatus, document search method, and computer program
US20060221357A1 (en) Information processing apparatus and method
US20060173904A1 (en) Information Processing Apparatus and Control Method Thereof
US9710524B2 (en) Image processing apparatus, image processing method, and computer-readable storage medium
JP2007042106A (en) Document processing method, document processing medium, document management method, document processing system, and document management system
JP2001357046A (en) Electronic imaging apparatus, keyword assignment system, and keyword assignment method
JP2000112993A (en) Document classification method, storage medium, document classification device, and document classification system
DE69426046T2 (en) Data access based on human-generated images
JP2007286767A (en) Image search system, image search server, control method therefor, computer program, and computer-readable storage medium
JP2004030122A (en) Drawing search support device and drawing search method
JP4533187B2 (en) Image processing apparatus and control method thereof
US9798711B2 (en) Method and system for generating a graphical organization of a page
JP2006025129A (en) Image processing system and image processing method
JP4261988B2 (en) Image processing apparatus and method
US20090150359A1 (en) Document processing apparatus and search method
JP2009145963A (en) Document processor and document processing method
JPH10289240A (en) Image processing apparatus and control method thereof
US8711440B2 (en) Method of producing probabilities of being a template shape
EP2166467B1 (en) Information processing apparatus, control method thereof, computer program, and storage medium
US12355927B2 (en) Information processing apparatus and information processing method
JP2020047031A (en) Document retrieval device, document retrieval system and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080326

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080507