[go: up one dir, main page]

JP2000057154A - Structured document storage and retrieval device - Google Patents

Structured document storage and retrieval device

Info

Publication number
JP2000057154A
JP2000057154A JP10223977A JP22397798A JP2000057154A JP 2000057154 A JP2000057154 A JP 2000057154A JP 10223977 A JP10223977 A JP 10223977A JP 22397798 A JP22397798 A JP 22397798A JP 2000057154 A JP2000057154 A JP 2000057154A
Authority
JP
Japan
Prior art keywords
document
individual element
structured document
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10223977A
Other languages
Japanese (ja)
Other versions
JP4255538B2 (en
Inventor
Takuka Tan
澤華 譚
Masataka Togashi
昌孝 冨樫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP22397798A priority Critical patent/JP4255538B2/en
Publication of JP2000057154A publication Critical patent/JP2000057154A/en
Application granted granted Critical
Publication of JP4255538B2 publication Critical patent/JP4255538B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 構造化文書の効率的な生成、蓄積、管理、利
用環境を提供する。 【解決手段】 論理的文書構造を表現する電子的文書デ
ータを個別要素に区分し、アプリケーション依存形式構
造化文書個別要素203とアプリケーション依存形式構
造化文書個別要素203のうち、テキストデータのみで
構成されるテキスト形式構造化文書個別要素206と表
示用イメージである表示用データ個別要素208の3種
類を生成・蓄積、管理し、蓄積し、テキスト形式構造化
文書個別要素206を検索して、検索結果に該当した各
個別要素に対応する表示用データ個別要素208および
アプリケーション依存形式構造化文書個別要素203を
検索結果として表示し、再利用可能にする構造化文書蓄
積検索装置である。
(57) [Summary] [Problem] To provide an environment for efficiently generating, storing, managing and using structured documents. SOLUTION: Electronic document data expressing a logical document structure is divided into individual elements, and is composed of only text data among an application dependent structured document individual element 203 and an application dependent structured document individual element 203. The three types of text-format structured document individual element 206 and display data individual element 208 which is a display image are generated, stored, managed, and stored, and the text-format structured document individual element 206 is searched. Is a structured document storage and retrieval device that displays, as a search result, a display data individual element 208 and an application-dependent format structured document individual element 203 corresponding to each individual element corresponding to.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、利用者が文書作成
のアプリケーションソフトウエア(例えば、ワードプロ
セッサ)の文書テンプレートを用いて作成した構造化文
書を、構造化文書を構成する個別要素に区分し、文書を
作成したアプリケーションソフトウエアに依存した形式
の構造化文書と、データベースの保存形式であるテキス
ト形式の構造化文書と、個別要素に対応する表示用デー
タの3種類の形式のデータを連携して効率的に生成・蓄
積・管理し、利用者の検索要求に適合した文書の文書内
の該当部分を印刷物と同等レベルで高品位な表示を実現
する装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention classifies a structured document created by a user using a document template of application software for creating a document (for example, a word processor) into individual elements constituting the structured document. The three types of data are linked: a structured document that depends on the application software that created the document, a structured document that is a text format that is a database storage format, and display data that corresponds to individual elements. The present invention relates to an apparatus that efficiently generates, stores, and manages a document, and realizes high-quality display of a corresponding portion of a document that meets a user's search request at a level equivalent to a printed matter.

【0002】[0002]

【従来の技術】従来から構造化文書は構造化文書専用エ
ディタで作成されていた。この問題を解決する手段とし
て特開平8−221399「構造化文書作成方法および
装置」がある。この装置によると、予め用意したユーザ
が定義した文書論理構造を表す仮タグと複数の文書論理
構造定義との対応関係を参照して、ユーザが仮タグを用
いて作成した原テキストと各文書型定義との一致度を求
め、その一致度順に文書型定義を表示し、ユーザに対し
て文書型定義の選択要求を行い、選択された文書型定義
に合わせて原テキスト中の仮タグを文書型定義に基づく
文書論理構造を表す情報に変換し、変換結果を含むテキ
ストを文書型定義に基づいて構文解析を行なうパーサに
よって解析し、変換結果の整合性を検証を行う、という
ものである。
2. Description of the Related Art Conventionally, structured documents have been created using an editor dedicated to structured documents. As means for solving this problem, there is JP-A-8-221399 "Structured document creation method and apparatus". According to this device, the original text created by the user using the temporary tag and each document type are referred to by referring to the correspondence between the temporary tag representing the document logical structure defined by the user and the plurality of document logical structure definitions prepared in advance. The degree of matching with the definition is obtained, the document type definitions are displayed in the order of the matching degree, the user is requested to select the document type definition, and the temporary tag in the original text is converted to the document type according to the selected document type definition. This is to convert the text including the conversion result into information representing the document logical structure based on the definition, to analyze the text including the conversion result by a parser that performs parsing based on the document type definition, and to verify the consistency of the conversion result.

【0003】また、従来から文書単位でしか文書を取り
扱うことができなかったことを解決するための装置とし
て特開平6−301721「全文データベース検索方
法」や特開平5−225240「文書データベース装
置」がある。特開平6−301721によると、文書の
論理的構造情報を含めた検索要求文の指定及び検索結果
の表示を可能とする全文データベース検索方式で、文書
の構成要素単位で文書を分解して、文書の論理的構造を
示す構造情報と、この構成要素を識別するための構成要
素識別子と、この構成要素識別子に続くテキスト情報と
を含むデータベースを作成し、このデータベースを検索
し、検索結果であるテキスト情報を表示する、というも
のである。特開平5−225240によると、文書デー
タベースに蓄積されている構造化文書から一部分の文書
内容を抽出することができるとともに抽出した内容の割
付処理を行うことができる、というものである。
Japanese Patent Application Laid-Open Nos. Hei 6-301721 "Document Database Searching Method" and Japanese Patent Laid-Open No. Hei 5-225240 "Document Database Apparatus" have been known as apparatuses for solving the problem that documents can be handled only in units of documents. is there. According to Japanese Patent Laid-Open No. Hei 6-301721, a full-text database search method that enables the specification of a search request sentence including the logical structure information of a document and the display of a search result is performed. Creates a database including structural information indicating the logical structure of the component, a component identifier for identifying the component, and text information following the component identifier, searches the database, and searches for a text that is a search result. Displaying information. According to Japanese Patent Application Laid-Open No. 5-225240, it is possible to extract a part of the document content from the structured document stored in the document database and to perform the allocation process of the extracted content.

【0004】[0004]

【発明が解決しようとする課題】これまでに示した従来
の文書の生成、蓄積、表示方式を採用した装置では、利
用者に対して構造化文書を効率的に生成・蓄積するこ
と、また、印刷物と同等レベルの高品質な画質の検索結
果を提供することは不可能であった。
In a device employing the conventional document generation, storage and display method described above, a structured document is efficiently generated and stored for a user. It has not been possible to provide search results with high quality image quality at the same level as printed matter.

【0005】特開平8−221399では、テキストの
みを扱うエディタで文書を作成するが、印刷結果と同じ
イメージが得られる編集画面で作業を行うことが可能な
アプリケーションが普及している現状において、このこ
とは文書作成者にとって大きなデメリットである。ま
た、ユーザが仮タグを付ける作業を行わなければならな
いため、付帯的作業が増加する。また、原テキストと予
め用意した文書論理構造定義との対応関係を参照して一
致度を求め、一致度順に文書型定義を表示し、ユーザに
その内1つを選択させるため、利用者が選択を誤る可能
性がある。
In Japanese Patent Application Laid-Open No. Hei 8-221399, a document is created with an editor that handles only text. However, in the current situation where applications capable of performing work on an editing screen that can obtain the same image as a print result are widely used, This is a major disadvantage for document writers. In addition, since the user has to perform the work of attaching a temporary tag, additional work is increased. Also, referring to the correspondence relationship between the original text and the document logical structure definition prepared in advance, the degree of coincidence is obtained, the document type definitions are displayed in order of the degree of coincidence, and the user is allowed to select one of them. May be mistaken.

【0006】また、特開平6−301721に示す方法
や特開平5−225240に示す装置では、蓄積してい
る区分した構造化文書の一部分をもとに検索結果として
テキストのみが表示対象となっている。また、利用者が
構造化文書を生成、再利用する手段を備えていない。
In the method disclosed in JP-A-6-301721 and the apparatus described in JP-A-5-225240, only text is displayed as a search result based on a part of a stored structured document. I have. Further, there is no means for a user to generate and reuse a structured document.

【0007】以上のように、従来の構造化文書の生成、
蓄積、表示方式を採用した装置では、利用者に対して効
率的に生成・蓄積・管理すること、また、印刷物と同等
レベルの高品質な検索結果を提供することは不可能であ
った。これまでの構造化文書管理システムでは蓄積時に
文書内に記されている文書属性を再度別途入力する必要
がある点や、利用者が構造化文書を生成、再利用する手
段を備えていない点、検索結果として印刷物と同等レベ
ルの高品質な表示が不可能である点、などの問題点があ
った。
As described above, generation of a conventional structured document,
It has been impossible for a device employing the storage and display method to efficiently generate, store and manage users, and to provide high-quality search results at the same level as printed materials. In the conventional structured document management system, the document attributes written in the document at the time of accumulation need to be separately input again, there is no means for the user to generate and reuse the structured document, There were problems such as the fact that high-quality display at the same level as printed matter was impossible as a search result.

【0008】本発明は、かかる現状に鑑みてなされたも
のであり、利用者に対して効果的な構造化文書作成環境
を提供し、生成された文書の文書構成を解析し、構成要
素ごとにアプリケーション依存形式構造化文書個別要素
に区分し、このアプリケーション依存形式構造化文書個
別要素からテキスト形式構造化文書個別要素および表示
用データ個別要素を生成し、これら3種類のデータ形式
を蓄積し、連携して管理することにより、利用者の検索
要求を受付け、検索結果として印刷物と同等レベルの高
品質な画質の表示を提供することを目的としている。
The present invention has been made in view of the above situation, provides an effective structured document creation environment for a user, analyzes the document structure of a generated document, and analyzes each component. Classify into application-dependent structured document individual elements, generate text-structured structured document individual elements and display data individual elements from these application-dependent structured structured document individual elements, accumulate these three types of data formats, and link It is intended to receive a user's search request and provide a display of high quality image quality at the same level as a printed matter as a search result.

【0009】[0009]

【課題を解決するための手段】この発明に係る構造化文
書蓄積検索装置は、作成する構造化文書を構成する各構
成要素をあらかじめ定義した文書構造定義を記憶する記
憶部と、上記文書構造定義に定義された構成要素に基づ
いて、文書を作成する文書作成部と、上記文書作成部で
作成された文書を、上記文書構造定義に定義されている
構成要素に対応する文書部分である個別要素に区分する
個別要素区分部と、上記個別要素区分部で区分された個
別要素に対して、複数の形式のデータを生成する個別要
素生成部と、上記個別要素生成部で生成された複数の形
式のデータを個別要素に対応づけて蓄積するデータ蓄積
処理部と、上記データ蓄積処理部が複数の形式のデータ
を蓄積する記憶領域であるデータ蓄積部と、上記データ
蓄積処理部でデータ蓄積部に蓄積されたデータを検索す
る検索管理部とを備えたことを特徴とする。
A structured document storage and retrieval apparatus according to the present invention includes: a storage unit for storing a document structure definition in which each component constituting a structured document to be created is defined in advance; And a document creation unit that creates a document based on the components defined in the document creation unit, and converts the document created by the document creation unit into an individual element that is a document portion corresponding to the component defined in the document structure definition. , An individual element generation unit that generates data in a plurality of formats for the individual elements classified by the individual element classification unit, and a plurality of formats generated by the individual element generation unit A data storage unit that stores the data of each format in association with the individual elements, a data storage unit that is a storage area in which the data storage unit stores a plurality of types of data, and a data storage unit that stores the data. Characterized by comprising a search management unit to retrieve the stored in the storage unit data.

【0010】上記文書作成部は、文書を作成するアプリ
ケーションソフトウエアを有し、アプリケーションソフ
トウエアは、アプリケーションソフトウエアのデータ保
存形式に従ったアプリケーション依存形式構造化文書を
作成し、上記個別要素区分部は、上記アプリケーション
依存形式構造化文書を区分してアプリケーション依存形
式構造化文書個別要素を生成し、上記データ蓄積部は、
少なくとも、上記アプリケーション依存形式構造化文書
個別要素と、上記アプリケーション依存形式構造化文書
個別要素をテキスト形式に変換したテキスト形式構造化
文書個別要素と、検索結果を出力する際に使用する表示
用データ個別要素とのいずれかを含む複数の形式のデー
タを蓄積する記憶領域を有することを特徴とする。
The document creation section has application software for creating a document. The application software creates an application-dependent format structured document according to a data storage format of the application software, and the individual element classification section. Generates an application-dependent format structured document individual element by classifying the application-dependent format structured document, and the data storage unit
At least the application-dependent format structured document individual element, the text format structured document individual element obtained by converting the application dependent format structured document individual element to a text format, and display data individual used when outputting a search result. It has a storage area for storing a plurality of types of data including any of the elements.

【0011】上記検索管理部は、上記データ蓄積部で蓄
積したデータを検索する検索部と、上記検索部で検索し
たデータを上記複数の形式のデータの少なくともいずれ
か一つを出力する検索結果出力部とを備えることを特徴
とする。
The search management section includes a search section for searching data stored in the data storage section, and a search result output for outputting at least one of the data in the plurality of formats to the data searched for by the search section. And a unit.

【0012】上記個別要素生成部は、上記アプリケーシ
ョン依存形式構造化文書個別要素を構造化文書のデータ
形式であるテキスト形式のデータに変換し、上記構造化
文書個別要素を生成するとともに、上記アプリケーショ
ン依存形式構造化文書個別要素に対応させて、表示用に
使用する表示用データを生成することを特徴とする。
The individual element generator converts the application-dependent structured document individual element into text format data, which is the data format of the structured document, and generates the structured document individual element. It is characterized in that display data to be used for display is generated in correspondence with a formal structured document individual element.

【0013】各個別要素は、当該個別要素を識別する識
別名を有し、上記データ蓄積処理部は、上記識別名に対
応づけて上記複数の形式のデータを蓄積することを特徴
とする。
Each of the individual elements has an identification name for identifying the individual element, and the data storage processing section stores the data in the plurality of formats in association with the identification name.

【0014】上記アプリケーションソフトウエアは、マ
クロ言語を有するとともに、上記マクロ言語により、上
記文書構造定義に基づいて、構造化文書を作成する文書
テンプレートを作成し、上記文書作成部は、上記文書テ
ンプレートに従い文書を作成することにより、アプリケ
ーション依存形式構造化文書を作成することを特徴とす
る。
The application software has a macro language, and creates a document template for creating a structured document based on the document structure definition using the macro language. It is characterized in that an application-dependent structured document is created by creating a document.

【0015】上記検索結果出力部は、アプリケーション
依存形式構造化文書を作成したアプリケーションソフト
ウエアを有し、表示用データ個別要素を出力することを
特徴とする。
The search result output section has application software for creating an application-dependent format structured document, and outputs a display data individual element.

【0016】[0016]

【発明の実施の形態】実施の形態1.本発明の実施の形
態の一例を図を用いて説明する。本実施の形態において
は、テキストで表現される構造化文書の形式としてSG
ML(Standard Generalized M
arkup Language)を採用する。従って、
文書構造定義に相当する概念はSGMLのDTD(Do
cument Type Definition)であ
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiment 1 An example of an embodiment of the present invention will be described with reference to the drawings. In the present embodiment, the format of a structured document represented by text is SG
ML (Standard Generalized M
arkup Language). Therefore,
The concept corresponding to the document structure definition is the SGML DTD (Do
document type definition).

【0017】図1は構造化文書蓄積検索装置全体の処理
フローを示した図である。文書作成部101は、具体的
には文書編集アプリケーションソフトウエア(ワードプ
ロセッサ)である。文書作成部101には、入力制限機
能および文書の構成要素の名称を示すスタイル付機能が
ある。入力制限機能は、予めSGMLのDTDにより定
義されている文書構造定義102を読み込み、使用でき
るスタイルを制限して、構造化文書の作成を実現する。
スタイルは、文字列が章であるのか、節であるのか、タ
イトルであるかなど属性を示すものである。スタイル付
機能は、文書作成時入力された文書を使用できるスタイ
ルに変更する機能である。この機能は文書編集アプリケ
ーションソフトウエアに付属しているマクロ言語で作成
される。文書作成部101では、文書を作成するアプリ
ケーションソフトウエアに依存した形式の構造化した文
書を作成する。この形式の文書をアプリケーション依存
形式構造化文書とする。アプリケーション依存形式構造
化文書201の具体例を、図8に示している。
FIG. 1 is a diagram showing a processing flow of the entire structured document storage and retrieval apparatus. The document creation unit 101 is, specifically, document editing application software (word processor). The document creation unit 101 has an input restriction function and a style-added function indicating the names of the components of the document. The input restriction function realizes creation of a structured document by reading the document structure definition 102 defined in advance by the SGML DTD and restricting usable styles.
The style indicates attributes such as whether the character string is a chapter, a section, or a title. The style-added function is a function for changing a document input at the time of document creation to a usable style. This function is created with the macro language attached to the document editing application software. The document creation unit 101 creates a structured document in a format depending on application software for creating a document. A document in this format is defined as an application-dependent structured document. FIG. 8 shows a specific example of the application-dependent format structured document 201.

【0018】アプリケーション依存形式構造化文書を構
成している各構成要素は、スタイルで区分すること、具
体的には、文字列が章であるのか、節であるのか、タイ
トルであるかなど属性によって区分することが可能であ
る。アプリケーション依存形式構造化文書を区分し、各
構成要素に区分する(103)。区分した各構成要素の
文書をアプリケーション依存形式構造化文書個別要素と
する(104)。具体的には、アプリケーション依存形
式構造化文書個別要素は、章部分、節部分など文書を構
成要素ごとに区分したものである。図9は、図8に示す
アプリケーション依存形式構造化文書201に基づい
て、アプリケーション依存形式構造化文書個別要素20
3を生成した場合を示している。
Each component constituting the application-dependent structured document is classified by a style. More specifically, it is determined by an attribute such as whether a character string is a chapter, a section, or a title. It is possible to classify. The application-dependent structured document is classified and divided into components (103). The document of each of the divided constituent elements is set as an application-dependent format structured document individual element (104). Specifically, the application-dependent format structured document individual element is obtained by dividing the document into components such as a chapter and a section. FIG. 9 shows an application-dependent format structured document individual element 20 based on the application-dependent format structured document 201 shown in FIG.
3 is generated.

【0019】次に、アプリケーション依存形式構造化文
書個別要素をもとに、SGML形式で表現されている個
別要素であるテキスト形式構造化文書個別要素(図1
0)、表示用データである表示用データ個別要素(図1
1)を生成する(105)。テキスト形式構造化文書個
別要素と表示用データ個別要素は、アプリケーション依
存形式構造化文書個別要素と1対1にそれぞれ対応して
蓄積されている。図10は、図9に示すアプリケーショ
ン依存形式構造化文書個別要素203に基づいて、テキ
スト形式構造化文書個別要素206を生成した場合を示
している。また、図11は、図9に示すアプリケーショ
ン依存形式構造化文書個別要素203に基づいて、表示
用データ個別要素208を生成した場合を示している。
Next, based on the application-dependent structured document individual element, a text structured document individual element (FIG. 1) which is an individual element expressed in the SGML format.
0), display data individual elements which are display data (FIG. 1)
1) is generated (105). The text-format structured document individual element and the display data individual element are stored in one-to-one correspondence with the application-dependent structured document individual element. FIG. 10 shows a case where a text-format structured document individual element 206 is generated based on the application-dependent structured document individual element 203 shown in FIG. FIG. 11 shows a case where a display data individual element 208 is generated based on the application-dependent format structured document individual element 203 shown in FIG.

【0020】検索部は検索要求を受け付け、検索結果を
出力する(109)。利用者から受け付けた検索要求を
もとに、データベースに蓄積したテキスト形式構造化文
書個別要素について検索を行い、検索結果に対応するア
プリケーション依存形式構造化文書個別要素を再利用の
用途として、また表示用データ個別要素を表示用データ
として利用者に返す。以上が本装置の全体の処理フロー
である。
The search unit receives the search request and outputs a search result (109). Based on the search request received from the user, search for the text-format structured document individual elements stored in the database, and display the application-dependent structured document individual elements corresponding to the search results for reuse and display Individual data elements for display are returned to the user as display data. The above is the overall processing flow of the present apparatus.

【0021】次に本装置の各部分の構成を、図2に基づ
いて説明する。構造化文書蓄積検索装置は、文書を作成
するアプリケーションソフトウエアによりアプリケーシ
ョン依存形式構造化文書201を作成する文書作成部1
01と、文書作成部101で作成したアプリケーション
依存形式構造化文書201を構成要素に対応する文書部
分である個別要素に区分する個別要素区分部202と、
個別要素区分部202で区分された個別要素に対して複
数のデータ形式を生成する個別要素生成部220と、個
別要素生成部220で生成された複数形式のデータを個
別要素ごとに対応づけて蓄積するデータ蓄積処理部20
9と、データを蓄積するデータ蓄積部230と、データ
を検索する検索管理部303とから構成されている。
Next, the configuration of each part of the apparatus will be described with reference to FIG. The structured document storage and retrieval apparatus includes a document creating unit 1 for creating an application-dependent structured document 201 by application software for creating a document.
01, an individual element classifying unit 202 for classifying the application-dependent structured document 201 created by the document creating unit 101 into individual elements which are document parts corresponding to the components,
An individual element generation unit 220 that generates a plurality of data formats for the individual elements classified by the individual element classification unit 202, and stores the data of the multiple formats generated by the individual element generation unit 220 in association with each individual element Data storage processing unit 20
9, a data storage unit 230 for storing data, and a search management unit 303 for searching for data.

【0022】データ蓄積部230は、蓄積管理部211
と、文書個別要素蓄積部212と、検索結果表示用デー
タ蓄積部213とを含む構成となっている。検索管理部
303は、図3に示すように、検索キー種別判定部30
2と、検索部304と、検索結果出力部305とを含む
構成となっている。さらに、個別要素生成部220は、
図2に示すように、構造化文書個別要素生成部205と
表示用データ個別要素生成部207とから構成されてい
る。
The data storage unit 230 includes a storage management unit 211
, A document individual element storage unit 212, and a search result display data storage unit 213. The search management unit 303, as shown in FIG.
2, a search unit 304, and a search result output unit 305. Further, the individual element generation unit 220
As shown in FIG. 2, it comprises a structured document individual element generation unit 205 and a display data individual element generation unit 207.

【0023】次に、各構成要素の動作について説明す
る。まず、文書作成部101について、図4を用いて動
作を説明する。文書作成部101では、アプリケーショ
ンソフトウエア(ワードプロセッサなど)によりアプリ
ケーション依存形式構造化文書を作成する。
Next, the operation of each component will be described. First, the operation of the document creation unit 101 will be described with reference to FIG. The document creation unit 101 creates an application-dependent structured document using application software (such as a word processor).

【0024】文書作成者は、あらかじめ、作成する文書
の構造を定めた文書構造定義102を作成しておく。次
に、文書作成者は、アプリケーションソフトウエアによ
って、文書構造定義102に基づいて、文書テンプレー
トを作成しておく。文書テンプレートは、アプリケーシ
ョンソフトウエアに付属する機能であるマクロプログラ
ムで作成されるものであって、入力制限機能とスタイル
付機能を有するため、文書構造定義102に沿った文書
の作成を可能にするものである。文書テンプレートはマ
クロプログラムが組み込まれているため、文書構造に従
った入力制限機能および文書を構成するの構成要素の名
称を示すスタイル付機能を有する。これらの機能は、文
書テンプレートごとに備えられている。文書は、文書テ
ンプレートを利用して、入力制限機能とスタイル付機能
に従って作成する。尚、文書作成のアプリケーションソ
フトウエアは、上記機能を満たすものであれば、複数の
アプリケーションソフトウエアを使用することも可能で
ある。
The document creator creates a document structure definition 102 in advance that defines the structure of the document to be created. Next, the document creator creates a document template based on the document structure definition 102 using application software. The document template is created by a macro program that is a function attached to the application software, and has an input restriction function and a style-added function, so that a document according to the document structure definition 102 can be created. It is. Since the document template incorporates a macro program, it has an input restriction function according to the document structure and a style-added function indicating the names of the components that constitute the document. These functions are provided for each document template. A document is created using a document template according to an input restriction function and a style-added function. Note that a plurality of application software can be used as the application software for document creation as long as the application satisfies the above functions.

【0025】具体例として、図8に示すアプリケーショ
ン依存形式構造化文書201を作成する場合を取り上げ
る。この具体例では、文書の冒頭は文書タイトルで始ま
り、次に作者名、章のタイトル、章の段落、節のタイト
ル、節の段落の順で構成される文書の場合の動作を例と
して図4を用いて説明する。文書作成部101は、文書
テンプレートごとに、文書を構成する各要素の順を記憶
するDTDに従った文書構造記憶領域を有する。利用者
が文書の編集を始める際に、対象となる文書テンプレー
トを開くと、文書テンプレート中に埋め込まれたマクロ
プログラムが動作し、文書構成記憶領域より最初の構成
要素を探し出し、その構成要素に対応する最初のスタイ
ルを設定する(401)。本実施の形態の場合、最初の
構成要素は文書タイトルなので、スタイルに文書タイト
ルを設定する。利用者が文書タイトルを入力し、入力終
了を意味する改行コードをキーボードから入力する。改
行コードによりアプリケーションソフトウエアに文書タ
イトルの入力完了が伝えられると、マクロプログラムは
スタイルに文書タイトルに次の構成要素である作者名を
設定する(402)。次に、利用者が作者名を入力し、
改行コードを入力し、アプリケーションソフトウエアに
文書タイトルの入力完了を伝えると、マクロプログラム
はスタイルに章タイトルを設定する。以下同様に、文書
テンプレートに付属するマクロプログラムは改行キーを
現在のスタイルに対する入力完了と判断し、文書構造記
憶領域より次の構成要素をスタイルに設定する。スタイ
ルを設定する際、次の構成要素が複数該当する場合(4
05)、選択画面を提示し、利用者に次に記す文字列が
該当する文書構成要素名を選択させ、選択された構成要
素をスタイルに設定する(406、407)。文書編集
が終了すると、図8に示すアプリケーション依存形式構
造化文書201の作成が完了する。
As a specific example, a case where an application-dependent structured document 201 shown in FIG. 8 is created will be described. In this specific example, FIG. 4 shows an example of the operation in the case of a document which starts with a document title at the beginning of the document, and then has an author name, a chapter title, a chapter paragraph, a section title, and a section paragraph. This will be described with reference to FIG. The document creation unit 101 has a document structure storage area in accordance with the DTD for storing the order of each element constituting a document for each document template. When a user starts editing a document and opens the target document template, the macro program embedded in the document template operates, searches for the first component from the document configuration storage area, and responds to that component. The first style to be set is set (401). In the case of the present embodiment, since the first component is the document title, the document title is set in the style. The user inputs a document title, and inputs a line feed code indicating the end of the input from the keyboard. When the input completion of the document title is notified to the application software by the line feed code, the macro program sets the author name as the next component in the document title in the style (402). Next, the user enters the author name,
When the user inputs a line feed code and notifies the application software that the input of the document title has been completed, the macro program sets the chapter title in the style. Similarly, the macro program attached to the document template determines that the input of the line feed key has been completed for the current style, and sets the next component in the document structure storage area to the style. When setting a style, if multiple of the following components are applicable (4
05), a selection screen is presented, and the user is caused to select a document component name corresponding to a character string described below, and the selected component is set as a style (406, 407). When the document editing is completed, the creation of the application-dependent format structured document 201 shown in FIG. 8 is completed.

【0026】以上のように、作成する文書の特徴に応じ
て予め準備される文書テンプレートを使用して文書を作
成することにより論理的構造を持ち、テキストで表現さ
れる構造化文書の原形となるアプリケーション依存形式
構造化文書を作成できる。
As described above, by creating a document using a document template prepared in advance according to the characteristics of the document to be created, the document has a logical structure, and becomes the original form of a structured document represented by text. Can create application-dependent structured documents.

【0027】次に、個別要素区分部202について、図
5を用いて動作を説明する。個別要素区分部202で
は、アプリケーション依存形式構造化文書個別要素20
3を生成する。この具体例では、図8に示すアプリケー
ション依存形式構造化文書201に基づいて、図9に示
すアプリケーション依存形式構造化文書個別要素203
を生成する場合を示す。アプリケーション依存形式構造
化文書201を文書の構成要素ごとに区分したものをア
プリケーション依存形式構造化文書個別要素とする。個
別要素は、アプリケーション依存形式構造化文書に記録
されているスタイルも基づいて区分する(501)。個
別要素に区分する際は、個別要素の属性を文書個別要素
種別記憶領域210に記録する。具体的には、文書タイ
トルや作成者などのような文書全体に影響を及ぼす文書
属性部分個別要素と、章のタイトル、章段落、節のタイ
トル、節段落などのような各部分を示す文書個別要素の
いずれに属するのか文書個別要素種別記憶領域210に
記録する(502、503)。
Next, the operation of the individual element classification unit 202 will be described with reference to FIG. In the individual element classification unit 202, the application-dependent format structured document individual element 20
3 is generated. In this specific example, based on the application-dependent format structured document 201 shown in FIG. 8, the application-dependent format structured document individual element 203 shown in FIG.
Is generated. An application-dependent format structured document 201 that is divided for each component of the document is defined as an application-dependent format structured document individual element. Individual elements are classified based on the style recorded in the application-dependent format structured document (501). When classifying into individual elements, the attributes of the individual elements are recorded in the document individual element type storage area 210. Specifically, document attribute part individual elements that affect the entire document such as the document title and author, and document individual parts that indicate each part such as chapter title, chapter paragraph, section title, section paragraph, etc. Which element the element belongs to is recorded in the document individual element type storage area 210 (502, 503).

【0028】次に個別要素生成部220の動作につい
て、図2を用いて説明する。構造化文書個別要素生成部
205は、個別要素区分部202で生成されたアプリケ
ーション依存形式構造化文書個別要素203を、スタイ
ルに基づいてSGMLの保存形式であるテキストからな
るテキスト形式構造化文書個別要素206を生成する。
テキスト形式構造化文書個別要素206を生成する場
合、構造化文書102で使用されている文書構造を示す
タグを使用する。使用するタグは、スタイルに対応する
タグ名を文書構造定義からスタイルに対応するタグを探
し出し付けて行く。スタイル−タグ対応記憶領域の生成
は、予め文書テンプレート毎にスタイルとタグの対応を
作成したスタイル−タグ定義ファイルを起動時に読み込
むことにより生成される。図9に示すアプリケーション
依存形式構造化文書個別要素203に基づいて生成した
テキスト形式構造化文書個別要素206を図10に示し
ている。
Next, the operation of the individual element generation unit 220 will be described with reference to FIG. The structured document individual element generation unit 205 converts the application-dependent format structured document individual element 203 generated by the individual element classification unit 202 into a text format structured document individual element composed of text, which is a storage format of SGML, based on the style. Generate 206.
When the text-structured structured document individual element 206 is generated, a tag indicating the document structure used in the structured document 102 is used. For the tag to be used, the tag name corresponding to the style is found and found from the document structure definition. The style-tag correspondence storage area is created by reading a style-tag definition file in which correspondence between styles and tags has been created for each document template in advance at the time of startup. FIG. 10 shows a text-format structured document individual element 206 generated based on the application-dependent format structured document individual element 203 shown in FIG.

【0029】表示用データ個別要素生成部207は、ア
プリケーション依存形式構造化文書個別要素203を表
示イメージに変換して表示用データ個別要素208を生
成する。生成された表示用データ個別要素208には、
アプリケーション依存形式構造化文書201に含まれる
テキストのほか、表や図など貼り付けているオブジェク
トすべてが表示用データとして含まれている。図9に示
すアプリケーション依存形式構造化文書個別要素203
に基づいて生成した表示用データ個別要素208を図1
1に示している。
The display data individual element generation unit 207 converts the application-dependent format structured document individual element 203 into a display image to generate a display data individual element 208. The generated display data individual element 208 includes:
In addition to the text included in the application-dependent format structured document 201, all pasted objects such as tables and figures are included as display data. An application-dependent format structured document individual element 203 shown in FIG.
The display data individual element 208 generated based on the
It is shown in FIG.

【0030】データ蓄積処理部209の動作について、
図6を用いて説明する。データ蓄積処理部209は、複
数形式のデータをデータ蓄積部230へ蓄積する。本実
施の形態では、検索用データとしてテキスト形式構造化
文書個別要素206を、検索された文書の再利用の用途
として、データ蓄積部230へ蓄積する。テキスト形式
構造化文書個別要素206に対応するアプリケーション
依存形式構造化文書個別要素203を、検索結果の表示
用として、データ蓄積部230へ蓄積する。テキスト形
式構造化文書個別要素206に対応する表示用データ個
別要素208を表示用データとして、データ蓄積部23
0へ蓄積する。
The operation of the data accumulation processing unit 209 will be described.
This will be described with reference to FIG. The data accumulation processing unit 209 accumulates data in a plurality of formats in the data accumulation unit 230. In the present embodiment, a text-format structured document individual element 206 is stored in the data storage unit 230 as search data for the purpose of reusing the searched document. The application-dependent structured document individual element 203 corresponding to the text structured document individual element 206 is stored in the data storage unit 230 for displaying the search result. The display data individual element 208 corresponding to the text structured document individual element 206 is used as the display data as the data storage unit 23.
Store to 0.

【0031】データ蓄積部230は、蓄積管理部211
と、文書個別要素蓄積部212と、検索結果表示用デー
タ蓄積部213を構成要素として有する。蓄積管理部2
11は、各個別要素を一意に決定する識別名と構造化文
書の文書属性部分個別要素に対応を格納した2次元のテ
ーブルで構成される。2次元テーブルは、まず、識別名
生成部204で予め利用者が生成した識別名をキーとし
て、文書個別要素種別記憶領域210の記録内容をもと
に、文書属性部分個別要素に対応する構造化文書個別要
素のみを取り出すことにより生成する。この2次元テー
ブルを図6の蓄積管理部211に示す。蓄積管理部21
1の識別名211aが識別名生成部204で生成された
個別要素区分部202生成した各個別要素を一意に決定
する識別名である。また、図6の例では、文書タイトル
211bおよび作成者211cを構造化文書個別要素の
文書属性部分の情報をとして挙げている。
The data storage unit 230 includes a storage management unit 211
And a document individual element storage unit 212 and a search result display data storage unit 213 as constituent elements. Storage management unit 2
Reference numeral 11 denotes a two-dimensional table in which an identifier for uniquely determining each individual element and a correspondence to the document attribute part individual element of the structured document are stored. First, the two-dimensional table is structured using the identification name generated by the user in advance by the identification name generation unit 204 as a key, based on the recorded contents of the document individual element type storage area 210 and corresponding to the document attribute partial individual element. Generated by extracting only document individual elements. This two-dimensional table is shown in the accumulation management unit 211 of FIG. Storage management unit 21
One identification name 211a is an identification name for uniquely determining each individual element generated by the individual element classification unit 202 generated by the identification name generation unit 204. In the example of FIG. 6, the document title 211b and the creator 211c are listed as information of the document attribute part of the structured document individual element.

【0032】さらに蓄積管理部211では、アプリケー
ション依存形式構造化文書個別要素203と表示用デー
タ個別要素208の実際の格納位置を記録する。これを
図6と図7を用いて説明する。データ蓄積処理部209
において蓄積するアプリケーション依存形式構造化文書
203と表示用データ個別要素208を受付けると、検
索結果表示用データ蓄積部213へ蓄積すると同時にそ
れらの格納位置を蓄積管理部211に含まれる表示用デ
ータ格納位置211dとアプリケーション依存形式構造
化文書個別要素格納位置211eに記録する。文書個別
要素蓄積部212は、テキスト形式構造化文書個別要素
206を蓄積する。蓄積する際に、上記の識別名211
aを、各テキスト形式構造化文書個別要素の先頭に付け
る(212a)。尚、各識別名212aは、各テキスト
形式構造化文書個別要素に対応する識別名211aと同
一の識別名である。
Further, the storage management unit 211 records the actual storage positions of the application-dependent format structured document individual element 203 and the display data individual element 208. This will be described with reference to FIGS. Data accumulation processing unit 209
When the application-dependent structured document 203 and the display data individual element 208 to be stored are received, they are stored in the search result display data storage unit 213 and at the same time, their storage positions are stored in the display data storage position included in the storage management unit 211. 211d and the application-dependent format structured document individual element storage location 211e. The document individual element storage unit 212 accumulates text format structured document individual elements 206. When storing, the identifier 211
"a" is added to the head of each text format structured document individual element (212a). Note that each identifier 212a is the same identifier as the identifier 211a corresponding to each text-format structured document individual element.

【0033】テキスト形式構造化文書個別要素206の
データを蓄積管理部211及び文書個別要素蓄積部21
2に蓄積する具体例を図12に示す。図12は、文書名
「aaaa」(206a)及び文書名「bbbb」(2
06b)の2つの文書の例である。蓄積管理部211へ
は、文書属性部分のデータを蓄積する。図12では、文
書タイトルと作者名である。また、文書個別要素蓄積部
212へは、章のデータ部分に識別名212aを付加し
たものを蓄積する。また、図12では表していないが、
節のデータ部分についても、節のデータ部分に識別名を
付加したものを、文書個別要素蓄積部212へ蓄積す
る。
The data of the text-format structured document individual element 206 is stored in the storage management unit 211 and the document individual element storage unit 21.
FIG. 12 shows a specific example of storing the data in No. 2. FIG. 12 shows the document name “aaaa” (206a) and the document name “bbbb” (2
06b) is an example of two documents. The storage management unit 211 stores the data of the document attribute portion. In FIG. 12, the document title and the author name are shown. Further, the document individual element storage unit 212 stores the data part of the chapter to which the identification name 212a is added. Although not shown in FIG. 12,
As for the data part of the clause, the data part of the clause with the identifier added thereto is stored in the document individual element storage unit 212.

【0034】検索結果表示用データ蓄積部213は、ア
プリケーション依存形式構造化文書個別要素203およ
び表示用データ個別要素蓄積部208を格納する。この
部分は各データ形式のままで蓄積される。各個別要素を
格納している位置は蓄積管理部211に記録する。
The search result display data storage unit 213 stores the application-dependent format structured document individual element 203 and the display data individual element storage unit 208. This part is stored in each data format. The position where each individual element is stored is recorded in the accumulation management unit 211.

【0035】次に、検索管理部303の動作について図
3を用いて説明する。検索は蓄積した3種類のデータを
連携させることにより行われる。まず、検索部304で
は、検索要求を受け付ける。検索画面の各検索キー入力
部は、文書属性部分、文書個別要素入力部分が独立した
入力枠が設けられている。入力された入力枠によりいず
れか1つの種別を示すフラグを入力された検索キーに付
けて検索部304に送信する。検索部304は送られて
きたフラグを元に、検索キーが文書タイトルや作者名な
どの文書属性部分であるのか、章・節をはじめとする文
書個別要素であるのか、検索キーの種別を検索キー種別
判定部302において判定する。
Next, the operation of the search management unit 303 will be described with reference to FIG. The search is performed by linking the three types of accumulated data. First, the search unit 304 receives a search request. Each search key input section of the search screen is provided with an input frame in which a document attribute portion and a document individual element input portion are independent. A flag indicating one of the types is attached to the input search key according to the input input frame and transmitted to the search unit 304. The search unit 304 searches for the type of the search key based on the sent flag, whether the search key is a document attribute part such as a document title or an author name, a document individual element such as a chapter / section. The key type determination unit 302 makes the determination.

【0036】判定結果は検索部304に送られ、最初に
検索キーとして文書タイトル、作者名など文書属性に対
する検索要求がきた場合、文書属性であるので、蓄積管
理部211が管理している2次元テーブルから検索結果
を表示する。この際、蓄積管理部211を検索すること
によって識別名を得る。識別名を基に、文書個別要素蓄
積部212に格納されている章、節などのテキスト形式
構造化文書個別要素206を取り出し、一時記憶領域3
08に保管する。次に絞込検索の検索キーとして、文書
個別要素が指定された場合、一時記憶領域308に記憶
された文書個別要素を検索する。以下、同様に検索を行
う。
The determination result is sent to the search unit 304, and when a search request for a document attribute such as a document title and an author name is first made as a search key, it is a document attribute. Display search results from a table. At this time, the identification name is obtained by searching the storage management unit 211. On the basis of the identification name, the text-format structured document individual element 206 such as a chapter or a section stored in the document individual element storage unit 212 is extracted, and the temporary storage area 3
08. Next, when a document individual element is designated as a search key for a narrow-down search, the document individual element stored in the temporary storage area 308 is searched. Hereinafter, a similar search is performed.

【0037】次に最初に検索キーとして章・節などテキ
スト形式構造化文書個別要素206に対応する検索要求
がきた場合、テキスト形式構造化文書個別要素206で
あるので、文書個別要素蓄積部212から該当するテキ
スト形式構造化文書個別要素206を取り出して一時記
憶領域308に記憶する。その際、識別名を取り出し、
対応する文書属性を蓄積管理部211から特定する。以
下、同様に検索を行う。テキスト形式構造化文書個別要
素206は、テキスト形式になっている全文を検索す
る。
Next, when a search request corresponding to a text-structured structured document individual element 206 such as a chapter or a section is first received as a search key, the document-structured document individual element 206 is received. The corresponding text-format structured document individual element 206 is taken out and stored in the temporary storage area 308. At that time, take out the distinguished name,
The corresponding document attribute is specified from the storage management unit 211. Hereinafter, a similar search is performed. The text-structured structured document individual element 206 searches for the full text in the text format.

【0038】次に検索結果出力部305の動作について
図3を用いて説明する。検索結果出力部305は、アプ
リケーション依存形式構造化文書個別要素および表示用
データ個別要素を抽出し、出力する。検索部304の検
索結果をもとにが蓄積管理部211に記録されているア
プリケーション依存形式構造化文書個別要素の格納位置
および表示用データ個別要素の格納位置に従い検索結果
表示用データ蓄積部213より各データ形式の個別要素
を抽出し、利用者に検索結果として出力する。その際、
アプリケーション依存形式構造化文書個別要素は、検索
後に編集等の再利用を目的として、表示用データ個別要
素は表示用データとして表示される。文書個別要素が検
索キーとして含まれている場合は、検索にヒットした文
書の該当部分のみを表示する。検索キーが文書属性のみ
の場合、全文表示する必要があるため、文書個別要素を
全て取り出し、文書全体を検索結果として表示する。
Next, the operation of the search result output unit 305 will be described with reference to FIG. The search result output unit 305 extracts and outputs an application-dependent format structured document individual element and a display data individual element. From the search result display data storage unit 213 in accordance with the storage position of the application-dependent format structured document individual element and the storage position of the display data individual element recorded on the storage management unit 211 based on the search result of the search unit 304. Extract individual elements of each data format and output to users as search results. that time,
The application-dependent format structured document individual element is displayed as display data for the purpose of reuse such as editing after retrieval. If a document individual element is included as a search key, only the relevant portion of the document that has been found in the search is displayed. If the search key is only the document attribute, it is necessary to display the entire text, so all document individual elements are extracted and the entire document is displayed as a search result.

【0039】実施の形態2.上記実施の形態1.では、
データ蓄積部230は、蓄積管理部211と、文書個別
要素蓄積部212と、検索結果表示用データ蓄積部21
3を含む構成としたが、この構成でなくとも、アプリケ
ーション依存形式構造化文書個別要素203と、テキス
ト形式構造化文書個別要素206と、表示用データ個別
要素208を含む複数形式のデータが、個別要素ごとに
関連付けられて保存されれば、他の形態でもかまわな
い。例えば、データ蓄積部230を、蓄積管理部211
と文書個別要素蓄積部212の構成とし、上記複数形式
のデータを文書個別要素蓄積部212に総て保存するこ
とも可能である。
Embodiment 2 Embodiment 1 above. Then
The data storage unit 230 includes a storage management unit 211, a document individual element storage unit 212, and a search result display data storage unit 21.
However, even in this configuration, data in a plurality of formats including the application-dependent structured document individual element 203, the text format structured document individual element 206, and the display data Other forms may be used as long as they are stored in association with each element. For example, the data storage unit 230 is replaced with the storage management unit 211.
The document individual element storage unit 212 may be configured to store all of the data in the plurality of formats in the document individual element storage unit 212.

【0040】実施の形態3.上記実施の形態1.では、
検索結果出力部305は、検索結果を表示する例を取り
上げたが、検索結果を加工して、ファクシミリに出力す
ることも可能である。また、所定のファイルに加工し
て、通信網を使用して、指定された場所へ転送すること
も可能である。さらに、上記の場合、予め、出力の形態
にあわせたデータ形式で保存しておくことも考えられ
る。
Embodiment 3 Embodiment 1 above. Then
The search result output unit 305 has described an example in which the search result is displayed. However, the search result can be processed and output to a facsimile. It is also possible to process the file into a predetermined file and transfer it to a designated location using a communication network. Furthermore, in the above case, it is also conceivable to store the data in a data format according to the output format in advance.

【0041】[0041]

【発明の効果】本発明に係る構造化文書蓄積検索装置に
よれば、作成した文書について、個別要素ごとに複数の
形式でデータの保存及び利用ができる。
According to the structured document storage and retrieval apparatus of the present invention, data of a created document can be stored and used in a plurality of formats for each individual element.

【0042】さらに、この発明によれば、検索結果を複
数の形式のデータで取得し、出力することができる。
Further, according to the present invention, a search result can be obtained and output as data in a plurality of formats.

【0043】また、この発明によれば、テキスト形式の
文書総てを検索可能にし、文書を作成したアプリケーシ
ョンプログラムを使用して、検索して取得した文書の利
用が可能になり、さらに、高画質の表示をすることがで
きる。
Further, according to the present invention, all the documents in the text format can be searched, and the retrieved and obtained documents can be used by using the application program which has created the documents. Can be displayed.

【0044】この発明によれば、個別要素ごとに複数形
式のデータを対応させて生成し、保存することができ
る。
According to the present invention, data of a plurality of formats can be generated for each individual element and stored.

【0045】この発明によれば、識別キーにより、文書
属性及び文書個別要素のいずれの検索キーであっても、
複数のデータを対応づけて検索することができる。
According to the present invention, regardless of the retrieval key of the document attribute and the document individual element,
A plurality of data can be searched in association with each other.

【0046】この発明によれば、文書作成のアプリケー
ションプログラムのマクロを利用することができる。
According to the present invention, a macro of an application program for document creation can be used.

【0047】この発明によれば、複数のデータ形式に対
応して検索結果を出力し、検索して取得した文書を再利
用することができる。従って、アプリケーション依存形
式構造化文書個別要素203により、構造化文書を専用
エディタではなくワードプロセッサを利用し生成するこ
とが可能となり、また文書を蓄積する際は文書の属性部
分を再入力する必要もない。さらに、表示用データ個別
要素208により、テキストのみならず、図や表やイメ
ージを含む印刷物と同等レベルの高品質な検索結果を提
示することができる。また、テキスト形式構造化文書個
別要素206についても、検索結果として提示し作成し
た文書として再利用することができる。このように、文
書作成から蓄積、検索、表示、再利用に至る全般的な文
書管理を行うことができる。
According to the present invention, it is possible to output a search result corresponding to a plurality of data formats and reuse a document obtained by searching. Therefore, the application-dependent format structured document individual element 203 enables a structured document to be generated using a word processor instead of a dedicated editor, and it is not necessary to re-input the attribute portion of the document when storing the document. . Furthermore, the display data individual element 208 can present not only text but also high-quality search results at the same level as printed matter including figures, tables, and images. Also, the text-structured structured document individual element 206 can be reused as a document presented and created as a search result. In this manner, general document management from document creation to storage, search, display, and reuse can be performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の構造化文書蓄積検索装置の処理を示
す処理フロー図である。
FIG. 1 is a process flowchart showing a process of a structured document storage and retrieval device of the present invention.

【図2】 本発明のシステム構成を示す図である。FIG. 2 is a diagram showing a system configuration of the present invention.

【図3】 本発明の検索処理の流れを示す図である。FIG. 3 is a diagram showing a flow of a search process of the present invention.

【図4】 本発明のアプリケーション依存形式構造化文
書作成の流れを示すフローチャート図である。
FIG. 4 is a flowchart illustrating a flow of creating an application-dependent format structured document according to the present invention.

【図5】 本発明のアプリケーション依存形式構造化文
書個別要素生成の流れを示すフローチャート図である。
FIG. 5 is a flowchart illustrating a flow of generating an application-dependent format structured document individual element according to the present invention.

【図6】 本発明のデータ蓄積処理の詳細を示す図であ
る。
FIG. 6 is a diagram showing details of data accumulation processing of the present invention.

【図7】 本発明のデータ蓄積処理の詳細を示す図であ
る。
FIG. 7 is a diagram showing details of data accumulation processing of the present invention.

【図8】 本発明のアプリケーション依存形式構造化文
書の具体例を示す図である。
FIG. 8 is a diagram showing a specific example of an application-dependent format structured document according to the present invention.

【図9】 本発明のアプリケーション依存形式構造化文
書個別要素の具体例を示す図である。
FIG. 9 is a diagram showing a specific example of an application-dependent format structured document individual element of the present invention.

【図10】 本発明のテキスト形式構造化文書個別要素
の具体例を示す図である。
FIG. 10 is a diagram showing a specific example of a text format structured document individual element of the present invention.

【図11】 本発明の表示用データ個別要素の具体例を
示す図である。
FIG. 11 is a diagram showing a specific example of a display data individual element of the present invention.

【図12】 本発明のデータ蓄積処理の詳細の具体例を
示す図である。
FIG. 12 is a diagram showing a specific example of details of data accumulation processing of the present invention.

【符号の説明】[Explanation of symbols]

101 文書作成部、102 文書構造定義、201
アプリケーション依存形式構造化文書、202 個別要
素区分部、203 アプリケーション依存形式構造化文
書個別要素、204 識別名生成部、205 構造化文
書個別要素生成部、206 テキスト形式構造化文書個
別要素、206a,206b テキスト形式構造化文書
個別要素の具体例、207 表示用データ個別要素生成
部、208 表示用データ個別要素、209 データ蓄
積処理部、210 文書個別要素種別記憶領域、211
蓄積管理部、211a,211b,211c,211
d,211e 蓄積管理部の構成要素、212 文書個
別要素蓄積部、212aテキスト形式構造化文書個別要
素の先頭に付加される識別名、213 検索結果表示用
データ蓄積部、220 個別要素生成部、230 デー
タ蓄積部、302検索キー種別判定部、304 検索
部、305 検索結果出力部、308 一時記憶領域。
101 document creation unit, 102 document structure definition, 201
Application-dependent format structured document, 202 individual element classifier, 203 application-dependent format structured document individual element, 204 identifier generation unit, 205 structured document individual element generator, 206 text format structured document individual element, 206a, 206b Specific example of text format structured document individual element, 207 display data individual element generation unit, 208 display data individual element, 209 data storage processing unit, 210 document individual element type storage area, 211
Storage management unit, 211a, 211b, 211c, 211
d, 211e Components of the storage management unit, 212 document individual element storage unit, 212a identification name added to the head of text format structured document individual element, 213 search result display data storage unit, 220 individual element generation unit, 230 Data storage unit, 302 search key type determination unit, 304 search unit, 305 search result output unit, 308 temporary storage area.

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 作成する構造化文書を構成する各構成要
素をあらかじめ定義した文書構造定義を記憶する記憶部
と、 上記文書構造定義に定義された構成要素に基づいて、文
書を作成する文書作成部と、 上記文書作成部で作成された文書を、上記文書構造定義
に定義されている構成要素に対応する文書部分である個
別要素に区分する個別要素区分部と、 上記個別要素区分部で区分された個別要素に対して、複
数の形式のデータを生成する個別要素生成部と、 上記個別要素生成部で生成された複数の形式のデータを
個別要素に対応づけて蓄積するデータ蓄積処理部と、 上記データ蓄積処理部が複数の形式のデータを蓄積する
記憶領域であるデータ蓄積部と、 上記データ蓄積処理部でデータ蓄積部に蓄積されたデー
タを検索する検索管理部とを備えたことを特徴とする構
造化文書蓄積検索装置。
1. A storage unit for storing a document structure definition in which each component constituting a structured document to be created is defined in advance, and a document creation for creating a document based on the component defined in the document structure definition And an individual element division unit for dividing the document created by the document creation unit into individual elements which are document parts corresponding to the components defined in the document structure definition. An individual element generation unit that generates data in a plurality of formats for the individual elements that have been set; and a data storage processing unit that stores the data in the plurality of formats generated by the individual element generation unit in association with the individual elements. A data storage unit that is a storage area in which the data storage processing unit stores data in a plurality of formats; and a search management unit that searches for data stored in the data storage unit by the data storage processing unit. A structured document storage and retrieval device characterized by the following.
【請求項2】 上記文書作成部は、文書を作成するアプ
リケーションソフトウエアを有し、 アプリケーションソフトウエアは、アプリケーションソ
フトウエアのデータ保存形式に従ったアプリケーション
依存形式構造化文書を作成し、 上記個別要素区分部は、上記アプリケーション依存形式
構造化文書を区分してアプリケーション依存形式構造化
文書個別要素を生成し、 上記データ蓄積部は、少なくとも、上記アプリケーショ
ン依存形式構造化文書個別要素と、上記アプリケーショ
ン依存形式構造化文書個別要素をテキスト形式に変換し
たテキスト形式構造化文書個別要素と、検索結果を出力
する際に使用する表示用データ個別要素とのいずれかを
含む複数の形式のデータを蓄積する記憶領域を有するこ
とを特徴とする請求項1記載の構造化文書蓄積検索装
置。
2. The document creation section has application software for creating a document. The application software creates an application-dependent format structured document according to a data storage format of the application software. The classifying unit classifies the application-dependent format structured document to generate an application-dependent format structured document individual element. The data storage unit includes at least the application-dependent format structured document individual element and the application-dependent format. A storage area for storing data in a plurality of formats including one of a text-format structured document individual element obtained by converting a structured document individual element into a text format and a display data individual element used for outputting a search result. The structuring according to claim 1, characterized by having Document storage and retrieval device.
【請求項3】 上記検索管理部は、上記データ蓄積部で
蓄積したデータを検索する検索部と、 上記検索部で検索したデータを上記複数の形式のデータ
の少なくともいずれか一つを出力する検索結果出力部と
を備えることを特徴とする請求項1または2記載の構造
化文書蓄積検索装置。
3. The search management unit includes: a search unit configured to search for data stored in the data storage unit; and a search unit configured to output at least one of the plurality of types of data from the data searched by the search unit. 3. The structured document storage and retrieval device according to claim 1, further comprising a result output unit.
【請求項4】 上記個別要素生成部は、上記アプリケー
ション依存形式構造化文書個別要素を構造化文書のデー
タ形式であるテキスト形式のデータに変換し、上記構造
化文書個別要素を生成するとともに、 上記アプリケーション依存形式構造化文書個別要素に対
応させて、表示用に使用する表示用データを生成するこ
とを特徴とする請求項2記載の構造化文書蓄積検索装
置。
4. The individual element generating unit converts the application-dependent structured document individual element into text format data, which is the data format of the structured document, and generates the structured document individual element. 3. The structured document storage and retrieval device according to claim 2, wherein display data to be used for display is generated in association with the application-dependent format structured document individual element.
【請求項5】 各個別要素は、当該個別要素を識別する
識別名を有し、 上記データ蓄積処理部は、上記識別名に対応づけて上記
複数の形式のデータを蓄積することを特徴とする請求項
2記載の構造化文書蓄積検索装置。
5. Each of the individual elements has an identification name for identifying the individual element, and the data storage processing section stores the data in the plurality of formats in association with the identification name. 3. The structured document storage and retrieval device according to claim 2.
【請求項6】 上記アプリケーションソフトウエアは、
マクロ言語を有するとともに、上記マクロ言語により、
上記文書構造定義に基づいて、構造化文書を作成する文
書テンプレートを作成し、 上記文書作成部は、上記文書テンプレートに従い文書を
作成することにより、アプリケーション依存形式構造化
文書を作成することを特徴とする請求項2記載の構造化
文書蓄積検索装置。
6. The application software,
Having a macro language, and using the above macro language,
A document template for creating a structured document is created based on the document structure definition, and the document creating unit creates an application-dependent structured document by creating a document according to the document template. 3. The structured document storage and retrieval device according to claim 2, wherein:
【請求項7】 上記検索結果出力部は、アプリケーショ
ン依存形式構造化文書を作成したアプリケーションソフ
トウエアを有し、 表示用データ個別要素を出力することを特徴とする請求
項2記載の構造化文書蓄積検索装置。
7. The structured document storage according to claim 2, wherein the search result output unit has application software for creating an application-dependent format structured document, and outputs a display data individual element. Search device.
JP22397798A 1998-08-07 1998-08-07 Structured document storage and retrieval device Expired - Fee Related JP4255538B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22397798A JP4255538B2 (en) 1998-08-07 1998-08-07 Structured document storage and retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22397798A JP4255538B2 (en) 1998-08-07 1998-08-07 Structured document storage and retrieval device

Publications (2)

Publication Number Publication Date
JP2000057154A true JP2000057154A (en) 2000-02-25
JP4255538B2 JP4255538B2 (en) 2009-04-15

Family

ID=16806650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22397798A Expired - Fee Related JP4255538B2 (en) 1998-08-07 1998-08-07 Structured document storage and retrieval device

Country Status (1)

Country Link
JP (1) JP4255538B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005352716A (en) * 2004-06-10 2005-12-22 Chugoku Electric Power Co Inc:The Automatic creation support system of energy saving diagnosis report, and its method
JP2006505863A (en) * 2002-11-07 2006-02-16 トムソン グローバル リソーシーズ アー.ゲー. Electronic document repository management and access system
JP2009543235A (en) * 2006-07-09 2009-12-03 90 ディグリー ソフトウェア インコーポレイテッド Method and apparatus for reusing data access and presentation elements

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006505863A (en) * 2002-11-07 2006-02-16 トムソン グローバル リソーシーズ アー.ゲー. Electronic document repository management and access system
JP2010211828A (en) * 2002-11-07 2010-09-24 Thomson Reuters Global Resources Electronic document repository management and access system
US7941431B2 (en) 2002-11-07 2011-05-10 Thomson Reuters Global Resources Electronic document repository management and access system
JP2005352716A (en) * 2004-06-10 2005-12-22 Chugoku Electric Power Co Inc:The Automatic creation support system of energy saving diagnosis report, and its method
JP2009543235A (en) * 2006-07-09 2009-12-03 90 ディグリー ソフトウェア インコーポレイテッド Method and apparatus for reusing data access and presentation elements

Also Published As

Publication number Publication date
JP4255538B2 (en) 2009-04-15

Similar Documents

Publication Publication Date Title
US6353840B2 (en) User-defined search template for extracting information from documents
US6377946B1 (en) Document search method and apparatus and portable medium used therefor
US20060235855A1 (en) Digital library system
JP2000222394A (en) Document managing device and method and recording medium for recording its control program
US20060080361A1 (en) Document information processing apparatus, document information processing method, and document information processing program
US20200175268A1 (en) Systems and methods for extracting and implementing document text according to predetermined formats
CN108197119A (en) The archives of paper quality digitizing solution of knowledge based collection of illustrative plates
JPH07311764A (en) Document peer review support system
JP2006072744A (en) Document processing apparatus, control method thereof, program, and storage medium
JP2001084254A (en) Electronic filing system and filing method
US10990338B2 (en) Information processing system and non-transitory computer readable medium
JP4255538B2 (en) Structured document storage and retrieval device
JP2006202081A (en) Metadata generation device
KR102909241B1 (en) Method of extraction-conversion and information retrieval of corporate filings electronic document using machine reading comprehension and systemt implementing thereof
CN119046408A (en) Method, device, computer equipment and storage medium for digitally managing cultural relic files
JP2001256256A (en) Device and method for retrieving electronic document
JP4480109B2 (en) Image management apparatus and image management method
KR102593884B1 (en) System and method for automatically generating documents and computer-readable recording medium storing of the same
JP2000020549A (en) Device for assisting input to document database system
JP2001297080A (en) Read assisting device
JP2003288332A (en) Structured document creation support method and structured document creation support system
JP2000268040A (en) Information classification method
JPH1145236A (en) Document management support apparatus and computer-readable recording medium storing a program for causing a computer to function as the apparatus
JP2005108006A (en) Method and system for managing document data, and computer program for document data management
CN118277539B (en) AI-based scientific and technological data mining method and system

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050715

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080701

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081007

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090127

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090128

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120206

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140206

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees