JP2004348593A - Storage search device, storage search method, storage search program, and storage search program recording medium - Google Patents
Storage search device, storage search method, storage search program, and storage search program recording medium Download PDFInfo
- Publication number
- JP2004348593A JP2004348593A JP2003146784A JP2003146784A JP2004348593A JP 2004348593 A JP2004348593 A JP 2004348593A JP 2003146784 A JP2003146784 A JP 2003146784A JP 2003146784 A JP2003146784 A JP 2003146784A JP 2004348593 A JP2004348593 A JP 2004348593A
- Authority
- JP
- Japan
- Prior art keywords
- structured document
- storage
- meta information
- search
- path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】オブジェクト指向構造化文書データベースがメタ情報を格納する機能を有しなくても、アプリケーションプログラムに依存せずに、メタ情報の追加・変更・削除に柔軟に対応できる格納検索装置、格納検索方法、格納検索プログラム、および格納検索プログラム記録媒体を提供する。
【解決手段】格納・検索システム1は、アプリケーション100、格納・検索装置200、オブジェクト指向構造化文書データベース(以下、データベースと呼ぶ)300を備えている。格納・検索装置200は、アプリケーション100から渡された構造化文書およびメタ情報をデータベース300に格納する機能と、アプリケーション100から渡されたパス検索式をもってデータベース300に格納された構造化文書およびメタ情報の検索を行い、その検索結果をアプリケーション100に返却する機能と、を有するミドルウェアプログラムが記録され、実行される装置である。
【選択図】 図1Kind Code: A1 A storage search device and storage search that can flexibly cope with addition, change, and deletion of meta information without depending on an application program even if the object-oriented structured document database does not have a function of storing meta information. A method, a storage search program, and a storage search program recording medium are provided.
A storage / retrieval system includes an application, a storage / retrieval device, and an object-oriented structured document database (hereinafter, referred to as a database). The storage / retrieval apparatus 200 has a function of storing the structured document and the meta information passed from the application 100 in the database 300, and a function of storing the structured document and the meta information stored in the database 300 with the path search formula passed from the application 100. And a function of returning a search result to the application 100.
[Selection diagram] Fig. 1
Description
【0001】
【発明の属する技術分野】
本発明は、構造化文書を格納し、検索するコンピュータシステムに用いられるミドルウェアに関し、特に、メタ情報を格納する機能を持たないオブジェクト指向データベースに対して構造化文書およびメタ情報を格納し、検索するミドルウェアに関する。
【0002】
【従来の技術】
近年、XML(eXtensible Markup Language)をはじめとする構造化文書が、インターネット上の様々な情報共有のためのデータフォーマットとして、利用されるようになっている。XMLは、1997年12月に、標準化団体W3C(World Wide Web Consorium)により標準化された構造化文書の規格の一種である。このXML規格に沿って書かれたデータをXML文書と呼ぶ。
【0003】
XML文書は、人が解読・編集可能な文書である。しかし、同時に、XML文書は、タグを用いて構造化されており、コンピュータプログラムが、容易に処理することが可能なデータでもある。XML文書のタグは、見かけは文書中に埋めこまれた「<」と「>」で囲まれた文字列である。タグには、開始タグと終了タグがあり、開始タグと終了タグで囲まれた領域を要素と呼ぶ。要素は、複数の子要素を持ち、それぞれの子要素が複数の孫要素を持つというように、入れ子状に記述できる。そのため、XML文書は、多段階の木構造を表現することができる。
【0004】
現在、XML文書によって表現される情報は、多岐に渡り、XML規格にタグの付け方の規則を規定することで、特定の用途への応用が行われている。例えば、企業間連携のためのRosettaNet(http://www.rosettanet.gr.jp/)やebXML(http://www.ebxml.org/)、リソース情報記述のためのRDF(Resource Definition Framework,http://www.w3.org/RDF/)、マルチメデイア情報記述のためのSVG(Scalable Vector Graphics)やSMIL(Synchronized Multimedia Integration Language)などがある。上記の特定用途のXML文書を利用するシステムは、それぞれのシステムが処理すべきXML文書であることを確認するために、XML用のスキーマ言語(XML Schema, http://www.w3.org/XML/Schema)を用いて検証を行い、規定外のXML文書を排除することで、処理対象のXML文書のみに処理を注力することができる。
【0005】
XML文書をコンピュータプログラムが処理する際には、XML文書が表現する木構造をコンピュータメモリ上の木構造に変換した方が便利である。このように、XML文書をコンピュータメモリ上の木構造として表現したものを、DOM(Document Object Model)と呼ぶ。DOMは、同じくW3Cにより標準化されている。DOMは、ノードとリンクよりなるノード・リンクモデルでXML文書を表現する。XML文書の要素は、DOMのノードに相当する。
【0006】
コンピュータメモリ上のDOMデータを処理するシステムを作成する際に、DOMデータ中のノードを指し示す検索式が利用できれば便利である。そのために、同じくW3Cにより、XPath(XML Path Language)という表記方法が標準化されている。XPathのようなパス検索式を用いることで、DOMデータ中の条件に合うノードを指し示すことができる。
【0007】
上記のようなXMLに関する様々な技術の規格化が行われ、様々なコンピュータシステムがXMLをベースとして開発されるようになったため、近年、XML文書を格納するためのデータベースの必要性も増している。XMLを格納するデータベースには、大きく分けて、リレーショナルデータベース、オブジェクト指向データベース、文書データベースの3種類がある。
【0008】
リレーショナルデータベースにXML文書を格納するには、XML文書をリレーショナルデータベースの格納モデルである二次元の表に変換する必要がある。現在、リレーショナルモデルに基づくリレーショナルデータベース管理システム(RDBMS)は、データベース管理システム(DBMS)の主流として、顧客管理データベースや物品管理データベースなどに広く利用されている。従って、信頼性の高いリレーショナルデータベース管理システム(RDBMS)を利用することは容易であるが、XML文書を二次元の表形式に変換するには、元となるXML文書の形式や利用目的を分析し、最適な変換方法を検討し、リレーショナルスキーマを設計する必要がある。そのため、設計・構築コストが高く、大規模なシステム開発には向くが、中小規模のシステム開発には不向きである。
【0009】
オブジェクト指向データベースにXML文書を格納するには、XML文書をそのままデータベースに格納すればよい。これは、オブジェクト指向データベースは、XML文書の基本構造である木構造をオブジェクトの親子関係として、そのままの形で格納することができるからである。そのため、システム開発のコスト低減や、構築期間の短縮が重要な中小規模のシステム開発においては、複雑なスキーマ設計が必要ないという理由から、XML文書を木構造データとしてデータベースに格納し、パス検索式を用いて検索を行うことが可能なオブジェクト指向データベースが盛んに利用されている。なお、以後の説明において、構造化文書を格納するオブジェクト指向データベースをオブジェクト指向構造化文書データベースと呼ぶ。
【0010】
文書データベースにXML文書を格納する際には、構造化文書を文章として格納する。文書データベースは、構造化文書を文章として扱い、自然言語解析を施し、索引付けを行い、データベースに格納するので、文章の類似検索が可能なデータベースである。そのため、文書データベースは、XML文書のうち、文章データを格納する場合に特化して利用されるが、文章を扱うシステム開発以外には、用いられない。
【0011】
オブジェクト指向構造化文書データベースの構造化文書の格納は、図19に示す構造化文書を図20(a)のようなノードとリンクの木構造として表現し、ノードオブジェクトとその間のリンクという形式で保存することで実現されている。尚、図20(b)は図20(a)の表記方法を説明している凡例であるが、これによれば、木構造には、必ずルートノードがあり、構造化文書の要素は要素ノード、属性は属性ノード、文字列はテキストノードとして格納される。
【0012】
オブジェクト指向構造化文書データベースは、このノードとリンクの木構造に対して、木構造取得機能、木構造操作機能、およびパス検索機能の3つの機能を有する。
【0013】
木構造取得機能は、データベースに格納された構造化文書を木構造としてアクセスし、ノード情報を取得する機能である。これにより、データベースクライアントは、木構造を辿り、ノードの情報を取得することができる。また、木構造を辿ることで、元の構造化文書を再構成することができる。例えば、図20(a)に示すノードn002を基点と指定すると、図21に示す部分構造化文書を取り出すことができる。
【0014】
木構造操作機能は、データベースに格納された構造化文書を木構造としてアクセスし、ノード情報を操作する機能である。これにより、データベースクライアントは、基点となるノードを指定し、そのノードへ新しい子ノードの追加を行うことができる。本機能を用いると、構造化文書中に別の構造化文書を、部分構造化文書として埋め込むことができる。例えば、図22に示す部分構造化文書をノードn002の子ノードに追加すると、図23に示す木構造になる。この機能を部分構造化文書挿入と呼ぶ。尚、部分構造化文書挿入については、ルートノード(図23におけるn000)を基点として構造化文書自身の挿入を指定することで、構造化文書の全文書挿入を実現することができる。
【0015】
パス検索機能は、パス検索式により該当するノード群をノード集合として取得する機能である。パスは、複数の要素名や属性名を“/”で区切った文字列で、UNIX(登録商標)OSなどで用いられているディレクトリパスと似た概念であり、構造化文書の木構造を辿る順序を表している。また、パス検索式には、条件式を付加することができる。条件式は、木構造を辿る際に、ノードの絞込みを行うことを指示する。図24は、パス検索式の一例である。この例では、orderノードの子の、bookノードの子の、authorノードを返却することと、priceノードの値が200以上であるbookノードに限ることを表している。図24に示すパス検索式は、ルートノードを基点とし、図23に示すノード集合N={n005}が返却される。
【0016】
以上のように、XML文書のような構造化された文書を格納する必要がある中小規模のデータベースシステムには、オブジェクト指向データベースが適している。
【0017】
尚、この出願に関連する先行技術文献情報としては、次のものがある。
【0018】
【特許文献1】
特開2001−331479
【0019】
【発明が解決しようとする課題】
ところで、従来、オブジェクト指向データベースとアプリケーションプログラムを用いてコンピュータシステムを開発する際には、XML文書のような構造化文書に文書外追加情報(例えば、XML文書の作成者、日付、更新履歴など。以下、これをメタ情報と呼ぶ)を付加して、オブジェクト指向データベースに格納する場合が多い。このような場合には、元となるXML文書のスキーマに任意の構造を付加する機能があるため、XML文書のスキーマにメタ情報を追加するという方法で対応していた。
【0020】
しかしながら、上記の方法においては、オブジェクト指向データベースのスキーマ上では元のXML文書とメタ情報部分は区別されないため、
(1) XML文書をオブジェクト指向データベースに格納する際には、XML文書とメタ情報を結合してから格納する
(2) オブジェクト指向データベースからXML文書を検索する際には、元のXML文書にメタ情報部分が含まれたまま取り出される
という処理が行われることになる。特に(2)については、扱うXML文書がRDFやSMILなど規格化されたXML文書である場合には、メタ情報部分が不正スキーマとしてエラーになるため、規格に合わないXML文書をそのままRDFやSMILなどの処理に使えないという問題が発生する。
【0021】
そのため、通常、アプリケーションが不要な部分であるメタ情報部分を削除し、RDFやSMILの処理で扱えるようにする手段が必要となり、このことから、上記コンピュータシステムの開発においては以下の問題が発生していた。
【0022】
(1) メタ情報の付加および削除処理にアプリケーションが対応する必要があり、開発コストが余計にかかる。
【0023】
(2) メタ情報が増えるとその度にアプリケーションを修正する必要がある。
【0024】
本発明は、上記の事情を鑑みたものであり、オブジェクト指向構造化文書データベースがメタ情報を格納する機能を有しなくても、アプリケーションプログラムに依存せずに、メタ情報の追加・変更・削除に柔軟に対応できる格納検索装置、格納検索方法、格納検索プログラム、および格納検索プログラム記録媒体を提供することを目的とする。
【0025】
【課題を解決するための手段】
上記目的を達成するため、請求項1記載の本発明は、アプリケーションプログラムからの指示に基づいてオブジェクト指向構造化文書データベースにアクセスし、情報処理を行う格納検索装置であって、構造化文書とともに前記オブジェクト指向構造化文書データベースに格納される前記構造化文書のメタ情報のパスに関する情報を記憶する設定情報記憶手段と、前記アプリケーションプログラムからの格納指示のもと受け取った前記構造化文書を前記オブジェクト指向構造化文書データベースに格納するとともに、前記アプリケーションプログラムから受け取ったメタ情報を、前記設定情報記憶手段に記憶されている前記メタ情報のパスに関する情報に従って、格納された前記構造化文書に挿入し、拡張構造化文書として格納する格納手段と、前記アプリケーションプログラムからの検索指示および前記設定情報記憶手段に記憶された前記メタ情報のパスに関する情報に従って、前記オブジェクト指向構造化文書データベースに格納された前記拡張構造化文書から該当する前記構造化文書又は前記メタ情報を分離して取得する検索手段と、を有することを要旨とする。
【0026】
請求項2記載の本発明は、請求項1記載の発明において、前記検索手段は、前記検索指示であるパス検索式と前記メタ情報のパスに関する情報の比較に基づいて、取得する文書が前記構造化文書か前記メタ情報かを判定し、判定した結果が構造化文書である場合には、取得した文書から前記格納手段で挿入した前記メタ情報を取り除くことを要旨とする。
【0027】
請求項3記載の本発明は、アプリケーションプログラムからの指示に基づいてオブジェクト指向構造化文書データベースにアクセスし、情報処理を行う格納検索装置の格納検索方法であって、構造化文書とともに前記オブジェクト指向構造化文書データベースに格納される前記構造化文書のメタ情報のパスに関する情報を記憶する設定情報記憶ステップと、前記アプリケーションプログラムからの格納指示のもと受け取った前記構造化文書を前記オブジェクト指向構造化文書データベースに格納するとともに、前記アプリケーションプログラムから受け取ったメタ情報を、前記設定情報記憶ステップで記憶した前記メタ情報のパスに関する情報に従って、格納された前記構造化文書に挿入し、拡張構造化文書として格納する格納ステップと、前記アプリケーションプログラムからの検索指示および前記設定情報記憶ステップで記憶した前記メタ情報のパスに関する情報に従って、前記オブジェクト指向構造化文書データベースに格納された前記拡張構造化文書から該当する前記構造化文書又は前記メタ情報を分離して取得する検索ステップと、を有することを要旨とする。
【0028】
請求項4記載の本発明は、請求項3記載の発明において、前記検索ステップは、前記検索指示であるパス検索式と前記メタ情報のパスに関する情報の比較に基づいて、取得する文書が前記構造化文書か前記メタ情報かを判定し、判定した結果が構造化文書である場合には、取得した文書から前記格納ステップで挿入した前記メタ情報を取り除くことを要旨とする。
【0029】
請求項5記載の本発明は、請求項3又は4に記載の格納検索装置に前記各ステップを実行させる格納検索プログラムであることを要旨とする。
【0030】
請求項6記載の本発明は、請求項5に記載された格納検索プログラムをコンピュータ読み取り可能な記録媒体に記録している格納検索プログラム記録媒体であることを要旨とする。
【0031】
【発明の実施の形態】
以下、図面を用いて本発明の実施の形態について説明する。
【0032】
図1は本発明の実施形態に係る格納・検索システム1の概略構成図である。図1に示す格納・検索システム1は、アプリケーション100、格納・検索装置200、オブジェクト指向構造化文書データベース(以下、データベースと呼ぶ)300を備えている。尚、格納・検索システム1は、構成としては、一つからなる装置、各構成要素が分散されて複数の装置がネットワーク接続されたシステムなどのいずれの構成であっても良い。
【0033】
アプリケーション100は、格納・検索装置200を利用するアプリケーションプログラムであり、その処理の中で構造化文書をデータベースに格納し、構造化文書を検索することを必要とするアプリケーションプログラムである。ここで、構造化文書を検索するために用いる検索式は上述したパス検索式である。
【0034】
格納・検索装置200は、アプリケーション100から渡された構造化文書およびメタ情報をデータベース300に格納する機能と、アプリケーション100から渡されたパス検索式をもってデータベース300に格納された構造化文書およびメタ情報の検索を行い、その検索結果をアプリケーション100に返却する機能と、を有するミドルウェアプログラムが記録され、実行される装置である。
【0035】
データベース300は、構造化文書を格納するオブジェクト指向構造化文書データベースであり、上述した木構造取得機能、木構造操作機能、およびパス検索機能の3つの機能を有する。
【0036】
さらに詳しくは、格納・検索装置200は、制御装置201、設定情報辞書202、格納装置203および、検索装置204を備えている。
【0037】
制御装置201は、アプリケーション100からパス検索式を受け取ると、他の装置202乃至204を制御し、アプリケーション100に検索結果を返却するようになっている。
【0038】
設定情報辞書202は、格納・検索装置200の動作を決定する設定情報を格納する辞書である。
【0039】
格納装置203は、制御装置201から構造化文書およびメタ情報を受け取り、データベース300に格納するようになっている。
【0040】
検索装置204は、制御装置201からパス検索式を受け取り、データベース300に対し検索を実行し、返却結果を制御装置201に返却するようになっている。
【0041】
尚、設定情報辞書202に格納される設定情報には、データベース300に格納する構造化文書に対して、どの位置にメタ情報を付加するかを示すメタ情報パスPが含まれている。
【0042】
次に、本実施の形態に係る格納・検索システム1の動作を図2乃至5を用いて説明する。ここで、図2は、格納・検索システム1の処理手順を示すフローチャート図である。図3乃至5は、図2の各ステップS100、S200、およびS300を詳細に説明するフローチャート図である。
【0043】
図2に示すように、格納・検索システム1は、まず、辞書の設定を行い、次に、アプリケーション100からの指示により、構造化文書の格納もしくは、構造化文書の検索を行う(ステップS100〜S400)。尚、複数の構造化文書を処理する場合においては、ステップS100をはじめに一度だけ行い、以降は個々の構造化文書について任意の順序でステップS200およびステップS300を繰り返し行う。
【0044】
ここで、上述の各ステップについて説明する。まず、図3を用いて辞書の設定ステップS100について説明する。
【0045】
ユーザは、上述したメタ情報パスPの一覧であるメタ情報パス集合P1−nを生成し(ステップS101)、生成したメタ情報パス集合P1−nを設定情報辞書202に対し設定入力する(ステップS102)。
【0046】
次に、図4を用いて構造化文書の格納ステップS200について説明する。
【0047】
アプリケーション100は、格納する構造化文書Dとメタ情報集合M1−nを生成し、制御装置201に入力し、構造化文書格納を指示する(ステップS201)。なお、メタ情報Miは、パスPiに対応するメタ情報である。
【0048】
制御装置201は、ステップS201で入力された構造化文書Dを、格納装置203に入力し、構造化文書の格納を指示する(ステップS202)。
【0049】
格納装置203は、ステップS202で入力された構造化文書Dをデータベース300に入力し、全文書挿入を指示する(ステップS203)。
【0050】
データベース300は、ステップS203で入力され指示された構造化文書Dを用いて、全文書挿入を実行する(ステップS204)。
【0051】
次に、制御装置201は、ステップS201で入力されたメタ情報集合M1−n、および設定情報辞書202より取り出したメタ情報パス集合P1−nを格納装置203に入力し、メタ情報格納を指示する(ステップS205)。
【0052】
格納装置203は、ステップS205で入力されたメタ情報Miをメタ情報パスPiに従ってデータベース300に入力し、部分構造化文書挿入を指示する(ステップS206)。
【0053】
データベース300は、ステップS206で入力され指示されたメタ情報Mi、およびメタ情報パスPiに基づいて部分構造化文書挿入を実行する(ステップS207)。この際、メタ情報パスPiの指し示す位置にメタ情報Miを挿入する。
【0054】
次に、図5を用いて構造化文書の検索ステップS300について説明する。
【0055】
アプリケーション100は、データベース300より構造化文書またはメタ情報を取得するためのパス検索式Qを生成する(ステップS301)。この際、パス検索式Qの条件に、構造化文書Dおよびメタ情報集合M1−nを指し示すパスを指定することができる。
【0056】
アプリケーション100は、ステップS301で生成したパス検索式Qを制御装置201に入力し、検索実行を指示する(ステップS302)。
【0057】
制御装置201は、ステップS302で入力されたパス検索式Qを検索装置204に入力し、検索実行を指示する(ステップS303)。
【0058】
検索装置204は、ステップS303で入力されたパス検索式Qをデータベース300に入力し、検索実行を指示すると、データベース300は、検索を実行し、検索装置204にノード集合N1−mを返却する(ステップS304)。
【0059】
検索装置204は、ステップS304で返却されたノード集合N1−mを、制御装置201に返却する(ステップS305)。
【0060】
制御装置201は、設定情報辞書202よりメタ情報パス集合P1−nを取得し、該メタ情報パス集合P1−nと、パス検索式Qから条件を除いたパスPQと、を比較する(ステップS306)。これは、具体的には、メタ情報パス集合P1−n中の全てのメタ情報パスPkについて、パスPQがメタ情報パスPk自身またはその子孫ノードを指し示すかどうかで判定するものである。パスPQがメタ情報パスPk自身またはその子孫ノードを指し示さない場合には、パス検索式Qは構造化文書Dの部分構造化文書集合を指し示すものとみなし、ステップS308を実行する。これに対して、パスPQがメタ情報パスPk自身またはその子孫ノードを指し示す場合には、パス検索式Qはメタ情報集合M1−nの部分構造化文書集合を指し示すものとみなし、ステップS309を実行する(ステップS307)。
【0061】
パスPQがメタ情報パスPk自身またはその子孫ノードを指し示さない場合には、制御装置201は、ステップS305で返却されたノード集合N1−mの個々のノードNjについて、部分構造化文書取得を実行する(ステップS308)。部分構造化文書取得は、ノードNj以下の子孫ノードを全て取得し、構造化文書に組み立てることで行う。ただし、この際、設定情報辞書202より、メタ情報パス集合P1−nを取得し、これらのパスに該当するノードに関しては取得しない。これにより生成されるノードNjを頂点とする部分構造化文書を部分構造化文書Ejとする。最終的に、ノード集合N1−mの全てのノードについて部分構造化文書を生成し、部分構造化文書集合E1−mを得る。
【0062】
これに対して、パスPQがメタ情報パスPk自身またはその子孫ノードを指し示す場合には、制御装置201は、ステップS305で返却されたノード集合N1−mの個々のノードNjについて、部分構造化文書取得を実行する(ステップS309)。部分構造化文書取得は、ノードNj以下の子孫ノードを全て取得し、構造化文書に組み立てることで行う。これにより生成されるノードNjを頂点とする部分構造化文書を部分構造化文書Ejとする。最終的に、ノード集合N1−mの全てのノードについて、部分構造化文書を生成し、部分構造化文書集合E1−mを得る。
【0063】
制御装置201は、ステップS308又はS309で生成した部分構造化文書集合E1−mをアプリケーション100に返却する(ステップS310)。
【0064】
次に、具体的に、構造化文書としてXML(eXtensible Markup Language)、データベース300は、パス検索式としてXPath(XML Path Language)をサポートするデータベース(以下、XML DBと呼ぶ)を用いた場合の格納・検索システム1について説明する。
【0065】
この格納・検索システム1は、上述した図2のフローチャートに示す動作を行う。ここで、実際に処理においては、アプリケーション100の利用目的とユーザの操作に応じて、任意の順序でステップS200およびS300を必要回数繰り返すが、説明上、ステップS100乃至S300を1度のみ行うものとする。
【0066】
まず、図3を用いて辞書の設定ステップS100について説明する。
【0067】
ユーザは、設定情報辞書202に対して、図6に示すメタ情報パスP1およびP2の一覧であるメタ情報パス集合P1−2を生成する(ステップS101)。
【0068】
そして、ユーザは、ステップS101で生成したメタ情報パス集合P1−2を、設定情報辞書202に対し設定する(ステップS102)。
【0069】
次に、図4を用いて構造化文書の格納ステップS200について説明する。
【0070】
アプリケーション100は、図7に示す構造化文書Dと、図8に示すメタ情報集合M1−2を生成し、制御装置201に入力し、構造化文書格納を指示する(ステップS201)。なお、メタ情報Mi(i=1,2)は、パスPi(i=1,2)に対応するメタ情報である。
【0071】
制御装置201は、ステップS201で入力された構造化文書Dを、格納装置203に入力し、構造化文書の格納を指示する(ステップS202)。
【0072】
格納装置203は、ステップS202で入力された構造化文書Dをデータベース300に入力し、全文書挿入を指示する(ステップS203)。
【0073】
データベース300は、ステップS203で入力され指示された構造化文書Dを用いて、全文書挿入を実行する(ステップS204)。格納された構造化文書Dのデータベース内での構造を図9に示す。
【0074】
制御装置201は、ステップS201で入力されたメタ情報集合M1−2、および設定情報辞書202より取り出されたメタ情報パス集合P1−2を格納装置203に入力し、メタ情報格納を指示する(ステップS205)。
【0075】
格納装置203は、ステップS205で入力されたメタ情報Miをメタ情報パスPiに従って、データベース300に入力し、部分構造化文書挿入を指示する(ステップS206)。
【0076】
データベース300は、ステップS206で入力され指示されたメタ情報Mi、およびメタ情報パスPiに基づいて部分構造化文書挿入を実行する(ステップS207)。この際、メタ情報パスPiの指し示す位置にメタ情報Miを挿入する。挿入された構造化文書Dとメタ情報集合M1−2のデータベース内での構造を図10に示す。図10においては、メタ情報パスP1の示すn006の位置にメタ情報M1が、メタ情報パスP2の示すn007の位置にメタ情報M2が挿入されている。
【0077】
次に、図5を用いて構造化文書の検索ステップS300について説明する。
【0078】
アプリケーション100は、データベース300より構造化文書を取得するための図11に示すパス検索式Qを生成する(ステップS301)。図11に示すパス検索式Qは、条件としてメタ情報を指定し(メタ情報であるfilename属性が‘homepage1.xml’であるもの)、構造化文書Dの部分構造化文書取得を表している(パス“/RDF”配下の部分構造化文書を取得)。
【0079】
アプリケーション100は、ステップS301で生成したパス検索式Qを制御装置201に入力し、検索実行を指示する(ステップS302)。
【0080】
制御装置201は、ステップS302で入力されたパス検索式Qを検索装置204に入力し、検索実行を指示する(ステップS303)。
【0081】
検索装置204は、ステップS303で入力されたパス検索式Qをデータベース300に入力し、検索実行を指示すると、データベース300は、検索を実行し、検索装置204にノード集合N1−mを返却する(ステップS304)。返却されるノード集合N1−m(m=1であり、N1)を図12に示す。
【0082】
検索装置204は、ステップS304で返却されたノード集合N1を、制御装置201に返却する(ステップS305)。
【0083】
制御装置201は、設定情報辞書202より、メタ情報パス集合P1−2を取得し、パス検索式Qから条件を除いたパスPQと比較する(ステップS306)。この例におけるパスPQを図13に示す。パスPQが指し示すパスはルートノードの子ノードの“RDF”ノードである。メタ情報パス集合P1−2中の全てのメタ情報パスPkについて、パスPQが指し示すノードが、メタ情報パスPk自身かその子孫ノードであるようなメタ情報パスPkが存在しないので、パス検索式Qは構造化文書Dの部分構造化文書集合を返却するものとみなしステップS308を実行する(ステップS307)。
【0084】
制御装置201は、ステップS305で返却されたノード集合N1のノードN1について、部分構造化文書取得を実行する(ステップS308)。部分構造化文書取得は、ノードN1以下の子孫ノードを全て取得し、構造化文書に組み立てることで行う。ただし、この際、設定情報辞書202より、図6に示すメタ情報パス集合P1−2を取得し、これらのパスに該当するノードは取得しない。これにより生成されるノードN1を頂点とする部分構造化文書を部分構造化文書E1とする。この具体例においては、ノード集合N1のノードはノードN1だけであるので、ノードN1より部分構造化文書集合E1を得る。図14に生成される部分構造化文書集合E1を示す。この時、データベース300内の木構造に付加されていたメタ情報は、部分構造化文書集合E1には付加されず、元の構造化文書Dに含まれている要素だけが出力される。
【0085】
制御装置201は、ステップS308で生成した部分構造化文書集合E1をアプリケーション100に返却する(ステップS310)。
【0086】
次に、ステップS307において、パス検索式Qがメタ情報を取得する場合の処理を以下に示す。
【0087】
アプリケーション100は、データベース300より構造化文書を取得するための図15に示すパス検索式Q’を生成する(ステップS301)。パス検索式Q’は、条件として構造化文書を指定し(構造化文書の“/RDF/Description/dc:creator”要素が‘春日’であるもの)、メタ情報の部分構造化文書取得を表している(パス“/RDF/change_log/log”配下の部分構造化文書を取得)。
【0088】
アプリケーション100は、ステップS301で生成したパス検索式Q’を制御装置201に入力し、検索実行を指示する(ステップS302)。
【0089】
制御装置201は、ステップS302で入力されたパス検索式Q’を検索装置204に入力し、検索実行を指示する(ステップS303)。
【0090】
検索装置204は、ステップS303で入力されたパス検索式Q’をデータベース300に入力し、検索実行を指示する(ステップS304)。データベース300は、検索を実行し、検索装置204にノード集合N’1−mを返却する。返却されるノード集合N’1−m(m=1であり、N’1)を図16に示す。
【0091】
検索装置204は、ステップS304で返却されたノード集合N’1を制御装置201に返却する(ステップS305)。
【0092】
制御装置201は、設定情報辞書202よりメタ情報パス集合P1−2を取得し、パス検索式Qから条件を除いたパスPQ ’と比較する(ステップS306)。この例におけるパスPQ ’を図17に示す。パスPQが指し示すパスはメタ情報集合M2の子ノードの“log”ノードである。メタ情報パス集合P1−2中の全てのメタ情報パスPkについて、パスPQが指し示すノードが、メタ情報パスPk自身かその子孫ノードであるようなメタ情報パスPkが存在する(「メタ情報パスP2」が該当)ので、パス検索式Q’はメタ情報集合M1−2の部分構造化文書集合を返却するものとみなしステップS309を実行する(ステップS307)。
【0093】
制御装置201は、ステップS305で返却されたノード集合N’1のノードN’1について、部分構造化文書取得を実行する(ステップS309)。部分構造化文書取得は、ノードN’1以下の子孫ノードを全て取得し、構造化文書に組み立てることで行う。これにより生成されるノードN’1を頂点とする部分構造化文書を部分構造化文書E’1とする。この具体例においては、ノード集合N’1−のノードはノードN’1だけであるので、ノードN’1より部分構造化文書集合E’1を得る。図18に生成される部分構造化文書集合E’1を示す。
【0094】
制御装置201は、ステップS309で生成した部分構造化文書集合E’1をアプリケーション100に返却する(ステップS310)。
【0095】
従って、本実施の形態の格納・検索システム1によれば、メタ情報を格納する機能のないデータベース300とアプリケーション100の間に、ミドルウェアとしての格納・検索装置200を用いることで、アプリケーション100に依存せずに、メタ情報の追加・変更・削除に柔軟に対応することができるので、システム設計・開発の利便性の向上を図ることができる。
【0096】
具体的には、オブジェクト指向構造化文書データベースに構造化文書を格納する際には、メタ情報を合わせて格納することができ、構造化文書を検索する際には、構造化文書とメタ情報を別々に取得することができる。また、構造化文書を取得する際には、メタ情報を条件として検索することが可能となり、メタ情報を取得する際には、構造化文書を条件として検索することが可能となる。
尚、上記実施の形態の格納・検索装置200に格納されたミドルウェアプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD−ROMなどのコンピュータ読み取り可能な記録媒体に記録することも、通信ネットワークを介して配信することも可能である。
【0097】
【発明の効果】
以上説明したように、本発明によれば、オブジェクト指向構造化文書データベースがメタ情報を格納する機能を有しなくても、アプリケーションプログラムに依存せずに、メタ情報の追加・変更・削除に柔軟に対応できる格納検索装置、格納検索方法、格納検索プログラム、および格納検索プログラム記録媒体を提供することができる。
【0098】
これにより、メタ情報を格納する機能を有しないオブジェクト指向構造化文書データベースを利用して、構造化文書およびメタ情報を格納・検索するコンピュータシステムのシステム開発コストを低減させることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る格納・検索システムの概略構成図である。
【図2】本発明の実施の形態に係る格納・検索システムの動作を示すフローチャートである
【図3】本発明の実施の形態に係る格納・検索システムの辞書の設定動作を示すフローチャートである。
【図4】本発明の実施の形態に係る格納・検索システムの構造化文書の格納動作を示すフローチャートである。
【図5】本発明の実施の形態に係る格納・検索システムの構造化文書の検索動作を示すフローチャートである。
【図6】メタ情報パスの一例である。
【図7】構造化文書の一例である。
【図8】メタ情報の一例である。
【図9】オブジェクト指向構造化文書データベースに格納された構造化文書の一例である。
【図10】オブジェクト指向構造化文書データベースに格納された構造化文書の一例である。
【図11】パス検索式の一例である。
【図12】ノード集合の一例である。
【図13】パスの一例である。
【図14】部分構造化文書の一例である。
【図15】パス検索式の一例である。
【図16】ノード集合の一例である。
【図17】パスの一例である。
【図18】部分構造化文書の一例である。
【図19】構造化文書の一例である。
【図20】オブジェクト指向構造化文書データベースに格納された構造化文書の一例である。
【図21】取り出された部分構造化文書の一例である。
【図22】挿入する部分構造化文書の一例である。
【図23】挿入後のオブジェクト指向構造化文書データベースに格納された構造化文書の一例である。
【図24】パス検索式の一例である。
【符号の説明】
1 格納・検索システム
100 アプリケーション
200 格納・検索装置
201 制御装置
202 設定情報辞書
203 格納装置
204 検索装置
300 オブジェクト指向構造化データベース[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to middleware used in a computer system for storing and retrieving structured documents, and more particularly, for storing and retrieving structured documents and meta information in an object-oriented database having no function of storing meta information. Regarding middleware.
[0002]
[Prior art]
In recent years, structured documents such as XML (extensible Markup Language) have been used as data formats for sharing various information on the Internet. XML is a type of standardized structured document standardized in December 1997 by the standardization organization W3C (World Wide Web Consortium). Data written in accordance with the XML standard is called an XML document.
[0003]
An XML document is a document that can be decrypted and edited by a person. However, at the same time, the XML document is structured using tags, and is data that can be easily processed by a computer program. The tag of the XML document is a character string apparently surrounded by “<” and “>” embedded in the document. The tag has a start tag and an end tag, and an area surrounded by the start tag and the end tag is called an element. An element can be nested, such as having multiple child elements, each child element having multiple grandchild elements. Therefore, the XML document can represent a multi-stage tree structure.
[0004]
At present, information represented by an XML document is diversified, and is applied to a specific application by defining rules for tagging in the XML standard. For example, RosettaNet (http://www.rosettanet.gr.jp/) and ebXML (http://www.ebxml.org/) for cooperation between companies, RDF (Resource Definition Framework, RDF for describing resource information) http://www.w3.org/RDF/), SVG (Scalable Vector Graphics) for describing multimedia information, SMIL (Synchronized Multimedia Integration Language), and the like. In order to confirm that each system is an XML document to be processed, a system that uses the XML document for a specific purpose described above uses an XML schema language (XML Schema, http://www.w3.org/). By performing verification using XML / Schema) and excluding non-defined XML documents, processing can be focused on only the XML document to be processed.
[0005]
When a computer program processes an XML document, it is more convenient to convert the tree structure represented by the XML document into a tree structure on a computer memory. A representation of an XML document as a tree structure on a computer memory is called a DOM (Document Object Model). DOM is also standardized by W3C. DOM expresses an XML document by a node / link model including nodes and links. Elements of an XML document correspond to DOM nodes.
[0006]
When creating a system for processing DOM data on a computer memory, it is convenient if a search expression that points to a node in the DOM data can be used. For this purpose, a notation called XPath (XML Path Language) is standardized by the W3C. By using a path search formula such as XPath, a node in the DOM data that meets a condition can be indicated.
[0007]
Since various technologies related to XML have been standardized as described above and various computer systems have been developed based on XML, the need for a database for storing XML documents has recently increased. . Databases that store XML are roughly classified into three types: relational databases, object-oriented databases, and document databases.
[0008]
In order to store an XML document in a relational database, it is necessary to convert the XML document into a two-dimensional table which is a storage model of the relational database. At present, a relational database management system (RDBMS) based on a relational model is widely used as a mainstream database management system (DBMS) for a customer management database, an article management database, and the like. Therefore, it is easy to use a highly reliable relational database management system (RDBMS). However, in order to convert an XML document into a two-dimensional table format, the format and purpose of use of the original XML document must be analyzed. It is necessary to consider the optimal conversion method and design a relational schema. Therefore, the design and construction costs are high and suitable for large-scale system development, but unsuitable for small- and medium-scale system development.
[0009]
To store an XML document in the object-oriented database, the XML document may be stored in the database as it is. This is because the object-oriented database can store the tree structure, which is the basic structure of the XML document, as it is as the parent-child relationship of the objects. Therefore, in the development of small- and medium-sized systems in which it is important to reduce the cost of system development and shorten the construction period, XML documents are stored in a database as tree-structured data in a database, since a complex schema design is not required. An object-oriented database that can perform a search by using is widely used. In the following description, an object-oriented database that stores structured documents is called an object-oriented structured document database.
[0010]
When storing an XML document in the document database, the structured document is stored as a sentence. The document database is a database that treats structured documents as sentences, performs natural language analysis, performs indexing, and stores the documents in the database, so that similarity search of sentences is possible. Therefore, the document database is used specifically for storing text data in the XML document, but is not used except for the system development that handles text.
[0011]
In the storage of the structured document in the object-oriented structured document database, the structured document shown in FIG. 19 is expressed as a tree structure of nodes and links as shown in FIG. 20A, and is stored in the form of node objects and links between them. It is realized by doing. 20B is a legend explaining the notation method of FIG. 20A. According to this, the tree structure always has a root node, and the element of the structured document is an element node. , Attributes are stored as attribute nodes, and character strings are stored as text nodes.
[0012]
The object-oriented structured document database has three functions of a tree structure acquisition function, a tree structure operation function, and a path search function for the tree structure of the nodes and links.
[0013]
The tree structure acquisition function is a function of accessing a structured document stored in a database as a tree structure and acquiring node information. This allows the database client to follow the tree structure and acquire node information. By tracing the tree structure, the original structured document can be reconstructed. For example, the node n shown in FIG.002Is designated as the base point, the partially structured document shown in FIG. 21 can be extracted.
[0014]
The tree structure operation function is a function of accessing a structured document stored in the database as a tree structure and operating node information. As a result, the database client can specify a base node and add a new child node to the specified node. By using this function, another structured document can be embedded as a partially structured document in the structured document. For example, the partially structured document shown in FIG.002When it is added to the child node of, the tree structure shown in FIG. 23 is obtained. This function is called partially structured document insertion. Note that the insertion of a partially structured document is performed using the root node (n in FIG. 23).000By designating the insertion of the structured document itself on the basis of ()), it is possible to insert all the documents of the structured document.
[0015]
The path search function is a function of acquiring a corresponding node group as a node set by a path search formula. A path is a character string in which a plurality of element names and attribute names are separated by “/”, and is a concept similar to a directory path used in a UNIX (registered trademark) OS or the like, and follows a tree structure of a structured document. Represents an order. Further, a conditional expression can be added to the path search expression. The conditional expression indicates that nodes should be narrowed down when tracing the tree structure. FIG. 24 is an example of a path search formula. In this example, it is shown that an author node, which is a child of the order node, a child of the book node, is returned, and that the value of the price node is limited to a book node whose value is 200 or more. The path search formula shown in FIG. 24 is based on the root node, and the node set N = {n shown in FIG.005} Is returned.
[0016]
As described above, an object-oriented database is suitable for a small- to medium-sized database system that needs to store a structured document such as an XML document.
[0017]
Prior art document information related to this application includes the following.
[0018]
[Patent Document 1]
JP-A-2001-331479
[0019]
[Problems to be solved by the invention]
By the way, conventionally, when a computer system is developed using an object-oriented database and an application program, additional information outside the document (for example, creator, date, update history, etc. of the XML document) is added to a structured document such as an XML document. Hereinafter, this is referred to as meta information) and stored in an object-oriented database in many cases. In such a case, since there is a function of adding an arbitrary structure to the schema of the original XML document, a method of adding meta information to the schema of the XML document has been used.
[0020]
However, in the above method, the original XML document and the meta information portion are not distinguished on the schema of the object-oriented database.
(1) When storing an XML document in an object-oriented database, the XML document and the meta information are combined and then stored.
(2) When retrieving an XML document from an object-oriented database, the original XML document is extracted with the meta information part included.
Is performed. In particular, regarding (2), if the XML document to be handled is a standardized XML document such as RDF or SMIL, an error occurs in the meta information part as an invalid schema. The problem that it cannot be used for such processing occurs.
[0021]
For this reason, it is usually necessary to provide a means for deleting the meta information portion, which is an unnecessary portion of the application, so that the application can handle the meta information portion in the RDF or SMIL processing. As a result, the following problems occur in the development of the computer system. I was
[0022]
(1) The application needs to cope with the addition and deletion of the meta information, and the development cost is increased.
[0023]
(2) It is necessary to modify the application each time the meta information increases.
[0024]
The present invention has been made in view of the above circumstances, and even if an object-oriented structured document database does not have a function of storing meta information, the addition, change, and deletion of meta information can be performed without depending on an application program. It is an object of the present invention to provide a storage search device, a storage search method, a storage search program, and a storage search program recording medium that can flexibly cope with the following.
[0025]
[Means for Solving the Problems]
In order to achieve the above object, the present invention according to
[0026]
According to a second aspect of the present invention, in the first aspect of the present invention, the search unit obtains the document having the structure based on a comparison between a path search expression as the search instruction and information on the path of the meta information. It is determined whether the document is a structured document or the meta information, and if the result of the determination is a structured document, the meta information inserted by the storage unit is removed from the acquired document.
[0027]
The present invention according to claim 3 is a storage and retrieval method of a storage and retrieval device that accesses an object-oriented structured document database based on an instruction from an application program and performs information processing, wherein the object-oriented structure is stored together with a structured document. Setting information storing step of storing information about a path of meta information of the structured document stored in the structured document database; and storing the structured document received under a storage instruction from the application program in the object-oriented structured document. The meta information received from the application program is inserted into the stored structured document according to the information on the path of the meta information stored in the setting information storing step, and is stored as an extended structured document. Storing step; According to a search instruction from the application program and information on the path of the meta information stored in the setting information storage step, the structured document or the extended structured document corresponding to the extended structured document stored in the object-oriented structured document database. And a search step of separating and acquiring the meta information.
[0028]
According to a fourth aspect of the present invention, in the third aspect of the present invention, in the searching step, based on a comparison between a path search expression as the search instruction and information on the path of the meta information, the document to be obtained has the structure It is determined whether the meta information is a structured document or the meta information, and if the result of the determination is a structured document, the meta information inserted in the storing step is removed from the acquired document.
[0029]
According to a fifth aspect of the present invention, there is provided a storage and retrieval program for causing the storage and retrieval device according to the third or fourth aspect to execute the above-described steps.
[0030]
According to a sixth aspect of the present invention, there is provided a storage and retrieval program recording medium which records the storage and retrieval program according to the fifth aspect on a computer-readable recording medium.
[0031]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0032]
FIG. 1 is a schematic configuration diagram of a storage and
[0033]
The
[0034]
The storage /
[0035]
The
[0036]
More specifically, the storage /
[0037]
When receiving the path search formula from the
[0038]
The setting
[0039]
The
[0040]
The
[0041]
Note that the setting information stored in the setting
[0042]
Next, the operation of the storage and
[0043]
As shown in FIG. 2, the storage /
[0044]
Here, each of the above steps will be described. First, the dictionary setting step S100 will be described with reference to FIG.
[0045]
The user sets a meta information path set P which is a list of the above meta information paths P.1-nIs generated (step S101), and the generated meta information path set P1-nIs input to the setting information dictionary 202 (step S102).
[0046]
Next, the structured document storage step S200 will be described with reference to FIG.
[0047]
The
[0048]
The
[0049]
The
[0050]
The
[0051]
Next, the
[0052]
The
[0053]
The
[0054]
Next, the structured document search step S300 will be described with reference to FIG.
[0055]
The
[0056]
The
[0057]
The
[0058]
When the
[0059]
The
[0060]
The
[0061]
Pass PQIs the meta information path PkIf the
[0062]
On the other hand, the path PQIs the meta information path PkWhen pointing to itself or its descendant nodes, the
[0063]
The
[0064]
Next, specifically, storage in the case of using an XML (extensible Markup Language) as a structured document and a database (hereinafter, referred to as an XML DB) that supports XPath (XML Path Language) as a path search expression is used. -The
[0065]
This storage /
[0066]
First, the dictionary setting step S100 will be described with reference to FIG.
[0067]
The user inputs the meta information path P shown in FIG.1And P2Meta information path set P that is a list of1-2Is generated (step S101).
[0068]
Then, the user sets the meta information path set P generated in step S101.1-2Is set in the setting information dictionary 202 (step S102).
[0069]
Next, the structured document storage step S200 will be described with reference to FIG.
[0070]
The
[0071]
The
[0072]
The
[0073]
The
[0074]
The
[0075]
The
[0076]
The
[0077]
Next, the structured document search step S300 will be described with reference to FIG.
[0078]
The
[0079]
The
[0080]
The
[0081]
When the
[0082]
The
[0083]
The
[0084]
The
[0085]
The
[0086]
Next, the processing when the path search formula Q acquires meta information in step S307 will be described below.
[0087]
The
[0088]
The
[0089]
The
[0090]
The
[0091]
The
[0092]
The
[0093]
The
[0094]
The
[0095]
Therefore, according to the storage /
[0096]
Specifically, when storing a structured document in the object-oriented structured document database, the meta information can be stored together. When searching the structured document, the structured document and the meta information can be stored. Can be obtained separately. In addition, when acquiring a structured document, it is possible to perform a search using meta information as a condition. When acquiring meta information, it is possible to perform a search using a structured document as a condition.
Note that the middleware program stored in the storage /
[0097]
【The invention's effect】
As described above, according to the present invention, even if the object-oriented structured document database does not have a function of storing meta information, it is possible to flexibly add, change, and delete meta information without depending on an application program. , A storage search method, a storage search program, and a storage medium storing a storage search program.
[0098]
This makes it possible to reduce the system development cost of a computer system that stores and retrieves structured documents and meta information using an object-oriented structured document database that does not have a function of storing meta information.
[Brief description of the drawings]
FIG. 1 is a schematic configuration diagram of a storage / retrieval system according to an embodiment of the present invention.
FIG. 2 is a flowchart showing an operation of the storage / retrieval system according to the embodiment of the present invention;
FIG. 3 is a flowchart showing a dictionary setting operation of the storage / search system according to the embodiment of the present invention.
FIG. 4 is a flowchart showing an operation of storing a structured document in the storage and retrieval system according to the embodiment of the present invention.
FIG. 5 is a flowchart illustrating a structured document search operation of the storage and search system according to the embodiment of the present invention.
FIG. 6 is an example of a meta information path.
FIG. 7 is an example of a structured document.
FIG. 8 is an example of meta information.
FIG. 9 is an example of a structured document stored in an object-oriented structured document database.
FIG. 10 is an example of a structured document stored in an object-oriented structured document database.
FIG. 11 is an example of a path search formula.
FIG. 12 is an example of a node set.
FIG. 13 is an example of a path.
FIG. 14 is an example of a partially structured document.
FIG. 15 is an example of a path search expression.
FIG. 16 is an example of a node set.
FIG. 17 is an example of a path.
FIG. 18 is an example of a partially structured document.
FIG. 19 is an example of a structured document.
FIG. 20 is an example of a structured document stored in an object-oriented structured document database.
FIG. 21 is an example of a retrieved partial structured document.
FIG. 22 is an example of a partially structured document to be inserted.
FIG. 23 is an example of a structured document stored in an object-oriented structured document database after insertion.
FIG. 24 is an example of a path search formula.
[Explanation of symbols]
1 Storage and retrieval system
100 applications
200 storage and retrieval device
201 Control device
202 Setting information dictionary
203 storage device
204 search device
300 Object-Oriented Structured Database
Claims (6)
構造化文書とともに前記オブジェクト指向構造化文書データベースに格納される前記構造化文書のメタ情報のパスに関する情報を記憶する設定情報記憶手段と、
前記アプリケーションプログラムからの格納指示のもと受け取った前記構造化文書を前記オブジェクト指向構造化文書データベースに格納するとともに、前記アプリケーションプログラムから受け取ったメタ情報を、前記設定情報記憶手段に記憶されている前記メタ情報のパスに関する情報に従って、格納された前記構造化文書に挿入し、拡張構造化文書として格納する格納手段と、
前記アプリケーションプログラムからの検索指示および前記設定情報記憶手段に記憶された前記メタ情報のパスに関する情報に従って、前記オブジェクト指向構造化文書データベースに格納された前記拡張構造化文書から該当する前記構造化文書又は前記メタ情報を分離して取得する検索手段と、
を有することを特徴とする格納検索装置。A storage and retrieval device that accesses an object-oriented structured document database based on an instruction from an application program and performs information processing,
Setting information storage means for storing information about a path of meta information of the structured document stored in the object-oriented structured document database together with the structured document;
The structured document received under the storage instruction from the application program is stored in the object-oriented structured document database, and the meta information received from the application program is stored in the setting information storage unit. Storage means for inserting into the stored structured document according to the information on the path of the meta information, and storing as an extended structured document;
According to a search instruction from the application program and information on the path of the meta information stored in the setting information storage unit, the structured document corresponding to the extended structured document stored in the object-oriented structured document database or Search means for separating and acquiring the meta information,
A storage and retrieval device characterized by having:
前記検索指示であるパス検索式と前記メタ情報のパスに関する情報の比較に基づいて、取得する文書が前記構造化文書か前記メタ情報かを判定し、判定した結果が構造化文書である場合には、取得した文書から前記格納手段で挿入した前記メタ情報を取り除くことを特徴とする請求項1記載の格納検索装置。The search means,
Based on a comparison between the path search expression that is the search instruction and the information about the path of the meta information, it is determined whether the document to be obtained is the structured document or the meta information, and when the determined result is a structured document, 2. The storage and retrieval device according to claim 1, wherein said meta information inserted in said storage means is removed from the acquired document.
構造化文書とともに前記オブジェクト指向構造化文書データベースに格納される前記構造化文書のメタ情報のパスに関する情報を記憶する設定情報記憶ステップと、
前記アプリケーションプログラムからの格納指示のもと受け取った前記構造化文書を前記オブジェクト指向構造化文書データベースに格納するとともに、前記アプリケーションプログラムから受け取ったメタ情報を、前記設定情報記憶ステップで記憶した前記メタ情報のパスに関する情報に従って、格納された前記構造化文書に挿入し、拡張構造化文書として格納する格納ステップと、
前記アプリケーションプログラムからの検索指示および前記設定情報記憶ステップで記憶した前記メタ情報のパスに関する情報に従って、前記オブジェクト指向構造化文書データベースに格納された前記拡張構造化文書から該当する前記構造化文書又は前記メタ情報を分離して取得する検索ステップと、
を有することを特徴とする格納検索方法。A storage and retrieval method for a storage and retrieval device that accesses an object-oriented structured document database based on an instruction from an application program and performs information processing,
Setting information storing step of storing information on a path of meta information of the structured document stored in the object-oriented structured document database together with the structured document;
Storing the structured document received under the storage instruction from the application program in the object-oriented structured document database; and storing the meta information received from the application program in the setting information storing step. According to the information on the path of, the storage step of inserting into the stored structured document, and storing as an extended structured document,
According to the search instruction from the application program and the information on the path of the meta information stored in the setting information storing step, the structured document or the extended structured document corresponding to the extended structured document stored in the object-oriented structured document database A search step for separating and obtaining meta information;
A storage retrieval method, comprising:
前記検索指示であるパス検索式と前記メタ情報のパスに関する情報の比較に基づいて、取得する文書が前記構造化文書か前記メタ情報かを判定し、判定した結果が構造化文書である場合には、取得した文書から前記格納ステップで挿入した前記メタ情報を取り除くことを特徴とする請求項3記載の格納検索方法。The search step includes:
Based on a comparison between the path search expression that is the search instruction and the information about the path of the meta information, it is determined whether the document to be obtained is the structured document or the meta information, and when the determined result is a structured document, 4. The storage retrieval method according to claim 3, wherein said step of removing said meta information inserted in said storing step from the acquired document.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003146784A JP4242701B2 (en) | 2003-05-23 | 2003-05-23 | Storage search device, storage search program, and storage search program recording medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003146784A JP4242701B2 (en) | 2003-05-23 | 2003-05-23 | Storage search device, storage search program, and storage search program recording medium |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2004348593A true JP2004348593A (en) | 2004-12-09 |
| JP4242701B2 JP4242701B2 (en) | 2009-03-25 |
Family
ID=33533538
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003146784A Expired - Fee Related JP4242701B2 (en) | 2003-05-23 | 2003-05-23 | Storage search device, storage search program, and storage search program recording medium |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4242701B2 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018120590A (en) * | 2017-01-26 | 2018-08-02 | 雲拓科技有限公司 | Claimed analysis recording device |
| WO2023188049A1 (en) * | 2022-03-30 | 2023-10-05 | 株式会社Robon | Metadata management system, metadata management method, and program |
-
2003
- 2003-05-23 JP JP2003146784A patent/JP4242701B2/en not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018120590A (en) * | 2017-01-26 | 2018-08-02 | 雲拓科技有限公司 | Claimed analysis recording device |
| WO2023188049A1 (en) * | 2022-03-30 | 2023-10-05 | 株式会社Robon | Metadata management system, metadata management method, and program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4242701B2 (en) | 2009-03-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7353222B2 (en) | System and method for the storage, indexing and retrieval of XML documents using relational databases | |
| US7386567B2 (en) | Techniques for changing XML content in a relational database | |
| JP4141556B2 (en) | Structured document management method, apparatus for implementing the method, and medium storing the processing program | |
| US20020147711A1 (en) | Apparatus, method, and program for retrieving structured documents | |
| JP2001167087A (en) | Structured document search device, structured document search method, program recording medium for structured document search, and index creation method for structured document search | |
| JP2008516341A5 (en) | ||
| JPH07319917A (en) | Document data base managing device and document data base system | |
| US7668888B2 (en) | Converting object structures for search engines | |
| JP5121146B2 (en) | Structured document management apparatus, structured document management program, and structured document management method | |
| JPH0830620A (en) | Structure retrieving device | |
| JP2008052662A (en) | Structured document management system and program | |
| JP4247108B2 (en) | Structured document search method, structured document search device, and program | |
| JP2005234837A (en) | Structured document processing method, structured document processing system and program thereof | |
| Milosavljević et al. | Retrieval of bibliographic records using Apache Lucene | |
| CN100498771C (en) | System and method for managing structured document | |
| JP4309818B2 (en) | Structured document management device, search device, storage method, search method, and program | |
| US7953761B2 (en) | System, method, and apparatus for retrieving structured document and apparatus for managing structured document | |
| Kucuk et al. | Application of metadata concepts to discovery of internet resources | |
| Yu et al. | Metadata management system: design and implementation | |
| JP4242701B2 (en) | Storage search device, storage search program, and storage search program recording medium | |
| JP3842576B2 (en) | Structured document editing method and structured document editing system | |
| JP4289022B2 (en) | Structured document processing method and apparatus, structured document processing program, and storage medium storing structured document processing program | |
| JP3842572B2 (en) | Structured document management method, structured document management apparatus and program | |
| JP4786695B2 (en) | Structure conversion device for structured documents | |
| JP3842574B2 (en) | Information extraction method, structured document management apparatus and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050725 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081021 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081125 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081216 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081225 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120109 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130109 Year of fee payment: 4 |
|
| LAPS | Cancellation because of no payment of annual fees |