JP2009075777A - 文書処理システム及び方法 - Google Patents
文書処理システム及び方法 Download PDFInfo
- Publication number
- JP2009075777A JP2009075777A JP2007243002A JP2007243002A JP2009075777A JP 2009075777 A JP2009075777 A JP 2009075777A JP 2007243002 A JP2007243002 A JP 2007243002A JP 2007243002 A JP2007243002 A JP 2007243002A JP 2009075777 A JP2009075777 A JP 2009075777A
- Authority
- JP
- Japan
- Prior art keywords
- document
- graph structure
- node
- peripheral
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title description 30
- 230000002093 peripheral effect Effects 0.000 claims abstract description 147
- 230000006870 function Effects 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims 3
- 238000000547 structure data Methods 0.000 description 101
- 230000008569 process Effects 0.000 description 25
- 230000007704 transition Effects 0.000 description 12
- 230000000295 complement effect Effects 0.000 description 10
- 238000002910 structure generation Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 239000000470 constituent Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】一方の文書から他方の文書を参照しているが、他方の文書から一方の文書を参照していない場合でも、一方の文書を表すノードと他方の文書を表すノードとの間を双方向に辿ることができるグラフ構造を提供する。
【解決手段】他の文書への参照情報を含む複数の文書のそれぞれについて、該文書に対応する中心ノードと、該文書に前記参照情報によりリンクされている他の文書に対応する周辺ノードとを含み、前記中心ノードは該文書を表すノード名を有し、前記周辺ノードは該他の文書を表すノード名を有するグラフ構造を生成することにより、前記複数の文書のそれぞれに対応する複数のグラフ構造を求め、前記複数のグラフ構造のうちの第1のグラフ構造中の第1の周辺ノードに対応する第1の文書を中心ノードとして含み、前記第1のグラフ構造の中心ノードに対応する第2の文書が周辺ノードとして含まれていない第2のグラフ構造に、前記第2の文書を表すノード名を有する第2の周辺ノードを追加する。
【選択図】図1
【解決手段】他の文書への参照情報を含む複数の文書のそれぞれについて、該文書に対応する中心ノードと、該文書に前記参照情報によりリンクされている他の文書に対応する周辺ノードとを含み、前記中心ノードは該文書を表すノード名を有し、前記周辺ノードは該他の文書を表すノード名を有するグラフ構造を生成することにより、前記複数の文書のそれぞれに対応する複数のグラフ構造を求め、前記複数のグラフ構造のうちの第1のグラフ構造中の第1の周辺ノードに対応する第1の文書を中心ノードとして含み、前記第1のグラフ構造の中心ノードに対応する第2の文書が周辺ノードとして含まれていない第2のグラフ構造に、前記第2の文書を表すノード名を有する第2の周辺ノードを追加する。
【選択図】図1
Description
本発明は、文書間の参照関係を表すグラフ構造を生成及び表示するための文書処理システムに関する。
近年、World Wide Web、Wikipedia(登録商標)やWeblogのように、互いに参照関係を持つ電子化された文書データは増える一方である。
文書間の参照関係をユーザにわかりやすく表示する方法として、各文書をノード、文書間の参照関係をグラフ表現により図示する方法が知られている。
例えば、特許文献1では、ユーザにクリッカブルなノードから構成されるグラフ構造を提示し、ユーザが着目しクリックしたノード(「フォーカス」エンティティ)をグラフの中央に再配置し、そのノードの詳細情報を画面上に展開する技術が開示されている。
また、非特許文献1では、インターネットのユーザであれば誰もが書き込める百科辞典であるWikipediaの機能を拡張し、例えば「ロンドンというテキストと、イングランドというテキスト間の関係は、"is capital of"という関係で結ばれる」という知識を、イングランドというテキスト中に執筆者に明示的に記述させる枠組みが提案されており、これに基づくグラフ表示の例が図示されている。
参照情報をもつ文書を少ない計算量でグラフ表示する方法としては、単一の文書を解析して、この文書を中心ノード(「フォーカス」エンティティ)とする単一のグラフ構造を生成し、これをユーザに提示することが考えられる。すなわち、全文書数(ノード数)をNとしたとき、全ノードの組み合わせ(N(N−1/2)通り)について参照関係の有無を調べ、全ノードを含む巨大なグラフ構造を構築するのではなく、あくまでN回ばらばらに文書を解析して、N個のばらばらなグラフ構造を用意することである。
この用途としては、例えば、「女優E」というキーワードで検索を行ったユーザに対して、「女優E」に関する文書を解析することにより得られたグラフ構造を提示することが考えられる。
例えば、女優Eに関する文書中に、「男性タレントG」への参照があった場合、「女優E」がこのグラフ構造の中心ノードとなり、「男性タレントG」が周辺ノードとなり、中心ノードから周辺ノードへの参照関係を表す矢印が表示されることになる。ここで、もしユーザが次に「男性タレントG」のノードをクリックすれば、今度は「男性タレントG」に関する文書を解析することにより得られた「男性タレントG」を中心ノードとする新たなグラフ構造を提示することができる。
特開2005−122703号公報
"Volkel, et al.: Semantic Wikipedia, Proceedings of ACM WWW 2006, Edinburgh, Scotland, 2006"
前述のクリッカブルなグラフ構造提示インタフェースにおいて、例えばユーザがクリックしたノードに対応する文書を別ウィンドウに表示し、そのウィンドウ内に広告を提示する場合、広告収入をビジネスとする企業は、ユーザがなるべく多くのノードをクリックしてくれるほど収入が増える。従って、ユーザにグラフ構造を自由に辿らせてなるべく多くのノードをクリックさせることが望ましい。
しかし、上記のように単一の文書を解析して単一のグラフ構造を得るアプローチでは、参照関係が双方向になっていない場合に問題が生じる。
具体的には、上記の「女優E」と「男性タレントG」の例において、「男性タレントG」に関する文書中には「女優E」への参照が存在しない場合が考えられる。特に、Wikipediaのように複数の執筆者がおもいおもいの方針でテキストを執筆する場合には、このような現象は頻発する。
この場合、「男性タレントG」を中心ノードとするグラフ構造には、「女優E」のノードが含まれない。従って、ユーザが「女優E」を中心ノードとするグラフ構造において周辺ノード「男性タレントG」をクリックし、「男性タレントG」を中心ノードとするグラフ構造に遷移した場合、ユーザは「女優E」のノードに引き返す手段がなく、これは直感的にもわかりにくいので、ユーザのクリックを妨げてしまう可能性がある。
このように、従来は、一方の文書から他方の文書を参照しているが、当該他方の文書から当該一方の文書を参照していない場合、当該他方の文書を中心ノードとするグラフ構造には当該一方の文書を表す周辺ノードが欠落しているので、当該他方の文書を中心ノードとするグラフ構造からは、(当該他方の文書を参照する)当該一方の文書の存在を認識できない、当該一方の文書を中心ノードとするグラフ構造へ遷移できない、という問題点があった。
そこで、上記問題点に鑑み、本発明は、一方の文書から他方の文書を参照しているが、当該他方の文書から当該一方の文書を参照していない場合でも、当該一方の文書を表すノードと当該他方の文書を表すノードとの間を双方向に辿ることができるグラフ構造を提供することを目的とする。
(1)文書処理システムは、
他の文書への参照情報を含む複数の文書を収集する文書収集手段と、
収集された前記複数の文書を記憶する第1の記憶手段と、
前記第1の記憶手段に記憶されている各文書について、該文書に対応する中心ノードと、該文書に前記参照情報によりリンクされている他の文書に対応する周辺ノードとを含み、前記中心ノードは該文書を表すノード名を有し、前記周辺ノードは該他の文書を表すノード名を有するグラフ構造を生成する生成手段と、
前記複数の文書のそれぞれに対応する複数のグラフ構造を記憶する第2の記憶手段と、
前記第2の記憶手段に記憶されている前記複数のグラフ構造のうちの第1のグラフ構造中の第1の周辺ノードに対応する第1の文書を中心ノードとして含み、前記第1のグラフ構造の中心ノードに対応する第2の文書が周辺ノードとして含まれていない第2のグラフ構造に、前記第2の文書を表すノード名を有する第2の周辺ノードを追加するグラフ構造補完手段と、
前記第2の記憶手段からグラフ構造を検索する第1の検索手段と、
検索されたグラフ構造を表示する第1の表示手段と、
を含む。
他の文書への参照情報を含む複数の文書を収集する文書収集手段と、
収集された前記複数の文書を記憶する第1の記憶手段と、
前記第1の記憶手段に記憶されている各文書について、該文書に対応する中心ノードと、該文書に前記参照情報によりリンクされている他の文書に対応する周辺ノードとを含み、前記中心ノードは該文書を表すノード名を有し、前記周辺ノードは該他の文書を表すノード名を有するグラフ構造を生成する生成手段と、
前記複数の文書のそれぞれに対応する複数のグラフ構造を記憶する第2の記憶手段と、
前記第2の記憶手段に記憶されている前記複数のグラフ構造のうちの第1のグラフ構造中の第1の周辺ノードに対応する第1の文書を中心ノードとして含み、前記第1のグラフ構造の中心ノードに対応する第2の文書が周辺ノードとして含まれていない第2のグラフ構造に、前記第2の文書を表すノード名を有する第2の周辺ノードを追加するグラフ構造補完手段と、
前記第2の記憶手段からグラフ構造を検索する第1の検索手段と、
検索されたグラフ構造を表示する第1の表示手段と、
を含む。
(2)前記グラフ補完手段は、前記第2のグラフ構造に、前記第1のグラフ構造への参照情報及び前記第2の文書を表すノード名を有する第2の周辺ノードを追加する。
(3)前記グラフ構造中の各周辺ノードは、該周辺ノードに対応する文書を中心ノードとする他のグラフ構造への参照情報を有する。
(4)前記第1の検索手段は、前記第1の表示手段で表示されたグラフ構造のなかから選択された周辺ノードの前記ノード名または前記参照情報を基に、該周辺ノードに対応する文書を中心ノードとする他のグラフ構造を前記第2の記憶手段から検索する。
一方の文書から他方の文書を参照しているが、当該他方の文書から当該一方の文書を参照していない場合でも、当該一方の文書を表すノードと当該他方の文書を表すノードとの間を双方向に辿ることができるグラフ構造を提供できる。
以下、本発明の実施形態について図面を参照して説明する。
図1は、本実施形態に係る文書処理システム1の構成例を示したものである。
図1において、文書処理システム1は、大きく分けて、グラフ構造生成部100、検索部101、第1の記憶部102、第2の記憶部103、第3の記憶部104を含む。
グラフ構造生成部100は、文書収集部11、文書解析部12、補完部13を含み、検索部101は、検索要求処理部14、第1の検索部15、第2の検索部16、第3の検索部17、検索結果提示部18を含む。
図1では、文書処理システム1をネットワークNWに接続された1つのサーバ装置として構成した場合を示しているが、この場合に限らず、複数のサーバ装置で構成されていてもよい。
文書収集部11は、例えば検索エンジンに用いられているクローラなどで構成され、World Wide Web (WWW)上の文書やWikipedia(登録商標)の文書のように、他の文書への参照情報(URI(Uniform Resource Identifier)やURL(Uniform resource Locator)などの情報資源を特定するための情報)が埋め込まれている文書(参照情報付き文書)をネットワークNWから収集し、第1の記憶部102に記憶する。文書収集部11は、ネットワークNW上のある特定のサイトから、参照情報付きの文書を定期的にまたは随時配信してもらい、これを受信して、第1の記憶部102に記憶するようにしてもよい。
第1の記憶部102は、収集された複数の文書が、当該文書を一意に特定するための識別情報(例えば、URIやURLなど)とともに記憶されている。
文書解析部12は、文書収集部11で収集され、第1の記憶部102に記憶された各文書を解析して、当該文書に対応するグラフ構造を表すグラフ構造データを生成し、第2の記憶部103に記憶する。
第1の記憶部102に記憶されている各文書に対し1つのグラフ構造データが生成され、各グラフ構造データは、当該文書を表す中心ノード、当該文書に参照情報によりリンクされている他の文書を表す周辺ノード、該中心ノードから該周辺ノードへのエッジを含むグラフ構造が、例えばXML(Extensible Markup Language)などの構造化文書記述言語を用いて記述されている。
文書解析部12は、第1の記憶部102に記憶された各文書に対し、当該文書を中心ノードとする上記グラフ構造データを生成する。各グラフ構造データは、当該グラフ構造データを一意に特定するための識別情報(例えば、URI、URLなど)や、第1の記憶部102(及び第3の記憶部104)に記憶されている複数の文書のうち当該グラフ構造データ(の中心ノード)に対応する文書の識別情報とともに、第2の記憶103に記憶される。
文書解析部12の文書解析処理の詳細は後述する。
補完部13は、第2の記憶部103に記憶された各グラフ構造データに対して、当該グラフ構造の中心ノードである文書にはリンクされていない他の文書(当該他の文書からは当該文書はリンクされている)を表す周辺ノードの記述を追加する。補完部13での補完処理の詳細は後述する。
検索要求処理部14は、ネットワークNWに接続されたユーザ端末2からの検索要求を受け付けて、第1の検索部15、第2の検索部16、第3の検索部17を起動する。
第1の検索部15は、キーワード等を基に、第2の記憶部103からグラフ構造データを検索する。
第2の検索部16は、第1の記憶部102からグラフ構造データ(中の中心ノード)に対応する文書を検索する。
第3の記憶部104は、ネットワークNW上から収集された全文書や、それらのインデックスが記憶されている。
第3の検索部17は、キーワード等を基に、第3の記憶部104から文書を検索する。
なお、図1では、第3の記憶部104と、グラフ構造データを生成する文書を記憶するための第1の記憶部102とを別個に表しているが、第3の記憶部104は必ずしも必要ではなく、第1の記憶部102があればよい。この場合、第3の検索部17は、第1の記憶部102からキーワードを基に文書を検索し、グラフ構造生成部100は、第1の記憶部102に記憶されている文書のうちの全部または一部の文書についてグラフ構造データを生成する。
また、図1に示した構成の場合、文書収集部11は、ネットワークNWからグラフ構造データを生成する文書のみを収集してもよいし、第1の記憶部102には、グラフ構造データを生成する文書のみを記憶しおいてもよい。
検索結果提示部18は、第1の検索部15での検索結果である文書、第2の検索部16での検索結果であるグラフ構造データ、第3の検索部17での検索結果である文書やその一覧を、検索要求元のユーザ端末2へ返す。この結果、ユーザ端末2では、ブラウザにより当該検索結果がユーザ端末2のディスプレイに表示される。
次に、図2に示すフローチャートを参照して、文書解析部12の処理動作について説明する。
文書解析部12は、第1の記憶部102から参照情報付き文書を1つずつ取り出し、第1の記憶部102に記憶されている処理対象の全ての文書について以下の処理を行う。
まず、文書解析部12は、変数iを「1」に初期化する(ステップS1)。次に、文書解析部12は、第1の記憶部102に記憶されている処理対象の複数の文書のうちのi(=1)番目の文書を取り出し、i番目の文書から、中心ノードのノード名として用いる文字列を抽出する(ステップS2)。中心ノードのノード名は、例えば、該i番目の文書のタイトルや見出し、表題などである。
次に、文書解析部12は、i番目の文書から、参照情報により該文書にリンクされている他の文書を検出する(ステップS3)。i番目の文書にリンクされている他の文書を検出した場合には、i番目の文書から、当該他の文書への参照情報が埋め込まれている文字列や画像を、当該他の文書を表す周辺ノードのノード名として抽出する(ステップS4)。
さらに、i番目の文書から、上記中心ノードから上記周辺ノードへのエッジに付加するラベルとして用いる文字列を抽出する(ステップS5)。
例えば、i番目の文書中の上記他の文書への参照情報が埋め込まれている箇所を中心に一定の範囲内の文字列などの文脈情報(例えば、i番目の文書中の上記他の文書への参照情報が埋め込まれている文字列及びその前後にある文字列)を、当該他の文書へのエッジに付加するラベルとして抽出する。あるいは、i番目の文書中で上記他の文書への参照情報が埋め込まれている文字列や画像を含む章や節のタイトルを当該他の文書へのエッジに付加するラベルとして抽出する。
そして、文書解析部12は、以上のようにして得られた、i番目の文書を表す中心ノードのノード名、i番目の文書にリンクされている他の文書を表す周辺ノードのノード名、中心ノードから周辺ノードへのエッジのラベルを含む、i番目の文書に対応するグラフ構造データを生成する。このグラフ構造データは、i番目の文書を表すノード名を有する中心ノードと、i番目の文書にリンクされている他の文書を表すノード名を有する周辺ノードと、中心ノードから周辺ノードへのエッジと、そのラベルを含むグラフ構造を、例えば、XML(Extensible Markup Language)などの構造化文書記述言語を用いて記述したものである。文書解析部12は、生成されたグラフ構造データを第2の記憶部103に記憶し(ステップS7)、変数iを1つインクリメントする(ステップS8)。
以上のステップS2〜ステップS8の処理を、変数iの値が、第1の記憶部102に記憶されている処理対象の文書の総数よりも大きくなるまで繰り返す(ステップS9)。
図3は、図2の文書解析処理における処理対象の文書(第1の記憶部102に記憶されている文書)の一例を示したもので、「女優E」に関する情報を記述した参照情報付き文書である。
図3に示した文書には、「女優Y」をはじめ、「男優S」「男性タレントI」などの文字列に、他の文書がそれぞれリンクされている(参照情報が埋め込まれている)。なお、図3では、他の文書がリンクされている文字列は、“[[” と “]]” で囲まれている。実際、Wikipedia(登録商標)ではこの形式で参照情報が埋め込まれている文字列を示している。参照情報が埋め込まれている文字列や画像は、図3に示したように、例えば“[[” と “]]” のようなタグや記号で囲まれているので、文書全体から、周辺ノードに相当する文書、及びそのノード名として用いる文字列を検出することは容易である。
図3に示した文書から、当該文書のタイトルや見出し、表題に相当する「女優E」が、中心ノードのノード名として抽出され、「女優Y」「男優S」「男性タレントG」が、それぞれ周辺ノードのノード名として抽出される。また、当該文書中の「女優Y」を含む文字列が、中心ノードから「女優Y」という周辺ノードへのエッジのラベルとして抽出され、当該文書中の「男優S」を含む文字列が中心ノードから「男優S」という周辺ノードへのエッジのラベルとして抽出され、当該文書中の「男性タレントG」を含む文字列が中心ノードから「男性タレントG」という周辺ノードへのエッジのラベルとして抽出される。
この結果、図3の文書からは、図4に示すような、「女優E」という中心ノードをもつグラフ構造が得られる。図4では、「女優E」が中心ノードとなっており、ここから当該文書にリンクされている「女優Y」、「男優S」、および「男性タレントG」が周辺ノードとして表されている。また、ノード間のエッジには、「女優E」の文書中から文書解析部12によって切り出された文脈情報(参照情報が埋め込まれている箇所周辺の文字列など)、あるいは章・節のタイトルがラベルとして付加されている。
文書解析部12は、図3の文書から、図4に示したようなグラフ構造を表すグラフ構造データを生成する。このグラフ構造データを予め作成されたスタイルシートなどを適用することで、ユーザ端末2のディスプレイには図4に示したグラフ構造が表示される。
図3では、1つのエッジにつき、1つのラベルを付加しているが、この場合に限らず、文書解析部12は、処理対象の文書中から、1つのエッジにつき複数の文脈情報をラベルとして抽出し、複数のラベル、あるいは、複数の文脈情報を含む1つのラベルを当該エッジに付加してもよい。さらに、1つのエッジにつき、文脈情報のラベルと章・節のタイトルのラベルとの2種類のラベルを付加してもよい。
また、1つの文書に多くの文書がリンクされている場合、多くの周辺ノードを含むグラフ構造となり、これをユーザ端末2に表示すると、ユーザにとって見にくい場合もあり得る。このような場合を考慮し、文書解析部12は、1つの中心ノードにリンクする周辺ノードの数を予め定められた数以内に限定するようにしてもよい。例えば、中心ノードに対応する文書にリンクされている文書のうち、先頭からの出現順に予め定められた数までの文書を周辺ノードとして採用する。
さらに、例えば、図4に示したグラフ構造を多くのユーザ端末2に提示したところ、図3の「女優E」に関する文書中で「女優Y」の文書の参照が頻繁に行われた場合、この情報を反映して、文書解析部12は、図4のグラフ構造中の「女優Y」のノードを大きく表示したり、「女優E」と「女優Y」を結ぶエッジの太さを太くするように、当該グラフ構造データを修正してもよい。
また、各エッジのラベルに関しては、通常は表示せずに、例えばユーザがエッジ上にマウスポインタを置いたらポップアップ表示するようなグラフ構造データを生成するようにしてもよい。
図5は、図4の「女優E」にリンクされている「男性タレントG」に関する文書の一例を示したものである。この文書からは、上述の文書解析処理により、中心ノード「男性タレントG」、その周辺ノード「男性タレントK」「男優T」「バンドP」を含む、図6に示したようなグラフ構造が生成される。
なお、図5の文書では、「所属バンド」という文字列が“==”というタグで囲まれているが、これは、章もしくは節のタイトルを表すタグである。実際、Wikipedia(登録商標)ではこの形式で章のタイトルであることを明示している。章や節のタイトルは、予め定められたタグや記号などで囲まれているので、文書全体から、章や節のタイトルを検出することは容易である。
図6のグラフ構造では、中心ノード「男性タレントG」の周辺ノードとして、「男性タレントK」、「男優T」、および「バンドP」が得られている。ここで、「男性タレントK」および「男優T」へのエッジのラベルとして、図4と同様に、図5の文書中で、当該周辺ノードに対応する文書がリンクされている文字列及びその前後の文字列が採用されている。一方、「バンドP」へのエッジのラベルとしては、図5の文書から抽出された章・節のタイトルである文字列「所属バンド」が採用されている。
このため、図6のグラフ構造では、各周辺ノードへ向かうエッジのラベルが、当該周辺ノードに対応する文書がリンクされている箇所周辺の文字列であるのか、章・節のタイトルであるのかを区別できるように、ラベルが章・節のタイトルである場合には、太線で囲んで表示されるようになっている。
図7は、図6のグラフ構造のソースデータであるグラフ構造データを示している。図7のグラフ構造データは、XMLで記述されており、「男性タレントG」を中心ノードとする、文書解析部12で生成されたグラフ構造データの一例である。
図7のグラフ構造データは、中心ノードの記述部分C1と、複数の(例えば、ここでは2つの)周辺ノードの記述部分C2、C3を含む。中心ノードの記述部分C1には、<entryname> というタグ名で中心ノードのノード名が記述されている。周辺ノードの記述部分C1及びC2には、<entryname> というタグ名で当該周辺ノードのノード名が記述されている。また、当該周辺ノードに、当該周辺ノードを中心ノードとするグラフ構造データをリンクするために、<link>というタグ名で、当該周辺ノードを中心ノードとするグラフ構造データへの参照情報(ここでは識別情報)が記述されている。さらに、中心ノードから当該周辺ノードへのエッジのラベルが<labeltext>というタグ名で記述され、このラベルが文脈情報と、章・節のタイトルのうちのどちらのタイプであるかを示す情報が、<labeltype>というタグ名で記述されている。例えば、ラベルが文脈情報であれば、「TITLE」という値が記述され、ラベルが章・節のタイトルであれば「CONTEXT」という値が記述されている。
1つ目の周辺ノードの記述部分C2には、中心ノードから当該周辺ノードへのエッジのラベルが2つあり、そのうちの1つ目は文脈情報のラベルであり、2つ目は章・節のタイトルであることがわかる。2つ目の周辺ノードの記述部分C3には、中心ノードから当該周辺ノードへのエッジのラベルが1つあり、それは文脈情報のラベルであることがわかる。
さらに、周辺ノードの記述部分には、当該記述部分が後述する補完処理で追加されたものであるのか否かを示す情報が<added_node>というタグ名で記述されている。ここでは、2つの周辺ノードの記述部分C1、C2は、補完処理で追加されたものではないため(当該グラフ構造データにもともと存在するものであるため)、「NO」という値が記述されている。
図4や図6に示したグラフ構造がユーザ端末2に表示された場合、ユーザにより、当該グラフ構造中の周辺ノードが選択されたとき(クリックされたとき)には、当該グラフ個構造のソースデータ(グラフ構造データ)中の当該選択された周辺ノードの記述部分に<link>要素に含まれている参照情報(識別情報)が、検索要求処理部14から第1の検索部15に渡され、当該識別情報を基に、第1の検索部16は、第2の記憶部103から、当該識別情報により特定されるグラフ構造データ、すなわち、当該周辺ノードを中心ノードとするグラフ構造データを検索する。検索されたグラフ構造データは、検索結果提示部17により、ユーザ端末2のディスプレイに表示される。
例えば、ユーザ端末2に、図4のグラフ構造が表示されている場合、ユーザが「男性タレントG」をクリックすると、図4のグラフ構造の表示から、図6のグラフ構造の表示に切り替わる。すなわち、図4のグラフ構造から図6のグラフ構造に遷移する。
この場合、図4のグラフ構造では、中心ノード「女優E」の周辺ノードとして「男性タレントG」が存在し、図4のグラフ構造から図6のグラフ構造へは遷移可能であるが、図6のグラフ構造では、中心ノード「男性タレントG」には、「女優E」という周辺ノードが存在しないため、図6のグラフ構造が表示されると、ユーザは「女優E」を中心ノードとする図4のグラフ構造に戻るというアクションを選択できない。これは、もともと、図6のグラフ構造の中心ノードに対応する文書(図5参照)に、図3に示すような「女優E」という文書がリンクされていないからである。
この問題を解決するのが、補完部13での補完処理である。次に、図8に示すフローチャートを参照して、補完部13の処理動作について説明する。
補完部13は、第2の記憶部103からグラフ構造データを1つずつ取り出し、第2の記憶部103に記憶されている処理対象の全てのグラフ構造について以下の処理を行う。
まず、補完部13は、変数iを「1」に初期化する(ステップS21)。次に、補完部13は、第2の記憶部103から、処理対象の複数のグラフ構造データのうちのi(=1)番目のグラフ構造データ(グラフ構造データ(i))を取り出す(ステップS22)。
補完部13は、変数jを「1」に初期化し(ステップS23)。グラフ構造データ(i)中の先頭からj番目の周辺ノードの記述部分に含まれている、当該周辺ノードを中心ノードとするグラフ構造データ(j)への参照情報(グラフ構造データ(j)の識別情報)を基に、第2の記憶部19から当該識別情報により特定されるグラフ構造データ(j)を取り出す(ステップS24)。
ここで、グラフ構造データ(i)により表されているグラフ構造をグラフ構造(i)とし、グラフ構造データ(j)により表されているグラフ構造をグラフ構造(j)とする。
ステップS25へ進み、グラフ構造データ(j)にグラフ構造データ(i)がリンクされているかどうかを調べる。これは、グラフ構造データ(j)中に、グラフ構造データ(i)への参照情報を含む周辺ノードの記述部分が含まれているかどうかを調べればよい。
グラフ構造データ(i)にグラフ構造データ(j)がリンクされているので、さらにグラフ構造データ(j)にグラフ構造データ(i)がリンクされている場合には、グラフ構造(i)からグラフ構造(j)へ遷移可能であり、しかもグラフ構造(j)からグラフ構造(i)へも遷移可能である。一方、グラフ構造データ(j)にグラフ構造データ(i)がリンクされていない場合には、グラフ構造(i)からグラフ構造(j)へは遷移可能であるが、グラフ構造(j)からグラフ構造(i)へは遷移することができない。
グラフ構造データ(j)にグラフ構造データ(i)がリンクされていない場合、ステップS5からステップS26へ進み、グラフ構造データ(j)に、グラフ構造データ(i)をリンクするための、グラフ構造データ(i)の中心ノードのノード名と同じノード名を有する新たな周辺ノードの記述を追加する(ステップS26)。
この新たな周辺ノードの記述には、グラフ構造データ(i)への参照情報(グラフ構造データ(i)の識別情報)と、グラフ構造データ(i)中のグラフ構造データ(j)に対応する周辺ノードの記述部分に含まれている、エッジのラベルとを含む。
例えば、図4に示したグラフ構造のソースデータが、グラフ構造データ(i)であり、このグラフ構造データ(i)中のj番目の周辺ノードを中心ノードとするグラフ構造データ(j)が図7であるとする。グラフ構造データ(i)の中で、周辺ノード「男性タレントG」の記述部分を図9に示す。
この場合、ステップS26では、グラフ構造データ(i)の識別情報と、グラフ構造データ(i)中の中心ノードのノード名と、図9の記述部分に含まれている、ラベルや、そのタイプとを基に、これらの情報を含む新たな周辺ノードの記述を、図7のグラフ構造データ(j)に追加する。
図10は、新たな周辺ノードの記述が追加されたグラフ構造データ(j)を示したものである。図10において、追加された新たな周辺ノードの記述部分D1には、<entryname> というタグ名でグラフ構造データ(i)の中心ノードのノード名「女優E」が記述されている。また、当該新たな周辺ノードに、グラフ構造データ(i)をリンクするために、<link>というタグ名で、グラフ構造データ(i)の識別情報が記述され、当該新たな周辺ノードと中心ノードとの間のエッジのラベルとそのタイプとして、図9の<labeltext>タグや、<labeltype>タグで記述されているものと同じラベルとタイプが記述されている。さらに、<added_node>タグで、当該新たな周辺ノードの記述部分が補完処理で追加されたものであることを示す値「YES」が記述されている。
図10に示したグラフ構造データの表示例を図11に示す。図11に示すグラフ構造では、図6に示したグラフ構造に、図10の記述部分D1に相当する、「女優E」という新たな周辺ノードが追加されている。また、中心ノード「男性タレントG」と新たな周辺ノード「女優E」との間のエッジには、「男性タレントG扮する主人公の恋人役として…」というラベルが付加されているが、このラベルとして用いている文字列は、上述したように、図5の文書「男性タレントG」から抽出したものではなく、図3の文書「女優E」から抽出されたもので、図4のグラフ構造中で、中心ノード「女優E」と周辺ノード「男性タレントG」との間のエッジのラベルある。
図11に示した表示例において、上述の補完処理によりグラフ構造に追加された周辺ノード「女優E」は、<added_node>タグの値が「YES」であることから、当該グラフ構造の中心ノードに対応する文書中にリンクされている文書を表す通常の周辺ノードとは異なる表示形態で表示される。例えば、図11では、中心ノードと通常のノードとの間のエッジは実線で表示されているが、中心ノードと追加された新たな周辺ノード「女優E」との間のエッジが、補完処理により追加された新たな周辺ノードであることを明示するために点線で表示されている。中心ノードと追加された新たな周辺ノードとの間のエッジを点線で表示する他、太い実戦や、他のエッジとは異なる色で表示してもよい。
グラフ構造中に上記補完処理により追加された周辺ノードの表示形態としては、上記のように、中心ノードと追加された周辺ノードとの間のエッジを、中心ノードと通常のノードとの間のエッジの表示形態とは異なる表示形態で表示する他、追加された周辺ノードを通常の周辺ノードの色、形、フォント、線などとは異なる表示形態で表示するようにしてもよい。
いずれにしても、グラフ構造を表示した際に、追加された周辺ノードと通常の周辺ノードとが区別できるように、追加された周辺ノード(そのエッジを含む)が、通常の周辺ノード(そのエッジを含む)の表示形態とは異なる表示形態で表示されていることが望ましい。
図8の説明に戻り、ステップS25において、グラフ構造データ(j)にグラフ構造データ(i)がリンクされている場合にはステップS27へ進み、変数jを1つインクリメントする。また、ステップS26で、グラフ構造データ(j)にグラフ構造データ(i)をリンクするための新たな周辺ノードの記述を追加した後もステップS27へ進む。
以上のステップS24〜ステップS27の処理を、変数jの値が、グラフ構造データ(i)中の周辺ノードの総数よりも大きくなるまで繰り返す(ステップS28)。変数jの値が、グラフ構造データ(i)中の周辺ノードの総数よりも大きい場合には、ステップS29へ進み、変数iを1つインクリメントし、変数iの値が第2の記憶部103に記憶されている処理対象のグラフ構造データの総数よりも大きくなるまで、ステップS22〜ステップS29までの処理を繰り返す(ステップS30)。
図8に示す補完処理では、グラフ構造(i)からj番目の周辺ノードを介してグラフ構造(j)へは遷移するが、グラフ構造(j)には、グラフ構造(i)へ遷移できる周辺ノードが含まれていない場合に(ステップS25)、グラフ構造(j)に、グラフ構造(i)へ遷移するための新たな周辺ノードを追加している(ステップS26)。グラフ構造(j)に、グラフ構造(i)へ遷移できる周辺ノードが含まれている場合には(ステップS25)、そのまま次の周辺ノードへと処理を移すようになっているが、この場合に限らず、図12に示すようなに補完処理を行うようにしてもよい。
図12に示す補完処理では、図8の補完処理のステップS25において、グラフ構造(j)にグラフ構造(i)へ遷移できる周辺ノードが含まれている場合には、ステップS41、ステップS42に示す処理を行ってからステップS27へ進むようになっている。
ステップS41、ステップS42の処理では、グラフ構造(i)で中心ノードから当該j番目の周辺ノードへのエッジのラベルとともに、当該j番目の周辺ノードから中心ノードへのエッジのラベルを表示するために必要な情報を、グラフ構造データ(i)に追加する。
ます、ステップS41では、グラフ構造データ(j)中の、グラフ構造データ(i)がリンクされている周辺ノードの記述部分から、エッジのラベルやそのタイプなどを抽出する。すなわち、<labeltext>要素や、<labeltype>要素の値を取り出す。
ステップS42では、グラフ構造データ(i)のj番目の周辺ノードの記述部分に、ステップS41で得られたラベルやそのタイプなどの情報を値としてもつ<labeltext>要素や、<labeltype>要素を追加する。
例えば、図6のグラフ構造をグラフ構造(i)であるとき、その周辺ノード「男性タレントK」にリンクされているグラフ構造データ(j)には、グラフ構造データ(i)へ遷移する周辺ノード「男性タレントG」が含まれているとする。この場合、図12の補完処理により、グラフ構造(j)の中心ノード「男性タレントK」から周辺ノード「男性タレントG」へのエッジのラベルが、グラフ構造(i)の中心ノード「男性タレントK」と周辺ノード「男性タレントG」との間のエッジに付加される。この結果、図13に示すように、グラフ構造(i)を表示する際には、中心ノード「男性タレントG」から周辺ノード「男性タレントK」へのエッジのラベルと、周辺ノード「男性タレントK」から中心ノード「男性タレントG」へのエッジのラベルとが表示される。
図13では、中心ノード「男性タレントG」に対応する文書内での「男性タレントK」に対する言及と、周辺ノード「男性タレントK」に対応する文書内での「男性タレントG」に対する言及とが共に表示されている。ユーザは、これらの情報を参考にしてノードを選択し、グラフ構造上を行き来すればよい。
補完部13で図8あるいは図12に示したような補完処理の施されたグラフ構造データが、第2の記憶部103に記憶される。
なお、以上の説明では、処理対象とする参照情報付き文書は日本語のみに限らず、あらゆる言語で記述された文書であってもよい。また、中心ノードや周辺ノードのノード名は、人物名に限らず、組織名や、論文のタイトル、Webページのタイトルなど、当該ノードに対応する参照付き文書を識別できるものであれば何でも良い。例えば、1つのグラフ構造に、人物名と組織名とが混在するノード名のノードが含まれていても良いし、日本語のノード名のノードと英語のノード名のノードとが混在してもよい。
次に、検索部101の処理動作について、図14に示すフローチャートを参照して説明する。
ユーザ端末2から入力されたキーワードは、検索要求処理部14により受け入れられ、該キーワードが、検索要求処理部14から第1の検索部15及び第3の検索部17に渡される(ステップS100)。
第1の検索部15は、検索要求処理部14から入力されたキーワードを基に、第2の記憶部103から、当該キーワードが中心ノードのノード名に含まれているグラフ構造データを検索する(ステップS101)。検索されたグラフ構造データは、検索結果提示部18によりユーザ端末2へ送信され、ユーザ端末2では、受信した当該グラフ構造データに記述されているグラフ構造をディスプレイに表示する(ステップS102)。
第3の検索部17は、検索要求処理部14から入力されたキーワードを基に、第3の記憶部104から、当該キーワードを含む文書を検索する(ステップS111)。例えば、当該キーワードを含む文書を第3の記憶部104から検索する。検索された文書の一覧は、検索結果提示部18によりユーザ端末2へ送信され、ユーザ端末2では、受信した検索結果の文書の一覧をディスプレイに表示する(ステップS112)。
図15は、ユーザ端末2のディスプレイに表示されるグラフ構造及び検索結果の文書一覧の画面表示例を示したものである。ここでは、ユーザ端末2からユーザが「女優E」というキーワードを入力した場合に、第1の検索部15で検索された、「女優E」を中心ノードとするグラフ構造(図4と同じグラフ構造)を表示するとともに、「女優E」をキーワードとして、第3の検索部17が第3の記憶部104から検索した文書の一覧を表示している。
図15に示した表示画面には、キーワードの入力及び表示するための領域A1と、グラフ構造を表示するための領域A2と、検索された文書の一覧を表示する領域A3とが設けられている。
図15に示したような表示インタフェース上において、ユーザがグラフ構造上の周辺ノード「男性タレントG」をクリックすると(ステップS103)、検索要求処理部14は、これを受けて、例えば、当該選択された周辺ノード「男性タレントG」のノード名を新たなキーワードに設定する(ステップS104)。すなわち、図5の表示画面上の領域A1には、「女優E」に代わって「男性タレントG」が表示される。さらに検索要求処理部14は、この新たなキーワード「男性タレントG」を第1の検索部15及び第3の検索部17に渡し、上記ステップS101〜ステップS102、ステップS111〜ステップS112の処理が行われる。
すなわち、ステップS101において、第1の検索部15は、新たなキーワード「男性タレントG」が中心ノードのノード名に含まれているグラフ構造データを検索し、検索されたグラフ構造データがユーザ端末2へ送信されて、ユーザ端末2の表示画面上の領域A2には、図11に示すようなグラフ構造が表示される(ステップS102)。
なお、ステップS101では、選択された周辺ノード「男性タレントG」がもつ参照情報(グラフ構造データ中の<link>要素の値)から当該参照情報に対応するグラフ構造データを検索してもよい。
ステップS111において、第3の検索部17は、新たなキーワード「男性タレントG」を基に、第3の記憶部104から、当該キーワードを含む文書を検索し、検索された文書の一覧がユーザ端末2へ送信されて、ユーザ端末2の表示画面上の領域A3には、受信した検索結果の文書の一覧が表示される(ステップS112)。
一方、図15に示したような表示インタフェース上において、ユーザがグラフ構造上の中心ノード「女優E」をクリックすると(ステップS103)、ステップS121へ進む。ステップS122では、検索要求処理部14は、当該中心ノードのノード名「女優E」を第2の検索部16へ渡す。なお、検索要求処理部14は、ユーザ端末2の表示画面上に表示されているグラフ構造に対応する文書(すなわち、当該グラフ構造の中心ノードに対応する文書)の識別情報を取得できる場合には、(例えば、文書の識別情報が当該グラフ構造データに付加されているあるいは含まれている場合など)当該中心ノードのノード名「女優E」とともに、あるいは当該ノード名に代えて、当該文書の識別情報を第2の検索部16へ渡す。
第2の検索部16は、検索要求得処理部14から入力されたノード名「女優」、または当該ノード名に対応する文書の識別情報を基に、第1の記憶部102から文書を検索する。ここでは、「女優」をタイトル、見出し、表題に含まれている文書を検索する。または入力された識別情報を有する文書を検索する。このようにして検索された文書は、検索結果提示部18によりユーザ端末2へ送信され、ユーザ端末2では、図15の表示画面とは別の新たなウインドウを表示して、この新たなウインドウ内に、受信した検索結果の文書を表示する。
なお、図14には示していないが、図15の表示画面の領域A3に表示されている文書の一覧のなかから、ある1つの文書が選択された場合、当該選択された文書を(例えば、図15の表示画面とは別の新たなウインドウを表示して、この新たなウインドウ内に)表示するとともに、図15の表示画面の領域A2に表示するグラフ構造を、当該文書を中心ノードとするグラフ構造に遷移させてもよい。
この場合、図15の表示画面の領域A3に表示されている文書の一覧のなかからある1つの文書がクリックされて選択されると、検索要求処理部14では、当該選択された文書の識別情報(例えば、URI、URLなど)を第1の検索部15及び第3の検索部17に渡す。
第1の検索部15は、検索要求処理部14から入力された文書の識別情報に対応付けて記憶されているグラフ構造データを第2の記憶部103から検索する。検索されたグラフ構造データはユーザ端末2へ送信されて、ユーザ端末2の表示画面上の領域A2に表示される。また第3の検索部15は、検索要求処理部14から入力された識別情報を有する文書を第3の記憶部104から検索する。検索された文書はユーザ端末2へ送信されて、新たなウインドウ内に表示される。
このように、図15の表示画面上の領域A2に表示されたグラフ構造から所望の周辺ノードから選択された場合には、当該選択された周辺ノードを中心ノードとする別のグラフ構造が表示される。この別のグラフ構造には、必ず、元のグラフ構造の中心ノードが周辺ノードとして含まれているため、当該周辺ノードを選択することで再び元のグラフ構造を表示することができる。
ユーザは、表示されたグラフ構造の周辺ノードを選択することで当該周辺ノードを中心ノードとするグラフ構造に遷移させて、参照関係のあるノード(文書)を辿ることができ、しかも、元のノード(文書)へも自由に戻ることができる。
すなわち、文書間の参照関係が非対称であることに起因するノードの欠落がある場合でも、ユーザが文書間の参照関係を図示したグラフのノード間を自由に辿ることができる。
従って、ユーザは、表示されたグラフ構造上の周辺ノードを選択することにより、多くの異なるグラフ構造間を双方向に辿ることができる。ユーザは、目的とする情報はもちろんのこと、これに関連し合う多くの情報を目にすることができるので、ユーザの興味をそそるようなグラフ構造の探索を実現することができる。
本発明の実施の形態に記載した本発明の手法(グラフ構造生成部100、検索部10の処理動作)は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、DVDなど)、半導体メモリなどの記録媒体に格納して頒布することもできる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
1…文書処理システム、2…ユーザ端末、11…文書収集部、12…文書解析部、13…補完部、14…検索要求処理部、15…第1の検索部、16…第2の検索部、17…第3の検索部、18…検索結果提示部、100…グラフ構造生成部、101…検索部、102…第1の記憶部、103…第2の記憶部、104…第3の記憶部
Claims (11)
- 他の文書への参照情報を含む複数の文書を収集する文書収集手段と、
収集された前記複数の文書を記憶する第1の記憶手段と、
前記第1の記憶手段に記憶されている各文書について、該文書に対応する中心ノードと、該文書に前記参照情報によりリンクされている他の文書に対応する周辺ノードとを含み、前記中心ノードは該文書を表すノード名を有し、前記周辺ノードは該他の文書を表すノード名を有するグラフ構造を生成する生成手段と、
前記複数の文書のそれぞれに対応する複数のグラフ構造を記憶する第2の記憶手段と、
前記第2の記憶手段に記憶されている複数のグラフ構造のうちの第1のグラフ構造中の第1の周辺ノードに対応する第1の文書を中心ノードとして含み、前記第1のグラフ構造の中心ノードに対応する第2の文書が周辺ノードとして含まれていない第2のグラフ構造に、前記第2の文書を表すノード名を有する第2の周辺ノードを追加するグラフ構造補完手段と、
前記第2の記憶手段からグラフ構造を検索する第1の検索手段と、
検索されたグラフ構造を表示する第1の表示手段と、
を含む文書処理システム。 - 前記第1の検索手段は、前記第1の表示手段で表示されたグラフ構造のなかから選択された周辺ノードを中心ノードとする他のグラフ構造を前記第2の記憶手段から検索し、
前記第1の表示手段は、検索された前記他のグラフ構造を表示することを特徴とする請求項1記載の文書処理システム。 - 前記第1の表示手段で表示された前記第1のグラフ構造のなかから前記第1の周辺ノードが選択されたとき、前記第1の検索手段で検索された前記第2のグラフ構造が前記第1の表示手段で表示され、
前記第1の表示手段で表示された前記第2のグラフ構造のなかから前記第2の周辺ノードが選択されたとき、前記第1の検索手段で検索された前記第1のグラフ構造が前記第1の表示手段で表示されることを特徴とする請求項2記載の文書処理システム。 - 前記生成手段は、前記文書中の前記他の文書への前記参照情報を有する文字列及びその周辺の文字列、または該参照情報を有する文字列を含む章または節のタイトルを、前記中心ノードと前記周辺ノードとの間のエッジのラベルとして含む前記グラフ構造に生成する請求項1記載の文書処理システム。
- 前記グラフ構造補完手段は、前記第2のグラフ構造中の前記中心ノードと前記第2の周辺ノードとの間のエッジのラベルとして、前記第1のグラフ構造中の前記中心ノードと前記第1の周辺ノードとの間のエッジのラベルを該第2のグラフ構造に追加することを特徴とする請求項4記載の文書処理システム。
- 前記グラフ構造補完手段は、
前記第1のグラフ構造中の第3の周辺ノードに対応する第3の文書を中心ノードとする第3のグラフ構造が、前記第1のグラフ構造の中心ノードに対応する前記第2の文書を周辺ノードとして含む場合、前記第1のグラフ構造中の前記中心ノードと前記第3の周辺ノードとの間のエッジに、前記第3のグラフ構造中の前記中心ノードと前記第2の文書に対応する周辺ノードとの間のエッジのラベルを追加することを特徴とする請求項4記載の文書処理システム。 - 前記第1の表示手段で表示された前記第2のグラフ構造中の前記第2の周辺ノードは、該第2のグラフ構造の前記中心ノードに対応する前記第2の文書にリンクされている文書に対応する周辺ノードとは異なる表示形態で表示されることを特徴とする請求項3記載の文書処理システム。
- 検索条件として入力されたキーワードを含む文書または前記第1の表示手段で表示されたグラフ構造の中心ノードのノード名を含む文書を前記第1の記憶手段から検索する第2の検索手段と、
前記第2の検索手段で検索された文書または検索された文書の一覧を表示する第2の表示手段と、
をさらに含み、
前記第1の検索手段は、前記キーワードを、前記中心ノードのノード名に含むグラフ構造を前記第2の記憶手段から検索することを特徴とする請求項1記載の文書処理システム。 - 他の文書への参照情報を含む複数の文書を記憶する第1の記憶手段と、
前記第1の記憶手段に記憶されている各文書について、該文書に対応する中心ノードと、該文書に前記参照情報によりリンクされている他の文書に対応する周辺ノードとを含み、前記中心ノードは該文書を表すノード名を有し、前記周辺ノードは該他の文書を表すノード名を有するグラフ構造を生成する生成手段と、
前記複数の文書のそれぞれに対応する複数のグラフ構造を記憶する第2の記憶手段と、
前記第2の記憶手段に記憶されている各グラフ構造を補完するグラフ構造補完手段と、
前記第2の記憶手段からグラフ構造を検索する検索手段と、
検索されたグラフ構造を表示する表示手段と、
を含む文書処理システムにおける文書処理方法であって、
前記グラフ構造補完手段が、前記複数のグラフ構造のうちの第1のグラフ構造中の第1の周辺ノードに対応する第1の文書を中心ノードとして含み、前記第1のグラフ構造の中心ノードに対応する第2の文書が周辺ノードとして含まれていない第2のグラフ構造に、前記第1のグラフ構造への参照情報及び前記第2の文書を表すノード名を有する第2の周辺ノードを追加するグラフ構造補完ステップと、
前記検索手段が、検索条件として入力されたキーワードを前記中心ノードのノード名に含むグラフ構造を前記第2の記憶手段から検索する第1の検索ステップと、
前記表示手段が、検索されたグラフ構造を表示する第1の表示ステップと、
を含む文書処理方法。 - 前記検索手段が、前記第1の表示ステップで表示された前記第1のグラフ構造のなかから選択された前記第1の周辺ノードを中心ノードとする前記第2のグラフ構造を前記第2の記憶手段から検索する第2の検索ステップと、
前記表示手段が、検索された前記第2のグラフ構造を表示する第2の表示ステップと、
前記検索手段が、前記第2の表示ステップで表示された前記第2のグラフ構造のなかから選択された前記第2の周辺ノードを中心ノードとする前記第1のグラフ構造を前記第2の記憶手段から検索する第3の検索ステップと、
前記表示手段が、検索された前記第1のグラフ構造を表示する第3の表示ステップと、
をさらに含む請求項9記載の文書処理方法。 - コンピュータを、
他の文書への参照情報を含む複数の文書を記憶する第1の記憶手段、
前記第1の記憶手段に記憶されている各文書について、該文書に対応する中心ノードと、該文書に前記参照情報によりリンクされている他の文書に対応する周辺ノードとを含み、前記中心ノードは該文書を表すノード名を有し、前記周辺ノードは該他の文書を表すノード名を有するグラフ構造を生成する生成手段、
前記複数の文書のそれぞれに対応する複数のグラフ構造を記憶する第2の記憶手段と、
前記第2の記憶手段に記憶されている前記複数のグラフ構造のうちの第1のグラフ構造中の第1の周辺ノードに対応する第1の文書を中心ノードとして含み、前記第1のグラフ構造の中心ノードに対応する第2の文書が周辺ノードとして含まれていない第2のグラフ構造に、前記第2の文書を表すノード名を有する第2の周辺ノードを追加するグラフ構造補完手段、
前記第2の記憶手段からグラフ構造を検索する第1の検索手段、
検索されたグラフ構造を表示する第1の表示手段、
として機能させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007243002A JP2009075777A (ja) | 2007-09-19 | 2007-09-19 | 文書処理システム及び方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007243002A JP2009075777A (ja) | 2007-09-19 | 2007-09-19 | 文書処理システム及び方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2009075777A true JP2009075777A (ja) | 2009-04-09 |
Family
ID=40610693
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007243002A Pending JP2009075777A (ja) | 2007-09-19 | 2007-09-19 | 文書処理システム及び方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2009075777A (ja) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013502653A (ja) * | 2009-08-17 | 2013-01-24 | マイクロソフト コーポレーション | セマンティック・トレーディング・フロア |
| WO2014069582A1 (ja) * | 2012-11-05 | 2014-05-08 | 日本電気株式会社 | 関連情報提示装置及び関連情報提示方法 |
| JP2016532962A (ja) * | 2014-07-16 | 2016-10-20 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 推奨結果の展示方法及び装置 |
| JP2023027810A (ja) * | 2021-08-18 | 2023-03-03 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
| JP2023044938A (ja) * | 2021-09-21 | 2023-04-03 | 株式会社日立製作所 | データ分析要件定義支援装置およびデータ分析要件定義支援方法 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1166100A (ja) * | 1997-08-15 | 1999-03-09 | Fuji Xerox Co Ltd | 情報検索装置 |
| JP2003067419A (ja) * | 2001-08-24 | 2003-03-07 | Toshiba Corp | 情報検索方法および情報検索システム |
-
2007
- 2007-09-19 JP JP2007243002A patent/JP2009075777A/ja active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1166100A (ja) * | 1997-08-15 | 1999-03-09 | Fuji Xerox Co Ltd | 情報検索装置 |
| JP2003067419A (ja) * | 2001-08-24 | 2003-03-07 | Toshiba Corp | 情報検索方法および情報検索システム |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013502653A (ja) * | 2009-08-17 | 2013-01-24 | マイクロソフト コーポレーション | セマンティック・トレーディング・フロア |
| WO2014069582A1 (ja) * | 2012-11-05 | 2014-05-08 | 日本電気株式会社 | 関連情報提示装置及び関連情報提示方法 |
| JP5963281B2 (ja) * | 2012-11-05 | 2016-08-03 | 日本電気株式会社 | 関連情報提示装置及び関連情報提示方法 |
| US10019493B2 (en) | 2012-11-05 | 2018-07-10 | Nec Corporation | Related information presentation device, and related information presentation method |
| JP2016532962A (ja) * | 2014-07-16 | 2016-10-20 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 推奨結果の展示方法及び装置 |
| JP2023027810A (ja) * | 2021-08-18 | 2023-03-03 | ヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
| JP7388661B2 (ja) | 2021-08-18 | 2023-11-29 | Lineヤフー株式会社 | 情報処理装置、情報処理方法、及び情報処理プログラム |
| JP2023044938A (ja) * | 2021-09-21 | 2023-04-03 | 株式会社日立製作所 | データ分析要件定義支援装置およびデータ分析要件定義支援方法 |
| JP7756526B2 (ja) | 2021-09-21 | 2025-10-20 | 株式会社日立製作所 | 情報処理装置および情報処理方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9292483B2 (en) | Intelligent text annotation | |
| US20150213514A1 (en) | Systems and methods for providing modular configurable creative units for delivery via intext advertising | |
| US20130305149A1 (en) | Document reader and system for extraction of structural and semantic information from documents | |
| US20120054143A1 (en) | Systems and methods for rule based inclusion of pixel retargeting in campaign management | |
| US20160171552A1 (en) | Systems and methods for contextualizing services for inline mobile banner advertising | |
| JP5229226B2 (ja) | 情報共有システム、情報共有方法、および情報共有プログラム | |
| US20130054356A1 (en) | Systems and methods for contextualizing services for images | |
| US20150227276A1 (en) | Method and system for providing an interactive user guide on a webpage | |
| US20100281417A1 (en) | Providing a search-result filters toolbar | |
| US20120290974A1 (en) | Systems and methods for providing a discover prompt to augmented content of a web page | |
| WO2012003191A1 (en) | Systems and methods for augmenting a keyword of a web pagr with video content | |
| US20120246561A1 (en) | Systems and methods for extended content harvesting for contextualizing | |
| US20140324518A1 (en) | Autotagging business processes | |
| CN113901169A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
| US20130091415A1 (en) | Systems and methods for invisible area detection and contextualization | |
| JP2009075777A (ja) | 文書処理システム及び方法 | |
| Mäkelä et al. | Enabling the Semantic Web with Ready-to-Use Web Widgets. | |
| Sesagiri Raamkumar et al. | Can I have more of these please? Assisting researchers in finding similar research papers from a seed basket of papers | |
| Bernardi et al. | Web applications design recovery and evolution with RE‐UWA | |
| JP2007193697A (ja) | 情報収集装置,情報収集方法およびプログラム | |
| Gao et al. | Stable web scraping: an approach based on neighbour zone and path similarity of page elements | |
| Li et al. | Crawling and Exploring RESTful Web APIs from RapidAPI | |
| Paternò et al. | How an LLM Can Improve Automatic Web Accessibility Validation? | |
| Chen et al. | Paper2Web: Let's Make Your Paper Alive! | |
| WO2007132524A1 (ja) | 差分抽出プログラム、方法及び装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090403 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110421 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110510 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110913 |