JP4042295B2 - Keyword extraction rule refinement support device, storage medium, and keyword extraction rule refinement support method - Google Patents
Keyword extraction rule refinement support device, storage medium, and keyword extraction rule refinement support method Download PDFInfo
- Publication number
- JP4042295B2 JP4042295B2 JP2000114320A JP2000114320A JP4042295B2 JP 4042295 B2 JP4042295 B2 JP 4042295B2 JP 2000114320 A JP2000114320 A JP 2000114320A JP 2000114320 A JP2000114320 A JP 2000114320A JP 4042295 B2 JP4042295 B2 JP 4042295B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- rule
- word
- presented
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000605 extraction Methods 0.000 title claims description 286
- 238000000034 method Methods 0.000 title claims description 81
- 230000014509 gene expression Effects 0.000 claims description 107
- 238000005728 strengthening Methods 0.000 claims description 71
- 238000007670 refining Methods 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 27
- 238000000746 purification Methods 0.000 claims description 12
- 239000002344 surface layer Substances 0.000 claims description 9
- 230000006870 function Effects 0.000 description 32
- 239000000284 extract Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 208000024891 symptom Diseases 0.000 description 9
- 230000002040 relaxant effect Effects 0.000 description 6
- 238000007639 printing Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000002787 reinforcement Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 206010019133 Hangover Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、例えば表現のパターンマッチングにより文書中からキーワードを抽出するキーワード抽出装置で用いられるキーワード抽出ルールの精製(強化及び緩和)を支援するキーワード抽出ルール精製支援装置や記憶媒体やキーワード抽出ルール精製支援方法に関する。
【0002】
【従来の技術】
例えばパターンやキーワード抽出ルールの生成を行う技術として、次のようなものがある。
一例として、特開平7−262189号公報(以下、文献1と言う)に記載された文型パタン抽出装置では、テキストから文型パターンを抽出して統合する。ここでの文型とは出現順のパターンである。
【0003】
また、例えば特開平9−6796号公報(以下、文献2と言う)に記載された照合パターン生成方法及び装置では、或る目的に対してユーザが適合/不適合の判断を与え、各々の文書集合からパターンを自動抽出する。
また、特開平10−21249号公報(以下、文献3と言う)に記載されたキーワード抽出ルール生成方法では、文書を構造化するために用いるキーワードの抽出ルールを自動生成し、与えられた出力書式定義から抽出する文字列の条件を自動生成する。
【0004】
ここで、上記文献1に記載された技術は、文書からパターンを抽出するものである。パターンを抽出するのみであり、それがどのようなことを意図するパターンであるかは示されない。パターンの統合は複数のルールのマージであり、精製をしているわけではない。
また、上記文献2に記載された技術は、或る視点に対してユーザが適合/不適合の判断を与え、適合文書の集合と不適合文書の集合からパターンを自動生成するものである。しかし、この技術によって得られたパターンは或る視点のみに特化されたものであり、その視点のみに固有のものである保証はなく、しかもキーワードを抽出できるものではない。
【0005】
また、上記文献3に記載された技術は、文書を構造化するためのキーワード抽出ルール生成技術であるが、ルールは語の出現順に依存するものである。あくまでも名前、日時などの構造を構成する属性毎のキーワード抽出であり、「問題」「要望」など視点別のキーワードを抽出するものではない。また、既存ルールを後の文書に合わせて精製することはできない。
以上のように、パターンやキーワード抽出ルールを自動で生成する技術はあるが、随時その精度が上がるような補正を支援する技術はない。
【0006】
【発明が解決しようとする課題】
上記従来例で示したように、従来では、キーワード抽出装置で用いられるキーワード抽出ルールの精製(強化及び緩和)を支援する技術がなかったため、一旦生成されたキーワード抽出ルールの精度を向上させることができないといった不具合があり、具体的には、例えばキーワード抽出装置における視点別、意味的なキーワードの抽出ルールに対して、文書に応じた精製の支援ができないといった不具合があった。
【0007】
本発明は、上記のような従来の事情を鑑みてなされたもので、例えば表現のパターンマッチングにより文書中からキーワードを抽出するキーワード抽出装置で用いられるキーワード抽出ルールの精製(強化及び緩和)を支援することができるキーワード抽出ルール精製支援装置や記憶媒体やキーワード抽出ルール精製支援方法を提供することを目的とする。
【0008】
【課題を解決するための手段】
上記目的を達成するため、本発明に係るキーワード抽出ルール精製支援装置では、次のようにして、所定のルールに基づいて文書からキーワードを抽出するキーワード抽出装置の当該ルールを精製することを支援する。ここで、ルールは、第1キーワード群に含まれる第1キーワードに該当する語と第2キーワード群に含まれる第2キーワードに該当する語とが所定の関係をもって出現する文書中の表現から所定のキーワードを抽出することを規定する。
【0009】
すなわち、提示手段がルールに適合した表現及び当該ルールをユーザに提示し、受付手段が提示した表現に対して提示したルールを不適用とする指示をユーザから受け付け、当該指示を受け付けた場合には、制約強化手段が提示した表現に対して提示したルールが不適用となるように当該ルールを変更する。
従って、例えばユーザが提示された表現に対して提示されたルールを不適用とする旨を判断した場合には、当該ユーザからのこのような指示に合うように当該ルールが変更されるため、ルールを強化する方向での当該ルールの精製を支援することができる。
【0010】
また、好ましい態様として、上記のようなキーワード抽出ルール精製支援装置では、制約強化手段は、提示した表現中の提示したルールに適合する語に該当するキーワードを当該ルールで規定される当該語に対応したキーワード群から削除することにより、提示した表現に対して提示したルールが不適用となるようにする。
【0011】
また、他の好ましい態様として、上記のようなキーワード抽出ルール精製支援装置では、制約強化手段は、提示した表現中の提示したルールに適合する語に該当するキーワードを下位概念の複数のキーワードへ変換し、これら下位概念の複数のキーワードの中で当該語に該当するキーワードを当該ルールで規定される当該語に対応したキーワード群から削除することにより、提示した表現に対して提示したルールが不適用となるようにする。
【0012】
また、本発明に係るキーワード抽出ルール精製支援装置では、次のようにして、所定のルールに基づいて文書からキーワードを抽出するキーワード抽出装置の当該ルールを精製することを支援する。ここで、ルールは、第1キーワード群に含まれる第1キーワードに該当する語と第2キーワード群に含まれる第2キーワードに該当する語とが所定の関係をもって出現する文書中の表現から所定のキーワードを抽出することを規定する。
【0013】
すなわち、提示手段がルールで規定される第1キーワード及び第2キーワード及び関係の内の2つのみに適合した表現及び当該ルールをユーザに提示し、受付手段が提示した表現に対して提示したルールを適用する指示をユーザから受け付け、当該指示を受け付けた場合には、制約緩和手段が提示した表現に対して提示したルールが適用されるように当該ルールを変更する。
従って、例えばユーザが提示された表現に対して提示されたルールを適用する旨を判断した場合には、当該ユーザからのこのような指示に合うように当該ルールが変更されるため、ルールを緩和する方向での当該ルールの精製を支援することができる。
【0014】
また、好ましい態様として、本発明に係るキーワード抽出ルール精製支援装置では、制約緩和手段は、提示した表現中の提示したルールに不適合であった語の概念を示すキーワードを当該ルールで規定される当該語に対応したキーワード群に追加することにより、提示した表現に対して提示したルールが適用されるようにする。
【0015】
また、他の好ましい態様として、本発明に係るキーワード抽出ルール精製支援装置では、制約緩和手段は、提示した表現中の提示したルールに不適合であった語の概念を示すキーワードと当該ルールで規定される当該語に対応したキーワード群中のキーワードとの共通上位概念を示すキーワードに当該キーワード群中の当該キーワードを置き換えることにより、提示した表現に対して提示したルールが適用されるようにする。
【0016】
また、他の好ましい態様として、本発明に係るキーワード抽出ルール精製支援装置では、制約緩和手段は、提示した表現中の提示したルールに不適合であった語を当該ルールで規定される当該語に対応したキーワード群に追加することにより、提示した表現に対して提示したルールが適用されるようにする。
【0017】
また、他の好ましい態様として、本発明に係るキーワード抽出ルール精製支援装置では、制約緩和手段は、提示した表現中の提示したルールに不適合であった語と当該ルールで規定される当該語に対応したキーワード群中の表層的なキーワードとの共通上位概念を示すキーワードに当該表層的なキーワードを置き換えることにより、提示した表現に対して提示したルールが適用されるようにする。
【0018】
また、本発明に係るキーワード抽出ルール精製支援装置では、マージ手段がルールで規定される第1キーワード群及び第2キーワード群及び関係の内の1つのみが異なる複数のルールを、当該異なる部分を総和した1つのルールへ変換する。
従って、例えば複数のルールの内容を実質的に変更することなく、これら複数のルールを1つのルールへ置き換えることができるため、ルールを整理して当該ルールを記憶するメモリの記憶容量を削減すること等ができる。
【0019】
また、以上に示したような本発明に係る各種の処理は、例えば記憶媒体に記憶されたプログラムをコンピュータにより読み取って実行することにより実現することも可能である。
一例として、本発明に係る記憶媒体は、コンピュータに実行させるプログラムを当該コンピュータの入力手段が読取可能に記憶しており、第1キーワード群に含まれる第1キーワードに該当する語と第2キーワード群に含まれる第2キーワードに該当する語とが所定の関係をもって出現する表現から所定のキーワードを抽出するルールに基づいて文書からキーワードを抽出するキーワード抽出装置の当該ルールを精製することを支援するために用いられ、当該プログラムは、ルールに適合した表現及び当該ルールをユーザに提示する処理と、提示した表現に対して提示したルールを不適用とする指示をユーザから受け付ける処理と、当該指示を受け付けた場合に提示した表現に対して提示したルールが不適用となるように当該ルールを変更する処理とを当該コンピュータに実行させる。
【0020】
また、同様に、本発明に係る記憶媒体は、コンピュータに実行させるプログラムを当該コンピュータの入力手段が読取可能に記憶しており、第1キーワード群に含まれる第1キーワードに該当する語と第2キーワード群に含まれる第2キーワードに該当する語とが所定の関係をもって出現する表現から所定のキーワードを抽出するルールに基づいて文書からキーワードを抽出するキーワード抽出装置の当該ルールを精製することを支援するために用いられ、当該プログラムは、ルールで規定される第1キーワード及び第2キーワード及び関係の内の2つのみに適合した表現及び当該ルールをユーザに提示する処理と、提示した表現に対して提示したルールを適用する指示をユーザから受け付ける処理と、当該指示を受け付けた場合に提示した表現に対して提示したルールが適用されるように当該ルールを変更する処理とを当該コンピュータに実行させる。
また、本発明は、キーワード抽出ルール精製支援方法として提供することもできる。
【0021】
【発明の実施の形態】
本発明に係る実施例を図面を参照して説明する。
まず、本発明の適用対象となるキーワード抽出装置の一例を示しておく。なお、キーワード抽出装置では例えばテキストを含む文書から予め用意されたキーワード抽出ルールとシソーラスを用いてその文書の特徴を示すキーワードを自動抽出することが行われ、本発明に係るキーワード抽出ルール精製装置ではこのようなキーワード抽出ルールの精製を支援することを行う。ここで、キーワード抽出ルールは表現パターンに基づくものであり、係り受け関係などを利用することができる。以下では、係り受け関係を用いた場合を例として説明を行う。
【0022】
図11には、係り受け関係を用いた場合におけるキーワード抽出装置の構成例を示してあり、このキーワード抽出装置では、文書群保持装置1がキーワード抽出ルール生成の対象となる文書群を保持し、係り受け解析装置2が文書群保持装置1によって保持される文書に対して係り受け解析処理を施し、パターンマッチング装置3が係り受け解析結果に対してキーワード抽出ルール保持装置4によって保持されるキーワード抽出ルールとのパターンマッチングを行う。また、キーワード抽出ルール保持装置4は予め用意されたキーワード抽出ルールを保持しており、シソーラス5は語の階層構造をデータとして保持している。
【0023】
次に、本発明の第1実施例に係るキーワード抽出ルール精製支援装置を説明する。なお、本例では、ルールの制約を強化することを支援する装置(キーワード抽出ルール制約強化支援装置)を示す。
図1には、本例に係るキーワード抽出ルール精製支援装置を組み込んだキーワード抽出装置の一例を示してあり、この装置には、例えば上記図11に示したものと同様な機能を有する文書群保持装置1や係り受け解析装置2やパターンマッチング装置3やキーワード抽出ルール保持装置4やシソーラス5と、本例の特徴的な構成部分であるキーワード抽出ルール制約強化装置6とが備えられている。なお、上記図11に示したものと同様な機能を有する構成部分1〜5については、同図に示したのと同じ符号を用いて示してある。
【0024】
文書群保持装置1は、例えばルール精製の対象となる文書群の入力を受け、それを保持する機能を有している。本例では、文書群は複数の文書からなり、各文書はテキストを含む。また、テキストは1個以上の文によって構成される。
以下では、次の文1〜文4を各々含む文書1〜文書4を適用して「問題」を示すキーワードを抽出ルールによって抽出する場合を例として示す。なお、この場合、各々のテキストの各形態素の要素位置は図2に示した通りであるとする。
【0025】
文1:ヨコの解像はできない。
文2:ヨコの解像はできる。
文3:バインダーののり付け部分にスキマができない。
文4:出力のスタックができない。
【0026】
係り受け解析装置2は、例えば文書群保持装置1によって保持される文書に対して係り受け解析処理を施して、得られた全ての係り受け関係のデータを保持する機能を有している。なお、係り受け解析の技術としては、例えばキーワード抽出ルールに適合した表現を発見することができるようなものであれば、種々なものが用いられてもよく、一例として、「野村浩郷: 自然言語処理の基礎技術, 電子情報通信学会編, コロナ社, 1988.」に開示されている公知の係り受け解析技術を利用することができる。
【0027】
係り側と受け側の要素は一文中の形態素出現位置で表現され、次の形の組で保持される。
(fp, r, bp)
ここで、fpと bpは各々係り側と受け側に関する文書中での出現位置を示し、rは当該係り側と当該受け側との間の関係を示す。
【0028】
上記した文1の場合には、係り受け関係を解析することによって得られる係り受け関係は次の2つの通りである。なお、“(否)”は、その形態素(ここでは、“でき”)に続く付属語の表現(ここでは、“ない”)が否定の意味を持つことを示す。
(1, の, 3) ・・関係1
(3, は, 5(否)) ・・関係2
【0029】
また、文2の場合には、係り受け関係を解析することによって得られる係り受け関係は次の2つの通りである。
(1, の, 3) ・・関係3
(3, は, 5) ・・関係4
【0030】
また、文3の場合には、係り受け関係を解析することによって得られる係り受け関係は次の4つの通りである。なお、“無”は、2つの形態素(ここでは、“のり付け”と“部分”)の間の関係を示す語が無いことを示す。
(1, の, 3) ・・関係5
(3, (無), 4) ・・関係6
(4, に, 8(否)) ・・関係7
(6, が, 8(否)) ・・関係8
【0031】
また、文4の場合には、係り受け関係を解析することによって得られる係り受け関係は次の2つの通りである。
(1, の, 3) ・・関係9
(3, が, 5(否)) ・・関係10
また、以上と同様に、各々の文書群の他の文書に対してもこのような解析処理を施す。
【0032】
キーワード抽出ルール保持装置4は、例えば予め用意されたキーワード抽出ルールを保持し、キーワード抽出ルール制約強化装置6から得られる抽出ルールを既存のキーワード抽出ルールに上書きする機能を有している。
1個のキーワード抽出ルールErは、
Er:(F, R, B) → A
の形式で表現され、キーワード抽出ルール保持装置4にはこの集合が保持される。
【0033】
ここで、上記したF, R, B, Aは集合であり、以下に、これらの詳細を示す。
Fは、係り語の表現の集合であり、各要素は[c]もしくは“s”で表現される。 Rは、関係の集合であり、各要素はrで示される。関係を指定しない場合は「(無)」と表記する。
Bは、受け語の表現の集合であり、各要素は[c]もしくは“s”で表現される。
Aは、キーワード抽出動作の内容であり、各要素は抽出する語の位置を示す。具体的には、係り語を抽出する場合にはfであり、受け語を抽出する場合にはbである。
また、上記したcはシソーラスに含まれる概念名を示し、上記したsは表層を示す。
【0034】
なお、本実施例に言うキーワード抽出ルールが本発明に言うルールに相当し、本実施例に言うFやBやRがそれぞれ本発明に言う第1キーワード群や第2キーワード群や所定の関係に相当し、本実施例に言うFの各要素やBの各要素がそれぞれ本発明に言う第1キーワードや第2キーワードに相当し、本実施例に言うAにより抽出されるキーワードが本発明に言う所定のキーワードに相当する。
【0035】
シソーラス5は、例えば語の階層構造を表現する機能を有しており、この構造は、例えば概念の木構造のノードにその概念に属する語の集合が更に付随する構造を有している。本実施例では、図3に示されるシソーラスT1が用いられる場合を示す。
【0036】
パターンマッチング装置3は、例えばキーワード抽出ルール保持装置4によって保持されるキーワード抽出ルールを用いて、係り受け解析装置2から得られる全ての係り受け関係に対して順次当該キーワード抽出ルールとのパターンマッチングを行う機能を有している。
また、パターンマッチング装置3は、パターンがマッチした場合(つまり、キーワード抽出ルールに適合した係り受けの表現が発見された場合)には、そのときの係り受けをマッチ表現として、適用したキーワード抽出ルールと共に出力する機能を有している。
【0037】
ここで、上記したキーワード抽出ルール保持装置4が次のキーワード抽出ルールEr1を保持する場合を例として考える。
Er1:({[印字品質], [サービス]}, {が, は}, {“でき(否)”}) → {f}
例えば上記した文1の関係2(「解像はできない」)は問題を示す表現である。これに対してEr1を適用すると、シソーラスT1より係り語「解像」は概念「印字品質」に属し、関係は「は」であり、受け語は「でき(否)」であるので、Er1にマッチし、係り語「解像」を概念「印字品質」のキーワードとして抽出する。
【0038】
また、例えば上記した文2の関係4(「解像はできる」)は問題を示す表現ではない。これに対してEr1を適用すると、シソーラスT1より係り語「解像」は概念「印字品質」に属し、関係は「は」であるが、受け語が「できる」であるので、Er1にマッチせず、「解像」をキーワードとして抽出しない。
また、例えば上記した文3の関係8(「スキマができない」)は問題を示す表現ではない。しかしながら、これに対してEr1を適用すると、シソーラスT1より係り語「スキマ」は概念「印字品質」に属し、関係は「が」であり、受け語は「でき(否)」であるので、Er1にマッチし、係り語「スキマ」を概念「印字品質」のキーワードとして抽出する。
【0039】
また、例えば上記した文4の関係10(「スタックができない」)は問題を示す表現である。これに対してEr1を適用すると、関係は「が」であり、受け語は「でき(否)」であるが、シソーラスT1より係り語「スタック」は概念「印字品質」に属さないので、Er1にマッチせず、「スタック」をキーワードとして抽出しない。
【0040】
なお、上記したキーワード抽出ルールEr1を例とすると、[印字品質]や[サービス]が本発明に言う第1キーワードに相当し、これに該当する「解像」や「スキマ」が本発明に言う第1キーワードに該当する語に相当し、同様に、“でき(否)”が本発明に言う第2キーワードに相当し、これに該当する「でき(否)」が本発明に言う第2キーワードに該当する語に相当する。
【0041】
上述のように、上記した文3の関係8(「スキマができない」)は問題を示す表現ではないにも関わらず、キーワード抽出ルールEr1とマッチしてしまうため、「スキマ」を概念「印字品質」(上記図3の例では、更に「印字エラー」の下)のキーワードとして抽出してしまう。このマッチングが起こらないようにするために、適用したEr1の制約を強化する必要がある。
【0042】
そこで、本例では、例えばパターンマッチング装置3からの入力を受けて、キーワード抽出ルールの制約を強化してキーワード抽出ルール保持装置4の該当箇所に上書きする機能を有したキーワード抽出ルール制約強化装置6を備えている。
図4には、キーワード抽出ルール制約強化装置6の内部動作の構成例を示してあり、このキーワード抽出ルール制約強化装置6は、本発明に言う提示手段及び受付手段を構成する制約強化指示装置11と、本発明に言う制約強化手段を構成する制約強化精製装置12及び制約強化ルール候補提示装置13とから構成されている。
【0043】
制約強化指示装置11は、キーワード抽出ルールの制約の強化を行うか否かをユーザに指示させ、当該指示を受け付ける機能を有している。この制約強化指示装置11は、例えば図5に示すように、キーワード抽出ルールの内容及び当該ルールにマッチした表現及びキーワードの抽出結果を並べて表示する。同図では、上記したルールEr1を上記した文3の関係8に適用した場合に抽出されるキーワード「スキマ」を強調表示している。
【0044】
このような表示画面をユーザが見て、このルールEr1の制約強化を行うべきかを判定し、Yes/Noの指示を与える。そして、制約強化指示装置11がYesの指示を受けた場合には後述する制約強化精製装置12や制約強化ルール候補提示装置13による制約強化処理が行われ、制約強化指示装置11がNoの指示を受けた場合にはこのような制約強化処理は行われず、このまま処理が終了させられて、例えば次のキーワードに関する制約強化指示装置11による処理へ移行する。
【0045】
このように、制約強化指示装置11は、パターンマッチング装置3によって或るキーワード抽出ルールと或る表現とがマッチしてキーワードが抽出されたときに、当該装置3から得られるキーワード抽出ルール、表現、キーワードをユーザに提示し、このキーワードを実際には抽出すべきかどうかのユーザの判断を受けて、その結果を出力する。そして、抽出すべきではないと指示された場合にはキーワード抽出ルール、表現、キーワードを制約強化精製装置12へ出力し、抽出すべきであると指示された場合にはこのキーワードの抽出に関する一連の処理を終了する。なお、ここで言う抽出すべきではないという指示が本発明に言う提示したルールを不適用とする指示に相当する。
【0046】
制約強化精製装置12は、上記した制約強化指示装置11によりYesの指示を受け付けた場合に、このキーワード抽出ルールの制約を強化する精製を行う機能を有している。本例の制約強化精製装置12は、2つの異なる手法(各々、強化手法1、強化手法2と言う)によりキーワード抽出ルールの制約を強化する機能を有している。
【0047】
まず、強化手法1を説明する。
すなわち、キーワード抽出ルール
Er:(F, R, B) → A
に対して、例えば抽出しないようにしたい語が係り語である場合には、当該係り語の概念をfcとすると、制約強化後のキーワード抽出ルールEraは、
Era:(F−{fc}, R, B) → A
となる。
【0048】
同様に、例えば抽出しないようにしたい語が受け語である場合には、当該受け語の概念をbcとすると、制約強化後のキーワード抽出ルールErbは、
Erb:(F, R, B−{bc}) → A
となる。
【0049】
具体的に、例えばキーワード抽出ルール保持装置4が保持するキーワード抽出ルールEr1に対して、上記した文3とのマッチングによって当該文3の関係8(「スキマができない」)とのマッチングを行った場合には、当該関係8は Er1にマッチして係り語「スキマ」が概念「印字品質」のキーワードとして抽出される。しかし、実際にはこの表現「スキマができない」は問題を示す表現ではないので、ユーザは、この抽出を行わないようにEr1を強化したいと考え、その旨を指示する。
この場合、抽出しないようにしたい語は係り語であるので上記したErが上記したEraへ変更されるような制約強化を行う。すなわち、Er1から得られる制約強化後のキーワード抽出ルールEra1は、
Era1:({[サービス]}, {が, は}, {“でき(否)”}) → {f}
となる。
【0050】
なお、上記したキーワード抽出ルールEr1を上記したキーワード抽出ルールEra1へ変更する場合を例とすると、上記した「スキマ」が本発明に言う提示した表現中の提示したルールに適合する語に相当し、上記した「印字品質」が当該語に該当するキーワードに相当し、上記したキーワード抽出ルールEr1で規定される係り語側のキーワード群が本発明に言う(提示した)ルールで規定される当該語に対応したキーワード群に相当し、当該キーワード群から当該キーワード「印字品質」が削除されている。ここで、本例では、係り語側の例を示したが、受け語側についても同様である。
【0051】
このように、強化手法1では、制約強化精製装置12は、制約強化指示装置11からキーワード抽出ルール、表現、キーワードの入力を受けて、キーワードの部分(本例のように係り受けの場合には、係り語或いは受け語)の概念をキーワード抽出ルールから削減する方法により当該ルールの制約を強化する。
【0052】
次に、強化手法2を説明する。
すなわち、キーワード抽出ルールErに対して、例えば抽出しないようにしたい語が係り語である場合には、当該係り語の概念fcのm個の下位概念をfcu1, …, fcumとし、これらの下位概念の中で当該係り語を包含する概念をfcui (1≦i≦m)とすると、Erの制約強化後のキーワード抽出ルールErcは、
Erc:(F−{fc}+{fcu1, …, fcui-1, fcui+1, …, fcum}, R, B) → A
となる。
【0053】
同様に、例えば抽出しないようにしたい語が受け語である場合には、当該受け語の概念bcのn個の下位概念をbcu1, …, bcunとし、これらの下位概念の中で当該受け語を包含する概念をbcuj (1≦j≦n)とすると、Erの制約強化後のキーワード抽出ルールErdは、
Erd:(F, R, B−{bc}+{bcu1, …, bcuj-1, bcuj+1, …, bcun}) → A
となる。
【0054】
上記した強化手法1の場合と同様に、例えばキーワード抽出ルール保持装置4がキーワード抽出ルールEr1を保持し、上記した文3とのマッチングによって当該文3の関係8(「スキマができない」)とのマッチングを行った場合には、抽出しないようにしたい語は係り語「スキマ」となるので、上記したErが上記したErcへ変更されるような制約強化を行う。具体的には、概念「印字品質」の下位概念は「印字状態」と「印字エラー」であり、「スキマ」は「印字エラー」に属しているので、概念「印字エラー」を削除する。すなわち、Er1から得られる制約強化後のキーワード抽出ルールErc1は、
Erc1:({[印字状態], [サービス]}, {が, は}, {“でき(否)”}) → {f}
となる。
【0055】
なお、上記したキーワード抽出ルールEr1を上記したキーワード抽出ルールErc1へ変更する場合を例とすると、上記した「印字状態」及び「印字エラー」が本発明に言う下位概念の複数のキーワードに相当し、これら下位概念の複数のキーワード中の「印字エラー」が本発明に言う下位概念の複数のキーワードの中で(ルールに適合した)語に該当するキーワードに相当し、当該語に該当した元々のキーワード「印字品質」が下位概念の中で当該語に該当しない「印字状態」へ置き換えられている。ここで、本例では、係り語側の例を示したが、受け語側についても同様である。
【0056】
このように、強化手法2では、制約強化精製装置12は、制約強化指示装置11からキーワード抽出ルール、表現、キーワードの入力を受けて、キーワードの部分(本例のように係り受けの場合には、係り語或いは受け語)の概念をシソーラスを用いて下位概念に展開した上で、当該部分が属する下位概念のみをキーワード抽出ルールから削減する方法により当該ルールの制約を強化する。
【0057】
制約強化ルール候補提示装置13は、上記した制約強化精製装置12によって精製された制約強化後のキーワード抽出ルールの候補(本例では、強化手法1により生成されるルール及び強化手法2により生成されるルール)をユーザに提示し、ユーザが提示された候補の中から1個を選択した場合に、当該選択の指示に従って上書き処理を行う機能を有している。つまり、制約強化ルール候補提示装置13では、ユーザにより選択されたルールが制約強化後のキーワード抽出ルールとして決定され、当該ルールがキーワード抽出ルール保持装置4中の制約強化前のルールに上書きされる。
【0058】
上記と同様に、例えばキーワード抽出ルールEr1を例とすると、この場合の候補は上記したEra1及び上記したErc1となり、例えば図6に示すような内容がユーザに対して表示される。同図の例では、各候補の元ルールEr1に対する変更箇所を強調表示している。例えばユーザが同図中の“1”を選択した場合には、Era1がキーワード抽出ルール保持装置4中のEr1に上書きされ、また、例えばユーザが同図中の“元ルール”を選択した場合には、上書き処理は行われずに、Er1がそのままキーワード抽出ルール保持装置4中に残る。
【0059】
以上のように、本例のキーワード抽出ルール精製支援装置では、例えばキーワード抽出装置のパターンマッチング装置3が行うマッチングの結果を受けて、ユーザの判断や選択に従ってキーワード抽出ルールの制約を強化していくことができ、これにより、例えば文書に合わせて既存のキーワード抽出ルールの制約強化処理を繰り返して行うことによって当該ルールの精製を実現することができる。
【0060】
次に、本発明の第2実施例に係るキーワード抽出ルール精製支援装置を説明する。なお、本例では、ルールの制約を緩和することを支援する装置(キーワード抽出ルール制約緩和支援装置)を示す。
図7には、本例に係るキーワード抽出ルール精製支援装置を組み込んだキーワード抽出装置の一例を示してあり、この装置には、例えば上記第1実施例の図1に示したものと同様な機能を有する文書群保持装置1や係り受け解析装置2やパターンマッチング装置3やキーワード抽出ルール保持装置4やシソーラス5と、本例の特徴的な構成部分である類似ルール選択装置21及びキーワード抽出ルール制約緩和装置22とが備えられている。
【0061】
なお、上記図1に示したものと同様な機能を有する構成部分1〜5については、同図に示したのと同じ符号を用いて示してある。
また、説明の便宜上から、上記第1実施例で示したのと同様な構成については、本例では、説明を省略する。
【0062】
本例では、キーワード抽出ルール保持装置4が次のようなキーワード抽出ルールEr2を保持する場合を例として示す。
Er2:({“丁合い”, [サービス]}, {が, は}, {“でき(否)”}) → {f}
この場合、パターンマッチング装置3が例えば上記した文4の関係10(「スタックができない」)とキーワード抽出ルールEr2とのマッチングを取ろうとすると、関係「が」と受け語「できない」についてはEr2の該当部分とマッチするが、係り語「スタック」についてはEr2の該当部分とマッチしないため、キーワードは抽出されない。
【0063】
また、キーワード抽出ルール保持装置4が保持する他のキーワード抽出ルールも全て上記した関係10とマッチしない場合には、当該関係10からはキーワードが抽出されない。しかし、「スタックができない」というのは問題を示す表現であり、「スタック」をキーワードとして抽出すべきである。
【0064】
そこで、本例では、このようなキーワードの抽出を実現するための構成として、類似ルール選択装置21やキーワード抽出ルール制約緩和装置22を備えている。
類似ルール選択装置21は、例えばキーワード抽出ルール保持装置4が保持する全てのキーワード抽出ルールと或る表現とがマッチしなかった場合に、その表現のパターンに近いキーワード抽出ルールをキーワード抽出ルール保持装置4が保持するキーワード抽出ルールの中から選択する機能を有している。
【0065】
本例のように係り受け関係が用いられている場合には、ここで選択されるキーワード抽出ルールは、次に示すUmaとUmbとUmcとのいずれかが成立するものとなる。
Umaは、係り語がマッチせず、関係と受け語はマッチするキーワード抽出ルールである。
Umbは、関係がマッチせず、係り語と受け語はマッチするキーワード抽出ルールである。
Umcは、受け語がマッチせず、係り語と関係はマッチするキーワード抽出ルールである。
具体的に、上記したEr2と上記した関係10の場合には、係り語「スタック」はEr2の係り語部分とマッチしないが、関係「が」と受け語「できない」は各々マッチするので、上記のUmaに相当する。
【0066】
このように、類似ルール選択装置21は、例えばパターンマッチング装置3によってマッチするキーワード抽出ルールがなかった場合に、表現とキーワード抽出ルールとの間で1箇所(本例のように係り受け関係の場合には、係り語、関係、受け語のいずれか)以外が全てマッチする(つまり、他の2個所がマッチする)ようなキーワード抽出ルールをキーワード抽出ルール保持装置4に保持されるキーワード抽出ルールの中から選択し、選択したキーワード抽出ルール及び表現及びマッチしなかったために抽出されなかったキーワードをキーワード抽出ルール制約緩和装置22へ出力する。
【0067】
キーワード抽出ルール制約緩和装置22は、例えば類似パターン選択装置21からの結果を受け、キーワード抽出ルールの制約を緩和してキーワード抽出ルール保持装置4の該当箇所に上書きする機能を有している。
図8には、キーワード抽出ルール制約緩和装置22の内部動作の構成例を示してあり、このキーワード抽出ルール制約緩和装置22は、例えば上記した類似ルール選択装置21と共に本発明に言う提示手段を構成するとともに、本発明に言う受付手段を構成する制約緩和指示装置31と、本発明に言う制約緩和手段を構成する制約緩和精製装置32及び制約緩和ルール候補提示装置33とから構成されている。
【0068】
制約緩和指示装置31は、キーワード抽出ルールの制約の緩和を行うか否かをユーザに指示させ、当該指示を受け付ける機能を有している。制約緩和指示装置31は、例えば図9に示すように、キーワード抽出ルールの内容及び例えば係り語と受け語とのいずれかが一致しなかったために当該キーワード抽出ルールとマッチしなかった表現及び抽出結果を並べて表示する。
【0069】
このような表示画面をユーザが見て、このルールEr2の制約緩和を実際に行うべきかを判定し、Yes/Noの指示を与える。そして、制約緩和指示装置31がYesの指示を受けた場合には後述する制約緩和精製装置32や制約緩和ルール候補提示装置33による制約緩和処理が行われ、制約緩和指示装置31がNoの指示を受けた場合にはこのような制約緩和処理は行われず、このまま処理が終了させられて、例えば次のキーワードに関する類似ルール選択装置21や制約緩和指示装置31による処理へ移行する。
【0070】
このように、制約緩和指示装置31は、類似ルール選択装置21から得られる文書、キーワード抽出ルール、表現、一致しなかった部分の語をユーザに提示し、この語を実際には抽出すべきかをユーザに判断させ、その結果を出力する。そして、抽出すべきであると指示された場合にはルール、表現、キーワードを制約緩和精製装置32へ出力し、抽出すべきでないと指示された場合にはこのキーワードの抽出に関する一連の処理を終了する。なお、ここで言う抽出すべきという指示が本発明に言う提示したルールを適用する指示に相当する。
【0071】
制約緩和精製装置32は、上記した制約緩和指示装置31によりYesの指示を受け付けた場合に、このキーワード抽出ルールの制約を緩和する精製を行う機能を有している。本例の制約緩和精製装置32は、4つの異なる手法(各々、緩和手法1、緩和手法2、緩和手法3、緩和手法4と言う)によりキーワード抽出ルールの制約を緩和する機能を有している。
【0072】
まず、緩和手法1を説明する。
すなわち、上記したUmaの場合を例とすると、例えば係り語がシソーラス中に存在すればキーワード抽出ルールErに対して制約緩和を行うことができ、この場合の制約緩和後のキーワード抽出ルールEreは、当該係り語の概念をfcとすると、
Ere:(F+{fc}, R, B) → A
となる。
【0073】
同様に、上記したUmcの場合を例とすると、例えば受け語がシソーラス中に存在すれば制約緩和を行うことができ、この場合の制約緩和後のキーワード抽出ルールErfは、当該受け語の概念をbcとすると、
Erf:(F, R, B+{bc}) → A
となる。
【0074】
具体的に、例えば上記したEr2が上記した関係10に関して制約緩和対象として検出された場合は、上記したUmaの場合に該当し、且つ、係り語はシソーラスT1中に存在するので、係り語「スタック」の概念「ソート」を追加した次のような制約緩和後のキーワード抽出ルールEre2が得られる。
Ere2:({“丁合い”, [サービス], [ソート]}, {が, は}, {“でき(否)”}) → {f}
【0075】
なお、上記したキーワード抽出ルールEr2を上記したキーワード抽出ルールEre2へ変更する場合を例とすると、上記した「スタック」が本発明に言う提示した表現中の提示したルールに不適合であった語に相当し、上記した[ソート]が本発明に言う当該語の概念を示すキーワードに相当し、当該キーワード[ソート]がキーワード抽出ルールに追加されている。ここで、本例では、係り語がマッチしない場合の例を示したが、受け語がマッチしない場合についても同様である。
【0076】
このように、緩和手法1では、制約緩和精製装置32は、制約緩和指示装置31からキーワード抽出ルール、表現、キーワードの入力を受けて、キーワードの部分(本例のように係り受けの場合には、係り語或いは受け語)の概念をキーワード抽出ルールの該当部分に追加する方法により当該ルールの制約を緩和する。
【0077】
次に、緩和手法2を説明する。
すなわち、上記したUmaの場合を例とすると、例えば係り語がシソーラス中に存在し、且つ、当該係り語の概念fcとキーワード抽出ルールErの係り語部分の或る概念fecとの共通上位概念があれば、その全ての共通上位概念fccに対して、この場合の制約緩和後のキーワード抽出ルールErgは、
Erg:(F−{fec}+{fcc}, R, B) → A
となる。
【0078】
同様に、上記したUmcの場合を例とすると、例えば受け語がシソーラス中に存在し、且つ、当該受け語の概念bcとErの受け語部分の或る概念becとの共通上位概念があれば、その全ての共通上位概念bccに対して、この場合の制約緩和後のキーワード抽出ルールErhは、
Erh:(F, R, B−{bec}+{bcc}) → A
となる。
【0079】
具体的に、例えば上記したキーワード抽出ルールEr2が上記した関係10に関して制約緩和対象として検出された場合は、上記したUmaの場合に該当し、且つ、係り語はシソーラスT1中に存在する。そして、係り語「スタック」の概念「ソート」と共通上位概念を持つ概念「サービス」がEr2の係り語部分に存在し、それらの共通上位概念は「症状」及び「問題」の2個となる。従って、次の2個の制約緩和後のキーワード抽出ルールErg2、Erg2'が得られる。
Erg2:({“丁合い”, [症状]}, {が, は}, {“でき(否)”}) → {f}
Erg2':({“丁合い”, [問題]}, {が, は}, {“でき(否)”}) → {f}
【0080】
なお、上記したキーワード抽出ルールEr2を上記したキーワード抽出ルールErg2、Erg2'へ変更する場合を例とすると、上記した「サービス」が本発明に言う(提示した)ルールで規定される(当該ルールに不適合であった)語に対応したキーワード群中のキーワードに相当し、上記した[症状]や上記した[問題]が本発明に言う(当該語の概念を示すキーワードと当該キーワード群中の当該キーワードとの)共通上位概念を示すキーワードに相当し、当該キーワード群中の当該キーワード「サービス」が当該共通上位概念を示すキーワードである[症状]や[問題]に置き換えられている。ここで、本例では、係り語がマッチしない場合の例を示したが、受け語がマッチしない場合についても同様である。
【0081】
このように、緩和手法2では、制約緩和精製装置32は、上位概念の折り畳みによる制約緩和を行い、具体的には、制約緩和指示装置31からキーワード抽出ルール、表現、キーワードの入力を受けて、キーワードの部分(本例のように係り受けの場合には、係り語或いは受け語)の概念とキーワード抽出ルールの該当部分の概念との共通上位概念に置き換える方法により当該ルールの制約を緩和する。
【0082】
次に、緩和手法3を説明する。
すなわち、上記したUmaの場合を例とすると、例えば係り語をfsとすると、この場合の制約緩和後のキーワード抽出ルールEriは、
Eri:(F+{“fs”}, R, B) → A
となる。
【0083】
同様に、上記したUmbの場合を例とすると、例えば関係をrとすると、この場合の制約緩和後のキーワード抽出ルールErjは、
Erj:(F, R+{r}, B) → A
となる。
また、上記したUmcの場合を例とすると、例えば受け語をbsとすると、この場合の制約緩和後のキーワード抽出ルールErkは、
Erk:(F, R, B+{“bs”}) → A
となる。
【0084】
具体的に、例えば上記したキーワード抽出ルールEr2が上記した関係10に関して制約緩和対象として検出された場合は、上記したUmaの場合に該当し、次の制約緩和後のキーワード抽出ルールEri2が得られる。
Eri2:({“丁合い”, [サービス], “スタック”}, {が, は}, {“でき(否)”})→ {f}
ここで、本例では、係り語がマッチしない場合の例を示したが、受け語がマッチしない場合についても同様である。
【0085】
このように、緩和手法3では、制約緩和精製装置32は、制約緩和指示装置31からキーワード抽出ルール、表現、キーワードの入力を受けて、キーワードの部分(本例のように係り受けの場合には、係り語或いは受け語)の表層をキーワード抽出ルールの該当部分に追加する方法により当該ルールの制約を緩和する。
【0086】
次に、緩和手法4を説明する。
すなわち、上記したUmaの場合を例とすると、例えば係り語fsとキーワード抽出ルールErの係り語部分における或る表層fesとがいずれもシソーラス中に存在し、それらの共通(上位)概念があれば、その全ての共通上位概念fccに対して、制約緩和後のキーワード抽出ルールErlは、
Erl:(F−{“fes”}+{[fcc]}, R, B) → A
となる。
【0087】
同様に、上記したUmcの場合を例とすると、例えば受け語bsとキーワード抽出ルールErの受け語部分における或る表層besとがいずれもシソーラス中に存在し、それらの共通(上位)概念があれば、その全ての共通上位概念bccに対して、制約緩和後のキーワード抽出ルールErmは、
Erm:(F, R, B−{“bes”}+{[bcc]}) → A
となる。
【0088】
具体的に、例えば上記したキーワード抽出ルールEr2が上記した関係10に関して制約緩和対象として検出された場合は、上記したUmaの場合に該当し、係り語「スタック」とEr2の係り語部分の表層「丁合い」とはいずれもシソーラスT1中に存在し、それらの共通(上位)概念「ソート」、「動作」、「症状」、「問題」があるので、次のような4個の制約緩和後のキーワード抽出ルールErm2、Erm2'、Erm2''、Erm2'''が得られる。
Erm2:({[ソート], [サービス]}, {が, は}, {“でき(否)”}) → {f}
Erm2':({[動作], [サービス]}, {が, は}, {“でき(否)”}) → {f}
Erm2'':({[症状], [サービス]}, {が, は}, {“でき(否)”}) → {f}
Erm2''':({[問題], [サービス]}, {が, は}, {“でき(否)”}) → {f}
【0089】
なお、上記したキーワード抽出ルールEr2を上記したキーワード抽出ルールErm2、Erm2'、Erm2''、Erm2'''へ変更する場合を例とすると、上記した「丁合い」が本発明に言う(提示した)ルールで規定される(当該ルールに不適合であった)語に対応したキーワード群中の表層的なキーワードに相当し、当該キーワード「丁合い」がこれと当該語「スタック」との共通上位概念を示すキーワードである「ソート」や「動作」や「症状」や「問題」に置き換えられている。ここで、本例では、係り語がマッチしない場合の例を示したが、受け語がマッチしない場合についても同様である。
【0090】
このように、緩和手法4では、制約緩和精製装置32は、表層から概念への変換による制約緩和を行い、具体的には、制約緩和指示装置31からキーワード抽出ルール、表現、キーワードの入力を受けて、キーワードの部分(本例のように係り受けの場合には、係り語或いは受け語)の表層とキーワード抽出ルールの該当部分の表層との共通概念に置き換える方法により当該ルールの制約を緩和する。
【0091】
制約緩和ルール候補提示装置33は、例えば上記した制約緩和精製装置32によって精製された制約緩和後のキーワード抽出ルールの候補(本例では、緩和手法1により生成されるルール及び緩和手法2により生成されるルール及び緩和手法3により生成されるルール及び緩和手法4により生成されるルール)をユーザに提示し、ユーザが提示された候補の中から1個を選択した場合に、当該選択の指示に従って上書き処理を行う機能を有している。つまり、制約緩和ルール候補提示装置33では、ユーザにより選択されたルールが制約緩和後のキーワード抽出ルールとして決定され、当該ルールがキーワード抽出ルール保持装置4中の制約緩和前のルールに上書きされる。
【0092】
上記と同様に、例えばキーワード抽出ルールEr2を例とすると、この場合の候補は上記したEre2, Erg2, Erg2', Eri2, Erm2, Erm2', Erm2'', Erm2'''となり、例えば図10に示すような内容がユーザに対して表示される。例えばユーザが同図中の“1”を選択した場合には、Ere2がキーワード抽出ルール保持装置4中のEr2に上書きされ、また、例えばユーザが同図中の“元ルール”を選択した場合には、上書き処理は行われずに、Er2がそのままキーワード抽出ルール保持装置4中に残る。
【0093】
以上のように、本例のキーワード抽出ルール精製支援装置では、例えばキーワード抽出装置のパターンマッチング装置3が行うマッチングの結果を受けて、ユーザの判断や選択に従ってキーワード抽出ルールの制約を緩和していくことができ、これにより、例えば文書に合わせて既存のキーワード抽出ルールの制約緩和処理を繰り返して行うことによって当該ルールの精製を実現することができる。
【0094】
次に、本発明の第3実施例に係るキーワード抽出ルール精製支援装置を説明する。
本例のキーワード抽出ルール精製支援装置の構成は、例えば上記第1実施例の図1や上記第2実施例の図7に示したものとほぼ同様であり、本例では、更に、本発明に言うマージ手段を構成するマージ機能(図示せず)を備えており、このマージ機能はキーワード抽出ルールをマージ(統合)する機能を有している。
【0095】
なお、上記図1や上記図7に示したものと同様な機能を有する構成部分1〜5については、同図に示したのと同じ符号を用いて示す。
また、説明の便宜上から、上記第1実施例や上記第2実施例で示したのと同様な構成については、本例では、説明を省略する。
【0096】
本例のマージ機能は、例えばキーワード抽出ルール保持装置4に保持されるキーワード抽出ルールのマージを任意の時点で行うことができる機能を有しており、以下で、この機能について具体的に説明する。
一例として、キーワード抽出ルール保持装置4によって保持されるキーワード抽出ルールの中に、次のような2個のキーワード抽出ルールEr3、 Er4があるとする。
Er3:({[印字状態]}, {が, は}, {“でき(否)”, “し(否)”}) → {f}
Er4:({[印字状態]}, {が, は}, {“な(い)”}) → {f}
【0097】
このとき、この2個のキーワード抽出ルールを1個のキーワード抽出ルールにマージすると、ユーザによる見易さを改善することができ、マッチングのスピードのアップを図ることができ、抽出ルール精製の精度のアップを図ることができるといった効果を得ることができる。
具体的には、上記したEr3、Er4をマージして得られるキーワード抽出ルールEr34は次のようになる。
Er34:({[印字状態]}, {が, は}, {“でき(否)”, “し(否)”, “な(い)”}) → {f}
【0098】
なお、この場合を例とすると、上記した2個のキーワード抽出ルールEr3,、Er4が本発明に言うルールで規定される第1キーワード群及び第2キーワード群及び関係の内の1つのみが異なる複数のルールに相当し、上記したキーワード抽出ルールEr34が本発明に言う当該異なる部分を総和した1つのルールに相当する。
【0099】
また、他の例として、キーワード抽出ルール保持装置4によって保持されるキーワード抽出ルールの中に、次のような2個のキーワード抽出ルールEr5、Er6があるとする。
Er5:({[使い勝手]}, {が, は}, {“悪(い)”}) → {f}
Er6:({[サービス]}, {が, は}, {“悪(い)”}) → {f}
【0100】
このとき、上記図3に示したシソーラスT1における「使い勝手」、「サービス」の2個の概念に共通する上位概念は「症状」であるので、上記したEr5、 Er6をマージして得られるキーワード抽出ルールEr56としては、一例として次のようなものが想定される。
Er56:({[症状]}, {が, は}, {“悪(い)”}) → {f}
【0101】
しかしながら、このようなマージを実行すると、元々包含されていた「使い勝手」及び「サービス」の他に「故障」や「動作」や「品質」の概念も包含されることになる。そこで、例えばユーザがこれを認める場合には、ユーザからの指示に従って、上記したEr56をマージされたキーワード抽出ルールとする。一方、ユーザがこれを認めない場合には、ユーザからの指示に従って、例えば次のキーワード抽出ルールEr56'をマージされたキーワード抽出ルールとする。
Er56':({[使い勝手] , [サービス]}, {が, は}, {“悪(い)”}) → {f}
【0102】
なお、この場合を例とすると、上記した2個のキーワード抽出ルールEr5、Er6が本発明に言うルールで規定される第1キーワード群及び第2キーワード群及び関係の内の1つのみが異なる複数のルールに相当し、上記したキーワード抽出ルールEr56や上記したキーワード抽出ルールEr56'が本発明に言う当該異なる部分を総和した1つのルールに相当する。
【0103】
ここで、本発明に係るキーワード抽出ルール精製支援装置やキーワード抽出装置の構成としては、必ずしも以上に示したものに限られず、種々な構成が用いられてもよい。
例えば、以上の実施例では、説明の便宜上から、上記第1実施例においてキーワード抽出ルールの制約を強化する機能を備えた装置を示す一方、上記第2実施例においてキーワード抽出ルールの制約を緩和する機能を備えた装置を示したが、このような制約強化機能とこのような制約緩和機能との両方を備えた構成を用いることも好ましい態様である。
【0104】
また、例えば、以上の実施例では、好ましい態様として、本発明に係るキーワード抽出ルール精製支援装置やキーワード抽出装置により行われる各種の処理としては、例えばプロセッサやメモリ等を備えたハードウエア資源においてプロセッサがROMに格納された制御プログラムを実行することにより制御される構成としたが、例えば当該処理を実行するための各機能手段を独立したハードウエア回路として構成することも可能である。
【0105】
また、本発明は上記のような制御プログラムを格納したフロッピーディスクやCD−ROM等のコンピュータにより読み取り可能な記憶媒体として把握することもでき、当該制御プログラムを記憶媒体からコンピュータに入力してプロセッサに実行させることにより、本発明に係る処理を遂行させることができる。
【0106】
【発明の効果】
以上説明したように、本発明に係るキーワード抽出ルール精製支援装置や記憶媒体やキーワード抽出ルール精製支援方法によると、例えばキーワードを抽出すべきでないのに或るキーワード抽出ルールとマッチしてしまうような場合であっても、そのルールの制約を強化してマッチしないようにすることができ、また、例えばキーワードを抽出すべきであるのにマッチするキーワード抽出ルールが存在しないような場合であっても、その表現に近いキーワード抽出ルールの制約を緩和してマッチするようにすることができる。こうしたことから、例えば文書に合わせて既存のキーワード抽出ルールの制約強化処理や制約緩和処理を繰り返して行うことによって、キーワード抽出ルールの精製を実現することができる。
【図面の簡単な説明】
【図1】本発明の第1実施例に係るキーワード抽出ルール精製支援装置を適用したキーワード抽出装置の一例を示す図である。
【図2】形態素の要素位置の一例を示す図である。
【図3】シソーラスのデータの一例を示す図である。
【図4】キーワード抽出ルール制約強化装置の構成例を示す図である。
【図5】制約強化指示装置による表示例を示す図である。
【図6】制約強化ルール候補提示装置による表示例を示す図である。
【図7】本発明の第2実施例に係るキーワード抽出ルール精製支援装置を適用したキーワード抽出装置の一例を示す図である。
【図8】キーワード抽出ルール制約緩和装置の構成例を示す図である。
【図9】制約緩和指示装置による表示例を示す図である。
【図10】制約緩和ルール候補提示装置による表示例を示す図である。
【図11】キーワード抽出装置の一例を示す図である。
【符号の説明】
1・・文書群保持装置、 2・・係り受け解析装置、
3・・パターンマッチング装置、 4・・キーワード抽出ルール保持装置、
5・・シソーラス、 6・・キーワード抽出ルール制約強化装置、
11・・制約強化指示装置、 12・・制約強化精製装置、
13・・制約強化ルール候補提示装置、 21・・類似ルール選択装置、
22・・キーワード抽出ルール制約緩和装置、 31・・制約緩和指示装置、
32・・制約緩和精製装置、 33・・制約緩和ルール候補提示装置、[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a keyword extraction rule refinement support device and a storage medium that support refinement (strengthening and relaxation) of a keyword extraction rule used in a keyword extraction device that extracts keywords from a document by pattern matching of expressions, for example.And keyword extraction rule refinement support methodAbout.
[0002]
[Prior art]
For example, there are the following techniques for generating patterns and keyword extraction rules.
As an example, the sentence pattern extraction apparatus described in Japanese Patent Laid-Open No. 7-262189 (hereinafter referred to as Document 1) extracts sentence patterns from text and integrates them. The sentence pattern here is a pattern in the order of appearance.
[0003]
Further, in the collation pattern generation method and apparatus described in, for example, Japanese Patent Application Laid-Open No. 9-6796 (hereinafter referred to as Document 2), the user gives a judgment of conformity / nonconformity for a certain purpose, and each document set Automatically extract patterns from
Further, in the keyword extraction rule generation method described in Japanese Patent Laid-Open No. 10-21249 (hereinafter referred to as Document 3), keyword extraction rules used for structuring a document are automatically generated, and a given output format Automatically generate the condition of the character string extracted from the definition.
[0004]
Here, the technique described in the above-mentioned
In the technique described in
[0005]
The technique described in
As described above, there is a technique for automatically generating a pattern and a keyword extraction rule, but there is no technique for supporting correction that increases the accuracy as needed.
[0006]
[Problems to be solved by the invention]
As shown in the above conventional example, conventionally, there is no technology that supports refinement (strengthening and relaxation) of the keyword extraction rules used in the keyword extraction device, so that the accuracy of the keyword extraction rules once generated can be improved. Specifically, for example, there is a problem that refining support according to the document cannot be performed for each viewpoint and semantic keyword extraction rule in the keyword extracting device.
[0007]
The present invention has been made in view of the above-described conventional circumstances, and supports, for example, refinement (strengthening and relaxation) of keyword extraction rules used in a keyword extraction device that extracts keywords from a document by pattern matching of expressions. Keyword extraction rule refinement support device and storage medium that canAnd keyword extraction rule refinement support methodThe purpose is to provide.
[0008]
[Means for Solving the Problems]
In order to achieve the above object, the keyword extraction rule refining support apparatus according to the present invention supports refining the rule of the keyword extracting apparatus that extracts a keyword from a document based on a predetermined rule as follows. . Here, the rule is determined based on an expression in a document in which a word corresponding to the first keyword included in the first keyword group and a word corresponding to the second keyword included in the second keyword group appear with a predetermined relationship. Specify that keywords are extracted.
[0009]
In other words, when the presentation unit presents an expression that matches the rule and the rule to the user, receives an instruction from the user that the rule presented to the expression presented by the reception unit is not applicable, and receives the instruction The rule is changed so that the rule presented to the expression presented by the constraint strengthening means is not applicable.
Therefore, for example, when the user determines that the rule presented for the presented expression is not applicable, the rule is changed to meet such an instruction from the user. It is possible to support the refinement of the rule in the direction of strengthening.
[0010]
Further, as a preferred aspect, in the keyword extraction rule refinement support device as described above, the constraint strengthening means corresponds to a keyword that corresponds to a word that matches the presented rule in the presented expression to the word specified by the rule. By deleting from the keyword group, the presented rule is not applied to the presented expression.
[0011]
As another preferred embodiment, in the keyword extraction rule refinement support apparatus as described above, the constraint strengthening means converts a keyword corresponding to a word that matches the presented rule in the presented expression into a plurality of keywords of a lower concept. Then, by deleting the keyword corresponding to the word from the keyword group corresponding to the word specified in the rule among the plurality of keywords of the subordinate concepts, the rule presented to the presented expression is not applied. To be.
[0012]
Further, the keyword extraction rule refinement support device according to the present invention supports the refinement of the rule of the keyword extraction device that extracts keywords from a document based on a predetermined rule as follows. Here, the rule is determined based on an expression in a document in which a word corresponding to the first keyword included in the first keyword group and a word corresponding to the second keyword included in the second keyword group appear with a predetermined relationship. Specify that keywords are extracted.
[0013]
In other words, the presentation means presents the user with an expression that matches only two of the first keyword and the second keyword and the relationship specified by the rule, and the rule, and the rule presented to the expression presented by the reception means When an instruction to apply is received from the user and the instruction is received, the rule is changed so that the rule presented to the expression presented by the constraint relaxation means is applied.
Therefore, for example, when the user decides to apply the presented rule to the presented expression, the rule is changed to match such an instruction from the user, so the rule is relaxed. It is possible to support the refinement of the rule in the direction of
[0014]
Further, as a preferred aspect, in the keyword extraction rule refinement support device according to the present invention, the constraint relaxation means includes a keyword that indicates a concept of a word that is incompatible with the presented rule in the presented expression. By adding to the keyword group corresponding to the word, the presented rule is applied to the presented expression.
[0015]
As another preferred embodiment, in the keyword extraction rule refinement support device according to the present invention, the constraint relaxation means is defined by a keyword indicating the concept of a word that is incompatible with the presented rule in the presented expression and the rule. By replacing the keyword in the keyword group with a keyword indicating a common superordinate concept with the keyword in the keyword group corresponding to the word, the presented rule is applied to the presented expression.
[0016]
As another preferred embodiment, in the keyword extraction rule refinement support device according to the present invention, the constraint relaxation means corresponds to a word that is incompatible with the presented rule in the presented expression corresponding to the word specified by the rule. By adding to the keyword group, the presented rule is applied to the presented expression.
[0017]
As another preferred embodiment, in the keyword extraction rule refinement support device according to the present invention, the constraint relaxation means corresponds to a word that is incompatible with the presented rule in the presented expression and the word specified by the rule. By replacing the surface keyword with a keyword indicating a common superordinate concept with the surface keyword in the keyword group, the presented rule is applied to the presented expression.
[0018]
Further, in the keyword extraction rule refinement support device according to the present invention, a plurality of rules that differ only in one of the first keyword group and the second keyword group and the relationship that the merging means defines in the rule, Convert to a summed rule.
Therefore, for example, since the plurality of rules can be replaced with one rule without substantially changing the contents of the plurality of rules, the storage capacity of a memory for storing the rules by organizing the rules is reduced. Etc.
[0019]
The various processes according to the present invention as described above can also be realized by, for example, reading and executing a program stored in a storage medium by a computer.
As an example, the storage medium according to the present invention stores a program to be executed by a computer so that the input means of the computer can read it, and a word corresponding to the first keyword included in the first keyword group and the second keyword group In order to assist in refining the rule of the keyword extraction apparatus that extracts a keyword from a document based on a rule for extracting a predetermined keyword from an expression in which a word corresponding to the second keyword included in the word appears in a predetermined relationship The program includes an expression that conforms to the rule, a process that presents the rule to the user, a process that accepts an instruction to apply the rule presented to the presented expression from the user, and an instruction that accepts the instruction. Change the rule so that the presented rule is not applicable to the presented expression And a process is executed to the computer.
[0020]
Similarly, the storage medium according to the present invention stores a program to be executed by a computer so that the input means of the computer can read it, and the word corresponding to the first keyword included in the first keyword group and the second Assists in refining the rules of the keyword extraction device that extracts keywords from a document based on the rules for extracting a predetermined keyword from an expression in which a word corresponding to the second keyword included in the keyword group appears in a predetermined relationship The program is used for the expression that matches only two of the first keyword and the second keyword specified in the rule and the relationship, the process of presenting the rule to the user, and the presented expression. Processing to accept an instruction to apply the rule presented by the user, and presented when the instruction is accepted And processing for changing the rule that the rule presented for the current is applied is executed in the computer.
The present invention can also be provided as a keyword extraction rule refinement support method.
[0021]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments according to the present invention will be described with reference to the drawings.
First, an example of a keyword extracting device to which the present invention is applied is shown. In the keyword extraction device, for example, a keyword indicating the characteristics of the document is automatically extracted from a document including text using a keyword extraction rule and a thesaurus prepared in advance, and the keyword extraction rule refining device according to the present invention is used. The refinement of such keyword extraction rules is supported. Here, the keyword extraction rule is based on an expression pattern, and a dependency relationship or the like can be used. Below, the case where a dependency relationship is used will be described as an example.
[0022]
FIG. 11 shows an example of the configuration of the keyword extraction device when a dependency relationship is used. In this keyword extraction device, the document
[0023]
Next, a keyword extraction rule refining support apparatus according to the first embodiment of the present invention will be described. In this example, an apparatus (keyword extraction rule restriction strengthening support apparatus) that supports strengthening rule restrictions is shown.
FIG. 1 shows an example of a keyword extraction device incorporating the keyword extraction rule refinement support device according to the present example. This device has, for example, a document group holding function similar to that shown in FIG. A
[0024]
The document
Below, the case where the keyword which shows a "problem" is extracted by the extraction rule by applying the
[0025]
Sentence 1: Horizontal resolution is not possible.
Sentence 2: You can resolve the horizontal.
Sentence 3: There is no gap in the glued part of the binder.
Statement 4: The output cannot be stacked.
[0026]
The
[0027]
The elements on the dependency side and the reception side are expressed by the morpheme appearance position in one sentence, and are held in a set of the following shapes.
(fp, r, bp)
Where fp and Each bp indicates the appearance position in the document relating to the dependency side and the reception side, and r indicates the relationship between the dependency side and the reception side.
[0028]
In the case of
(1, of, 3) ・ ・
(3, is 5 (no)) ・ ・
[0029]
In the case of
(1, of, 3) ・ ・
(3, 5) ・ ・
[0030]
In the case of
(1, of, 3) ・ ・
(3, (none), 4) ・ ・ Relationship 6
(4, n, 8 (no)) ・ ・ Relation 7
(6, but, 8 (no)) ・ ・ Relationship 8
[0031]
In the case of
(1, of, 3) ・ ・ Relationship 9
(3, but, 5 (no)) ・ ・ Relationship 10
Similarly to the above, such analysis processing is performed on other documents in each document group.
[0032]
The keyword extraction
One keyword extraction rule Er is
Er: (F, R, B) → A
The keyword extraction
[0033]
Here, F, R, B, and A described above are sets, and details thereof will be described below.
F is a set of phenomonic expressions, and each element is represented by [c] or “s”. R is a set of relationships, and each element is denoted by r. If the relationship is not specified, it is expressed as “(None)”.
B is a collection of spoken language expressions, and each element is represented by [c] or “s”.
A is the content of the keyword extraction operation, and each element indicates the position of the word to be extracted. Specifically, it is f when extracting a related word, and b when extracting a received word.
In addition, the above c represents a concept name included in the thesaurus, and the above s represents a surface layer.
[0034]
Note that the keyword extraction rule in this embodiment corresponds to the rule in the present invention, and F, B, and R in this embodiment correspond to the first keyword group, the second keyword group, and a predetermined relationship, respectively, in the present invention. Corresponding, each element of F and B elements in this embodiment correspond to the first keyword and second keyword in the present invention, respectively, and the keyword extracted by A in this embodiment says to the present invention. It corresponds to a predetermined keyword.
[0035]
The
[0036]
The
In addition, when the pattern matches (that is, when a dependency expression suitable for the keyword extraction rule is found), the
[0037]
Here, the keyword extraction
Er1: ({[Print Quality], [Service]}, {but, is}, {“can (not)”}) → {f}
For example, the relation 2 (“cannot be resolved”) of the
[0038]
For example, the relationship 4 (“can be resolved”) of the
Further, for example, the relationship 8 (“cannot be cleared”) of the
[0039]
Further, for example, the relation 10 (“can't stack”) of the
[0040]
The keyword extraction rule Er described above1As an example, [print quality] and [service] correspond to the first keyword referred to in the present invention, and “resolution” and “clearance” corresponding thereto correspond to the first keyword referred to in the present invention. Correspondingly, similarly, “done (no)” corresponds to the second keyword referred to in the present invention, and “done (no)” corresponding to this corresponds to the word corresponding to the second keyword referred to in the present invention.
[0041]
As described above, the relation 8 (“cannot be cleared”) of the
[0042]
Therefore, in this example, for example, a keyword extraction rule constraint strengthening device 6 having a function of receiving input from the
FIG. 4 shows a configuration example of the internal operation of the keyword extraction rule constraint strengthening device 6, and this keyword extraction rule constraint strengthening device 6 is a constraint strengthening
[0043]
The constraint strengthening
[0044]
The user sees such a display screen, and this rule Er1Judgment on whether or not to strengthen the restrictions, and give Yes / No instructions. When the constraint strengthening
[0045]
As described above, the constraint strengthening
[0046]
The constraint strengthening
[0047]
First, the
That is, keyword extraction rules
Er: (F, R, B) → A
On the other hand, for example, if a word that should not be extracted is a related word, and the concept of the related word is fc,
Era: (F− {fc}, R, B) → A
It becomes.
[0048]
Similarly, for example, when a word that should not be extracted is a receiver, if the concept of the receiver is bc, the keyword extraction rule Erb after strengthening the constraint is:
Erb: (F, R, B− {bc}) → A
It becomes.
[0049]
Specifically, for example, the keyword extraction rule Er held by the keyword extraction
In this case, since the word that is desired not to be extracted is a related term, constraint reinforcement is performed so that the above-described Er is changed to the above-described Era. That is, Er1Keyword extraction rule Era after constraint strengthening obtained from Era1Is
Era1: ({[Service]}, {but, is}, {“can (deny)”}) → {f}
It becomes.
[0050]
The keyword extraction rule Er described above1The keyword extraction rule Era mentioned above1As an example, the above-mentioned “skimming” corresponds to a word that matches the presented rule in the presented expression referred to in the present invention, and the above-mentioned “print quality” corresponds to a keyword corresponding to the word. And the above keyword extraction rule Er1The keyword group on the side of the stipulated word defined in (1) corresponds to the keyword group corresponding to the word defined in the rule (presented) according to the present invention, and the keyword “print quality” is deleted from the keyword group. . Here, in this example, the example on the side of the slang word was shown, but the same applies to the side of the receiver word.
[0051]
As described above, in the
[0052]
Next, the
That is, for the keyword extraction rule Er, for example, if a word that should not be extracted is a related word, m subordinate concepts of the related word concept fc are fcu.1,…, FcumAmong these subconcepts, fcui If (1 ≦ i ≦ m), the keyword extraction rule Erc after strengthening the constraint of Er is
Erc: (F− {fc} + {fcu1,…, Fcui-1, fcui + 1,…, Fcum}, R, B) → A
It becomes.
[0053]
Similarly, for example, if a word that is not to be extracted is a received word, n subordinate concepts of the received word concept bc are bcu.1,…, BcunAnd the concept that includes the receiver in these subordinate concepts is bcuj If (1 ≦ j ≦ n), then the keyword extraction rule Erd after strengthening the Er constraint is
Erd: (F, R, B− {bc} + {bcu1,…, Bcuj-1, bcuj + 1,…, Bcun}) → A
It becomes.
[0054]
As in the case of the above-described
Erc1: ({[Print Status], [Service]}, {G, is}, {“Can (No)”}) → {f}
It becomes.
[0055]
The keyword extraction rule Er described above1The keyword extraction rule Erc above1As an example, the above-mentioned “printing status” and “printing error” correspond to a plurality of keywords of the subordinate concept referred to in the present invention, and “printing error” in the plurality of keywords of the subordinate concept is the main keyword. It corresponds to a keyword corresponding to a word (conforming to a rule) among a plurality of keywords of a subordinate concept referred to in the invention, and the original keyword “print quality” corresponding to the word does not correspond to the word in a subordinate concept. It has been replaced with “printing status”. Here, in this example, the example on the side of the slang word was shown, but the same applies to the side of the receiver word.
[0056]
As described above, in the
[0057]
The constraint strengthening rule
[0058]
As above, for example, the keyword extraction rule Er1As an example, the candidate in this case is Era mentioned above1And the above-mentioned Erc1For example, the contents as shown in FIG. 6 are displayed to the user. In the example in the figure, the original rule Er of each candidate1The changes to are highlighted. For example, if the user selects “1” in the figure, Era1Is Er in the keyword extraction
[0059]
As described above, in the keyword extraction rule refining support device of this example, for example, in response to the result of matching performed by the
[0060]
Next, a keyword extraction rule refining support apparatus according to a second embodiment of the present invention will be described. In this example, an apparatus (keyword extraction rule restriction relaxation support apparatus) that supports relaxation of rule restrictions is shown.
FIG. 7 shows an example of a keyword extraction device incorporating the keyword extraction rule refinement support device according to the present example. This device has, for example, the same functions as those shown in FIG. 1 of the first embodiment. Document
[0061]
In addition, about the component parts 1-5 which have the same function as what was shown in the said FIG. 1, it has shown using the same code | symbol as shown in the same figure.
For convenience of explanation, the description of the same configuration as that shown in the first embodiment is omitted in this example.
[0062]
In this example, the keyword extraction
Er2: ({“Collation”, [service]}, {but, is}, {“can do (no)”}) → {f}
In this case, the
[0063]
In addition, when all the other keyword extraction rules held by the keyword extraction
[0064]
Therefore, in this example, a similar
For example, when all the keyword extraction rules held by the keyword extraction
[0065]
When a dependency relationship is used as in this example, any of the following Uma, Umb, and Umc is established as the keyword extraction rule selected here.
Uma is a keyword extraction rule in which the related words do not match and the relationship and the received words match.
Umb is a keyword extraction rule in which the relationship does not match, and the related words and the received words match.
Umc is a keyword extraction rule in which the received words do not match and the relationship with the related words matches.
Specifically, Er mentioned above2In the case of the relationship 10 described above, the syntactic term “stack” is Er2The relation “ga” and the received word “cannot” match each other, but correspond to the above Uma.
[0066]
In this way, the similar
[0067]
The keyword extraction rule
FIG. 8 shows a configuration example of the internal operation of the keyword extraction rule
[0068]
The constraint
[0069]
The user sees such a display screen, and this rule Er2Judge whether to actually relax the restrictions and give Yes / No instructions. When the constraint
[0070]
In this way, the constraint
[0071]
The constraint relaxation refining apparatus 32 has a function of performing refining to relax the restriction of the keyword extraction rule when a Yes instruction is received by the constraint
[0072]
First, the
In other words, taking the case of Uma as an example, for example, if a related term is present in the thesaurus, it is possible to perform constraint relaxation for the keyword extraction rule Er. In this case, the keyword extraction rule Ere after relaxation of the constraint is: If the concept of the clerk is fc,
Ere: (F + {fc}, R, B) → A
It becomes.
[0073]
Similarly, in the case of Umc as described above, for example, if a received word exists in the thesaurus, the restriction can be relaxed, and the keyword extraction rule Erf after the restriction relaxation in this case is based on the concept of the received word. If bc,
Erf: (F, R, B + {bc}) → A
It becomes.
[0074]
Specifically, for example, the above-mentioned Er2Is detected as a restriction relaxation target with respect to the relationship 10 described above, it corresponds to the case of Uma described above, and the related term is a thesaurus T1The keyword extraction rule Ere after relaxation of the following constraints, adding the concept “sort” of the term “stack”2Is obtained.
Ere2: ({“Collation”, [service], [sort]}, {but, is}, {“can do (no)”}) → {f}
[0075]
The keyword extraction rule Er described above2The above keyword extraction rule Ere2As an example, the above-mentioned “stack” corresponds to a word that does not conform to the presented rule in the presented expression referred to in the present invention, and the above-mentioned [Sort] It corresponds to a keyword indicating a concept, and the keyword [sort] is added to the keyword extraction rule. Here, in this example, an example is shown in which the related words do not match, but the same applies to the case where the received words do not match.
[0076]
As described above, in the
[0077]
Next,
In other words, taking the case of Uma as an example, for example, a related term exists in the thesaurus, and a common superordinate concept of the related term concept fc and a certain concept fec of the related term part of the keyword extraction rule Er is If so, for all the common superordinate concepts fcc, the keyword extraction rule Erg after the constraint relaxation in this case is
Erg: (F− {fec} + {fcc}, R, B) → A
It becomes.
[0078]
Similarly, in the case of Umc as described above, for example, if the received word exists in the thesaurus, and there is a common superordinate concept between the concept bc of the received word and a certain concept bec of the received word part of Er, For all the common superordinate concepts bcc, the keyword extraction rule Erh after the constraint relaxation in this case is
Erh: (F, R, B− {bec} + {bcc}) → A
It becomes.
[0079]
Specifically, for example, the keyword extraction rule Er described above2Is detected as a restriction relaxation target with respect to the relationship 10 described above, it corresponds to the case of Uma described above, and the related term is a thesaurus T1Present in. The concept “service”, which has a common superordinate concept with the concept “sort” of the term “stack”, is Er2The common superordinate concepts are “symptom” and “problem”. Therefore, the following two keyword extraction rules Erg after relaxing the constraints2, Erg2'Is obtained.
Erg2: ({“Collation”, [symptom]}, {but, is}, {“can be (no)”}) → {f}
Erg2': ({{Collation}, [problem]}, {but, is}, {“can be (no)”}) → {f}
[0080]
The keyword extraction rule Er described above2The above keyword extraction rule Erg2, Erg2Taking the case of changing to 'as an example, the above-mentioned "service" corresponds to the keyword in the keyword group corresponding to the word specified (presented) in the present invention (provided that it did not conform to the rule). The [symptom] and the [problem] described above correspond to the keyword indicating the common superordinate concept (the keyword indicating the concept of the word and the keyword in the keyword group) according to the present invention. Is replaced by [symptom] and [problem] which are keywords indicating the common superordinate concept. Here, in this example, an example is shown in which the related words do not match, but the same applies to the case where the received words do not match.
[0081]
As described above, in the
[0082]
Next, the
That is, taking the case of Uma as an example, for example, if the clerk is fs, the keyword extraction rule Eri after the constraint relaxation in this case is
Eri: (F + {“fs”}, R, B) → A
It becomes.
[0083]
Similarly, taking the above Umb as an example, for example, if the relationship is r, the keyword extraction rule Erj after the constraint relaxation in this case is
Erj: (F, R + {r}, B) → A
It becomes.
Also, taking the case of Umc as an example, for example, if the received language is bs, the keyword extraction rule Erk after the constraint relaxation in this case is
Erk: (F, R, B + {“bs”}) → A
It becomes.
[0084]
Specifically, for example, the keyword extraction rule Er described above2Is detected as a restriction relaxation target with respect to the above relation 10, it corresponds to the case of Uma described above, and the keyword extraction rule Eri after the next restriction relaxation is applied.2Is obtained.
Eri2: ({“Collation”, [service], “stack”}, {but, is}, {“can do (no)”}) → {f}
Here, in this example, an example is shown in which the related words do not match, but the same applies to the case where the received words do not match.
[0085]
As described above, in the
[0086]
Next, the
In other words, taking the case of Uma as an example, for example, if the term fs and the surface layer fes in the term part of the keyword extraction rule Er both exist in the thesaurus, and there is a common (upper) concept of them For all the common superordinate concepts fcc, the keyword extraction rule Erl after relaxing the constraint is
Erl: (F − {“fes”} + {[fcc]}, R, B) → A
It becomes.
[0087]
Similarly, in the case of Umc as described above, for example, the received word bs and a certain surface layer bes in the received word part of the keyword extraction rule Er exist in the thesaurus, and there is a common (upper) concept thereof. For example, for all the common superordinate concepts bcc, the keyword extraction rule Erm after constraint relaxation is
Erm: (F, R, B − {“bes”} + {[bcc]}) → A
It becomes.
[0088]
Specifically, for example, the keyword extraction rule Er described above2Is detected as a restriction relaxation target for relation 10 above, it corresponds to the case of Uma described above, and the terms “stack” and Er2The surface layer of the hangover part is "Thesaurus"1Since there are common (higher-order) concepts “sort”, “behavior”, “symptom”, and “problem”, the following four keyword extraction rules after relaxation of constraints Erm2, Erm2', Erm2'', Erm2'' 'Is obtained.
Erm2: ({[Sort], [service]}, {but, is}, {“can do (no)”}) → {f}
Erm2': ({[Action], [Service]}, {G, is}, {“Can (No)”}) → {f}
Erm2'' : ({[Symptom], [service]}, {but, is}, {“can do (no)”}) → {f}
Erm2'' ': ({[Problem], [Service]}, {G, is}, {“Can (No)”}) → {f}
[0089]
The keyword extraction rule Er described above2The keyword extraction rule Erm described above2, Erm2', Erm2'', Erm2Taking the case of changing to '' 'as an example, the surface layer in the keyword group corresponding to the word specified (presented) in the above-mentioned “collation” according to the present invention (not conforming to the rule) The keyword “collation” is replaced with “sort”, “behavior”, “symptom”, and “problem”, which are keywords that indicate a common superordinate concept between this keyword and the word “stack”. Yes. Here, in this example, an example is shown in which the related words do not match, but the same applies to the case where the received words do not match.
[0090]
As described above, in the
[0091]
The constraint relaxation rule
[0092]
As above, for example, the keyword extraction rule Er2As an example, the candidate in this case is the above-mentioned Ere2, Erg2, Erg2', Eri2, Erm2, Erm2', Erm2'', Erm2For example, the contents as shown in FIG. 10 are displayed to the user. For example, if the user selects “1” in the figure, Ere2Is Er in the keyword extraction
[0093]
As described above, in the keyword extraction rule refinement support device of this example, for example, in response to the result of matching performed by the
[0094]
Next, a keyword extraction rule refining support apparatus according to a third embodiment of the present invention will be described.
The configuration of the keyword extraction rule refining support apparatus of this example is substantially the same as that shown in FIG. 1 of the first embodiment and FIG. 7 of the second embodiment, for example. A merge function (not shown) constituting a merge means is provided, and this merge function has a function of merging (integrating) keyword extraction rules.
[0095]
In addition, about the component parts 1-5 which have the function similar to what was shown in the said FIG.1 and the said FIG.7, it shows using the same code | symbol as shown in the figure.
For convenience of explanation, the description of the same configuration as that shown in the first embodiment and the second embodiment is omitted in this example.
[0096]
The merge function of this example has a function capable of merging keyword extraction rules held in, for example, the keyword extraction
As an example, among the keyword extraction rules held by the keyword extraction
ErThree: ({[Print status]}, {but, is}, {“can do (no)”, “do (do)”}) → {f}
ErFour: ({[Print status]}, {but, is}, {“な (い)”}) → {f}
[0097]
At this time, if these two keyword extraction rules are merged into one keyword extraction rule, the visibility by the user can be improved, the matching speed can be increased, and the accuracy of the extraction rule refinement can be improved. The effect that it can aim at up can be acquired.
Specifically, the above-mentioned ErThree, ErFourKeyword extraction rule Er obtained by merging34Is as follows.
Er34: ({[Print status]}, {but, is}, {“can do (no)”, “do (do not)”, “do (no)”}) → {f}
[0098]
Taking this case as an example, the above two keyword extraction rules ErThree, ErFourCorresponds to a plurality of rules in which only one of the first keyword group and the second keyword group and the relationship defined by the rule according to the present invention is different, and the keyword extraction rule Er described above34Corresponds to one rule in which the different parts referred to in the present invention are summed.
[0099]
As another example, in the keyword extraction rules held by the keyword extraction
ErFive: ({[Usability]}, {but, is}, {“Evil”}) → {f}
Er6: ({[Service]}, {but, is}, {“Evil”}) → {f}
[0100]
At this time, the thesaurus T shown in FIG.1The upper concept common to the two concepts of “usability” and “service” is “symptom”.Five, Er6Keyword extraction rule Er obtained by merging56As an example, the following is assumed.
Er56: ({[Symptom]}, {but, is}, {“evil”}) → {f}
[0101]
However, when such a merge is executed, the concepts of “failure”, “operation”, and “quality” are included in addition to the “usability” and “service” originally included. So, for example, if the user approves this, Er described above will follow the instructions from the user.56Is a merged keyword extraction rule. On the other hand, if the user does not accept this, for example, the following keyword extraction rule Er according to the instruction from the user56Let 'be the merged keyword extraction rule.
Er56': ({[Usability], [Service]}, {but, is}, {“Evil”}) → {f}
[0102]
Taking this case as an example, the above two keyword extraction rules ErFive, Er6Corresponds to a plurality of rules in which only one of the first keyword group and the second keyword group and the relationship defined by the rule according to the present invention is different, and the keyword extraction rule Er described above56And the above keyword extraction rule Er56'Corresponds to one rule summing up the different parts of the present invention.
[0103]
Here, the configurations of the keyword extraction rule refinement support device and the keyword extraction device according to the present invention are not necessarily limited to those described above, and various configurations may be used.
For example, in the above embodiment, for convenience of explanation, an apparatus having a function of strengthening the restriction of the keyword extraction rule in the first embodiment is shown, while the restriction of the keyword extraction rule is relaxed in the second embodiment. Although an apparatus having a function has been shown, it is also a preferable aspect to use a configuration having both such a constraint strengthening function and such a constraint relaxation function.
[0104]
Further, for example, in the above embodiment, as a preferable aspect, various processes performed by the keyword extraction rule refinement support device and the keyword extraction device according to the present invention include, for example, a processor in a hardware resource including a processor and a memory. Is controlled by executing a control program stored in the ROM. However, for example, each functional means for executing the processing can be configured as an independent hardware circuit.
[0105]
The present invention can also be understood as a computer-readable storage medium such as a floppy disk or a CD-ROM storing the control program as described above, and the control program is input from the storage medium to the computer and input to the processor. By executing, the processing according to the present invention can be performed.
[0106]
【The invention's effect】
As described above, the keyword extraction rule refinement support device and the storage medium according to the present inventionAnd keyword extraction rule refinement support methodAccording to, for example, even when a keyword should not be extracted but matched with a certain keyword extraction rule, the restriction of the rule can be strengthened so that it does not match. Even when a keyword should be extracted but there is no matching keyword extraction rule, it can be matched by relaxing the restriction of the keyword extraction rule close to the expression. For this reason, for example, refining of the keyword extraction rule can be realized by repeatedly performing the constraint strengthening process or the constraint relaxation process of the existing keyword extraction rule according to the document.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating an example of a keyword extraction device to which a keyword extraction rule refinement support device according to a first embodiment of the present invention is applied.
FIG. 2 is a diagram illustrating an example of element positions of morphemes.
FIG. 3 is a diagram illustrating an example of thesaurus data;
FIG. 4 is a diagram illustrating a configuration example of a keyword extraction rule constraint strengthening apparatus.
FIG. 5 is a diagram illustrating a display example by a constraint strengthening instruction apparatus.
FIG. 6 is a diagram illustrating a display example by the constraint strengthening rule candidate presentation device.
FIG. 7 is a diagram illustrating an example of a keyword extraction device to which a keyword extraction rule refinement support device according to a second embodiment of the present invention is applied.
FIG. 8 is a diagram illustrating a configuration example of a keyword extraction rule constraint relaxation apparatus.
FIG. 9 is a diagram showing a display example by the constraint relaxation instructing device.
FIG. 10 is a diagram illustrating a display example by the constraint relaxation rule candidate presentation device.
FIG. 11 is a diagram illustrating an example of a keyword extraction device.
[Explanation of symbols]
1 .... Document group holding device, 2 .... Dependency analysis device,
3.
5 .... Thesaurus, 6 .... Keyword extraction rule constraint strengthening device,
11 .. Restriction strengthening instruction device, 12 .... Restriction strengthening refining device,
13 .... Restriction strengthening rule candidate presentation device, 21 ... Similar rule selection device,
22. Keyword extraction rule
32 .. Restriction relaxation refinement device, 33 .. Restriction relaxation rule candidate presentation device,
Claims (13)
ルールに適合した表現及び当該ルールをユーザに提示する提示手段と、
提示した表現に対して提示したルールを不適用とする指示をユーザから受け付ける受付手段と、
当該指示を受け付けた場合に、提示した表現に対して提示したルールが不適用となるように当該ルールを変更する制約強化手段と、
を備えたことを特徴とするキーワード抽出ルール精製支援装置。Corresponding to the second keyword which is an element included in the second keyword group which is a set of dependency word set is a first keyword group to the first keyword to the appropriate word and received word representations are the elements included in the expression Keyword extraction for extracting a keyword from a document based on a rule for extracting a first keyword as a related word or a second keyword as a received word as a keyword from an expression in which the word appears with a predetermined relationship between the related side and the receiving side A keyword extraction rule refinement support device that assists in refining the rule of the device,
An expression adapted to the rule and a presentation means for presenting the rule to the user;
An accepting means for accepting from the user an instruction not to apply the presented rule to the presented expression;
A constraint strengthening means for changing the rule so that the rule presented to the presented expression is not applicable when the instruction is accepted;
A keyword extraction rule refining support apparatus characterized by comprising:
制約強化手段は、提示した表現中の提示したルールに適合する語に該当するキーワードを当該ルールで規定される当該語に対応したキーワード群から削除することにより、提示した表現に対して提示したルールが不適用となるようにすることを特徴とするキーワード抽出ルール精製支援装置。In the keyword extraction rule refinement | purification assistance apparatus of Claim 1,
The constraint strengthening means deletes the keyword corresponding to the word that matches the presented rule in the presented expression from the keyword group corresponding to the word specified by the rule, and thereby presents the rule presented for the presented expression. A keyword extraction rule refining support apparatus characterized in that is not applicable.
制約強化手段は、提示した表現中の提示したルールに適合する語に該当するキーワードを下位概念の複数のキーワードへ変換し、これら下位概念の複数のキーワードの中で当該語に該当するキーワードを当該ルールで規定される当該語に対応したキーワード群から削除することにより、提示した表現に対して提示したルールが不適用となるようにすることを特徴とするキーワード抽出ルール精製支援装置。In the keyword extraction rule refinement | purification assistance apparatus of Claim 1,
The constraint strengthening means converts a keyword corresponding to a word that conforms to the presented rule in the presented expression into a plurality of keywords of the lower concept, and selects a keyword corresponding to the word from the plurality of keywords of the lower concept. A keyword extraction rule refining support apparatus, characterized in that, by deleting from a keyword group corresponding to the word specified by the rule, the presented rule is not applicable to the presented expression.
ルールで規定される第1キーワード及び第2キーワード及び関係の内の2つのみに適合した表現及び当該ルールをユーザに提示する提示手段と、
提示した表現に対して提示したルールを適用する指示をユーザから受け付ける受付手段と、
当該指示を受け付けた場合に、提示した表現に対して提示したルールが適用されるように当該ルールを変更する制約緩和手段と、
を備えたことを特徴とするキーワード抽出ルール精製支援装置。Corresponding to the second keyword which is an element included in the second keyword group which is a set of dependency word set is a first keyword group to the first keyword to the appropriate word and received word representations are the elements included in the expression Keyword extraction for extracting a keyword from a document based on a rule for extracting a first keyword as a related word or a second keyword as a received word as a keyword from an expression in which the word appears with a predetermined relationship between the related side and the receiving side A keyword extraction rule refinement support device that assists in refining the rule of the device,
An expression adapted to only two of the first keyword and the second keyword and the relationship defined by the rule, and a presentation means for presenting the rule to the user;
Accepting means for accepting from the user an instruction to apply the presented rule to the presented expression;
A constraint relaxation means for changing the rule so that the presented rule is applied to the presented expression when the instruction is accepted;
A keyword extraction rule refining support apparatus characterized by comprising:
制約緩和手段は、提示した表現中の提示したルールに不適合であった語の概念を示すキーワードを当該ルールで規定される当該語に対応したキーワード群に追加することにより、提示した表現に対して提示したルールが適用されるようにすることを特徴とするキーワード抽出ルール精製支援装置。In the keyword extraction rule refinement assistance device according to claim 4,
The constraint relaxation means adds a keyword indicating the concept of a word that is incompatible with the presented rule in the presented expression to the keyword group corresponding to the word specified by the rule, A keyword extraction rule refining support apparatus, characterized in that the presented rule is applied.
制約緩和手段は、提示した表現中の提示したルールに不適合であった語の概念を示すキーワードと当該ルールで規定される当該語に対応したキーワード群中のキーワードとの共通上位概念を示すキーワードに当該キーワード群中の当該キーワードを置き換えることにより、提示した表現に対して提示したルールが適用されるようにすることを特徴とするキーワード抽出ルール精製支援装置。In the keyword extraction rule refinement assistance device according to claim 4,
The constraint relaxation means is a keyword indicating a common superordinate concept between a keyword indicating a concept of a word that is incompatible with the presented rule in the presented expression and a keyword in a keyword group corresponding to the word specified by the rule. A keyword extraction rule refining support apparatus, wherein the presented rule is applied to the presented expression by replacing the keyword in the keyword group.
制約緩和手段は、提示した表現中の提示したルールに不適合であった語を当該ルールで規定される当該語に対応したキーワード群に追加することにより、提示した表現に対して提示したルールが適用されるようにすることを特徴とするキーワード抽出ルール精製支援装置。In the keyword extraction rule refinement assistance device according to claim 4,
The constraint relaxation means applies the rule that was presented to the presented expression by adding the word that did not conform to the presented rule in the presented expression to the keyword group corresponding to the word specified by the rule. The keyword extraction rule refinement | purification assistance apparatus characterized by making it do.
制約緩和手段は、提示した表現中の提示したルールに不適合であった語と当該ルールで規定される当該語に対応したキーワード群中の表層的なキーワードとの共通上位概念を示すキーワードに当該表層的なキーワードを置き換えることにより、提示した表現に対して提示したルールが適用されるようにすることを特徴とするキーワード抽出ルール精製支援装置。In the keyword extraction rule refinement assistance device according to claim 4,
The constraint relaxation means applies the surface layer to a keyword indicating a common superordinate concept between a word that is incompatible with the presented rule in the presented expression and a surface keyword in the keyword group corresponding to the word specified by the rule. A keyword extraction rule refining support apparatus characterized in that a proposed rule is applied to a presented expression by replacing a typical keyword.
ルールで規定される第1キーワード群及び第2キーワード群及び関係の内の1つのみが異なる複数のルールを、当該異なる部分を総和した1つのルールへ変換するマージ手段を備えたことを特徴とするキーワード抽出ルール精製支援装置。In the keyword extraction rule refinement | purification assistance apparatus of any one of Claim 1 thru | or 8,
A merge means for converting a plurality of rules that differ only in one of the first keyword group, the second keyword group, and the relationship defined by the rules into one rule that is a sum of the different portions is provided. Keyword extraction rule refinement support device.
係り語の表現の集合である第1キーワード群に含まれる要素である第1キーワードに該当する語と受け語の表現の集合である第2キーワード群に含まれる要素である第2キーワードに該当する語とが係り側と受け側との所定の関係をもって出現する表現から係り語である第1キーワード又は受け語である第2キーワードをキーワードとして抽出するルールに基づいて文書からキーワードを抽出するキーワード抽出装置の当該ルールを精製することを支援するために用いられ、
当該プログラムは、ルールに適合した表現及び当該ルールをユーザに提示する処理と、
提示した表現に対して提示したルールを不適用とする指示をユーザから受け付ける処理と、
当該指示を受け付けた場合に、提示した表現に対して提示したルールが不適用となるように当該ルールを変更する処理とを当該コンピュータに実行させることを特徴とする記憶媒体。In a storage medium that stores a program to be executed by a computer so that the input means of the computer can read the program,
Corresponding to the second keyword which is an element included in the second keyword group which is a set of dependency word set is a first keyword group to the first keyword to the appropriate word and received word representations are the elements included in the expression Keyword extraction for extracting a keyword from a document based on a rule for extracting a first keyword as a related word or a second keyword as a received word as a keyword from an expression in which the word appears with a predetermined relationship between the related side and the receiving side Used to help refine the rules of the device,
The program includes an expression that conforms to the rule and a process of presenting the rule to the user,
A process of accepting from the user an instruction not to apply the presented rule to the presented expression;
A storage medium that, when receiving the instruction, causes the computer to execute a process of changing the rule so that the presented rule is not applicable to the presented expression.
係り語の表現の集合である第1キーワード群に含まれる要素である第1キーワードに該当する語と受け語の表現の集合である第2キーワード群に含まれる要素である第2キーワードに該当する語とが係り側と受け側との所定の関係をもって出現する表現から係り語である第1キーワード又は受け語である第2キーワードをキーワードとして抽出するルールに基づいて文書からキーワードを抽出するキーワード抽出装置の当該ルールを精製することを支援するために用いられ、
当該プログラムは、ルールで規定される第1キーワード及び第2キーワード及び関係の内の2つのみに適合した表現及び当該ルールをユーザに提示する処理と、
提示した表現に対して提示したルールを適用する指示をユーザから受け付ける処理と、
当該指示を受け付けた場合に、提示した表現に対して提示したルールが適用されるように当該ルールを変更する処理とを当該コンピュータに実行させることを特徴とする記憶媒体。In a storage medium that stores a program to be executed by a computer so that the input means of the computer can read the program,
Corresponding to the second keyword which is an element included in the second keyword group which is a set of dependency word set is a first keyword group to the first keyword to the appropriate word and received word representations are the elements included in the expression Keyword extraction for extracting a keyword from a document based on a rule for extracting a first keyword as a related word or a second keyword as a received word as a keyword from an expression in which the word appears with a predetermined relationship between the related side and the receiving side Used to help refine the rules of the device,
The program includes an expression adapted to only two of the first keyword and the second keyword defined in the rule, and a process of presenting the rule to the user,
A process of accepting an instruction from the user to apply the presented rule to the presented expression;
A storage medium that, when receiving the instruction, causes the computer to execute a process of changing the rule so that the presented rule is applied to the presented expression.
キーワード抽出ルール精製支援装置の提示手段が、ルールに適合した表現及び当該ルールをユーザに提示し、
キーワード抽出ルール精製支援装置の受付手段が、提示した表現に対して提示したルールを不適用とする指示をユーザから受け付け、
キーワード抽出ルール精製支援装置の制約強化手段が、当該指示を受け付けた場合に、提示した表現に対して提示したルールが不適用となるように当該ルールを変更する、ことを特徴とするキーワード抽出ルール精製支援方法。Corresponding to the second keyword which is an element included in the second keyword group which is a set of dependency word set is a first keyword group to the first keyword to the appropriate word and received word representations are the elements included in the expression Keyword extraction for extracting a keyword from a document based on a rule for extracting a first keyword as a related word or a second keyword as a received word as a keyword from an expression in which the word appears with a predetermined relationship between the related side and the receiving side A keyword extraction rule refining support method in a keyword extraction rule refining support device that supports refining the rule of the device,
The presentation means of the keyword extraction rule refinement support device presents the user with the expression that matches the rule and the rule,
The accepting means of the keyword extraction rule refinement support device accepts an instruction from the user that the rule presented for the presented expression is not applied,
A keyword extraction rule characterized in that, when the constraint strengthening means of the keyword extraction rule refinement support apparatus accepts the instruction, the rule is changed so that the presented rule is not applicable to the presented expression. Purification support method.
キーワード抽出ルール精製支援装置の提示手段が、ルールで規定される第1キーワード及び第2キーワード及び関係の内の2つのみに適合した表現及び当該ルールをユーザに提示し、
キーワード抽出ルール精製支援装置の受付手段が、提示した表現に対して提示したルールを適用する指示をユーザから受け付け、
キーワード抽出ルール精製支援装置の制約緩和手段が、当該指示を受け付けた場合に、提示した表現に対して提示したルールが適用されるように当該ルールを変更する、ことを特徴とするキーワード抽出ルール精製支援方法。Corresponding to the second keyword which is an element included in the second keyword group which is a set of dependency word set is a first keyword group to the first keyword to the appropriate word and received word representations are the elements included in the expression Keyword extraction for extracting a keyword from a document based on a rule for extracting a first keyword as a related word or a second keyword as a received word as a keyword from an expression in which the word appears with a predetermined relationship between the related side and the receiving side A keyword extraction rule refining support method in a keyword extraction rule refining support device that supports refining the rule of the device,
The presenting means of the keyword extraction rule refinement support device presents to the user an expression that matches only two of the first keyword and the second keyword defined in the rule and the relationship, and the rule,
The receiving means of the keyword extraction rule refinement support device receives an instruction from the user to apply the presented rule to the presented expression,
The keyword extraction rule refinement is characterized in that, when the constraint relaxation unit of the keyword extraction rule refinement support apparatus accepts the instruction, the rule is changed so that the presented rule is applied to the presented expression. Support method.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000114320A JP4042295B2 (en) | 2000-04-14 | 2000-04-14 | Keyword extraction rule refinement support device, storage medium, and keyword extraction rule refinement support method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000114320A JP4042295B2 (en) | 2000-04-14 | 2000-04-14 | Keyword extraction rule refinement support device, storage medium, and keyword extraction rule refinement support method |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2001297100A JP2001297100A (en) | 2001-10-26 |
| JP2001297100A5 JP2001297100A5 (en) | 2005-04-14 |
| JP4042295B2 true JP4042295B2 (en) | 2008-02-06 |
Family
ID=18626141
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000114320A Expired - Fee Related JP4042295B2 (en) | 2000-04-14 | 2000-04-14 | Keyword extraction rule refinement support device, storage medium, and keyword extraction rule refinement support method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4042295B2 (en) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006323517A (en) * | 2005-05-17 | 2006-11-30 | Mitsubishi Electric Corp | Text classification device and program |
| JP4694258B2 (en) * | 2005-05-31 | 2011-06-08 | 株式会社エヌ・ティ・ティ・データ | Information extraction apparatus, information extraction method, and program |
| JP5083669B2 (en) * | 2006-03-23 | 2012-11-28 | 日本電気株式会社 | Information extraction system, information extraction method, information extraction program, and information service system |
| JP4744373B2 (en) * | 2006-06-27 | 2011-08-10 | ソニー エリクソン モバイル コミュニケーションズ, エービー | Portable information terminal |
| JP5317922B2 (en) * | 2009-10-16 | 2013-10-16 | 株式会社野村総合研究所 | Information extraction rule creation support system |
| US8527497B2 (en) | 2010-12-30 | 2013-09-03 | Facebook, Inc. | Composite term index for graph data |
-
2000
- 2000-04-14 JP JP2000114320A patent/JP4042295B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2001297100A (en) | 2001-10-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5590039A (en) | Natural language processing apparatus and method for performing processing to analyze the meaning of an input sentence entered in the form of a natural language | |
| JP4544674B2 (en) | A system that provides information related to the selected string | |
| US8484238B2 (en) | Automatically generating regular expressions for relaxed matching of text patterns | |
| US20100268724A1 (en) | Method and system for approximate string matching | |
| CN101154218A (en) | Dictionary registration device and dictionary registration method | |
| JP4042295B2 (en) | Keyword extraction rule refinement support device, storage medium, and keyword extraction rule refinement support method | |
| JP3139658B2 (en) | Document display method | |
| JP3429612B2 (en) | Dictionary registration device and machine translation device | |
| JP2005157823A (en) | Knowledge base system, method for determining semantic relationship between words in the system, and computer program therefor | |
| JP3326646B2 (en) | Dictionary / rule learning device for machine translation system | |
| JP4024137B2 (en) | Quantity expression search device | |
| JPH10207896A (en) | Search term expansion method and apparatus and information search method and apparatus | |
| JP2778025B2 (en) | Learning Co-occurrence Dictionary | |
| JP4300056B2 (en) | CONCEPT EXPRESSION GENERATION METHOD, PROGRAM, STORAGE MEDIUM, AND CONCEPT EXPRESSION GENERATION DEVICE | |
| JP3999771B2 (en) | Translation support program, translation support apparatus, and translation support method | |
| JP4368550B2 (en) | Document search apparatus, document search method, and program causing computer to execute the method | |
| JP2006309377A (en) | Document retrieval apparatus, document retrieval method, program thereof, and recording medium | |
| JP2003173338A (en) | Dictionary construction support apparatus, dictionary construction support method, and dictionary construction support program | |
| JPH10340264A (en) | Machine translation device and computer-readable recording medium where machine translation processing program is recorded | |
| JP3051747B2 (en) | Machine translation method and machine translation system | |
| JPH10171811A (en) | Method and apparatus for supporting creation of same-language interlingual sentence | |
| JPH11345229A (en) | Character processing device and computer-readable recording medium storing character processing program | |
| JPH11272674A (en) | Text input device and method, and recording medium | |
| JP2006235970A (en) | Source code search device, source code search method, source code search program, and recording medium for recording source code search program | |
| JPH113336A (en) | Machine translation apparatus and computer-readable recording medium recording machine translation processing program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040602 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040602 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070629 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070717 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070914 |
|
| TRDD | Decision of grant or rejection written | ||
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20071003 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071023 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071105 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101122 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111122 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111122 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121122 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121122 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131122 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |