[go: up one dir, main page]

JP2002073680A - 技術情報検索システム - Google Patents

技術情報検索システム

Info

Publication number
JP2002073680A
JP2002073680A JP2000261366A JP2000261366A JP2002073680A JP 2002073680 A JP2002073680 A JP 2002073680A JP 2000261366 A JP2000261366 A JP 2000261366A JP 2000261366 A JP2000261366 A JP 2000261366A JP 2002073680 A JP2002073680 A JP 2002073680A
Authority
JP
Japan
Prior art keywords
information
search
technical information
similarity
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000261366A
Other languages
English (en)
Inventor
Tatsuo Nakamura
村 達 生 中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Research Institute Inc
Original Assignee
Mitsubishi Research Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Research Institute Inc filed Critical Mitsubishi Research Institute Inc
Priority to JP2000261366A priority Critical patent/JP2002073680A/ja
Publication of JP2002073680A publication Critical patent/JP2002073680A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 熟練を要することなく、簡易な手順で高精度
の検索が可能な技術情報検索システムを提供する。 【解決手段】 本発明の技術情報検索システムは、検索
文の入力や検索結果の出力を行う利用者用端末装置1
と、検索文に基づいて技術情報の検索処理を行う検索装
置2と、検索装置2に技術情報の登録を行う管理用端末
装置3とを備えている。ユーザが入力した検索文を形態
素解析して単語ベクトルを生成し、技術情報データベー
ス装置4に登録されている各技術情報の単語ベクトルと
の内積を計算した結果に基づいて類似度を判定するた
め、各技術情報との類似度を簡易かつ精度よく判定する
ことができる。また、類似度の高低がわかるような形態
で検索結果を表示するため、複数の技術情報が検索され
ても、各技術情報の類似度の高さを客観的に把握するこ
とができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された検索文
に基づいて技術情報の検索を行う技術情報検索システム
に関する。
【0002】
【従来の技術】最近、特許情報を初めとして、大量の技
術情報が電子化されてインターネット等を介してアクセ
ス可能になってきた。技術情報の中には、無料で提供さ
れるものや、特定のIDやパスワードで照合を行って有
料で提供されるものがあり、また技術情報の言語やデー
タ形式もさまざまである。このため、これら大量の技術
情報の中から所望の技術情報を簡易かつ迅速に検索する
技術が必要になる。
【0003】
【発明が解決しようとする課題】特許情報などの技術情
報の検索を行う場合、従来はキーワードを指定して検索
を行うことが多かった。ところが、的確なキーワードを
入力しないと検索の精度が上がらないという問題があ
る。
【0004】例えば、汎用的なキーワードを指定して検
索を行うと、該当件数が急激に増加して、真に必要な情
報の抽出が困難になってしまう。したがって、検索の精
度を上げるには、熟練したサーチャーの存在が不可欠で
あり、一般の人が検索を行っても、精度の悪い検索しか
できないことから、検索システム自体があまり利用され
ないという悪循環に陥っていた。
【0005】一方、インターネットの普及に伴い、ホー
ムページ上に広告情報を表示する例が増えてきた。その
例の一つとして、ユーザが入力した検索条件に対応する
検索結果を表示する際に、その検索条件に関連のある広
告情報を表示する広告付与システムが提案されている。
【0006】このシステムは、予め広告主が広告対象で
ある製品やサービスの分類をシステム管理上の分類の中
から選択して登録しておき、検索結果を表示する際に、
その検索結果の分類に属する広告情報を同時に表示する
ものである。
【0007】しかしながら、広告対象である製品やサー
ビスと、分類との適合度を上げるためには、分類の階層
構造をより細かくしなければならない。このため、広告
主側の負担が急激に増加し、広告件数そのものが減少し
てしまう。
【0008】また、同一分類に属する製品やサービスの
情報が多数存在する場合、表示の優先度を決定する合理
的な手段が提案されていない。
【0009】さらに、広告主は、自己の製品やサービス
に関する広告情報がなるべく多く表示されるよう、広範
囲の分類を指定したがることも多いと思われるが、その
ようにすると、ユーザに大量の広告情報を提供すること
になり、広告情報を分類分けするメリットが薄れてしま
う。
【0010】また、従来、特許のような技術情報の市場
価値を評価する手法としては、当事者間で締結した契約
に基づくライセンス料により評価するのが主流であっ
た。しかしながら、ライセンス契約の内容は当事者以外
には非公開である場合が多く、限られた分野の既存取引
についての評価しかできず、新しい技術の市場価値の予
測手法としては適用できなかった。
【0011】本発明は、このような点に鑑みてなされた
ものであり、その目的は、熟練を要することなく、簡易
な手順で高精度の検索が可能な技術情報検索システムを
提供することにある。
【0012】
【課題を解決するための手段】上述した課題を解決する
ために、本発明は、入力された検索文の中から関連語を
抽出する関連語抽出手段と、抽出された関連語に対して
形態素解析を行う第1の形態素解析手段と、前記第1の
形態素解析手段による形態素解析により得られた単語そ
れぞれに対して、技術情報の内容を加味した重み付けを
行ってベクトル情報を生成する第1のベクトル生成手段
と、複数の検索対象技術情報に対して形態素解析を行う
第2の形態素解析手段と、前記第2の形態素解析手段に
よる形態素解析により得られた単語それぞれに対して、
技術情報の内容を加味した重み付けを行ってベクトル情
報を生成する第2のベクトル生成手段と、前記第1のベ
クトル生成手段で生成されたベクトル情報と前記第2の
ベクトル生成手段で生成されたベクトル情報との間で内
積を演算する内積演算手段と、前記内積演算手段の演算
結果に基づいて、検索文と検索対象技術情報との類似度
を判定する類似度判定手段と、前記類似度判定手段によ
る判定結果の出力対象を選択する出力対象選択手段と、
選択された出力対象を前記類似度判定手段により判定さ
れた類似度順に並べて出力する検索結果出力手段とを備
える。
【0013】本発明では、検索文の中から抽出した関連
語に対応するベクトル情報と検索対象技術情報のベクト
ル情報との類似度を判定し、類似度順に並べて検索結果
を出力するようにしたため、検索文とどの程度類似して
いるかを定量的に把握することができ、検索文に類似す
る技術情報を簡易かつ迅速に検索することができる。
【0014】また、本発明は、入力された検索文の中か
ら関連語を抽出する関連語抽出手段と、抽出された関連
語に対して形態素解析を行う第1の形態素解析手段と、
前記第1の形態素解析手段による形態素解析により得ら
れた単語それぞれに対して、技術情報の内容を加味した
重み付けを行ってベクトル情報を生成する第1のベクト
ル生成手段と、複数の検索対象技術情報に対して形態素
解析を行う第2の形態素解析手段と、前記第2の形態素
解析手段による形態素解析により得られた単語それぞれ
に対して、技術情報の内容を加味した重み付けを行って
ベクトル情報を生成する第2のベクトル生成手段と、前
記第2のベクトル生成手段で生成されたベクトル情報を
格納する第1の情報蓄積手段と、広告情報に対して形態
素解析を行う第3の形態素解析手段と、前記第3の形態
素解析手段による形態素解析により得られた単語それぞ
れに対して、技術情報の内容を加味した重み付けを行っ
てベクトル情報を生成する第3のベクトル生成手段と、
前記第3のベクトル生成手段で生成されたベクトル情報
を格納する第2の情報蓄積手段と、前記第1の情報蓄積
手段に格納されたベクトル情報と前記第1のベクトル生
成手段で生成されたベクトル情報との間で内積を演算
し、かつ前記第2の情報蓄積手段に格納されたベクトル
情報と前記第1のベクトル生成手段で生成されたベクト
ル情報との間で内積を演算する内積演算手段と、前記内
積演算手段の演算結果に基づいて類似度を判定する類似
度判定手段と、判定された類似度に基づいて、類似度順
に検索対象技術情報を出力するとともに、類似度が所定
量よりも高い広告情報を出力する検索結果出力手段と、
を備える。
【0015】また、本発明では、検索文と検索対象技術
情報との類似度を考慮に入れて広告情報を提供するよう
にしたため、関心のある者のみに広告情報を提供でき、
広告効果を高めることができる。
【0016】
【発明の実施の形態】以下、本発明に係る技術情報検索
システムについて、図面を参照しながら具体的に説明す
る。
【0017】(第1の実施形態)図1は本発明に係る技
術情報検索システムの第1の実施形態の概略構成を示す
ブロック図である。図1の技術情報検索システムは、検
索文の入力や検索結果の出力を行う利用者用端末装置1
と、検索文に基づいて技術情報の検索処理を行う検索装
置2と、検索装置2に技術情報の登録を行う管理用端末
装置3とを備えている。
【0018】各端末装置1はパーソナルコンピュータ
(以下、PC)などの比較的小型のコンピュータで構成
され、検索装置2はサーバなどの比較的大型のコンピュ
ータで構成される。
【0019】検索装置2は、表示装置2aとプリンタ2
bとを有し、検索装置2には、検索対象となる技術情報
が登録された技術情報データベース(DB)装置4と、
論文等の関連情報が登録された関連情報データベース装
置5と、関連語句が登録された関連語句データベース装
置6とが接続されている。
【0020】各端末装置1と検索装置2とは、ローカル
エリアネットワーク(以下、LAN)、インターネット
または通信回線等の通信網を介してデータの送受信を行
う。
【0021】ユーザは、利用者用端末装置1のキーボー
ド等から検索文を入力する。検索文には、字数制限や文
字種制限がなく、各自の言葉で任意の文章を入力するこ
とができる。また、検索対象の正式な名称が不明でも、
概念や仕組みを説明する文章を入力することにより検索
を行うことができる。例えば、「水素と酸素を用いて、
発電する仕組みや技術」という文章を検索文として入力
することで検索を行える。この場合、後述するように、
「燃料電池」に関する技術情報が抽出される。
【0022】検索装置2は、利用者用端末装置1で入力
された検索文に基づいて検索処理を行い、その検索結果
は利用者用端末装置1に送られる。また、管理用端末装
置3は検索装置2に技術情報を登録し、検索装置2は管
理用端末装置3に管理情報を送信する。
【0023】図2は図1の技術情報検索システムの第1
の実施形態の処理動作を説明するフローチャートであ
る。ユーザが利用者用端末装置1から検索文を入力する
(ステップS1)と、その検索文は検索装置2に送られ
る。検索装置2は、検索文に含まれる関連語を抽出する
(ステップS2)。
【0024】続いて、検索装置2は、形態素解析を行う
(ステップS3)。形態素解析とは、文章(自然文)に
含まれている単語を抽出するものであり、具体的には複
合名詞句と数詞を抽出する。例えば、上述した「水素と
酸素を用いて、発電する仕組みや技術」という検索文の
場合、「水素」、「酸素」、「発電」、「仕組み」、
「技術」、「用いる」の6つの単語とその類似語が抽出
される。
【0025】続いて、形態素解析により抽出された単語
それぞれ(検索語群)を、技術情報の内容を加味した重
み(ウエイト)をつけて数値情報(ベクトル)化する
(ステップS4)。この処理は検索語群のインデキシン
グと呼ばれており、この処理で生成される数値情報を以
下では単語ベクトルと呼ぶ。例えば、データベース装置
内のどのファイルにも頻出する用語や、接頭語・接尾語
などは重要度が低いと判断してウエイトを低くし、特定
の技術情報ファイルにのみ頻出する用語は、その技術情
報を代表する単語とみなしてウエイトを高くする。
【0026】ステップS4の処理が終了すると、次に、
技術情報データベース装置4に登録されている技術情報
と検索語群のインデックスとの間でベクトル処理を行っ
て類似度を検出する(ステップS5)。
【0027】ここでは、技術情報データベース装置4に
登録されている技術情報をベクトル表現した単語ベクト
ルと検索文の検索語群をベクトル表現した単語ベクトル
とを比較し、ベクトルの向きが近い情報を抽出する。ベ
クトルの向きの近さは内積で表すことができ、この内積
の値を本実施形態では類似度という指標で表す。
【0028】例えば、上述した検索文に含まれる「水
素」、「酸素」、「発電」、「仕組み」、「技術」、
「用いる」の6つの単語の意味的な重み(ウエイト)が
すべて等価の場合には、これらの単語の組み合わせに最
も近い単語の組み合わせが含まれる文書を技術情報デー
タベース装置4の中から検索する。
【0029】単語一つ一つが独立した変数だとすると、
上記の検索文の場合、数ある次元のうち、特定の6次元
の合成ベクトルで表される。このため、ステップS5で
は、この合成ベクトルの向きに最も近い、すなわち内積
が1に近い技術情報を検索する。
【0030】例えば、「燃料電池」の説明として、技術
情報データベース装置4の中に、「物質が反応するとき
に生じる化学エネルギーを電気エネルギーとして取り出
す装置。通常、水素と酸素の化学反応を用いるが、水素
はメタノール等を改質することにより得る。」という技
術情報があったとすると、この技術情報中の「電気」や
「エネルギー」という単語から「発電」という単語が関
連づけられる。また、検索文中に「水素」と「酸素」と
いう単語があることから、上記の「燃料電池」に関する
技術情報が高い類似度で抽出される。
【0031】ところで、図2のフローチャートにおい
て、ステップS2が関連語抽出手段に、ステップS3が
第1の形態素解析手段に、図10のステップS54が第2
の形態素解析手段に、図2のステップS5が内積演算手
段に、ステップS6が類似度判定手段に、ステップS9
が出力対象選択手段に、ステップS10〜S12が検索結果
出力手段に、それぞれ対応する。
【0032】図3は上述した検索文に対する技術情報デ
ータベース装置4の検索手順を示す図である。技術情報
データベース装置4に登録されるべき各技術情報は、形
態素解析されて、各単語ごとに単語ベクトルが生成され
た後、技術情報データベース装置4に登録される(ステ
ップS21〜S24)。
【0033】一方、ユーザが入力した検索文も、形態素
解析されて、各単語ごとに単語ベクトルが生成される
(ステップS25〜S27)。
【0034】続いて、検索文の単語ベクトルと技術情報
データベース装置4に登録された各単語ベクトルとの間
で内積を演算し(ステップS28)、その演算結果に基づ
いて類似度を判定する(ステップS29)。
【0035】なお、技術情報データベース装置4には、
多数の技術情報が登録されており、各技術情報ごとに検
索語群との間で内積を演算して類似度を検出する。
【0036】このように、本実施形態では、内積の大小
により類似度を判定できるため、類似度の判定を簡易か
つ精度よく行うことができる。
【0037】図2のステップS5の処理が終了すると、
続いて、ステップS5で数学的に算出された類似度が予
め定めた基準類似度より小さいか否かを判定する(ステ
ップS6)。算出された類似度の中に基準類似度を超え
るものがなければ、検索文に関連のある技術情報はない
と判断して、その旨を利用者用端末装置1に表示する
(ステップS7)。
【0038】一方、類似度が基準類似度以上と判定され
た技術情報については、その技術情報を技術情報データ
ベース装置4から抽出する(ステップS8)。続いて、
検索結果をどのような形式で利用者用端末装置1の画面
に表示するかを選択する(ステップS9)。例えば、ユ
ーザが技術情報別に表示する旨の選択を行った場合は、
類似度の高い技術情報から順に利用者用端末装置1に表
示する処理を行う(ステップS10)。
【0039】図4は技術情報別に検索結果を表示する例
を示す図である。画面内には、ユーザが入力した検索文
を表示する領域W1と、技術情報抽出結果リストを表示
する領域W2と、技術情報の詳細内容を表示する領域W
3とが設けられる。
【0040】技術情報抽出結果リストには、類似度の高
い順に技術情報の名称がリスト表示される。また、各技
術情報が検索文にどの程度類似しているかを一目で把握
できるように、類似度が数値で表示される。類似度が高
いほど、検索文に近い内容であることを示しており、検
索者にとって有用な情報であることを示す指標である。
【0041】なお、類似度を数値で表示する代わりに、
図5に示すように棒グラフ等で表示してもよい。グラフ
で表示すれば、各技術情報の類似度の差異を容易に把握
することができる。
【0042】技術情報抽出結果リスト内の任意の技術情
報をユーザがマウス等で選択すると、その技術情報に対
応する詳細内容が右側の表示領域W3に表示される。こ
の領域には、ユーザが選択した技術情報の書誌的情報だ
けでなく、全文情報や関連情報も表示してもよい。
【0043】一方、図2のステップS6において、ユー
ザが関連技術分類(例えば、国際特許分類IPC)別に
表示する旨の選択を行った場合は、類似度の高い関連技
術分類から順に利用者用端末装置1に表示する処理を行
う(ステップS8)。
【0044】図6は図2のステップS8の処理の詳細フ
ローチャートである。まず、ステップS7と同様に、技
術情報別の類似度検出を行う(ステップS31)。続い
て、類似度検出された各技術情報の関連技術分類を検出
する(ステップS32)。
【0045】続いて、関連技術分類別に類似度の平均値
やばらつきを算定する(ステップS33)。続いて、類似
度の高い順に関連技術分類を並べたリストを作成する
(ステップS34)。
【0046】図7は図2のステップS8に対応する検索
結果表示画面の一例を示す図である。図4との違いは、
関連技術分類別に検索結果を表示する点である。関連技
術分類別に検索結果を集計して表示し、ユーザは、検索
文に関連のある技術分類を把握でき、技術分類を指定し
てさらなる検索を行うことができる。
【0047】一方、図2のステップS6において、ユー
ザが関連企業別に表示する旨の選択を行った場合は、平
均類似度の高い関連企業から順に利用者用端末装置1に
表示する処理を行う(ステップS9)。
【0048】図8はステップS9の処理の詳細フローチ
ャートである。技術情報別の類似度検出を行った(ステ
ップS41)後、類似度検出された各技術情報の関連企業
を検出する(ステップS42)。
【0049】続いて、関連企業別に類似度の平均値やば
らつきを算定する(ステップS43)。続いて、関連企業
を類似度の高い順に並べたリストを作成する(ステップ
S44)。
【0050】図9は図2のステップS9に対応する検索
結果表示画面の一例を示す図である。図4との違いは、
関連企業別に検索結果を集計して表示する点である。関
連企業別に検索結果を表示することにより、ユーザは、
検索文に関連のある企業名を一目で把握できる。
【0051】技術情報データベース装置4に登録されて
いる技術情報が多いほど、利用価値が高まるため、本実
施形態では、新たな技術情報を逐次、技術情報データベ
ース装置4に登録できるようにしている。
【0052】図10は管理用端末装置3が行う技術情報
登録処理の処理手順を示すフローチャートである。ま
ず、登録すべき技術情報を取り込む(ステップS51)。
続いて、取り込んだ技術情報のデータ形式を、技術情報
データベース装置4に見合ったデータ形式に変換する
(ステップS52)。ここでは、主に、タグ情報の変換を
行う。
【0053】図11は技術情報データベース装置4に登
録されている各技術情報がもつタグの一覧を示す図であ
り、特許文書用のタグの例を示している。
【0054】特許文書用のタグには、文書の先頭を示す
<doc>、文書のタイトルを示す<title\>、出願年を示す<
createddate\>、特許権者を示す<au\>、キーワードを示
す<keywordt\>、本文を示す<body>、および文書の最後
を示す</doc>などがある。
【0055】図12は技術情報データベース装置4に登
録されている技術情報の一例を示す図であり、特許文書
の例を示している。図示のように、各技術情報は、タグ
を付けた状態で技術情報データベース装置4に登録され
るため、これらタグに基づいて検索を行うことにより、
所望の技術文書を簡易かつ迅速に探り出すことができ
る。
【0056】図10のステップS52のタグ変換処理が終
了すると、次に検索用の技術情報データを作成する(ス
テップS53)。続いて、図2のステップS3と同様の手
法で形態素解析を行って関連語を抽出した(ステップS
54)後、各関連語に重要度等を加味した重み付けを行う
(ステップS55)。このとき、各関連語をベクトル的に
表現した数値データを生成し、このデータを技術情報デ
ータベース装置4に登録する(ステップS56)。
【0057】図13〜図15は図10のステップS52で
行われるタグ変換処理の処理手順を示すフローチャート
である。まず、エラー情報を記録するエラーログファイ
ルをオープンする(ステップS71)。次に、処理開始時
刻等の処理情報を記録する処理ログファイルをオープン
する(ステップS72)。
【0058】次に、処理開始時刻を処理ログに記録する
(ステップS73)。次に、特許文書が記録されたCD-ROM
内の特許文書データを順次読み出す(ステップS74)。
次に、種々のタグ変数を初期化する(ステップS75)。
具体的には、作者名を表す変数$authorにはヌルデータ
を、キーワードを表す変数$ktには<keywordt>を、タイ
トルを表す変数$titleには<title>を、作成日を表す変
数$c_dateには<createddate>を入力する。
【0059】次に、フラグを初期化した(ステップS7
6)後、特許データファイルをオープンし(ステップS7
7)、特許文書データを一行ずつ読み出す(ステップS7
8)。読み出した行に、隅付き括弧で囲まれた「発明の
名称」という用語が存在するか否かを判定する(ステッ
プS79)。この用語が存在すれば、変数$titleに、発明
の名称の具体名を代入する(ステップS80)。
【0060】ステップS79でNOと判定された場合、ある
いはステップS80の処理が終了した場合には、読み出し
た行に、隅付き括弧で囲まれた「出願日」という用語が
存在するか否かを判定する(ステップS81)。この用語
が存在すれば、日付を表す全角文字をyyyy/mm/ddの形式
の半角文字に変換した(ステップS82)後、この半角文
字を変数$c_dateに代入する(ステップS83)。
【0061】ステップS81でNOと判定された場合、ある
いはステップS83の処理が終了した場合には、読み出し
た行に、隅付き括弧で囲まれた「特許権者」または「出
願人」という用語が存在するか否かを判定する(図14
のステップS84)。この用語が存在すれば、隅付き括弧
で囲まれた「氏名または名称」という用語が存在する行
までスキップした後、その行に記載された具体的な氏名
または名称を変数$authorに代入する(ステップS8
5)。
【0062】ステップS84でNOと判定された場合、ある
いはステップS85の処理が終了した場合には、隅付き括
弧で囲まれた「国際特許分類」という用語が存在するか
否かを判定し(ステップS86)、この用語が存在すれ
ば、キーワードフィールド・フラグをオンする(ステッ
プS87)。
【0063】ステップS86でNOと判定された場合、ある
いはステップS87が終了した場合、特許データファイル
の最終行までタグ変換を行ったか否かを判定する(ステ
ップS88)。まだ最終行までタグ変換を行っていない場
合には、ステップS78以降の処理を繰り返す。
【0064】最終行までタグ変換を行った場合には、タ
グ抜けが存在するか否かを判定する(ステップS89)。
タグ抜けが存在する場合には、エラーログの出力を行う
(ステップS90)。
【0065】ステップS89でNOと判定された場合、ある
いはステップS90の処理が終了した場合には、出力ディ
レクトリが存在するか否かを判定する(ステップS9
1)。出力ディレクトリが存在しない場合にはディレク
トリを初期作成する(ステップS92)。
【0066】ステップS91でYESと判定された場合、
あるいはステップS92の処理が終了した場合、対象年フ
ァイルをオープンする(ステップS93)。まず、開始タ
グ<doc>をオープンする(ステップS94)。次に、抽出
したタグを対象年ファイルに出力する(ステップS9
5)。ここで、抽出するタグは、例えば、<title>、<cre
ateddate>、<au>、<keuwordt>である。
【0067】次に、特許文書本体のタグ<body>の後に、
特許文書データの全内容を出力する(図15のステップ
S96)。次に、対象年ファイルに終了タグ</doc>を出力
した後、同ファイルをクローズする(ステップS97)。
【0068】次に、CD-ROMに記録された全特許文書デー
タについて、タグ変換と年別ファイルへの出力が終了し
たか否かを判定する(ステップS98)。次に、タグ変換
と年別ファイルへの登録が終了したCD-ROMの名称や番号
を処理ログに記録する(ステップS99)。
【0069】次に、すべてのCD-ROMについての処理が終
了したか否かを判定する(ステップS100)。まだ処理
が終了していないCD-ROMがあれば、ステップS74以降の
処理を行う(ステップS101)。次に、処理ログファイ
ルとエラーログファイルをクローズする(ステップS10
2)。
【0070】図16および図17は図2のフローチャー
トで説明した検索処理の詳細内容を示すフローチャート
である。まず、検索文字列が記録されている入力ファイ
ルをオープンした(ステップS121)後、検索結果を記
録する出力ファイルをオープンする(ステップS12
2)。
【0071】次に、検索対象である技術情報を格納した
参照文書数をセットした(ステップS123)後、検索文
字列を読み込む(ステップS124)。次に、読み込んだ
検索文字列にエラーがあるか否かを判定する(ステップ
S125)。エラーがない場合には、検索文字列のベクト
ルを生成する(ステップS126)。次に、生成したベク
トルに基づいて技術情報の検索処理を行う(ステップS
127)。
【0072】次に、ユーザが設定した関連度がゼロか否
かを判定する(ステップS128)。関連度がゼロより大
きければ、その関連度に基づいて関連語抽出を行う(ス
テップS129)。次に、抽出した関連語に基づいて、技
術情報の検索を行う(ステップS130)。
【0073】ステップS128でYESと判定された場合か、
ステップS130の処理が終了した場合は、IPCコード
の集計および整列を行った(ステップS131)後に、特
許権者の集計および整列を行い(ステップS132)、そ
の後に、出願年の集計および整列を行い(ステップS13
3)、次に、ステップS130〜S132の集計および整列結
果を出力する(ステップS134)。
【0074】次に、ユーザが設定した要約率の数値がゼ
ロか否かを判定する(ステップS135)。ここで、要約
率とは、全文章数に対する要約文章数の比率である。要
約率の数値がゼロより大きい場合には、要約処理を行う
(ステップS136)。
【0075】次に、すべての検索結果が得られたか否か
を判定し(ステップS137)、まだ得られていないもの
があれば、ステップS124以降の処理を繰り返す。すべ
ての検索結果が得られた場合には、その結果を出力した
(ステップS138)後、処理を終了する。
【0076】このように、第1の実施形態では、ユーザ
が入力した検索文を形態素解析して単語ベクトルを生成
し、技術情報データベース装置4に登録されている各技
術情報の単語ベクトルとの内積を計算した結果に基づい
て類似度を判定するため、各技術情報との類似度を簡易
かつ精度よく判定することができる。
【0077】また、類似度の高低がわかるような形態で
検索結果を表示するため、複数の技術情報が検索されて
も、各技術情報の類似度の高さを客観的に把握すること
ができる。
【0078】さらに、第1の実施形態では、検索文の中
に技術的なキーワードが含まれていなくても、精度の高
い検索を行えるため、通常の文章と同じような形式で検
索文を作成でき、検索文の作成に熟練を要さなくなるた
め、ユーザの使い勝手が向上する。
【0079】(第2の実施形態)第2の実施形態は、検
索結果を表示する際、検索文に関連のある広告情報を併
せて表示するものである。
【0080】図18は本発明に係る技術情報検索システ
ムの第2の実施形態の概略構成を示すブロック図であ
る。図18では、図1と共通する構成部分には同一符号
を付しており、以下では相違点を中心に説明する。
【0081】図18の技術情報検索システムは、製品
(商品)やサービスの広告情報を提供する広告主用端末
装置7を備えている。この広告主用端末装置7はPCな
どで構成され、インターネット等の通信網を介して検索
装置2とデータの送受信を行う。
【0082】また、図18の検索装置2は、広告主用端
末装置7から提供された広告情報を登録する広告情報デ
ータベース装置(広告情報DB)9を有する。このデー
タベース装置9は、上述した技術情報データベース装置
4や関連情報データベース装置5と同じ記録装置に格納
されてもよいし、それぞれ別個に記録装置を設けてもよ
い。
【0083】図19は図18の技術情報検索システムの
第2の実施形態の概略構成を示すフローチャートであ
る。図19には、新たな技術情報を技術情報データベー
ス装置4に登録する手順と、検索手順と、新たな広告情
報を広告情報データベース装置9に登録する手順とが示
されている。これらのうち、技術情報データベース装置
4に登録する手順(ステップS151〜S156)は図10と
同じであるため、説明を省略する。
【0084】広告主が広告主端末装置を介して製品やサ
ービスの広告情報を入力すると(ステップS157)、検
索装置2はその入力情報を形態素解析し(ステップS15
8)、重要度等を加味して広告情報の重み付け処理(イ
ンデキシング)を行う(ステップS159)。より具体的
には、広告情報に関する単語ベクトルを生成して、広告
情報データベース装置9に登録する(ステップS16
0)。
【0085】なお、広告主は、新たな広告情報を登録す
る場合には、図15に示すフォーマットに従って必要な
事項を記録した文書を、通信網を介して検索装置に送信
する。
【0086】一方、ユーザが利用者用端末装置1を介し
て検索文を入力すると(ステップS161)、検索装置2
はその検索文を形態素解析し(ステップS162,S16
3)、重要度等を加味して検索語群の重み付け処理を行
う(ステップS164)。
【0087】続いて、検索装置2は、検索語群に関する
単語ベクトルと技術情報データベース装置4に登録され
ている各単語ベクトルとの間で内積を演算するととも
に、検索語に関する単語ベクトルと広告情報データベー
ス装置9に登録されている各単語ベクトルとの間で内積
を演算して類似度を検出する(ステップS165)。
【0088】続いて、検索装置2は、内積の演算結果に
基づいて類似度を判定する(ステップS166)。より具
体的には、内積の演算結果が予め入力された基準類似度
よりも小さいか否かを判定する。内積の演算結果すべて
が基準類似度より小さい場合には、類似度は低いと判断
して、該当する技術情報がない旨の表示を行う(ステッ
プS167)。
【0089】一方、内積の演算結果のうち、基準類似度
以上のものがあれば、該当する技術情報を技術情報デー
タベース装置4から抽出し、かつその技術情報に関連の
ある広告情報を広告情報データベース装置9から抽出す
る(ステップS168)。
【0090】続いて、検索結果の表示形式をユーザに選
択させた(ステップS169)後、技術情報と、その技術
情報に関連のある広告情報を、技術情報別、関連技術分
類別、または関連企業別に表示する(ステップS170、
S171、S172)。
【0091】ところで、図19のステップS162が関連
語抽出手段に、ステップS163が第1の形態素解析手段
に、ステップS154が第2の形態素解析手段に、ステッ
プS158が第3の形態素解析手段に、ステップS156が第
1の情報蓄積手段に、ステップS160が第2の情報蓄積
手段に、ステップS165が内積演算手段に、ステップS1
66が類似度判定手段に、ステップS170〜S172が検索結
果出力手段に、それぞれ対応する。
【0092】図20は利用者用端末装置1に表示される
検索結果の画面表示例を示す図である。図示のように、
検索文の表示領域、技術情報の抽出結果リストの表示領
域、および技術情報の詳細内容の表示領域以外に、広告
情報の表示領域が設けられる。この表示領域のサイズ
は、広告情報の数に応じて任意に変更してもよい。
【0093】広告情報を表示する際、類似度の高低に応
じて広告の表示サイズを変えるようにすれば、ユーザの
関心の高い広告情報ほど大きく表示することができ、広
告の効果をよりいっそう高めることができる。また、ユ
ーザにとっても、自分が関心のある製品またはサービス
の広告情報が大きく表示されることから、この広告情報
を確認することで、容易に検索目的を達成することがで
きる。
【0094】図20の画面内に表示された特定の広告情
報を、ユーザがマウス等で選択すると、その広告情報に
関する製品またはサービスの概要を表示させたり、ある
いは、その広告情報を提供する企業等のホームページが
表示されるようにするのが望ましい。これにより、ユー
ザが必要とする場合のみ広告情報の詳細内容を表示でき
る。
【0095】ところで、広告掲載による定量的効果は、
以下の(1)式で表される。
【0096】a=(b×c)/Σb×d …(1) ここで、aは広告効果指標、bは画面に当該広告が表示
された回数、cは当該広告が表示された際の類似度、d
は当該広告のバナーがマウス等で選択されて当該広告の
概要が参照された回数である。
【0097】(1)式にて算出されるaの値が大きいほ
ど広告効果が大きいことを示している。したがって、こ
のaの値に基づいて広告掲載料金を設定すれば、各広告
主に対して広告効果に応じた請求を行うことができる。
上記の(1)式が掲載料金設定手段に相当する。
【0098】また、技術情報データベース装置4に登録
されている技術情報の客観的な市場価値についても、同
様に定量的に計測することができ、この場合の定量的効
果は、以下の(2)式で表される。
【0099】S=(t×u)/Σt×v …(2) ここで、Sは抽出技術情報の市場価値指標、tは画面に
当該技術情報がリスト表示された回数、当該技術情報が
表示された際の類似度、vはリストアップされた当該技
術情報がマウス等により選択されて、当該技術情報の概
要が参照された回数である。
【0100】このSは実際にライセンス取引が行われる
ときの価値基準として利用することができる。このSの
値が大きいほど価値が高いと考えられるため、Sの大き
い技術情報については、タイトル情報を強調表示して、
ユーザの注意を喚起するのが望ましい。上記の(2)式
が市場価値推定手段に相当する。
【0101】また、広告主は、インターネット等を介し
て、オンライン上で広告掲載の申し込みをすることがで
きる。図21はオンライン上での広告掲載の申し込み画
面の一例を示す図である。図示のように、広告主は、キ
ャッチコピー、製品名、会社名、連絡先および製品概要
などを各欄に入力した後、インターネット等を介して広
告掲載の申し込みを行う。検索装置2は、広告主からの
広告情報を広告情報データベース装置9に格納する。
【0102】このように、第2の実施形態では、ユーザ
が入力した検索文に関連のある技術情報を類似度順に表
示するだけでなく、その技術情報に関連のある広告情報
を表示するようにしたため、特定の製品やサービスに関
心のあるユーザのみに広告を提供することができ、広告
の効果を高めることができる。すなわち、検索結果に関
連のある広告情報をユーザに提供するため、広告情報に
関心があると思われるユーザのみに広告情報を提供で
き、不特定多数の者に広告を行うよりも、広告による商
品やサービスの売れ行きを伸ばせる。
【0103】また、検索結果が得られた段階でユーザに
広告情報を提供するようにしたため、広告情報を無駄に
ユーザに提供しなくてすみ、ユーザに迷惑をかけなくな
る。
【0104】さらに、オンラインにて広告情報の申し込
みを行えるため、広告主の便宜が図れるとともに、広告
情報の変更も容易に行える。
【0105】本実施形態では、広告情報の新規登録を行
う場合は、広告主用端末装置7に図21に示す製品情報
インデックスを表示させるようにしている。図21の製
品情報インデックスは、キャッチコピー、製品またはサ
ービス名、会社名、連絡先、および製品概要の各欄を有
する。製品情報インデックスに入力された情報は、検索
装置2に送られて広告情報データベース装置9に登録さ
れる。
【0106】
【発明の効果】以上詳細に説明したように、本発明によ
れば、検索文と検索対象技術情報との類似度を考慮に入
れて検索結果を出力するようにしたため、個々の検索対
象技術情報が検索文にどの程度類似しているかを容易か
つ正確に把握することができる。これにより、先行技術
文献をもとに特許審査を行う審査官の審査業務の迅速・
効率化が図れる。また、企業の特許動向分析(例えば、
研究開発戦略立案や他社の開発状況の調査など)の精度
向上や効率化が図れるとともに、技術連関分析の実用化
が図れる。
【0107】さらに、本発明によれば、検索文との類似
度が高い広告情報を自動的に提供するようにしたため、
広告に関心のある者のみに広告を提供でき、ダイレクト
マーケティングによる対費用効果の高い広告掲載を実現
できる。また、広告に関心のない者には広告情報が提供
されなくなるため、検索サービスのユーザに迷惑をかけ
なくなる。
【0108】また、検索サービスに広告情報を含める分
だけ、検索サービスの利用料を安価に設定でき、検索サ
ービスの利用促進が図れる。また、類似度に応じて広告
情報の内容等を変えることにより、広告効果を高めるこ
とができる。
【図面の簡単な説明】
【図1】本発明に係る技術情報検索システムの第1の実
施形態の概略構成を示すブロック図。
【図2】図1の技術情報検索システムの第1の実施形態
の処理動作を説明するフローチャート。
【図3】上述した検索文に対する技術情報データベース
装置の検索手順を示す図。
【図4】技術情報別に検索結果を表示する例を示す図。
【図5】技術情報抽出結果リストを示す図。
【図6】図2のステップS8の処理の詳細フローチャー
ト。
【図7】図2のステップS8に対応する検索結果表示画
面の一例を示す図。
【図8】ステップS9の処理の詳細フローチャート。
【図9】図2のステップS9に対応する検索結果表示画
面の一例を示す図。
【図10】管理用端末装置3が行う技術情報登録処理の
処理手順を示すフローチャート。
【図11】技術情報データベース装置に登録されている
各技術情報がもつタグの一覧を示す図。
【図12】技術情報データベース装置に登録されている
技術情報の一例を示す図。
【図13】図10のステップS52で行われるタグ変換処
理の処理手順を示すフローチャート。
【図14】図13に続くフローチャート。
【図15】図14に続くフローチャート。
【図16】図2のフローチャートで説明した検索処理の
詳細内容を示すフローチャート。
【図17】図16に続くフローチャート。
【図18】本発明に係る技術情報検索システムの第2の
実施形態の概略構成を示すブロック図。
【図19】図18の技術情報検索システムの第2の実施
形態の概略構成を示すフローチャート。
【図20】利用者用端末装置に表示される検索結果の画
面表示例を示す図。
【図21】オンライン上での広告掲載の申し込み画面の
一例を示す図。
【符号の説明】
1 利用者用端末装置 2 検索装置 3 管理用端末装置 4 技術情報データベース装置 5 関連情報データベース装置 6 関連語句データベース装置 7 広告主用端末装置 8 製品情報データベース装置 9 広告情報データベース装置

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】入力された検索文の中から関連語を抽出す
    る関連語抽出手段と、 抽出された関連語に対して形態素解析を行う第1の形態
    素解析手段と、 前記第1の形態素解析手段による形態素解析により得ら
    れた単語それぞれに対して、技術情報の内容を加味した
    重み付けを行ってベクトル情報を生成する第1のベクト
    ル生成手段と、 複数の検索対象技術情報に対して形態素解析を行う第2
    の形態素解析手段と、 前記第2の形態素解析手段による形態素解析により得ら
    れた単語それぞれに対して、技術情報の内容を加味した
    重み付けを行ってベクトル情報を生成する第2のベクト
    ル生成手段と、 前記第1のベクトル生成手段で生成されたベクトル情報
    と前記第2のベクトル生成手段で生成されたベクトル情
    報との間で内積を演算する内積演算手段と、 前記内積演算手段の演算結果に基づいて、検索文と検索
    対象技術情報との類似度を判定する類似度判定手段と、 前記類似度判定手段による判定結果の出力対象を選択す
    る出力対象選択手段と、 選択された出力対象を前記類似度判定手段により判定さ
    れた類似度順に並べて出力する検索結果出力手段とを備
    えることを特徴とする技術情報検索システム。
  2. 【請求項2】前記出力対象選択手段により選択される出
    力対象は、技術情報別、関連技術分類別および関連企業
    別の少なくとも一つを含むことを特徴とする請求項1に
    記載の技術情報検索システム。
  3. 【請求項3】前記検索結果出力手段が出力する検索結果
    に特定の技術情報が含まれている回数と、その特定の技
    術情報に対する前記類似度判定手段による類似度判定結
    果と、その特定の技術情報に対する前記詳細情報表示制
    御手段による表示回数とに基づいて、各技術情報の市場
    価値を推定する市場価値推定手段をさらに備えることを
    特徴とする請求項1または2に記載の技術情報検索シス
    テム。
  4. 【請求項4】前記検索結果出力手段は、選択された出力
    対象を前記類似度判定手段により判定された類似度順に
    並べて出力する際、この出力対象の類似度が視覚的に把
    握可能な指標を表示させることを特徴とする請求項1〜
    3のいずれかに記載の技術情報検索システム。
  5. 【請求項5】入力された検索文の中から関連語を抽出す
    る関連語抽出手段と、 抽出された関連語に対して形態素解析を行う第1の形態
    素解析手段と、 前記第1の形態素解析手段による形態素解析により得ら
    れた単語それぞれに対して、技術情報の内容を加味した
    重み付けを行ってベクトル情報を生成する第1のベクト
    ル生成手段と、 複数の検索対象技術情報に対して形態素解析を行う第2
    の形態素解析手段と、 前記第2の形態素解析手段による形態素解析により得ら
    れた単語それぞれに対して、技術情報の内容を加味した
    重み付けを行ってベクトル情報を生成する第2のベクト
    ル生成手段と、 前記第2のベクトル生成手段で生成されたベクトル情報
    を格納する第1の情報蓄積手段と、 広告情報に対して形態素解析を行う第3の形態素解析手
    段と、 前記第3の形態素解析手段による形態素解析により得ら
    れた単語それぞれに対して、技術情報の内容を加味した
    重み付けを行ってベクトル情報を生成する第3のベクト
    ル生成手段と、 前記第3のベクトル生成手段で生成されたベクトル情報
    を格納する第2の情報蓄積手段と、 前記第1の情報蓄積手段に格納されたベクトル情報と前
    記第1のベクトル生成手段で生成されたベクトル情報と
    の間で内積を演算し、かつ前記第2の情報蓄積手段に格
    納されたベクトル情報と前記第1のベクトル生成手段で
    生成されたベクトル情報との間で内積を演算する内積演
    算手段と、 前記内積演算手段の演算結果に基づいて類似度を判定す
    る類似度判定手段と、 判定された類似度に基づいて、類似度順に検索対象技術
    情報を出力するとともに、類似度が所定量よりも高い広
    告情報を出力する検索結果出力手段と、を備えることを
    特徴とする技術情報検索システム。
  6. 【請求項6】前記検索結果出力手段は、検索文との類似
    度が高い広告情報ほど大きく表示させることを特徴とす
    る請求項5に記載の技術情報検索システム。
  7. 【請求項7】表示された広告情報の少なくとも一つを選
    択する広告選択手段と、 前記広告選択手段により選択された広告情報の詳細情報
    を表示させる詳細広告表示制御手段を備えることを特徴
    とする請求項5または6に記載の技術情報検索システ
    ム。
  8. 【請求項8】表示画面に特定の広告が表示された回数
    と、表示画面に表示された前記特定の広告と検索文との
    類似度と、前記詳細広告表示制御手段により前記特定の
    広告が選択された回数とに基づいて、前記特定の広告の
    掲載料金額を設定する掲載料金設定手段を備えることを
    特徴とする請求項5〜7のいずれかに記載の技術情報検
    索システム。
JP2000261366A 2000-08-30 2000-08-30 技術情報検索システム Pending JP2002073680A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000261366A JP2002073680A (ja) 2000-08-30 2000-08-30 技術情報検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000261366A JP2002073680A (ja) 2000-08-30 2000-08-30 技術情報検索システム

Publications (1)

Publication Number Publication Date
JP2002073680A true JP2002073680A (ja) 2002-03-12

Family

ID=18749217

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000261366A Pending JP2002073680A (ja) 2000-08-30 2000-08-30 技術情報検索システム

Country Status (1)

Country Link
JP (1) JP2002073680A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006350668A (ja) * 2005-06-15 2006-12-28 Nippon Telegr & Teleph Corp <Ntt> 広告情報配信システム及びそのプログラム
WO2008143116A1 (ja) * 2007-05-17 2008-11-27 So-Ti, Inc. 文書検索装置及び文書検索方法
JP2011090463A (ja) * 2009-10-21 2011-05-06 Fujitsu Ltd 文書検索システム、情報処理装置およびプログラム
US8041601B2 (en) 2003-09-30 2011-10-18 Google, Inc. System and method for automatically targeting web-based advertisements
KR101245109B1 (ko) 2011-06-27 2013-03-18 한국항공대학교산학협력단 정보 검색 시스템의 벡터 유사도 산출방법
JP2014500988A (ja) * 2010-09-20 2014-01-16 アリババ・グループ・ホールディング・リミテッド テキストセットの照合
JP2014095949A (ja) * 2012-11-07 2014-05-22 Yahoo Japan Corp 広告処理装置及び広告処理方法
US20170207223A1 (en) * 2014-06-11 2017-07-20 Sony Corporation Semiconductor device and method of manufacturing the same
JP2021144348A (ja) * 2020-03-10 2021-09-24 富士通株式会社 情報処理装置及び情報処理方法
JP2022078423A (ja) * 2020-11-13 2022-05-25 IP Nexus株式会社 企業情報検索装置、企業情報検索方法および企業情報検索プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07319905A (ja) * 1994-05-25 1995-12-08 Fujitsu Ltd 情報検索装置
JPH09153066A (ja) * 1995-11-29 1997-06-10 Matsushita Electric Ind Co Ltd 文書検索装置
JPH10301946A (ja) * 1997-04-24 1998-11-13 Fujitsu Ltd 情報提供装置
JP2000148765A (ja) * 1998-11-05 2000-05-30 Nec Corp 検索システムおよび検索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07319905A (ja) * 1994-05-25 1995-12-08 Fujitsu Ltd 情報検索装置
JPH09153066A (ja) * 1995-11-29 1997-06-10 Matsushita Electric Ind Co Ltd 文書検索装置
JPH10301946A (ja) * 1997-04-24 1998-11-13 Fujitsu Ltd 情報提供装置
JP2000148765A (ja) * 1998-11-05 2000-05-30 Nec Corp 検索システムおよび検索方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8041601B2 (en) 2003-09-30 2011-10-18 Google, Inc. System and method for automatically targeting web-based advertisements
JP2006350668A (ja) * 2005-06-15 2006-12-28 Nippon Telegr & Teleph Corp <Ntt> 広告情報配信システム及びそのプログラム
WO2008143116A1 (ja) * 2007-05-17 2008-11-27 So-Ti, Inc. 文書検索装置及び文書検索方法
JP5159772B2 (ja) * 2007-05-17 2013-03-13 株式会社創知 文書検索装置及び文書検索方法
US8818979B2 (en) 2007-05-17 2014-08-26 Valuenex Consulting Inc. Document retrieving apparatus and document retrieving method
JP2011090463A (ja) * 2009-10-21 2011-05-06 Fujitsu Ltd 文書検索システム、情報処理装置およびプログラム
JP2014500988A (ja) * 2010-09-20 2014-01-16 アリババ・グループ・ホールディング・リミテッド テキストセットの照合
KR101245109B1 (ko) 2011-06-27 2013-03-18 한국항공대학교산학협력단 정보 검색 시스템의 벡터 유사도 산출방법
JP2014095949A (ja) * 2012-11-07 2014-05-22 Yahoo Japan Corp 広告処理装置及び広告処理方法
US20170207223A1 (en) * 2014-06-11 2017-07-20 Sony Corporation Semiconductor device and method of manufacturing the same
US9917091B2 (en) * 2014-06-11 2018-03-13 Sony Corporation Semiconductor device and method of manufacturing the same
JP2021144348A (ja) * 2020-03-10 2021-09-24 富士通株式会社 情報処理装置及び情報処理方法
JP7388256B2 (ja) 2020-03-10 2023-11-29 富士通株式会社 情報処理装置及び情報処理方法
JP2022078423A (ja) * 2020-11-13 2022-05-25 IP Nexus株式会社 企業情報検索装置、企業情報検索方法および企業情報検索プログラム

Similar Documents

Publication Publication Date Title
Elmogy et al. Fake reviews detection using supervised machine learning
CN110069610B (zh) 基于Solr的检索方法、装置、设备和存储介质
US7783644B1 (en) Query-independent entity importance in books
Bravo-Marquez et al. Combining strengths, emotions and polarities for boosting twitter sentiment analysis
US8214363B2 (en) Recognizing domain specific entities in search queries
Sharoff et al. The Web Library of Babel: evaluating genre collections.
US10552467B2 (en) System and method for language sensitive contextual searching
US20110258227A1 (en) Method and system for searching documents
RU2005111001A (ru) Проверка релевантности между ключевыми словами и содержанием веб-сайта
JPH096799A (ja) 文書分類装置及び文書検索装置
JP6529133B2 (ja) 複数地域でのトピックの評価を分析する装置、プログラム及び方法
JP2003281186A (ja) 類似性判断のための例題ベース検索方法及び検索システム
JP2002073680A (ja) 技術情報検索システム
Khairani et al. Named-entity recognition and optical character recognition for detecting halal food ingredients: Indonesian case study
JP2003271609A (ja) 情報監視装置及び情報監視方法
JP2000163437A (ja) 文書分類方法および文書分類装置ならびに文書分類処理プログラムを記録した記録媒体
Asr et al. Misinformation detection in news text: Automatic methods and data limitations
Rizun et al. Development and research of the text messages semantic clustering methodology
JP2021039627A (ja) 発想提案支援システム、発想提案支援装置、発想提案支援方法及びプログラム
Nurkholis et al. Web scraping for summarization of freelance job website using vector space model
Ramirez et al. ACE: improving search engines via Automatic Concept Extraction
TW469386B (en) Document retrieval and classification method and apparatus
JP2005092443A (ja) クラスター分析装置およびクラスター分析方法
CN110457435A (zh) 一种专利新颖性分析系统及其分析方法
JP2006139484A (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040709

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041109