JP2001052014A - Natural sentence searchable device and storage medium storing program for realizing the same - Google Patents
Natural sentence searchable device and storage medium storing program for realizing the sameInfo
- Publication number
- JP2001052014A JP2001052014A JP11224939A JP22493999A JP2001052014A JP 2001052014 A JP2001052014 A JP 2001052014A JP 11224939 A JP11224939 A JP 11224939A JP 22493999 A JP22493999 A JP 22493999A JP 2001052014 A JP2001052014 A JP 2001052014A
- Authority
- JP
- Japan
- Prior art keywords
- search
- keyword
- natural sentence
- given
- natural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 18
- 238000011156 evaluation Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 9
- 238000013500 data storage Methods 0.000 description 6
- 241000700605 Viruses Species 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- QFTYEBTUFIFTHD-UHFFFAOYSA-N 1-[6,7-dimethoxy-1-[1-(6-methoxynaphthalen-2-yl)ethyl]-3,4-dihydro-1H-isoquinolin-2-yl]-2-piperidin-1-ylethanone Chemical compound C1=CC2=CC(OC)=CC=C2C=C1C(C)C(C1=CC(OC)=C(OC)C=C1CC1)N1C(=O)CN1CCCCC1 QFTYEBTUFIFTHD-UHFFFAOYSA-N 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【課題】 従来のインターネットキーワード検索サーバ
を用いて、自然文検索条件にて所望の検索結果を得る。
【解決手段】 自然文検索条件が与えられると、検索サ
ーバにこれを分断したキーワードを与える(ステップS
3,5)。検索結果としてメタデータが与えられると、
与えられた自然文との類似度を演算する(ステップS1
3)。そして、類似度の高い順に並び替える(ステップ
S18)。並び替えられた検索結果が表示される(ステ
ップS19)。サーバ側の負担を増やすことなく、操作
者の意図に沿ったサイトを表示できる。
(57) [Summary] [Problem] To obtain a desired search result under natural sentence search conditions using a conventional Internet keyword search server. SOLUTION: Given a natural sentence search condition, a search server is provided with a divided keyword (step S).
3, 5). Given metadata as search results,
The similarity with the given natural sentence is calculated (step S1).
3). Then, the images are rearranged in descending order of similarity (step S18). The sorted search results are displayed (step S19). A site can be displayed according to the operator's intention without increasing the burden on the server side.
Description
【0001】[0001]
【発明の属する技術分野】この発明は、自然文検索装置
に関し、特にキーワード検索装置に接続して自然文検索
を行う装置に関する。[0001] 1. Field of the Invention [0002] The present invention relates to a natural sentence search apparatus, and more particularly to an apparatus connected to a keyword search apparatus and performing a natural sentence search.
【0002】[0002]
【従来の技術】今日、インターネットに接続されたコン
ピュータには膨大な情報が記憶されている。かかる膨大
な情報から操作者が欲する情報を取得するために、ユー
ザの要求するサイトを検索する検索サーバとして、Ya
hoo(商標),Infoseek(商標)等が知られ
ている。2. Description of the Related Art Today, a huge amount of information is stored in a computer connected to the Internet. As a search server for searching for a site requested by a user in order to obtain information desired by an operator from such a vast amount of information, Ya
hoo (trademark), Infoseek (trademark) and the like are known.
【0003】前記検索サーバを用いた検索について説明
する。前記検索サーバには、各サイトのメタデータ(タ
イトルやサマリ等)が予め記憶されている。ユーザは、
検索サーバにアクセスして所望のキーワードを入力す
る。検索サーバは、前記メタデータ中に前記キーワード
を含むサイトのメタデータおよびURLをユーザに提示
する。ユーザは表示されたメタデータを読んで、検索意
図に合致したサイトであるかを判断する。このようにし
て、膨大なサイトの中からユーザが望むサイトを探すこ
とができる。A search using the search server will be described. In the search server, metadata (title, summary, etc.) of each site is stored in advance. The user
Access the search server and enter the desired keyword. The search server presents the user with the metadata and URL of the site including the keyword in the metadata. The user reads the displayed metadata and determines whether the site matches the search intention. In this way, a site desired by the user can be searched from a huge number of sites.
【0004】[0004]
【発明が解決しようとする課題】しかしながら、前記検
索サーバには以下のような問題があった。前記検索サー
バは、入力されたキーワードが前記メタデータに存在す
るか否かで判断する。したがって、例えば、「コンピュ
ータウィルスの被害について知りたい」というような自
然文検索条件では検索ができなかった。また、前記自然
文をタームに分割してキーワードとして与えても、ヒッ
ト数が多い場合には、ユーザは、各サイトのメタデータ
を参考にして、前記検索条件に合致したサイトであるか
否かを検討する必要がある。However, the search server has the following problems. The search server determines whether the input keyword exists in the metadata. Therefore, for example, a search could not be performed under natural sentence search conditions such as "I want to know about the damage of computer viruses". Also, even if the natural sentence is divided into terms and given as keywords, if the number of hits is large, the user refers to the metadata of each site and determines whether or not the site matches the search condition. Need to be considered.
【0005】かかる問題を解決するために、前記検索サ
ーバに検索条件として与えられる自然文の意味を解釈し
て検索できるようにすることも考えられる。しかし、こ
のような自然文検索のためのインデックスが増えて、前
記検索サーバーの負担が増大する。[0005] In order to solve such a problem, it is conceivable to enable a search by interpreting the meaning of a natural sentence given to the search server as a search condition. However, the index for such a natural sentence search increases, and the load on the search server increases.
【0006】この発明は上記問題を解決し、既存の検索
サーバを用いて、検索条件として自然文を与えて、その
自然文の意味に合致した検索結果を得ることのできるデ
ータ検索装置またはその方法を提供することを目的とす
る。[0006] The present invention solves the above-mentioned problems, and provides a natural sentence as a search condition using an existing search server, and obtains a search result that matches the meaning of the natural sentence or a method thereof. The purpose is to provide.
【0007】[0007]
【課題を解決するための手段および発明の効果】1)本
発明にかかるプログラムを記憶した記録媒体において
は、予めURLで特定される複数のドキュメントについ
てのメタデータを記憶しておき、検索キーワードが与え
られると前記メタデータ中にその検索キーワードを含む
ドキュメントのURLを合致度順に特定するインターネ
ットに接続された検索サーバに、インターネットを介し
て接続されるコンピュータを自然文検索可能装置として
実現するプログラムを記憶した記憶媒体であって、自然
文で構成された自然文検索条件が与えられると、与えら
れた自然文検索条件から検索キーワードを抽出して前記
検索サーバに与え、前記検索サーバ装置から検索結果と
してドキュメントのメタデータが合致度とともに与えら
れると、このメタデータと前記自然文検索条件との類似
度を演算し、この類似度に基づいて前記ドキュメントの
合致度を変更する処理を前記コンピュータに実行させる
ためのプログラムが記憶されている。このように、前記
自然文に基づいて抽出されたキーワードで一旦検索した
後、検索結果のメタデータと前記自然文との類似度に基
づいて検索結果の並び替えることにより、インターネッ
ト接続されて、キーワード検索を行う既存の検索サーバ
を用いて、自然文検索が可能となる。Means for Solving the Problems and Effects of the Invention 1) In a recording medium storing a program according to the present invention, metadata about a plurality of documents specified by a URL is stored in advance, and a search keyword is stored. When given, a program for realizing a computer connected via the Internet as a natural sentence searchable device to a search server connected to the Internet which specifies URLs of documents including the search keyword in the metadata in order of matching degree. When a natural sentence search condition composed of a natural sentence is given in a stored storage medium, a search keyword is extracted from the given natural sentence search condition and given to the search server, and a search result is sent from the search server device. If the document metadata is given along with the match level as Calculating a similarity of the natural sentence search conditions data, the program for executing a process of changing the degree of match of the document to the computer on the basis of the similarity are stored. As described above, once a search is performed with the keyword extracted based on the natural sentence, the search result is rearranged based on the similarity between the metadata of the search result and the natural sentence, so that the keyword is connected to the Internet. A natural sentence search can be performed using an existing search server that performs a search.
【0008】2)本発明にかかるプログラムを記憶した
記録媒体においては、予めURLで特定される複数のド
キュメントについてのメタデータを記憶しておき、検索
キーワードが与えられると前記メタデータ中にその検索
キーワードを含むドキュメントのURLを合致度順に特
定するインターネットに接続された検索サーバに、イン
ターネットを介して接続されるコンピュータを自然文検
索可能装置として実現するプログラムを記憶した記憶媒
体であって、自然文で構成された自然文検索条件が与え
られると、与えられた自然文検索条件から検索キーワー
ドを抽出して前記検索サーバに与え、前記検索サーバ装
置から前記検索キーワードに合致したドキュメントのU
RLが与えられると、そのURLで特定されるドキュメ
ントと前記自然文検索条件との類似度を演算し、この類
似度に基づいてドキュメントの合致度を変更する処理を
前記コンピュータに実行させるためのプログラムが記憶
されている。このように、前記自然文に基づいて抽出さ
れたキーワードで一旦検索した後、検索結果のURLで
特定されるドキュメントと前記自然文との類似度に基づ
いて検索結果の並び替えることにより、インターネット
接続検索サーバからメタデータが与えられない場合で
も、自然文検索が可能となる。さらに、前記ドキュメン
トを用いて類似度を演算しているので、より前記自然文
検索条件に合致した検索結果を得ることができる。[0008] 2) In a recording medium storing a program according to the present invention, metadata about a plurality of documents specified by a URL is stored in advance, and when a search keyword is given, the search is performed in the metadata. A storage medium storing a program for realizing a computer connected via the Internet as a natural sentence searchable device in a search server connected to the Internet for specifying URLs of documents including keywords in order of matching degree, Is given, a search keyword is extracted from the given natural sentence search condition and provided to the search server, and the search server apparatus sends a U of a document that matches the search keyword.
Given a RL, a program for calculating the similarity between the document specified by the URL and the natural sentence search condition, and causing the computer to execute a process of changing the matching degree of the document based on the similarity Is stored. As described above, once a search is performed using the keyword extracted based on the natural sentence, the search result is rearranged based on the similarity between the document specified by the URL of the search result and the natural sentence. Even when metadata is not provided from the search server, natural sentence search can be performed. Furthermore, since the similarity is calculated using the document, it is possible to obtain a search result that more matches the natural sentence search condition.
【0009】3)本発明にかかるプログラムを記憶した
記録媒体においては、与えられた検索キーワードに基づ
いて前記検索キーワードを含むファイルを特定するキー
ワード検索装置に接続されるコンピュータを、自然文検
索可能装置として実現するプログラムを記憶した記憶媒
体であって、自然文で構成された自然文検索条件が与え
られると、この自然文から検索キーワードを抽出して前
記キーワード検索装置に与え、前記キーワード検索装置
によって特定されたファイルについて、そのファイルの
内容を直接または間接的に表すファイル内容情報と前記
自然文検索条件との類似度を演算し、この類似度に基づ
いて前記特定されたファイルの前記合致度を決定する処
理を前記コンピュータに実行させるためのプログラムが
記憶されている。このように、前記自然文に基づいて抽
出されたキーワードで一旦検索した後、前記ファイル内
容情報と前記自然文との類似度に基づいて検索結果の並
び替えることにより、キーワード検索を行う既存のキー
ワード検索装置を用いて、自然文検索が可能となる。[0009] 3) In the recording medium storing the program according to the present invention, a computer connected to a keyword search device for specifying a file containing the search keyword based on a given search keyword can be used as a natural sentence searchable device. When a natural sentence search condition composed of natural sentences is given, a search keyword is extracted from the natural sentence and given to the keyword search device. For the specified file, calculate the similarity between the file content information that directly or indirectly represents the content of the file and the natural sentence search condition, and calculate the matching degree of the specified file based on the similarity. A program for causing the computer to execute the process of determining is stored. As described above, once a search is performed using the keyword extracted based on the natural sentence, the search result is rearranged based on the similarity between the file content information and the natural sentence. A natural sentence search can be performed using the search device.
【0010】4)本発明にかかる自然文検索可能装置
は、与えられた検索キーワードに基づいて前記検索キー
ワードを含むファイルを特定するキーワード検索装置に
接続され、1)自然文で構成された自然文検索条件が与え
られると、この自然文を記憶する記憶手段、2)前記自然
文から検索キーワードを抽出して前記キーワード検索装
置に与えるキーワード出力手段、3)前記キーワード検索
装置から検索結果が与えられると、特定されたファイル
について、そのファイルの内容を直接または間接的に表
すファイル内容情報と前記自然文との類似度を演算する
演算手段、4)この類似度に基づいて前記特定されたファ
イルの評価を決定する評価手段を備えている。このよう
に、前記自然文に基づいて抽出されたキーワードで一旦
検索した後、前記ファイル内容情報と前記自然文との類
似度に基づいて検索結果の並び替えることにより、キー
ワード検索を行う既存のキーワード検索装置を用いて、
自然文検索が可能となる。4) A natural sentence searchable device according to the present invention is connected to a keyword search device for specifying a file containing the search keyword based on a given search keyword, and 1) a natural sentence composed of natural sentences When a search condition is given, storage means for storing the natural sentence, 2) keyword output means for extracting a search keyword from the natural sentence and giving it to the keyword search device, and 3) search results from the keyword search device Calculating means for calculating the similarity between the natural sentence and the file content information directly or indirectly representing the content of the specified file for the specified file; 4) calculating the similarity of the specified file based on the similarity; An evaluation means for determining an evaluation is provided. As described above, once a search is performed using the keyword extracted based on the natural sentence, the search result is rearranged based on the similarity between the file content information and the natural sentence. Using a search device,
Natural sentence search becomes possible.
【0011】5)本発明にかかるコンピュータを用いた
自然文検索方法は、与えられた検索キーワードに基づい
て前記検索キーワードを含むファイルを特定するキーワ
ード検索装置にコンピュータを接続し、前記コンピュー
タは、1)自然文で構成された自然文検索条件が与えられ
ると、この自然文から検索キーワードを抽出して前記キ
ーワード検索装置に与え、2)前記キーワード検索装置か
ら検索結果が与えられると、前記検索結果に基づいて特
定されたファイルについて、そのファイルの内容を直接
または間接的に表すファイル内容情報と前記自然文との
類似度を演算し、3)この類似度に基づいて前記特定され
たファイルの評価を決定する。このように、前記自然文
に基づいて抽出されたキーワードで一旦検索した後、前
記各ファイルについてファイル内容情報と前記自然文と
の類似度に基づいて検索結果の並び替えることにより、
キーワード検索を行う既存のキーワード検索装置を用い
て、自然文検索が可能となる。5) A natural sentence search method using a computer according to the present invention includes connecting the computer to a keyword search device that specifies a file including the search keyword based on a given search keyword, and ) When a natural sentence search condition composed of natural sentences is given, a search keyword is extracted from the natural sentence and given to the keyword search device. 2) When a search result is given from the keyword search device, the search result is given. For the file specified based on the similarity, calculate the similarity between the file contents information that directly or indirectly represents the content of the file and the natural sentence, and 3) evaluate the specified file based on the similarity. To determine. In this way, by once searching for the keyword extracted based on the natural sentence, the search results are rearranged for each file based on the similarity between the file content information and the natural sentence,
A natural sentence search can be performed using an existing keyword search device that performs a keyword search.
【0012】なお、「ファイル内容情報」とは、そのフ
ァイルの内容を直接または間接的に表すデータであり、
実施形態ではメタデータに該当する。なお、メタデータ
とは、そのドキュメントにおける特徴的なタームやその
集合であり、さらにファイル内容のタイトルやファイル
内容の要約等も含む。The "file content information" is data that directly or indirectly represents the content of the file.
In the embodiment, this corresponds to metadata. Note that the metadata is a characteristic term or a set of the terms in the document, and further includes a title of the file content, a summary of the file content, and the like.
【0013】[0013]
【発明の実施の形態】1.機能ブロック図の説明 本発明の一実施形態を図面に基づいて説明する。図1に
示す自然文検索可能装置1は、キーワード検索装置19
に接続されて用いられる。キーワード検索装置19は、
与えられた検索キーワードに基づいて前記検索キーワー
ドを含むファイルを特定する。BEST MODE FOR CARRYING OUT THE INVENTION Description of Functional Block Diagram One embodiment of the present invention will be described with reference to the drawings. The natural sentence searchable device 1 shown in FIG.
It is used by being connected to. The keyword search device 19
A file containing the search keyword is specified based on the given search keyword.
【0014】自然文検索可能装置1は、記憶手段3、キ
ーワード出力手段5、演算手段7、評価手段9、および
出力手段11を備えている。The natural sentence searchable device 1 includes a storage unit 3, a keyword output unit 5, a calculation unit 7, an evaluation unit 9, and an output unit 11.
【0015】記憶手段3は、自然文で構成された自然文
検索条件が与えられると、この自然文を記憶する。キー
ワード出力手段5は、記憶手段3に記憶された自然文か
ら検索キーワードを抽出してキーワード検索装置19に
与える。演算手段7は、キーワード検索装置19から検
索結果が与えられると、特定されたファイルについて、
そのファイルの内容を直接または間接的に表すファイル
内容情報と前記自然文との類似度を演算する。評価手段
8は、この類似度に基づいて前記特定されたファイルの
評価を決定する。出力手段9は、評価手段が決定した各
ファイルの評価を報知する。The storage means 3 stores a natural sentence given a natural sentence search condition composed of natural sentences. The keyword output unit 5 extracts a search keyword from the natural sentence stored in the storage unit 3 and provides the keyword to the keyword search device 19. When the search result is given from the keyword search device 19, the calculation means 7
The similarity between the natural sentence and the file content information that directly or indirectly represents the content of the file is calculated. The evaluation means 8 determines the evaluation of the specified file based on the similarity. The output unit 9 reports the evaluation of each file determined by the evaluation unit.
【0016】なお、本実施形態においては、キーワード
検索装置19と、自然文検索可能装置1とは、TCP/
IPによってインターネット接続されている場合につい
て説明したが、LAN等で接続されている場合も同様に
適用できる。さらに、TCP/IP以外の通信プロトコ
ルで接続されている場合も同様である。In the present embodiment, the keyword search device 19 and the natural sentence searchable device 1 are TCP /
The case where the Internet connection is established by IP has been described, but the case where the connection is established by LAN or the like can be similarly applied. Further, the same applies to a case where the connection is made using a communication protocol other than TCP / IP.
【0017】また、報知手段として表示手段を採用した
が、これ以外の報知手段、例えば音声発生手段等を採用
してもよい。Although the display means is used as the notification means, other notification means, such as a sound generation means, may be used.
【0018】2.インターネットを用いた接続例 図1に示す自然文検索可能装置1をインターネットを介
してキーワード検索装置であるキーワード検索サーバに
接続した場合について説明する。自然文検索可能装置1
は、図2に示すように、インターネットを介してキーワ
ード検索サーバ20に接続されている。キーワード検索
サーバ20には、各サイトのURLとメタデータが予め
記憶されている。自然文検索可能装置1は、自然文検索
条件が入力されると、かかる自然文から検索キーワード
を抽出して、検索キーワードとしてキーワード検索サー
バ20に与える。キーワード検索サーバ20は予め記憶
されている各ドキュメントのメタデータに基づいて、前
記キーワードを含むドキュメントを特定する。特定した
ドキュメントのURLおよびメタデータは、自然文検索
可能装置1に与えられる。自然文検索可能装置1は与え
られた検索結果について、前記自然文との類似度に基づ
いて並び替える。2. Example of Connection Using the Internet A case will be described in which the natural sentence searchable device 1 shown in FIG. 1 is connected to a keyword search server, which is a keyword search device, via the Internet. Natural sentence searchable device 1
Are connected to the keyword search server 20 via the Internet, as shown in FIG. The URL and metadata of each site are stored in the keyword search server 20 in advance. When a natural sentence search condition is input, the natural sentence searchable device 1 extracts a search keyword from the natural sentence and gives it to the keyword search server 20 as a search keyword. The keyword search server 20 specifies a document including the keyword based on metadata of each document stored in advance. The specified document URL and metadata are provided to the natural sentence searchable device 1. The natural sentence searchable device 1 sorts the given search results based on the similarity with the natural sentence.
【0019】3.自然文検索装置1のハードウェア構成 図3を用いて、図2に示す自然文検索可能装置1をCP
Uを用いて実現したハードウェア構成の一例を示す。3. Hardware Configuration of Natural Sentence Retrieval Apparatus 1 Referring to FIG. 3, the natural sentence retrievable apparatus 1 shown in FIG.
1 shows an example of a hardware configuration realized using U.
【0020】自然文検索可能装置1は、CPU23、メ
モリ27、ハードディスク26、CRT30、FDD2
5、キーボード28、マウス31、通信ボード32およ
びバスライン29を備えている。CPU23は、ハード
ディスク26に記憶された制御プログラムにしたがいバ
スライン29を介して、各部を制御する。The natural sentence searchable device 1 comprises a CPU 23, a memory 27, a hard disk 26, a CRT 30, a FDD 2
5, a keyboard 28, a mouse 31, a communication board 32, and a bus line 29. The CPU 23 controls each unit via a bus line 29 according to a control program stored in the hard disk 26.
【0021】この制御プログラムは、FDD25を介し
て、プログラムが記憶されたフレキシブルディスク(F
D)25aから読み出されてハードディスク26にイン
ストールされたものである。なお、フレキシブルディス
ク以外に、CD−ROM、ICカード等のプログラムを
実体的に一体化したコンピュータ可読の記録媒体から、
ハードディスクにインストールさせるようにしてもよ
い。さらに、通信回線を用いてダウンロードするように
してもよい。The control program is transmitted via the FDD 25 to a flexible disk (F) storing the program.
D) It is read from 25a and installed on the hard disk 26. In addition to the flexible disk, a computer-readable recording medium in which a program such as a CD-ROM or an IC card is substantially integrated is used.
You may make it install on a hard disk. Furthermore, you may make it download using a communication line.
【0022】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク26にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをFDD25
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦他の形態等に変換が必要なもの(例えば、
データ圧縮されているものを、解凍する等)、さらに
は、他のモジュール部分と組合して実行可能なものも含
む。In the present embodiment, the program is installed on the hard disk 26 from the flexible disk, so that the computer indirectly executes the program stored on the flexible disk. However, without being limited to this, the program stored in the flexible disk is stored in the FDD25.
Alternatively, it may be executed directly from. Note that, as a program executable by a computer, not only a program that can be directly executed by simply installing it as it is, but also a program that needs to be once converted into another form or the like (for example,
Decompression of data that has been compressed, etc.), and also includes those that can be executed in combination with other module parts.
【0023】ハードディスク26は、プログラム記憶部
26aを有する。プログラム記憶部26aには、後述す
るプログラムが記憶されている。The hard disk 26 has a program storage section 26a. The program storage unit 26a stores a program described later.
【0024】通信ボード32は、CPU23からの命令
に基づき、インターネットに接続された他のコンピュー
タとデータの送受信処理を行う。The communication board 32 transmits and receives data to and from another computer connected to the Internet based on a command from the CPU 23.
【0025】4.フローチャート つぎに、ハードディスク26のプログラム記憶部26a
に記憶されているプログラムについて、図4を用いて説
明する。以下では、「最近日本で話題になっているコン
ピュータウィルスの対策について知りたい」との自然文
検索条件を入力した場合について説明する。図4では、
クライアント側とサーバ側における処理がまとめて表示
されている。4. Flow chart Next, the program storage unit 26a of the hard disk 26
Will be described with reference to FIG. The following describes a case where a natural sentence search condition of “I want to know about countermeasures against computer viruses that have recently become a topic in Japan” is input. In FIG.
The processes on the client side and the server side are displayed together.
【0026】操作者は前記自然文「最近日本で話題にな
っているコンピュータウィルスの対策について知りた
い」を入力する(ステップS1)。CPU23は、入力
された自然文をRAM27に記憶する(ステップS2)
とともに、かかる自然文からキーワードを抽出する(ス
テップS3)。この場合、キーワードとして、「最近」
「日本」「話題」「コンピュータウィルス」および「ワ
クチン」が抽出される。The operator inputs the natural sentence "I want to know about countermeasures against computer viruses that have recently become a hot topic in Japan" (step S1). The CPU 23 stores the input natural sentence in the RAM 27 (step S2).
At the same time, a keyword is extracted from the natural sentence (step S3). In this case, the keyword "Recent"
"Japan", "topics", "computer viruses" and "vaccines" are extracted.
【0027】CPU23は、通信ボード32を介して検
索サーバへかかるキーワードを送信する(ステップS
5)。The CPU 23 transmits the keyword to the search server via the communication board 32 (step S).
5).
【0028】サーバ側では、クライアント側から検索要
求があるか否か判断しており(ステップS21)、検索
要求があると、該当するファイルのURLおよびメタデ
ータを抽出するとともに、検索ヒット率順に並べて(ス
テップS21)、クライアント側に送信する(ステップ
S25)。送信される検索結果を図5に示す。The server determines whether there is a search request from the client (step S21). If there is a search request, the server extracts the URL and metadata of the corresponding file and arranges them in the order of the search hit rate. (Step S21), and transmits to the client side (Step S25). FIG. 5 shows the transmitted search results.
【0029】クライアント側では、CPU23はステッ
プS5の送信後、検索結果を受領するか否か判断してお
り(ステップS7)、検索結果を受け取ると、メモリ2
7のダウンロードデータ記憶部27aに記憶する(ステ
ップS9)。On the client side, after transmitting the step S5, the CPU 23 determines whether or not to receive the search result (step S7).
7 is stored in the download data storage unit 27a (step S9).
【0030】本実施形態においては、後述するように自
然文との一致度を演算するために、受け取ったメタデー
タから、関連語拡張処理を行うとともに、メタデータを
多次元ベクトル化して、メモリ27に記憶した。かかる
処理について簡単に説明する。In the present embodiment, in order to calculate the degree of coincidence with a natural sentence, as will be described later, related word extension processing is performed from the received metadata, and the metadata is converted into a multidimensional vector. Memorized. This processing will be briefly described.
【0031】関連語拡張処理は次のようにして行われ
る。自然言語処理における形態素解析を用いて、全メタ
データ中に含まれるターム(主に名詞句)を全て抜き出
す。次にメタデータ中に含まれる全タームの出現頻度お
よび位置関係(係り受け関係を含む)から各ターム間の
相関度(0〜1の数値)を算出し、関連語を抽出する。
例えば、ターム「競輪」がターム「オリンピック」及び
ターム「中野浩一」とが同時に用いられていることが多
ければ、関連語として抽出される。このように、関連語
とは、特定のタームとよく一緒に用いられている(出現
する)タームをいう。このように、タームの出現頻度や
位置関係に基づいて統計的に関連語を拡張処理を行うこ
とにより、新しいタームや専門用語に対しても的確な検
索を可能となる。The related word expansion process is performed as follows. Using morphological analysis in natural language processing, all terms (mainly noun phrases) included in all metadata are extracted. Next, the degree of correlation (numerical value of 0 to 1) between the terms is calculated from the appearance frequency and the positional relationship (including the dependency relationship) of all the terms included in the metadata, and related words are extracted.
For example, if the term “bicycle” is often used simultaneously with the term “Olympic” and the term “Koichi Nakano”, it is extracted as a related word. As described above, the related term refers to a term that is frequently used (appears) with a specific term. As described above, by performing the expansion process on the related words statistically based on the appearance frequency and the positional relationship of the terms, it is possible to accurately search for new terms and technical terms.
【0032】多次元ベクトル化について説明する。ま
ず、tfidf法を用いて各タームの重み付けを行う。
tfidf法とは、情報検索におけるキーワード決定の
手法であり、ある文書中におけるそのタームの出現頻度
を示すtf(term frequency)および全文書中で当該
タームがいかに少ない文書でしか現れないかの希少性を
示すidf(inverse document frequency)を用い
て、タームの重み付けをする手法である。そして、各メ
タデータを、前記関連語を考慮しつつ、各タームの多次
元空間ベクトルで表現する。The multidimensional vectorization will be described. First, each term is weighted using the tfidf method.
The tfidf method is a method of determining a keyword in information retrieval, and is a term frequency (tf) indicating the frequency of occurrence of a term in a certain document, and the rarity of how few terms appear in all documents. Is a method of weighting terms using an idf (inverse document frequency) that indicates Then, each metadata is represented by a multi-dimensional space vector of each term while considering the related words.
【0033】また、ステップS1で与えられた自然文も
同様にして、多次元ベクトル化する。Similarly, the natural sentence given in step S1 is converted into a multidimensional vector.
【0034】つぎに、CPU23は処理項目番号iを初
期化し(ステップS11)、i番目の項目について、ス
テップS2にて記憶した自然文との類似度を演算し、こ
れを記憶する(ステップS13)。この場合であれば、
図5に示す第1番目の項目「会社案内 ★日本支社・・
・」について、自然文「最近日本で話題になっているコ
ンピュータウィルスの対策について知りたい」との類似
度が演算される。Next, the CPU 23 initializes the process item number i (step S11), calculates the similarity between the i-th item and the natural sentence stored in step S2, and stores it (step S13). . In this case,
The first item shown in Fig. 5 "Company profile ★ Japan branch office ...
, A similarity to the natural sentence “I want to know about countermeasures against computer viruses that have recently become a hot topic in Japan” is calculated.
【0035】本実施形態においては、第1番目のメタデ
ータの多次元ベクトルと、自然文で表現された問い合わ
せ文との内積を類似度として演算した。In the present embodiment, the inner product of the multidimensional vector of the first metadata and the query sentence expressed as a natural sentence is calculated as the similarity.
【0036】CPU23は、全項目について類似度演算
が終了したか否か判断する(ステップS15)。この場
合、終了していないので、処理項目番号iをインクリメ
ントし(ステップS17)、ステップS13の処理を繰
り返す。The CPU 23 determines whether or not the similarity calculation has been completed for all items (step S15). In this case, since the processing has not been completed, the processing item number i is incremented (step S17), and the processing of step S13 is repeated.
【0037】このようにして全項目について自然文との
類似度演算が終了すると、CPU23は、各項目を類似
度順に並び替え、メモリ27の並べ替えデータ記憶部2
7bに記憶する(ステップS18)。並び替え結果を図
6に示す。CPU23は、並び替え後の検索結果に基づ
いて、所定の形式で、CRT30に表示する(ステップ
S19)。When the similarity calculation with the natural sentence is completed for all the items in this way, the CPU 23 sorts the items in order of the similarity, and sorts the items in the sorted data storage unit 2 of the memory 27.
7b (step S18). FIG. 6 shows the sorting result. The CPU 23 displays the information on the CRT 30 in a predetermined format based on the search result after the sorting (step S19).
【0038】このように、一旦検索エンジンにキーワー
ドで検索させ、検索結果と与えられた自然文との類似度
に応じて各ドキュメントの順位を並び替えることによ
り、サーバ側の負担を増やすことなく、操作者の意図に
沿ったサイトを操作者に与えることができる。これによ
り従来のキーワード検索サーバを利用して、自然文によ
る検索が可能となる。As described above, the search engine is once made to perform a search using a keyword, and the order of each document is rearranged according to the similarity between the search result and the given natural sentence. A site according to the operator's intention can be provided to the operator. As a result, a search using natural sentences can be performed using the conventional keyword search server.
【0039】操作者はかかる検索結果を見て、所望のド
キュメントが記憶されていると予想される項目をマウス
でクリックすると、従来と同様に、当該項目のURLが
特定されて、該当サイトに対してドキュメント転送要求
がなされる。When the operator looks at the search result and clicks on the item expected to store the desired document with the mouse, the URL of the item is specified and the corresponding site is specified in the same manner as in the prior art. A document transfer request is made.
【0040】以上説明したように、本発明においては、
キーワード検索サーバによる検索結果を別途ランク(順
序)付けすることができる。As described above, in the present invention,
Search results by the keyword search server can be separately ranked (ordered).
【0041】このようにして、あるタームが単純にメタ
データ中に存在するか否かでヒット率を演算するという
キーワード検索サーバと比べて、各メタデータの意味解
析をしているかのようにして、検索結果を並び替えるこ
とができる。これにより、検索意図に合致したドキュメ
ントを簡易且つ迅速に探し出すことができる。In this way, as compared with a keyword search server that simply calculates a hit rate based on whether or not a certain term exists in metadata, it is as if the semantic analysis of each metadata is being performed. , The search results can be sorted. This makes it possible to easily and quickly search for a document that matches the search intention.
【0042】このように、入力した自然文と検索エンジ
ンから返されるメタデータとの類似度を比較すること
で、検索結果を絞り込み、よりユーザの意図した結果に
近いものを上位を列挙できる。As described above, by comparing the similarity between the input natural sentence and the metadata returned from the search engine, it is possible to narrow down the search results and list the top ones closer to the results intended by the user.
【0043】特に、前記キーワード検索サーバは、単純
にあるキーワードが存在するか否かという判断で、その
ヒット率を求め、得られたヒット率順に各URLとその
メタデータを返すことが多い。したがって、検索結果と
しては、前記キーワードが全て存在するドキュメントの
方が、一部のキーワードが欠落しているドキュメントよ
りも上位に列挙されることとなる。これに対して、最終
的に前記自然文とメタデータを比較することにより、検
索意図に合致しないデータの表示順位を低くすることが
可能となる。In particular, the keyword search server often determines the hit ratio simply by determining whether or not a certain keyword exists, and returns each URL and its metadata in the order of the obtained hit ratio. Therefore, as a search result, a document in which all of the keywords exist is listed higher than a document in which some of the keywords are missing. On the other hand, by finally comparing the natural sentence with the metadata, it becomes possible to lower the display order of data that does not match the search intention.
【0044】本発明にかかる自然文検索可能装置におい
ては、検索対象をあらわす自然文からキーワードを抽出
し、キーワード検索サーバに与え、その結果得られたサ
イトのメタデータと前記自然文とを照合して、ヒット率
の高いものから列挙している。したがって、ユーザがい
ちいちメタデータを分析する必要がない。特に、検索サ
イトの情報は年々膨張する傾向にあるので、かかる情報
から、簡易に検索ノイズを除去することができる。In the natural sentence searchable device according to the present invention, a keyword is extracted from a natural sentence representing a search target, provided to a keyword search server, and the resulting site metadata is collated with the natural sentence. And those with the highest hit rates. Therefore, there is no need for the user to analyze the metadata each time. In particular, since search site information tends to expand year by year, search noise can be easily removed from such information.
【0045】また、メタデータを用いて類似度判定を行
っているので迅速な並び替えが可能となる。Further, since the similarity determination is performed using the metadata, quick rearrangement is possible.
【0046】4.第2実施形態 前記第1実施形態においては、キーワード検索サーバの
検索結果に含まれるメタデータを用いた例について説明
したが、メタデータではなく、当該URLで特定される
ドキュメントデータそのものを用いるようにしてもよ
い。この場合の、フローチャートを図7に示す。4. Second Embodiment In the first embodiment, an example using metadata included in a search result of a keyword search server has been described. However, instead of metadata, document data itself specified by the URL is used. You may. FIG. 7 shows a flowchart in this case.
【0047】図7において、ステップS9までの処理は
第1実施形態と同様である。サーバ側から検索結果を受
け取ると、メモリ27にURLを記憶する(ステップS
33)。CPU23は、全URLについてドキュメント
をダウンロードする命令をそのドキュメントを記憶する
コンピュータに与えて、全URLで特定されるドキュメ
ントをダウンロードし、ダウンロードデータ記憶部27
aに記憶する(ステップS35)。In FIG. 7, the processing up to step S9 is the same as in the first embodiment. When a search result is received from the server, the URL is stored in the memory 27 (step S).
33). The CPU 23 gives an instruction to download the document for all the URLs to the computer that stores the document, downloads the document specified by the entire URL, and downloads the document specified by the URL.
a (step S35).
【0048】なお、ダウンロードしたドキュメントデー
タについては、第1実施形態と同様に、関連語拡張処理
を行った後、かかる関連語を考慮して、各ドキュメント
を多次元ベクトルで表す。操作者から与えられた自然文
についても同様である。As in the first embodiment, the downloaded document data is subjected to related word expansion processing, and each document is represented by a multidimensional vector in consideration of such related words. The same applies to a natural sentence given by the operator.
【0049】CPU23は処理ドキュメント番号jを初
期化し(ステップS11)、j番目のドキュメントにつ
いて、ステップS2にて記憶した自然文との類似度を演
算し、これを記憶する(ステップS43)。類似度演算
については省略する。The CPU 23 initializes the processing document number j (step S11), calculates the similarity between the j-th document and the natural sentence stored in step S2, and stores it (step S43). The similarity calculation is omitted.
【0050】CPU23は、全項目について類似度演算
が終了したか否か判断する(ステップS45)。この場
合、終了していないので、処理項目番号jをインクリメ
ントし(ステップS17)、ステップS43の処理を繰
り返す。The CPU 23 determines whether or not the similarity calculation has been completed for all items (step S45). In this case, since the processing has not been completed, the processing item number j is incremented (step S17), and the processing of step S43 is repeated.
【0051】このようにして全項目について自然文との
類似度演算が終了すると、CPU23は、各ドキュメン
トについて、類似度順に並び替え、並び替えデータ記憶
部27bに記憶する(ステップS48)。CPU23
は、並び替え後の検索結果をCRT30に表示する(ス
テップS49)。操作者から指定が与えられると、CP
U23は、ダウンロードデータ記憶部27aに記憶した
ドキュメントを読み出して、CRT30に表示させる。When the similarity calculation with the natural sentence is completed for all items in this way, the CPU 23 sorts the documents in order of similarity and stores them in the sorted data storage unit 27b (step S48). CPU23
Displays the sorted search results on the CRT 30 (step S49). When the operator gives the designation, the CP
U23 reads the document stored in the download data storage unit 27a and displays it on the CRT 30.
【0052】このように、一旦検索エンジンにキーワー
ドで検索させ、検索結果と与えられた自然文との類似度
に応じて並び替えることにより、サーバ側の負担を増や
すことなく、操作者の意図に沿ったサイトを検索するこ
とができる。特に類似度判定のためのメタデータが得ら
れない場合に有用である。また、メタデータを用いて並
び替えるよりも精度の高い自然文検索が可能となる。As described above, the search engine is once made to perform a search using a keyword, and is rearranged according to the similarity between the search result and the given natural sentence. You can search the site along. This is particularly useful when metadata for similarity determination cannot be obtained. Also, natural sentence search with higher accuracy than sorting using metadata can be performed.
【0053】なお、ステップS49の表示の際に、並べ
替え後のデータはドキュメントデータの先頭から所定の
文字数を表示するようにしてもよいし、要約して表示す
るようにしてもよい。In the display in step S49, the rearranged data may be displayed with a predetermined number of characters from the beginning of the document data, or may be displayed in a summarized form.
【0054】5.他の実施形態 上記実施形態においては、インターネットに接続された
コンピュータを用いた場合について説明したが、ネット
ワーク接続されていれば同様に適用することができる。
この場合には、WWWにおけるURLではなく、各ドキ
ュメントのファイルID(ファイル名を含む)で特定す
ればよい。5. Other Embodiments In the above embodiment, a case was described in which a computer connected to the Internet was used. However, the present invention can be similarly applied as long as the computer is connected to a network.
In this case, it is sufficient to specify the file ID (including the file name) of each document instead of the URL in the WWW.
【0055】なお、自然文との類似度演算については、
上記実施形態の手法に限らず、他の自然文類似度演算手
法を用いてもよい。Incidentally, regarding the similarity calculation with the natural sentence,
Not limited to the method of the above embodiment, another natural sentence similarity calculation method may be used.
【0056】本実施形態においては、日本語の文書の場
合について説明したが、他の言語、例えば、英語、ドイ
ツ語、中国語、韓国語等についても同様に適用すること
ができる。In this embodiment, the case of a Japanese document has been described. However, the present invention can be similarly applied to other languages such as English, German, Chinese, and Korean.
【0057】なお、検索条件として自然文を用いてい
る。したがって、検索エンジンから与えられるメタデー
タと比較する際に、文脈等の意味を利用することもでき
る。Note that natural sentences are used as search conditions. Therefore, when comparing with the metadata provided from the search engine, the meaning such as context can be used.
【0058】本実施形態においては、ダウンロードデー
タ記憶部および並べ替えデータ記憶部をメモリ27に設
けたが、いずれかまたは双方をハードディスク26に記
憶するようにしてもよい。In this embodiment, the download data storage unit and the rearrangement data storage unit are provided in the memory 27, but either or both of them may be stored in the hard disk 26.
【0059】本実施形態においては、図1に示す機能を
実現する為に、CPU23を用い、ソフトウェアによっ
てこれを実現している。しかし、その一部もしくは全て
を、ロジック回路等のハードウェアによって実現しても
よい。In the present embodiment, in order to realize the functions shown in FIG. 1, the CPU 23 is used and the functions are realized by software. However, some or all of them may be realized by hardware such as a logic circuit.
【図面の簡単な説明】[Brief description of the drawings]
【図1】本発明にかかる自然文検索可能装置1の機能ブ
ロック図である。FIG. 1 is a functional block diagram of a natural sentence searchable device 1 according to the present invention.
【図2】図1に示す自然文検索可能装置1のネットワー
クの接続例の一例を示す。FIG. 2 shows an example of a network connection example of the natural sentence searchable device 1 shown in FIG.
【図3】自然文検索可能装置1をCPUで構成したハー
ドウェア構成を示す。FIG. 3 shows a hardware configuration in which the natural sentence searchable device 1 is configured by a CPU.
【図4】自然文検索処理のフローチャートである。FIG. 4 is a flowchart of a natural sentence search process.
【図5】キーワード検索サーバによる検索結果の一例を
示す。FIG. 5 shows an example of a search result by the keyword search server.
【図6】並べ替え後の検索結果を示す。FIG. 6 shows search results after sorting.
【図7】他の実施形態のフローチャートである。FIG. 7 is a flowchart of another embodiment.
23・・・CPU 27・・・メモリ 23: CPU 27: Memory
Claims (5)
トについてのメタデータを記憶しておき、検索キーワー
ドが与えられると前記メタデータ中にその検索キーワー
ドを含むドキュメントのURLを合致度順に特定するイ
ンターネットに接続された検索サーバに、インターネッ
トを介して接続されるコンピュータを自然文検索可能装
置として実現するプログラムを記憶した記憶媒体であっ
て、 自然文で構成された自然文検索条件が与えられると、与
えられた自然文検索条件から検索キーワードを抽出して
前記検索サーバに与え、前記検索サーバ装置から検索結
果としてドキュメントのメタデータが合致度とともに与
えられると、このメタデータと前記自然文検索条件との
類似度を演算し、この類似度に基づいて前記ドキュメン
トの合致度を変更する、 処理を前記コンピュータに実行させるためのプログラム
を記憶した記憶媒体。1. An Internet for storing metadata of a plurality of documents specified by URLs in advance, and specifying a URL of a document including the search keyword in the metadata in the order of matching degree when a search keyword is given. Is a storage medium storing a program that realizes a computer connected via the Internet as a natural sentence searchable device, and a natural sentence search condition composed of natural sentences is given to a search server connected to When a search keyword is extracted from the given natural sentence search condition and provided to the search server, and the search server device provides the metadata of the document as a search result along with the matching degree, the metadata and the natural sentence search condition Is calculated, and the degree of matching of the document is determined based on the similarity. A storage medium storing a program for causing the computer to execute a process to be changed.
トについてのメタデータを記憶しておき、検索キーワー
ドが与えられると前記メタデータ中にその検索キーワー
ドを含むドキュメントのURLを合致度順に特定するイ
ンターネットに接続された検索サーバに、インターネッ
トを介して接続されるコンピュータを自然文検索可能装
置として実現するプログラムを記憶した記憶媒体であっ
て、 自然文で構成された自然文検索条件が与えられると、与
えられた自然文検索条件から検索キーワードを抽出して
前記検索サーバに与え、前記検索サーバ装置から前記検
索キーワードに合致したドキュメントのURLが与えら
れると、そのURLで特定されるドキュメントと前記自
然文検索条件との類似度を演算し、この類似度に基づい
てドキュメントの合致度を変更する、 処理を前記コンピュータに実行させるためのプログラム
を記憶した記憶媒体。2. An Internet for storing metadata of a plurality of documents specified by URLs in advance, and specifying a URL of a document including the search keyword in the metadata in the order of matching degree when a search keyword is given. Is a storage medium storing a program that realizes a computer connected via the Internet as a natural sentence searchable device, and a natural sentence search condition composed of natural sentences is given to a search server connected to A search keyword is extracted from the given natural sentence search condition and provided to the search server. When a URL of a document that matches the search keyword is provided from the search server device, the document specified by the URL and the natural sentence Calculate the similarity with the search condition, and based on this similarity, A storage medium storing a program for causing the computer to execute a process for changing the degree of matching of the program.
記検索キーワードを含むファイルを特定するキーワード
検索装置に接続されるコンピュータを、自然文検索可能
装置として実現するプログラムを記憶した記憶媒体であ
って、 自然文で構成された自然文検索条件が与えられると、こ
の自然文から検索キーワードを抽出して前記キーワード
検索装置に与え、 前記キーワード検索装置によって特定されたファイルに
ついて、そのファイルの内容を直接または間接的に表す
ファイル内容情報と前記自然文検索条件との類似度を演
算し、この類似度に基づいて前記特定されたファイルの
前記合致度を決定する、 処理を前記コンピュータに実行させるためのプログラム
を記憶した記憶媒体。3. A storage medium storing a program for realizing, as a natural sentence searchable device, a computer connected to a keyword search device for specifying a file including the search keyword based on a given search keyword. Given a natural sentence search condition composed of natural sentences, a search keyword is extracted from the natural sentence and provided to the keyword search device. For a file specified by the keyword search device, the contents of the file are directly Or calculating the degree of similarity between the file content information indirectly represented and the natural sentence search condition, and determining the degree of matching of the specified file based on the degree of similarity. A storage medium that stores a program.
記検索キーワードを含むファイルを特定するキーワード
検索装置に接続される自然文検索可能装置であって、 自然文で構成された自然文検索条件が与えられると、こ
の自然文を記憶する記憶手段、 前記自然文から検索キーワードを抽出して前記キーワー
ド検索装置に与えるキーワード出力手段、 前記キーワード検索装置から検索結果が与えられると、
特定されたファイルについて、そのファイルの内容を直
接または間接的に表すファイル内容情報と前記自然文と
の類似度を演算する演算手段、 この類似度に基づいて前記特定されたファイルの評価を
決定する評価手段、 を備えた自然文検索可能装置。4. A natural sentence searchable device connected to a keyword search device for specifying a file containing the search keyword based on a given search keyword, wherein a natural sentence search condition composed of natural sentences is When given, storage means for storing the natural sentence, keyword output means for extracting a search keyword from the natural sentence and providing it to the keyword search device, when a search result is provided from the keyword search device,
Calculating means for calculating the similarity between the specified sentence and the file contents information directly or indirectly representing the contents of the file and the natural sentence; determining the evaluation of the specified file based on the similarity; A natural sentence searchable device comprising: an evaluation unit.
検索キーワードを含むファイルを特定するキーワード検
索装置にコンピュータを接続し、 前記コンピュータは、 1)自然文で構成された自然文検索条件が与えられると、
この自然文から検索キーワードを抽出して前記キーワー
ド検索装置に与え、 2)前記キーワード検索装置から検索結果が与えられる
と、前記検索結果に基づいて特定されたファイルについ
て、そのファイルの内容を直接または間接的に表すファ
イル内容情報と前記自然文との類似度を演算し、 3)この類似度に基づいて前記特定されたファイルの評価
を決定すること、 を特徴とするコンピュータを用いた自然文検索方法。5. A computer is connected to a keyword search device for specifying a file containing the search keyword based on a given search keyword, wherein the computer is provided with a natural sentence search condition composed of natural sentences. When,
A search keyword is extracted from this natural sentence and provided to the keyword search device. 2) When a search result is provided from the keyword search device, the contents of the file specified based on the search result are directly or Calculating the similarity between the indirectly represented file content information and the natural sentence, and 3) determining the evaluation of the specified file based on the similarity, wherein a natural sentence search using a computer is performed. Method.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11224939A JP2001052014A (en) | 1999-08-09 | 1999-08-09 | Natural sentence searchable device and storage medium storing program for realizing the same |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11224939A JP2001052014A (en) | 1999-08-09 | 1999-08-09 | Natural sentence searchable device and storage medium storing program for realizing the same |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2001052014A true JP2001052014A (en) | 2001-02-23 |
Family
ID=16821567
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11224939A Pending JP2001052014A (en) | 1999-08-09 | 1999-08-09 | Natural sentence searchable device and storage medium storing program for realizing the same |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2001052014A (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007011973A (en) * | 2005-07-04 | 2007-01-18 | Sharp Corp | Information search apparatus and information search program |
| JP2012003603A (en) * | 2010-06-18 | 2012-01-05 | Hitachi Systems & Services Ltd | Information retrieval system |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1999005618A1 (en) * | 1997-07-22 | 1999-02-04 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
-
1999
- 1999-08-09 JP JP11224939A patent/JP2001052014A/en active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1999005618A1 (en) * | 1997-07-22 | 1999-02-04 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007011973A (en) * | 2005-07-04 | 2007-01-18 | Sharp Corp | Information search apparatus and information search program |
| JP2012003603A (en) * | 2010-06-18 | 2012-01-05 | Hitachi Systems & Services Ltd | Information retrieval system |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8452766B1 (en) | Detecting query-specific duplicate documents | |
| US10929487B1 (en) | Customization of search results for search queries received from third party sites | |
| US7111237B2 (en) | Blinking annotation callouts highlighting cross language search results | |
| US6604101B1 (en) | Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network | |
| US7130849B2 (en) | Similarity-based search method by relevance feedback | |
| US8086623B2 (en) | Context-sensitive term expansion with multiple levels of expansion | |
| CN100481077C (en) | Visual method and device for strengthening search result guide | |
| US20040006560A1 (en) | Method and system for translingual translation of query and search and retrieval of multilingual information on the web | |
| US20050060290A1 (en) | Automatic query routing and rank configuration for search queries in an information retrieval system | |
| US20020099685A1 (en) | Document retrieval system; method of document retrieval; and search server | |
| US20060059132A1 (en) | Searching hypertext based multilingual web information | |
| JP2010009577A (en) | Information processing apparatus, full text retrieval method, full text retrieval program, and recording medium | |
| US20060190446A1 (en) | Web search system and method thereof | |
| JP2002197104A (en) | Device and method for data retrieval processing, and recording medium recording data retrieval processing program | |
| US20040015485A1 (en) | Method and apparatus for improved internet searching | |
| US20020059346A1 (en) | Sort system for text retrieval | |
| US20050114317A1 (en) | Ordering of web search results | |
| Smith | Search features of digital libraries | |
| JPH10269233A (en) | Document database search result display method and apparatus | |
| JP2001265774A (en) | Information retrieval method and apparatus, recording medium recording information retrieval program, and hypertext information retrieval system | |
| JPH1145257A (en) | Web document search support apparatus and computer-readable recording medium storing a program for causing a computer to function as the apparatus | |
| JP2002222208A (en) | Document search system, document search method, and search server | |
| JP2001052014A (en) | Natural sentence searchable device and storage medium storing program for realizing the same | |
| JP2003208447A (en) | Document search device, document search method, document search program, and medium recording document search program | |
| JPH10289241A (en) | Image processing apparatus and control method thereof |