[go: up one dir, main page]

JP2003030231A - Document search service providing method and apparatus, document search service providing program, and storage medium storing document search service providing program - Google Patents

Document search service providing method and apparatus, document search service providing program, and storage medium storing document search service providing program

Info

Publication number
JP2003030231A
JP2003030231A JP2001210873A JP2001210873A JP2003030231A JP 2003030231 A JP2003030231 A JP 2003030231A JP 2001210873 A JP2001210873 A JP 2001210873A JP 2001210873 A JP2001210873 A JP 2001210873A JP 2003030231 A JP2003030231 A JP 2003030231A
Authority
JP
Japan
Prior art keywords
www
information
search
page
site information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001210873A
Other languages
Japanese (ja)
Inventor
Koichi Ushijima
浩一 牛島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001210873A priority Critical patent/JP2003030231A/en
Publication of JP2003030231A publication Critical patent/JP2003030231A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 特定の話題に興味を持つ人々が各人の推薦す
る最新のWWWページ情報を共有することを容易にする
と共に、特定の話題に特化したWWWページ検索サービ
スを構築する。 【解決手段】 本発明は、情報登録者端末から入力され
たWWWサイト情報及び登録者名をWWWサイト情報D
Bに記憶し、指定されたWWWサイトから該WWWサイ
トに含まれるWWWページ群を取得し、検索用DBに格
納し、検索時に、検索キーワードに関連するWWWペー
ジ群を検索用DBから検索し、WWWサイト毎にグルー
プ化し、グループ毎に、WWWサイト情報と、情報登録
者の名前を付加したページを作成し、検索利用者端末に
表示する。
(57) [Summary] [Problem] To make it easy for people who are interested in a specific topic to share the latest WWW page information recommended by each person, and to provide a WWW page search service specialized for a specific topic. To construct. According to the present invention, WWW site information and a registrant name input from an information registrant terminal are converted to WWW site information D.
B, obtains a group of WWW pages included in the specified WWW site from the designated WWW site, stores it in the search DB, and searches a group of WWW pages related to the search keyword from the search DB at the time of search. Grouping is performed for each WWW site, and a page is created for each group, to which WWW site information and the name of the information registrant are added, and displayed on the search user terminal.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、文書検索サービス
提供方法及び装置及び文書検索サービス提供プログラム
及び文書検索サービス提供プログラムを格納した記憶媒
体に係り、特に、ネットワーク上に存在する文書集合か
ら特定の条件に適合する文書を探し出す検索システムに
おいて、検索対象となる文書集合を収集するための文書
検索サービス提供方法及び装置及び文書検索サービス提
供プログラム及び文書検索サービス提供プログラムを格
納した記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document search service providing method and apparatus, a document search service providing program, and a storage medium storing the document search service providing program. The present invention relates to a document search service providing method and apparatus for collecting a set of documents to be searched, a document search service providing program, and a storage medium storing the document search service providing program in a search system that searches for documents that match a condition.

【0002】[0002]

【従来の技術】従来、特定の話題に興味を持つ人々の間
で、どこのWWWサイトにどのような情報があるかとい
う情報を共有するために、リンク集と呼ばれるページを
作成する方法が採られている。リンク集は図10のよう
なものであり、WWWのハイパーリンク機能を用いて、
関連するWWWサイトへのリンクを配置し、リンク先の
タイトルやロゴ、簡単な紹介文などを付加したものであ
る。利用者はこの紹介文を見て、どのサイトに所望の情
報があるかを判断することができる。
2. Description of the Related Art Conventionally, a method of creating a page called a link collection has been adopted in order to share information about which WWW site has what information among people who are interested in a particular topic. Has been. The link collection is as shown in Fig. 10. Using the hyperlink function of WWW,
Links to related WWW sites are placed, and the titles, logos, and brief introductions of the links are added. The user can judge which site has desired information by looking at this introduction.

【0003】しかし、従来のリンク集を用いる方法で
は、関連サイトが多くなるにつれてリンク集から所望の
サイトを探すことが困難となっている。そこで考えられ
たのが、“Yahoo”に代表されるディレクトリ型検
索サービスである。これは、人手により、WWWサイト
のカテゴリ分けや説明文の入力を行なっており、これを
元にWWWサイトの検索を行なうシステムである。ディ
レクトリ型検索サービスはいわば、すべての話題を扱う
大規模なリンク集に検索機能を付加したものであると言
える。
However, in the conventional method using the link collection, it becomes difficult to find a desired site from the link collection as the number of related sites increases. Then, a directory-type search service represented by "Yahoo" was considered. This is a system for manually categorizing WWW sites and inputting explanations, and searching for WWW sites based on this. It can be said that a directory-type search service is, in a sense, a large collection of links that deal with all topics, with a search function added.

【0004】一方、増加し続けるWWWページを探し出
すためのサービスとして、ロボット型検索と呼ばれる検
索サービスも広く利用されている。ロボット型検索サー
ビスは、WWWページのリンクを辿りながら自動的にW
WWページを収集する「情報収集ロボット」あるいは
「クローラー」と呼ばれるプログラムを使用している。
これらは、機械的に情報の収集が行なわれるため、リン
ク集やディレクトリ型検索サービスのようにカテゴリや
紹介文を提供することはできないが、新しく現れたWW
Wページを自動的に発見することが可能であることや、
WWWページそのものを検索対象としているためにディ
レクトリ型検索サービスでは発見できないようなWWW
ページも見つけ出すことができる。また、情報収集ロボ
ットにより絶えず情報が更新されているため、最新の情
報に基づいた検索を行なうことができる。
On the other hand, as a service for searching for an ever-increasing number of WWW pages, a search service called robot type search is also widely used. The robot-type search service automatically follows the WWW page links
It uses a program called "information gathering robot" or "crawler" that collects WW pages.
Since they collect information mechanically, they cannot provide categories or introductory sentences like link collections and directory-type search services, but they are new to WW.
W pages can be automatically discovered,
WWW that cannot be found by the directory-type search service because the WWW page itself is the search target
You can also find the page. Also, since the information collecting robot constantly updates the information, it is possible to perform a search based on the latest information.

【0005】ロボット型検索サービスのこのような利点
を生かしながら、特定の話題のみに特化した検索サービ
スを提供することも行なわれている。これは、ロボット
が巡回するWWWサイトを、特定の話題に関連したWW
Wサイトのみに限定することによって実現されている。
While making use of such advantages of the robot type search service, it is also provided to provide a search service specialized only for a specific topic. This is a WWW site where robots travel around, and a WW related to a specific topic.
It is realized by limiting to W site only.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上記従
来のリンク集やディレクトリ検索サービスでは、更新を
手作業に負っているため、情報が古くなりやすく、リン
ク先が既に存在しなくなっている、いわゆるリンク切れ
や、新しいWWWサイトの情報が存在しない、という状
態が発生し易い。特に、ディレクトリサービスでは、デ
ータ登録時の情報を検索対象としているため、最近のキ
ーワードでは検索できないことも多い。
However, in the above-described conventional link collections and directory search services, since updating is manually performed, information is apt to become old, and so-called link destinations no longer exist. It is easy for a situation such as a disconnection or the absence of new WWW site information. In particular, since the directory service targets the information at the time of data registration as a search target, it is often impossible to search by the recent keywords.

【0007】また、ロボット型検索サービスでは、情報
の更新は、頻繁に行なわれるものの、特定の話題に検索
対象を制限することができず、検索結果に利用者にとっ
て必要のないWWWページが大量に含まれることにな
る。また、紹介文やカテゴリなどの付加情報がないた
め、利用者が検索結果の中からどのリンクを選べば良い
かを判断することが難しくなっている。
Further, in the robot type search service, although information is updated frequently, the search target cannot be limited to a specific topic, and a large number of WWW pages that are not needed by the user are included in the search results. Will be included. Moreover, since there is no additional information such as an introduction sentence and a category, it is difficult for the user to determine which link should be selected from the search results.

【0008】また、ロボットが巡回するWWWサイトを
制限して話題を特定する方法では、ロボット型検索サー
ビスの特徴である新しいWWWサイトを発見する機能が
生きず、やはり情報が古くなるという問題が発生する。
[0008] Further, in the method of limiting the WWW sites that the robot crawls to identify a topic, the function of discovering a new WWW site, which is a feature of the robot type search service, does not work, and information also becomes old. To do.

【0009】本発明は、上記の点に鑑みなされたもの
で、特定の話題に興味を持つ人々が各人の推薦する最新
のWWWページ情報を共有することを容易にすると共
に、特定の話題に特化したWWWページ検索サービスを
構築するための文書検索サービス提供方法及び装置及び
文書検索サービス提供プログラム及び文書検索サービス
提供プログラムを格納した記憶媒体を提供することを目
的とする。
The present invention has been made in view of the above points, and makes it easy for people who are interested in a particular topic to share the latest WWW page information recommended by each person, and An object of the present invention is to provide a document search service providing method and apparatus for constructing a specialized WWW page search service, a document search service providing program, and a storage medium storing the document search service providing program.

【0010】[0010]

【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。
FIG. 1 is a diagram for explaining the principle of the present invention.

【0011】本発明(請求項1)は、コンピュータネッ
トワーク上に存在するWWWページの集合から所望の文
書を発見するための文書検索サービス提供方法におい
て、情報登録者の情報登録者端末からのアクセスに対し
て、情報登録者の認証を行い(ステップ1)、情報登録
者端末に対して、検索対象となるWWWサイトの名前、
URL、紹介文を含むWWWサイト情報の入力を促し
(ステップ2)、情報登録者端末から入力されたWWW
サイト情報及び登録者名をWWWサイト情報データベー
スに記憶し(ステップ3)、指定されたWWWサイトか
ら該WWWサイトに含まれるWWWページ群を取得し、
検索用データベースに格納し(ステップ4)、検索利用
者の検索利用者端末に対して、検索キーワードの入力を
促し(ステップ5)、検索利用者端末から入力された検
索キーワードに関連するWWWページ群を検索用データ
ベースから検索し(ステップ6)、検索されたWWWペ
ージ群をWWWサイト毎にグループ化し(ステップ
7)、グループ毎に、WWWサイトの名前、紹介文を含
むWWWサイト情報と、情報登録者の名前を付加したペ
ージを作成し(ステップ8)、作成されたページを検索
結果として検索利用者端末に表示する(ステップ9)。
The present invention (Claim 1) provides a method for providing a document search service for finding a desired document from a set of WWW pages existing on a computer network, wherein the information registrant accesses from an information registrant terminal. On the other hand, the information registrant is authenticated (step 1), and the name of the WWW site to be searched is displayed on the information registrant terminal.
WWW input from the information registrant terminal prompting for input of WWW site information including URL and introduction text (step 2)
The site information and the registrant name are stored in the WWW site information database (step 3), the WWW page group included in the WWW site is acquired from the designated WWW site,
Stored in the search database (step 4), prompting the search user's search user terminal to enter the search keyword (step 5), and grouping WWW pages related to the search keyword input from the search user terminal. Is searched from the search database (step 6), the searched WWW page group is grouped by WWW site (step 7), and WWW site information including the name of WWW site and introductory text is registered for each group. A page to which the name of the person is added is created (step 8), and the created page is displayed as a search result on the search user terminal (step 9).

【0012】本発明(請求項2)は、コンピュータネッ
トワーク上に存在するWWWページの集合から所望の文
書を発見するための文書検索サービス提供方法におい
て、情報登録者の情報登録者端末からのアクセスに対し
て、情報登録者の認証を行い、情報登録者端末に対し
て、検索対象となるWWWサイトの名前、URL、紹介
文を含むWWWサイト情報の入力を促し、情報登録者端
末から入力されたWWWサイト情報及び登録者名をWW
Wサイト情報データベースに記憶し、指定されたWWW
サイトから該WWWサイトに含まれるWWWページ群を
取得し、検索用データベースに格納する。
The present invention (Claim 2) provides a method for providing a document search service for finding a desired document from a set of WWW pages existing on a computer network, wherein access is made from an information registrant terminal of an information registrant. On the other hand, the information registrant is authenticated, the information registrant terminal is prompted to enter the WWW site information including the name, URL, and introductory text of the WWW site to be searched. WWW site information and registrant name WW
Stored in the W site information database and designated WWW
A WWW page group included in the WWW site is acquired from the site and stored in the search database.

【0013】本発明(請求項3)は、コンピュータネッ
トワーク上に存在するWWWページの集合から所望の文
書を発見するための文書検索サービス提供方法におい
て、検索利用者の検索利用者端末に対して、検索キーワ
ードの入力を促し、検索利用者端末から入力された検索
キーワードに関連するWWWページ群を検索用データベ
ースから検索し、検索されたWWWページ群をWWWサ
イト毎にグループ化し、グループ毎に、WWWサイトの
名前、紹介文を含むWWWサイト情報と、情報登録者の
名前を付加したページを作成し、作成されたページを検
索結果として検索利用者端末に表示する。
According to the present invention (claim 3), in a document search service providing method for finding a desired document from a set of WWW pages existing on a computer network, a search user terminal of a search user is provided with: It prompts the user to enter a search keyword, searches the search database for WWW page groups related to the search keyword input from the search user terminal, groups the searched WWW page groups for each WWW site, and for each group, WWW WWW site information including the site name and introductory text and a page to which the name of the information registrant is added are created, and the created page is displayed as a search result on the search user terminal.

【0014】本発明(請求項4)は、所定の条件を満た
している場合に、WWWサイト情報データベースに保存
されているWWWサイト情報を読み出し、WWWサイト
情報に含まれているURLからWWWページ群を取得
し、取得したWWWページを元に、検索用データベース
を更新する。
According to the present invention (claim 4), when a predetermined condition is satisfied, WWW site information stored in the WWW site information database is read, and the WWW page group is read from the URL included in the WWW site information. Is acquired, and the search database is updated based on the acquired WWW page.

【0015】図2は、本発明の原理構成図である。FIG. 2 is a block diagram showing the principle of the present invention.

【0016】本発明(請求項5)は、コンピュータネッ
トワーク上に存在するWWWページの集合から所望の文
書を発見するための文書検索サービス提供装置であっ
て、情報登録者の認証を行なう会員認証手段11と、会
員認証手段11により認証された情報登録者からUR
L、タイトル、紹介文を含むWWWサイト情報を受け付
けるWWWサイト情報入力手段12と、WWWサイト情
報入力手段12からのWWWサイト情報及び情報登録者
名を保持するWWWサイト情報保持手段15と、WWW
サイト情報保持手段15に保持されたWWWサイト情報
に基づいて、WWWページ情報を収集するWWWページ
収集手段14と、WWWページ収集手段14によって収
集されたWWWページの情報を検索可能な形で保持する
WWWページ索引保持手段16と、検索利用者の検索利
用者端末40からのアクセスに対して検索キーワードの
入力を促し、該検索利用者端末40から入力された検索
キーワードに関連するWWWページ群を検索し、WWW
サイト毎にグループ化し、WWWサイト情報及び情報登
録者名を付加した検索結果を該検索利用者端末40に表
示する検索手段17とを有する。
The present invention (Claim 5) is a document retrieval service providing apparatus for finding a desired document from a set of WWW pages existing on a computer network, and a member authentication means for authenticating an information registrant. 11 and UR from the information registrant authenticated by the member authentication means 11.
WWW site information input means 12 for receiving WWW site information including L, title, and introduction text, WWW site information holding means 15 for holding WWW site information and information registrant name from WWW site information input means 12, and WWW
Based on the WWW site information stored in the site information storage unit 15, a WWW page collection unit 14 that collects WWW page information, and WWW page information collected by the WWW page collection unit 14 is stored in a searchable form. The WWW page index holding unit 16 and the search user's access to the search user terminal 40 are prompted to enter the search keyword, and the WWW page group related to the search keyword input from the search user terminal 40 is searched. And WWW
A search unit 17 is provided for grouping the sites and displaying the search results with the WWW site information and the information registrant name added on the search user terminal 40.

【0017】本発明(請求項6)は、コンピュータネッ
トワーク上に存在するWWWページの集合から所望の文
書を発見するための文書検索サービス提供装置であっ
て、情報登録者の認証を行なう会員認証手段と、会員認
証手段により認証された情報登録者からURL、タイト
ル、紹介文を含むWWWサイト情報を受け付けるWWW
サイト情報入力手段と、WWWサイト情報入力手段から
のWWWサイト情報及び情報登録者名を保持するWWW
サイト情報保持手段と、WWWサイト情報保持手段に保
持されたWWWサイト情報に基づいて、WWWページ情
報を収集するWWWページ収集手段と、WWWページ収
集手段によって収集されたWWWページの情報を検索可
能な形で保持するWWWページ索引保持手段とを有す
る。
The present invention (Claim 6) is a document retrieval service providing apparatus for discovering a desired document from a set of WWW pages existing on a computer network, and a member authenticating means for authenticating an information registrant. And WWW that accepts WWW site information including URL, title, and introductory text from the information registrant authenticated by the member authentication means.
Site information input means, WWW holding WWW site information and information registrant name from WWW site information input means
Site information holding means, WWW page collection means for collecting WWW page information based on the WWW site information held in the WWW site information holding means, and WWW page information collected by the WWW page collection means can be searched And WWW page index holding means for holding in a form.

【0018】本発明(請求項7)は、コンピュータネッ
トワーク上に存在するWWWページの集合から所望の文
書を発見するための文書検索サービス提供装置であっ
て、検索利用者の検索利用者端末からのアクセスに対し
て検索キーワードの入力を促し、該検索利用者端末から
入力された検索キーワードに関連するWWWページ群を
検索し、WWWサイト毎にグループ化し、WWWサイト
情報及び情報登録者名を付加した検索結果を該検索利用
者端末に表示する検索手段とを有する。
The present invention (Claim 7) is a document search service providing apparatus for finding a desired document from a set of WWW pages existing on a computer network, which is provided from a search user terminal of a search user. Prompting the user to enter a search keyword for access, searching for WWW page groups related to the search keyword input from the search user terminal, grouping by WWW site, and adding WWW site information and information registrant name. And a search means for displaying the search result on the search user terminal.

【0019】本発明(請求項8)は、時間を計測するタ
イマと、タイマが一定の時間を計数する度に、WWWペ
ージ収集手段において収集されたWWWページで、WW
Wページ索引保持手段に保持されているWWWページ情
報を更新する更新手段とを更に有する。
According to the present invention (claim 8), a timer for measuring time, and a WWW page collected by the WWW page collection means each time the timer counts a certain time, the WW is collected.
It further comprises update means for updating the WWW page information held in the W page index holding means.

【0020】本発明(請求項9)は、コンピュータネッ
トワーク上に存在するWWWページの集合から所望の文
書を発見するための文書検索サービス提供プログラムで
あって、情報登録者の認証を行なう会員認証プロセス
と、会員認証プロセスにより認証された情報登録者から
URL、タイトル、紹介文を含むWWWサイト情報を受
け付けるWWWサイト情報入力プロセスと、WWWサイ
ト情報入力プロセスからのWWWサイト情報及び情報登
録者名を保持するWWWサイト情報データベースに保持
されたWWWサイト情報に基づいて、WWWページ情報
を収集するWWWページ収集プロセスと、WWWページ
収集プロセスによって収集されたWWWページの情報を
検索可能な形で保持するWWWページ索引データベース
に格納するWWWページ索引格納プロセスとを有する。
The present invention (claim 9) is a document retrieval service providing program for discovering a desired document from a set of WWW pages existing on a computer network, which is a member authentication process for authenticating an information registrant. And WWW site information input process that receives WWW site information including URL, title, and introduction from the information registrant authenticated by the member authentication process, and WWW site information and information registrant name from the WWW site information input process A WWW page collection process that collects WWW page information based on the WWW site information stored in the WWW site information database, and a WWW page that retains the WWW page information collected by the WWW page collection process in a searchable form WWW page stored in the index database And a di-index storage process.

【0021】本発明(請求項10)は、コンピュータネ
ットワーク上に存在するWWWページの集合から所望の
文書を発見するための文書検索サービス提供プログラム
であって、検索利用者の検索利用者端末からのアクセス
に対して検索キーワードの入力を促し、該検索利用者端
末から入力された検索キーワードに関連するWWWペー
ジ群を検索し、WWWサイト毎にグループ化し、WWW
サイト情報及び情報登録者名を付加した検索結果を該検
索利用者端末に表示する検索プロセスとを有する。本発
明(請求項11)は、時間を計測するタイマが一定の時
間を計数する度に、WWWページ収集プロセスにおいて
収集されたWWWページで、WWWページ索引データベ
ースに保持されているWWWページ情報を更新する更新
プロセスとを更に有する。
The present invention (claim 10) is a program for providing a document search service for finding a desired document from a set of WWW pages existing on a computer network, the program being provided from a search user terminal of a search user. Prompt the user to enter a search keyword for access, search for WWW page groups related to the search keyword input from the search user terminal, group by WWW site, WWW
And a search process for displaying the search result added with the site information and the information registrant name on the search user terminal. The present invention (Claim 11) updates the WWW page information held in the WWW page index database with the WWW page collected in the WWW page collection process every time the timer for counting time counts a certain time. And an update process to perform.

【0022】本発明(請求項12)は、コンピュータネ
ットワーク上に存在するWWWページの集合から所望の
文書を発見するための文書検索サービス提供プログラム
を格納した記憶媒体であって、情報登録者の認証を行な
う会員認証プロセスと、会員認証プロセスにより認証さ
れた情報登録者からURL、タイトル、紹介文を含むW
WWサイト情報を受け付けるWWWサイト情報入力プロ
セスと、WWWサイト情報入力プロセスからのWWWサ
イト情報及び情報登録者名を保持するWWWサイト情報
データベースに保持されたWWWサイト情報に基づい
て、WWWページ情報を収集するWWWページ収集プロ
セスと、WWWページ収集プロセスによって収集された
WWWページの情報を検索可能な形で保持するWWWペ
ージ索引データベースに格納するWWWページ索引格納
プロセスとを有する。
The present invention (Claim 12) is a storage medium storing a document search service providing program for finding a desired document from a set of WWW pages existing on a computer network, the authentication of an information registrant. W including the URL, title, and introductory text from the information registrant authenticated by the member authentication process
Collect WWW page information based on the WWW site information input process that accepts WW site information, and the WWW site information stored in the WWW site information database that holds the WWW site information and the information registrant name from the WWW site information input process And a WWW page index storing process for storing the information of the WWW pages collected by the WWW page collecting process in a WWW page index database that holds the WWW page information in a searchable manner.

【0023】本発明(請求項13)は、コンピュータネ
ットワーク上に存在するWWWページの集合から所望の
文書を発見するための文書検索サービス提供プログラム
を格納した記憶媒体であって、検索利用者の検索利用者
端末からのアクセスに対して検索キーワードの入力を促
し、該検索利用者端末から入力された検索キーワードに
関連するWWWページ群を検索し、WWWサイト毎にグ
ループ化し、WWWサイト情報及び情報登録者名を付加
した検索結果を該検索利用者端末に表示する検索プロセ
スとを有する。本発明(請求項14)は、時間を計測す
るタイマが一定の時間を計数する度に、WWWページ収
集プロセスにおいて収集されたWWWページで、WWW
ページ索引データベースに保持されているWWWページ
情報を更新する更新プロセスとを更に有する。
The present invention (Claim 13) is a storage medium storing a document search service providing program for finding a desired document from a set of WWW pages existing on a computer network. Prompt the user to enter a search keyword for access from the user terminal, search for WWW page groups related to the search keyword input from the search user terminal, group by WWW site, and register WWW site information and information. And a search process for displaying the search result with the person name added on the search user terminal. According to the present invention (claim 14), the WWW page collected in the WWW page collection process is used every time the timer for counting time counts a certain time.
And an update process for updating the WWW page information held in the page index database.

【0024】上記のように、本発明では、インターネッ
ト上のホームページ等の情報の在処を提供する検索サー
ビス(例えば、サーチエンジン、Yahooのようなデ
ィレクトリ)において、登録型とロボット検索型の両方
の長所を併せ持つシステムを構築することで、情報登録
者は、WWWサイトの情報をネットワーク上から自由に
登録することができる。これにより、検索サービスの対
象が固定されず、情報登録者の働きかけによって検索対
象を拡張することを可能とする。
As described above, according to the present invention, in a search service (for example, a search engine, a directory such as Yahoo) that provides the location of information such as a home page on the Internet, the advantages of both the registration type and the robot search type are provided. By constructing a system having both, the information registrant can freely register the information of the WWW site from the network. As a result, the target of the search service is not fixed, and the search target can be expanded by the action of the information registrant.

【0025】ここで、情報登録者は、検索利用者であっ
てもよい。この場合、検索サービスを利用する利用者コ
ミュニティ内の興味の変化に応じて検索対象を変化させ
ることができるようになり、検索サービスの利用価値を
向上させることができる。
Here, the information registrant may be a search user. In this case, the search target can be changed according to the change of interest in the user community that uses the search service, and the utility value of the search service can be improved.

【0026】また、本発明では、実際にWWWサイトか
らWWWページ群を取得し、検索対象としているため、
実際にWWWページ中に現れるキーワードで検索できる
ようになる。また、実際には存在しないURLが入力さ
れたとしてもこの段階でWWWページが取得できないた
め、リンク切れを未然に防ぐことができる。
Further, in the present invention, since the WWW page group is actually acquired from the WWW site and is set as the search target,
You will be able to search by the keywords that actually appear in the WWW page. Further, even if a URL that does not actually exist is input, the WWW page cannot be acquired at this stage, so it is possible to prevent the link from being broken.

【0027】また、本発明による検索結果は、WWWサ
イト毎に纏められ、WWWサイトを登録した情報登録者
の名前と紹介文が提示される。検索利用者は、この紹介
文により適切なWWWサイトを選別することが可能とな
る。また、情報登録者の名前が提示されるため、コミュ
ニケーション内での信頼関係を利用した選別、例えば、
「ある分野の専門家であるAさんの紹介ならば有効だろ
う」、あるいは、「自分と趣味の似ているBさんの推薦
は重要だ」、という選別ができるようになる。また、本
発明では、情報登録者の名前を提示するため、コミュニ
ティの話題にそぐわないWWWサイトを登録することに
対する抑止効果が期待できる。
The search results according to the present invention are summarized for each WWW site, and the name and the introductory text of the information registrant who registered the WWW site are presented. A search user can select an appropriate WWW site by this introduction. Also, since the name of the information registrant is presented, selection using the trust relationship in communication, for example,
You will be able to select "It would be effective to introduce Mr. A, who is an expert in a certain field," or "It is important to recommend Mr. B who has a hobby similar to me." Further, in the present invention, since the name of the information registrant is presented, it is possible to expect a deterrent effect on registering a WWW site that does not fit the topic of the community.

【0028】これらの機能より、コミュニティの活性化
が図られ、特定の話題に向けた検索サービスの情報を最
新に維持できるようになる。
With these functions, the community is activated and the information of the search service for a specific topic can be kept up to date.

【0029】また、本発明では、所定の条件を満たした
場合に、保存されているWWWサイト情報を読み出し、
WWWサイト情報に含まれているURLからWWWペー
ジ群を取得し、取得したWWWページを元に検索用デー
タベースを更新することが可能であり、例えば、1日1
回のように、定期的にWWWサイトから最新のWWWペ
ージ情報を取得し、検索用データベースを更新する。こ
れにより、検索対象の情報を最新に保ち、かつリンク切
れを防ぐことが可能となる。
Further, in the present invention, when the predetermined condition is satisfied, the stored WWW site information is read,
It is possible to acquire the WWW page group from the URL included in the WWW site information and update the search database based on the acquired WWW page.
Like the times, the latest WWW page information is periodically acquired from the WWW site and the search database is updated. This makes it possible to keep the information to be searched up to date and prevent broken links.

【0030】[0030]

【発明の実施の形態】以下、図面と共に本発明の実施の
形態について説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings.

【0031】図3は、本発明の一実施の形態における文
書検索サービス提供装置の構成を示す。
FIG. 3 shows the configuration of a document search service providing apparatus according to an embodiment of the present invention.

【0032】同図示す装置10は、情報登録者端末2
0、WWWサーバ30、検索利用者端末40に接続され
ている。
The device 10 shown in FIG.
0, WWW server 30, and search user terminal 40.

【0033】情報登録者端末20及び情報利用者端末4
0には、WWWブラウザがインストールされている。例
えば、マイクロソフト社の「インターネットエクスプロ
ーラ」等などで本装置10にアクセスすることができ
る。
Information registrant terminal 20 and information user terminal 4
0 has a WWW browser installed. For example, the device 10 can be accessed by "Internet Explorer" of Microsoft Corporation.

【0034】装置10は、サーバコンピュータ上に構成
されており、情報登録者端末20、情報利用者端末40
からの要求を受け付けるためにHTTPサーバを利用す
ることができる。例えば、フリーソフトの“apach
e(アパッチ)”等を利用してもよい。
The device 10 is constructed on a server computer, and has an information registrant terminal 20 and an information user terminal 40.
An HTTP server can be used to accept requests from. For example, the free software "apach"
e (Apache) ”or the like may be used.

【0035】装置10は、会員認証部11、WWWサイ
ト情報入力部12、タイマ13、WWWページ収集部1
4、WWWサイト情報保持部15、WWWぺージ索引保
持部16、検索部17より構成される。
The device 10 includes a member authentication unit 11, a WWW site information input unit 12, a timer 13, and a WWW page collection unit 1.
4, WWW site information holding unit 15, WWW page index holding unit 16, and search unit 17.

【0036】このうち、WWWサイト情報入力部12、
検索部17は、HTTPサーバの機能拡張方法であるC
GIインタフェースを使って作成することができる。
Of these, the WWW site information input section 12,
The search unit 17 is C, which is an HTTP server function expansion method.
It can be created using the GI interface.

【0037】会員認証部11は、HTTPサーバの認証
機構をそのまま利用してもよい。他に認証サーバを用意
して、認証結果を“Cookie”などの技術を使って
伝えるという一般的な手法で実現してもよい。
The member authentication section 11 may use the authentication mechanism of the HTTP server as it is. Alternatively, an authentication server may be prepared and the authentication result may be transmitted using a technique such as "Cookie".

【0038】タイマ13は、設定された時間間隔で信号
を出力し、WWWページ収集部14を起動させることが
できる。タイマ13は、例えば、UNIX(登録商標)
の“cron”などの機能を使って実現することができ
る。
The timer 13 can output a signal at a set time interval to activate the WWW page collection unit 14. The timer 13 is, for example, UNIX (registered trademark).
It can be realized by using a function such as "cron" of.

【0039】WWWページ収集部14は、一般に情報収
集ロボットと呼ばれるものであり、フリーソフトウェア
の“wget”または、“httpdown”などのソ
フトウェアを使えばよい。
The WWW page collection unit 14 is generally called an information collection robot, and may use software such as free software "wget" or "httpdown".

【0040】WWWサイト情報保持部15は、WWWサ
イト情報DB151を含んでいる。WWWサイト情報D
B151は、市販のRDBMSを使って実現することが
できる。
The WWW site information holding section 15 includes a WWW site information DB 151. WWW site information D
B151 can be realized by using a commercially available RDBMS.

【0041】WWWページ索引保持部16は、WWWペ
ージDB161と、全文検索エンジン162を含んでい
る。WWWページDB161は、WWWサイト情報DB
151と同様に、市販のRDBMSを使って実現するこ
とができる。全文検索エンジン162は、全文検索機能
を提供するもので、“N−gram”を使ったもの、形
態素解析を使ったもの、ベクトル空間法などの手法を使
ったものが一般に使用されている。
The WWW page index holding unit 16 includes a WWW page DB 161 and a full-text search engine 162. The WWW page DB 161 is a WWW site information DB
Similar to 151, it can be realized by using a commercially available RDBMS. The full-text search engine 162 provides a full-text search function, and generally, the one using “N-gram”, the one using morphological analysis, and the one using a method such as a vector space method are generally used.

【0042】次に、本発明の動作を説明する。Next, the operation of the present invention will be described.

【0043】最初に、情報登録時の動作について説明す
る。
First, the operation at the time of information registration will be described.

【0044】図4は、本発明の一実施の形態における情
報登録動作のフローチャートである。
FIG. 4 is a flowchart of the information registration operation according to the embodiment of the present invention.

【0045】ステップ101) まず、情報登録者端末
20からのアクセスに対して、ログイン即ち、会員認証
が完了しているかどうかを検査する。ログインが完了し
ていなければ、ステップ111に移行する。
Step 101) First, for the access from the information registrant terminal 20, it is checked whether or not login, that is, member authentication is completed. If the login is not completed, the process proceeds to step 111.

【0046】ステップ102) ログインが完了してい
れば、WWWサイト情報が入力されているかどうかを確
認する。ここで、WWWサイト情報が入力されていなけ
れば、ステップ121に移行する。WWWサイト情報が
入力されている場合には、ステップ103に移行する。
Step 102) If the login is completed, it is confirmed whether the WWW site information has been entered. Here, if the WWW site information has not been input, the process proceeds to step 121. If the WWW site information has been input, the process proceeds to step 103.

【0047】ステップ103) 図5に示すWWW情報
登録画面(詳細は、ステップ121で後述する)で入力
されたWWWサイト情報と認証によって取得された情報
登録者IDをWWWサイト情報DB151に格納する。
Step 103) The WWW site information entered on the WWW information registration screen (details will be described later in step 121) shown in FIG. 5 and the information registrant ID obtained by the authentication are stored in the WWW site information DB 151.

【0048】ステップ104) WWWページ収集部1
7により、指定されたWWWサイトからWWWページを
収集する。このとき、図5の「ハイパーリンクを辿る」
チェックボックス103の状態によってWWWページ収
集部17の動作を替える。
Step 104) WWW page collection unit 1
7, collect WWW pages from the designated WWW site. At this time, "follow hyperlink" in FIG.
The operation of the WWW page collection unit 17 is changed depending on the state of the check box 103.

【0049】ステップ105) WWWページ収集部1
7でWWWページの取得が成功したかどうかを検査す
る。もし取得に失敗していれば、ステップ131に移行
する。取得に成功していればステップ106に移行す
る。
Step 105) WWW page collection unit 1
In step 7, check whether the WWW page has been successfully acquired. If the acquisition has failed, the process proceeds to step 131. If the acquisition is successful, the process proceeds to step 106.

【0050】ステップ106) 情報の取得に成功して
いれば、「ご登録ありがとうございました」というメッ
セージを表示する。
Step 106) If the information acquisition is successful, a message "Thank you for registration" is displayed.

【0051】ステップ107) 取得したWWWページ
に基づいてWWWページDB161及び全文検索エンジ
ン162を更新し、終了する。
Step 107) The WWW page DB 161 and the full-text search engine 162 are updated based on the acquired WWW page, and the process ends.

【0052】ステップ111) ステップ101におい
て、ログインが完了していない場合には、ログイン画面
あるいはログインサーバへ情報登録者端末を移動させる
ように制御して終了する。
Step 111) If the login is not completed in Step 101, control is performed to move the information registrant terminal to the login screen or the login server, and the process ends.

【0053】ステップ121) ステップ102におい
て、WWW情報が入力されていない場合には、WWWサ
イト登録画面を表示して終了する。図5の画面には、W
WWサイトのタイトルを入力するテキストフィールド1
01、URLを入力するテキストフィールド102、指
定したURLの中に含まれるハイパーリンクをさらにた
どってそのWWWサイトの内容も検索対象に含めるかど
うかを指定するチェックボックス103、紹介文を入力
するテキストエリア104、登録ボタン105が表示さ
れる。
Step 121) When the WWW information is not input in Step 102, the WWW site registration screen is displayed and the process ends. The screen of FIG.
Text field 1 for entering title of WW site
01, a text field 102 for inputting a URL, a check box 103 for specifying whether or not to further search the contents of the WWW site by following the hyperlink included in the specified URL, and a text area for inputting an introduction sentence 104 and a registration button 105 are displayed.

【0054】ステップ131) ステップ105におい
て、WWWページの取得に失敗している場合には、「指
定されたサイトから情報が取得できません」というメッ
セージを表示して終了する。
Step 131) In step 105, if the acquisition of the WWW page has failed, a message "Information cannot be acquired from the specified site" is displayed and the process ends.

【0055】ここで、データベースの構造について説明
する。
Here, the structure of the database will be described.

【0056】図6は、本発明の一実施の形態におけるW
WWサイト情報DB及びWWWページDBのテーブル構
造を示す。本装置10は、WWWサイト情報DB151
とWWWページDB161の2つのデータベースを使用
している。
FIG. 6 shows W in one embodiment of the present invention.
The table structure of WW site information DB and WWW page DB is shown. This device 10 has a WWW site information DB 151.
And WWW page DB 161 are used.

【0057】WWWサイト情報DB151のWWWサイ
ト情報は、それぞれサイトIDを付与して他のWWWサ
イト情報と区別される。一方、WWWページDB161
では、ページを区別するページIDの他に、そのページ
がどのWWWサイトに含まれるかを示すサイトIDを持
っている。サイトIDは検索時のグループ化の際に使用
される。
The WWW site information in the WWW site information DB 151 is given a site ID to be distinguished from other WWW site information. On the other hand, WWW page DB 161
Then, in addition to the page ID that distinguishes the page, it has a site ID indicating which WWW site the page is included in. The site ID is used for grouping at the time of search.

【0058】次に、検索時の処理について説明する。Next, the processing at the time of retrieval will be described.

【0059】図7は、本発明の一実施の形態における検
索動作のフローチャートである。
FIG. 7 is a flowchart of the search operation according to the embodiment of the present invention.

【0060】ステップ201) まず、検索利用者端末
40からのアクセスに対し、検索キーワードが与えられ
ているかを確認する。検索キーワードが与えられていな
ければ、ステップ211に移行する。
Step 201) First, it is confirmed whether or not a search keyword is given to the access from the search user terminal 40. If no search keyword is given, the process proceeds to step 211.

【0061】ステップ202) 検索キーワードが与え
られている場合には、全文検索エンジン162を使って
与えられた検索キーワードを含むWWWページのページ
IDの集合を取得する。
Step 202) When a search keyword is given, the full-text search engine 162 is used to obtain a set of page IDs of WWW pages including the given search keyword.

【0062】ステップ203) ステップ202におけ
る検索結果がある場合には、ステップ204に移行し、
ない場合には、ステップ221に移行する。
Step 203) If there is a search result in Step 202, move to Step 204,
If not, the process proceeds to step 221.

【0063】ステップ204) 検索結果がある場合に
は、WWWぺージDB161を使って、各ページIDを
サイトID毎にグループ化する。
Step 204) If there is a search result, each page ID is grouped by site ID using the WWW page DB 161.

【0064】ステップ205) 各サイトID毎にサイ
トのスコアを計算する。このスコアは、全文検索エンジ
ンがWWWページ毎に返却するスコアの和でも良いし、
単純にヒットしたWWWページが何件WWWサイトに含
まれているかでもよい。
Step 205) The score of the site is calculated for each site ID. This score may be the sum of the scores returned by the full-text search engine for each WWW page,
It may be simply how many WWW pages are hits included in the WWW site.

【0065】ステップ206) ステップ205で求め
られたスコアの大きい順番にサイト情報を並べ替える。
Step 206) The site information is sorted in descending order of the score obtained in Step 205.

【0066】ステップ207) 検索結果画面に表示可
能な件数に検索結果を切り詰める処理を行なう。1画面
に表示できるWWWページの件数は、設定で変更できる
ように構築することが望ましい。
Step 207) The search results are truncated to the maximum number that can be displayed on the search result screen. It is desirable to construct the number of WWW pages that can be displayed on one screen so that the number can be changed by setting.

【0067】ステップ208) ステップ207で残っ
たWWWサイト、WWWページに関する表示データをW
WWサイト情報DB151及びWWWページDB161
から取得する。
Step 208) The display data concerning the WWW site and WWW page remaining in Step 207 is W
WW site information DB 151 and WWW page DB 161
To get from.

【0068】ステップ209) ステップ208で取得
した表示データを組み合わせた検索結果画面を作成し、
検索利用者端末40に送信して終了する。
Step 209) Create a search result screen combining the display data obtained in Step 208,
Send to the search user terminal 40 and end.

【0069】ステップ211) ステップ201で検索
キーワードが入力されていない場合には、検索画面を表
示する。検索画面は、検索キーワードを入力するテキス
トフィールドと検索ボタンを含んでいる。
Step 211) When the search keyword is not input in Step 201, the search screen is displayed. The search screen includes a text field for inputting a search keyword and a search button.

【0070】ステップ221) ステップ203におい
て、検索結果がゼロの場合には、「検索件数は0です」
というメッセージを表示して終了する。
Step 221) If the search result is zero in Step 203, "the number of searches is 0".
Is displayed and the process ends.

【0071】図8は、本発明の一実施の形態における検
索結果画面の例を示す。検索結果は、WWWサイト毎に
タイトル203、情報登録者が入力したサイトの紹介文
204、情報登録者の名前(ID)205と、検索キー
ワードで照合に成功したWWWページのタイトル群20
6が表示されている。タイトル203とタイトル群20
6はハイパーリンクになっている。タイトル203をク
リックすると、WWWサイトのトップページにジャンプ
する。また、タイトル群206は、検索にヒットしたW
WWページそのものにジャンプする。また、情報登録者
ID206を情報登録者のメールアドレスへのハイパー
リンクにすることもできる。このように、本装置10の
検索結果は、サイト別に紹介文を付与して提示されるの
で、どのWWWページを見ればよいかが分かりやすい。
また、情報登録者名が提示されているので、Aさんの推
薦なら間違いないだろうという判断材料を提供すること
ができる。
FIG. 8 shows an example of the search result screen in the embodiment of the present invention. The search result is a title 203 for each WWW site, an introduction sentence 204 of the site input by the information registrant, a name (ID) 205 of the information registrant, and a title group 20 of WWW pages that have been successfully matched with the search keyword.
6 is displayed. Title 203 and title group 20
6 is a hyperlink. Click the title 203 to jump to the top page of the WWW site. In addition, the title group 206 is W that has hit the search.
Jump to the WW page itself. The information registrant ID 206 can also be a hyperlink to the information registrant's email address. In this way, since the search result of the device 10 is presented with an introduction sentence for each site, it is easy to understand which WWW page should be viewed.
In addition, since the information registrant name is presented, it is possible to provide a judgment material that it is certain that Mr. A's recommendation will be correct.

【0072】次に、WWWページの更新処理について説
明する。
Next, the WWW page update process will be described.

【0073】図9は、本発明の一実施の形態におけるW
WWページ情報更新のフローチャートである。
FIG. 9 shows W in one embodiment of the present invention.
It is a flowchart of WW page information update.

【0074】当該WWWページの更新は、タイマ13に
よって起動されるものである。
The updating of the WWW page is started by the timer 13.

【0075】ステップ301) まず、WWWページ収
集部14が一日に一度など、タイマ13から定期的に処
理が起動されると、WWWサイト情報DB151から1
レコードずつWWWサイト情報を取り出す。
Step 301) First, when the process of the WWW page collection unit 14 is periodically activated from the timer 13 such as once a day, the WWW site information DB 151 is set to 1
Retrieve WWW site information record by record.

【0076】ステップ302) WWWサイト情報DB
151からのレコードの取り出しが最後のレコードに到
達したかをチェックする。レコードの終わりでなけれ
ば、ステップ303に移行し、最終レコードである場合
には、ステップ311に移行する。
Step 302) WWW site information DB
It is checked whether the record fetch from 151 has reached the last record. If it is not the end of the record, the process proceeds to step 303, and if it is the last record, the process proceeds to step 311.

【0077】ステップ303) レコードの終わりでな
ければ、取り出されたレコードのURLからWWWペー
ジ収集部14を使って、WWWページを取得し、再び、
ステップ301の処理を行なう。
Step 303) If it is not the end of the record, the WWW page is acquired from the URL of the retrieved record using the WWW page collection unit 14, and again,
The process of step 301 is performed.

【0078】ステップ311) ステップ302におい
て、取り出されたレコードが最終レコードである場合に
は、WWWページ収集部14において、収集されたWW
Wページの情報を使って、WWWページDB161及び
全文検索エンジン162の情報を更新し、終了する。
Step 311) If the record retrieved in step 302 is the last record, the WW collected by the WWW page collection unit 14
The information on the WWW page DB 161 and the full-text search engine 162 is updated using the information on the W page, and the process ends.

【0079】また、上記の実施の形態における図4、図
7、図9に示す各フローチャートの処理をプログラムと
して構築し、文書検索サービス提供装置として利用され
るコンピュータのCPUにインストールする、または、
ネットワークを介して流通させることが可能である。
Further, the processes of the flowcharts shown in FIGS. 4, 7, and 9 in the above-described embodiment are constructed as a program and installed in the CPU of the computer used as the document search service providing device, or
It can be distributed via a network.

【0080】また、構築されたプログラムを文書検索サ
ービス提供装置として利用されるコンピュータに接続さ
れるハードディスク装置や、フロッピー(登録商標)デ
ィスク、CD−ROM等の可搬記憶媒体に格納してお
き、本発明を実施する際にインストールすることによ
り、容易に本発明を実現できる。
Further, the constructed program is stored in a hard disk device connected to a computer used as a document search service providing device, a portable storage medium such as a floppy (registered trademark) disk, or a CD-ROM, The present invention can be easily realized by installing it when carrying out the present invention.

【0081】なお、本発明は、上記の実施の形態に限定
されることなく、特許請求の範囲内において種々変更・
応用が可能である。
The present invention is not limited to the above-mentioned embodiments, and various modifications and changes are made within the scope of the claims.
It can be applied.

【0082】[0082]

【発明の効果】上述のように、本発明によれば、特定の
話題に興味を持つ人々が各人の推薦する最新のWWWペ
ージ情報を共有することを容易にすることができると共
に、特定の話題に特化したWWWページ検索サービスを
構築することが可能である。
As described above, according to the present invention, it is possible for people who are interested in a particular topic to share the latest WWW page information recommended by each person, and at the same time, a specific It is possible to build a WWW page search service specialized for a topic.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理を説明するための図である。FIG. 1 is a diagram for explaining the principle of the present invention.

【図2】本発明の原理構成図である。FIG. 2 is a principle configuration diagram of the present invention.

【図3】本発明の一実施の形態における文書検索サービ
ス提供装置の構成図である。
FIG. 3 is a configuration diagram of a document search service providing apparatus according to an embodiment of the present invention.

【図4】本発明の一実施の形態における情報登録動作の
フローチャートである。
FIG. 4 is a flowchart of an information registration operation according to the embodiment of the present invention.

【図5】本発明の一実施の形態におけるWWWサイト情
報登録画面の例である。
FIG. 5 is an example of a WWW site information registration screen according to the embodiment of the present invention.

【図6】本発明の一実施の形態におけるWWWサイト情
報DB及びWWWページDBテーブルの構造を示す図で
ある。
FIG. 6 is a diagram showing structures of a WWW site information DB and a WWW page DB table in the embodiment of the present invention.

【図7】本発明の一実施の形態における検索動作のフロ
ーチャートである。
FIG. 7 is a flowchart of a search operation according to the embodiment of the present invention.

【図8】本発明の一実施の形態における検索結果画面の
例である。
FIG. 8 is an example of a search result screen in the embodiment of the present invention.

【図9】本発明の一実施の形態におけるWWWページ情
報更新のフローチャートである。
FIG. 9 is a flowchart of updating WWW page information according to the embodiment of the present invention.

【図10】従来のリンク集の例である。FIG. 10 is an example of a conventional link collection.

【符号の説明】[Explanation of symbols]

10 文書検索サービス提供装置 11 会員認証手段、会員認証部 12 WWWサイト情報入力手段、WWWサイト情報入
力部 13 タイマ 14 WWWページ収集手段、WWWページ収集部 15 WWWサイト情報保持手段、WWWサイト情報保
持部 16 ページ索引保持手段、WWWページ索引保持部 17 検索手段 20 情報登録者端末 30 WWWサーバ 40 検索利用者端末 101 タイトルを入力するテキストフィールド 102 URLを入力するテキストフィールド 103 チェックボックス 104 紹介文を入力するテキストエリア 105 登録ボタン 151 WWWサイト情報DB 161 WWWページDB 162 全文検索エンジン 203 タイトル 204 WWWサイトの紹介文 205 情報登録者の名前 206 情報登録者ID
10 Document Retrieval Service Providing Device 11 Member Authentication Unit, Member Authentication Unit 12 WWW Site Information Input Unit, WWW Site Information Input Unit 13 Timer 14 WWW Page Collection Unit, WWW Page Collection Unit 15 WWW Site Information Storage Unit, WWW Site Information Storage Unit 16 page index holding means, WWW page index holding part 17 search means 20 information registrant terminal 30 WWW server 40 search user terminal 101 text field 102 for entering a title text field 103 for entering a URL 103 check box 104 for entering an introductory text Text area 105 Registration button 151 WWW site information DB 161 WWW page DB 162 Full-text search engine 203 Title 204 WWW site introduction sentence 205 Information registrant name 206 Information registrant ID

Claims (14)

【特許請求の範囲】[Claims] 【請求項1】 コンピュータネットワーク上に存在する
WWWページの集合から所望の文書を発見するための文
書検索サービス提供方法において、 情報登録者の情報登録者端末からのアクセスに対して、
情報登録者の認証を行い、 前記情報登録者端末に対して、検索対象となるWWWサ
イトの名前、URL、紹介文を含むWWWサイト情報の
入力を促し、 前記情報登録者端末から入力された前記WWWサイト情
報及び登録者名を、WWWサイト情報データベースに記
憶し、 指定されたWWWサイトから該WWWサイトに含まれる
WWWページ群を取得し、検索用データベースに格納
し、 検索利用者の検索利用者端末に対して、検索キーワード
の入力を促し、 前記検索利用者端末から入力された検索キーワードに関
連するWWWページ群を前記検索用データベースから検
索し、 検索されたWWWページ群をWWWサイト毎にグループ
化し、 グループ毎に、WWWサイトの名前、紹介文を含むWW
Wサイト情報と、前記情報登録者の名前を付加したペー
ジを作成し、 作成された前記ページを検索結果として前記検索利用者
端末に表示することを特徴とする文書検索サービス提供
方法。
1. A method for providing a document search service for discovering a desired document from a set of WWW pages existing on a computer network, comprising: accessing an information registrant terminal from an information registrant terminal;
The information registrant is authenticated, the information registrant terminal is prompted to enter WWW site information including the name, URL, and introduction text of the WWW site to be searched, and the information registrant terminal inputs the WWW site information. WWW site information and registrant name are stored in the WWW site information database, WWW page groups included in the WWW site are acquired from the designated WWW site, stored in the search database, and the search user of the search user The terminal is prompted to enter a search keyword, the WWW page group related to the search keyword input from the search user terminal is searched from the search database, and the searched WWW page group is grouped for each WWW site. WW including the WWW site name and introductory text for each group
A document search service providing method comprising: creating a page to which W site information and the name of the information registrant are added, and displaying the created page as a search result on the search user terminal.
【請求項2】 コンピュータネットワーク上に存在する
WWWページの集合から所望の文書を発見するための文
書検索サービス提供方法において、 情報登録者の情報登録者端末からのアクセスに対して、
情報登録者の認証を行い、 前記情報登録者端末に対して、検索対象となるWWWサ
イトの名前、URL、紹介文を含むWWWサイト情報の
入力を促し、 前記情報登録者端末から入力された前記WWWサイト情
報及び登録者名を、WWWサイト情報データベースに記
憶し、 指定されたWWWサイトから該WWWサイトに含まれる
WWWページ群を取得し、検索用データベースに格納す
ることを特徴とする文書検索サービス提供方法。
2. A document search service providing method for discovering a desired document from a set of WWW pages existing on a computer network, comprising: accessing an information registrant terminal from an information registrant terminal;
The information registrant is authenticated, the information registrant terminal is prompted to enter WWW site information including the name, URL, and introduction text of the WWW site to be searched, and the information registrant terminal inputs the WWW site information. A document search service characterized by storing WWW site information and a registrant name in a WWW site information database, acquiring a WWW page group included in the WWW site from a designated WWW site, and storing the WWW page group in a search database. How to provide.
【請求項3】 コンピュータネットワーク上に存在する
WWWページの集合から所望の文書を発見するための文
書検索サービス提供方法において、 検索利用者の検索利用者端末に対して、検索キーワード
の入力を促し、 前記検索利用者端末から入力された検索キーワードに関
連するWWWページ群を検索用データベースから検索
し、 検索されたWWWページ群をWWWサイト毎にグループ
化し、 グループ毎に、WWWサイトの名前、紹介文を含むWW
Wサイト情報と、前記情報登録者の名前を付加したペー
ジを作成し、 作成された前記ページを検索結果として前記検索利用者
端末に表示することを特徴とする文書検索サービス提供
方法。
3. A document search service providing method for finding a desired document from a set of WWW pages existing on a computer network, wherein a search user terminal of a search user is prompted to enter a search keyword, The WWW page group related to the search keyword input from the search user terminal is searched from the search database, the searched WWW page group is grouped for each WWW site, and the WWW site name and introduction text are grouped for each group. Including WW
A document search service providing method comprising: creating a page to which W site information and the name of the information registrant are added, and displaying the created page as a search result on the search user terminal.
【請求項4】 所定の条件を満たしている場合に、前記
WWWサイト情報データベースに保存されているWWW
サイト情報を読み出し、 前記WWWサイト情報に含まれているURLからWWW
ページ群を取得し、取得した前記WWWページを元に、
前記検索用データベースを更新する請求項1または、2
記載の文書検索サービス提供方法。
4. A WWW stored in the WWW site information database when a predetermined condition is satisfied.
The site information is read, and the WWW is read from the URL included in the WWW site information.
Acquire a page group, based on the acquired WWW page,
3. The database for search is updated, claim 1 or 2.
Document search service provision method described.
【請求項5】 コンピュータネットワーク上に存在する
WWWページの集合から所望の文書を発見するための文
書検索サービス提供装置であって、 情報登録者の認証を行なう会員認証手段と、 前記会員認証手段により認証された情報登録者からUR
L、タイトル、紹介文を含むWWWサイト情報を受け付
けるWWWサイト情報入力手段と、 前記WWWサイト情報入力手段からのWWWサイト情報
及び情報登録者名を保持するWWWサイト情報保持手段
と、 前記WWWサイト情報保持手段に保持された前記WWW
サイト情報に基づいて、WWWページ情報を収集するW
WWページ収集手段と、 前記WWWページ収集手段によって収集されたWWWペ
ージの情報を検索可能な形で保持するWWWページ索引
保持手段と、 検索利用者の検索利用者端末からのアクセスに対して検
索キーワードの入力を促し、該検索利用者端末から入力
された検索キーワードに関連するWWWページ群を検索
し、WWWサイト毎にグループ化し、WWWサイト情報
及び情報登録者名を付加した検索結果を該検索利用者端
末に表示する検索手段とを有することを特徴とする文書
検索サービス提供装置。
5. A document search service providing apparatus for discovering a desired document from a set of WWW pages existing on a computer network, the member authenticating means for authenticating an information registrant, and the member authenticating means. UR from authenticated information registrant
WWW site information input means for receiving WWW site information including L, title, and introduction, WWW site information holding means for holding WWW site information and information registrant name from the WWW site information input means, and the WWW site information The WWW held by the holding means
W to collect WWW page information based on site information W
WW page collecting means, WWW page index holding means for holding the information of WWW pages collected by the WWW page collecting means in a searchable form, and a search keyword for access from a search user terminal of a search user. The WWW page group related to the search keyword input from the search user terminal, grouped by WWW site, and the search result obtained by adding the WWW site information and the information registrant name is used for the search. An apparatus for providing a document search service, comprising: a search unit for displaying on a person's terminal.
【請求項6】 コンピュータネットワーク上に存在する
WWWページの集合から所望の文書を発見するための文
書検索サービス提供装置であって、 情報登録者の認証を行なう会員認証手段と、 前記会員認証手段により認証された情報登録者からUR
L、タイトル、紹介文を含むWWWサイト情報を受け付
けるWWWサイト情報入力手段と、 前記WWWサイト情報入力手段からのWWWサイト情報
及び情報登録者名を保持するWWWサイト情報保持手段
と、 前記WWWサイト情報保持手段に保持された前記WWW
サイト情報に基づいて、WWWページ情報を収集するW
WWページ収集手段と、 前記WWWページ収集手段によって収集されたWWWペ
ージの情報を検索可能な形で保持するWWWページ索引
保持手段とを有することを特徴とする文書検索サービス
提供装置。
6. A document retrieval service providing apparatus for discovering a desired document from a set of WWW pages existing on a computer network, comprising: a member authenticating means for authenticating an information registrant; and the member authenticating means. UR from authenticated information registrant
WWW site information input means for receiving WWW site information including L, title, and introduction, WWW site information holding means for holding WWW site information and information registrant name from the WWW site information input means, and the WWW site information The WWW held by the holding means
W to collect WWW page information based on site information W
An apparatus for providing a document search service, comprising: a WW page collecting means; and a WWW page index holding means for holding information of WWW pages collected by the WWW page collecting means in a searchable form.
【請求項7】 コンピュータネットワーク上に存在する
WWWページの集合から所望の文書を発見するための文
書検索サービス提供装置であって、 検索利用者の検索利用者端末からのアクセスに対して検
索キーワードの入力を促し、該検索利用者端末から入力
された検索キーワードに関連するWWWページ群を検索
し、WWWサイト毎にグループ化し、WWWサイト情報
及び情報登録者名を付加した検索結果を該検索利用者端
末に表示する検索手段とを有することを特徴とする文書
検索サービス提供装置。
7. A document search service providing apparatus for finding a desired document from a set of WWW pages existing on a computer network, wherein a search keyword is provided for access from a search user terminal of a search user. Prompting for input, searching for WWW page groups related to the search keyword input from the search user terminal, grouping by WWW site, and adding the WWW site information and information registrant name to the search result. An apparatus for providing a document search service, comprising: a search unit for displaying on a terminal.
【請求項8】 時間を計測するタイマと、 前記タイマが一定の時間を計数する度に、前記WWWペ
ージ収集手段において収集されたWWWページで、前記
WWWページ索引保持手段に保持されているWWWペー
ジ情報を更新する更新手段とを更に有する請求項5また
は、6記載の文書検索サービス提供装置。
8. A timer for measuring time, and a WWW page collected by said WWW page collection means every time said timer counts a certain time, and a WWW page held in said WWW page index holding means 7. The document search service providing device according to claim 5, further comprising update means for updating information.
【請求項9】 コンピュータネットワーク上に存在する
WWWページの集合から所望の文書を発見するための文
書検索サービス提供プログラムであって、 情報登録者の認証を行なう会員認証プロセスと、 前記会員認証プロセスにより認証された情報登録者から
URL、タイトル、紹介文を含むWWWサイト情報を受
け付けるWWWサイト情報入力プロセスと、 前記WWWサイト情報入力プロセスからのWWWサイト
情報及び情報登録者名を保持するWWWサイト情報デー
タベースに保持された前記WWWサイト情報に基づい
て、WWWページ情報を収集するWWWページ収集プロ
セスと、 前記WWWページ収集プロセスによって収集されたWW
Wページの情報を検索可能な形で保持するWWWページ
索引データベースに格納するWWWページ索引格納プロ
セスとを有することを特徴とする文書検索サービス提供
プログラム。
9. A document search service providing program for discovering a desired document from a set of WWW pages existing on a computer network, comprising: a member authentication process for authenticating an information registrant; and a member authentication process. WWW site information input process for receiving WWW site information including URL, title, and introductory text from an authenticated information registrant, and WWW site information database holding WWW site information and information registrant name from the WWW site information input process A WWW page collection process for collecting WWW page information based on the WWW site information stored in the WWW page information, and a WW collected by the WWW page collection process.
And a WWW page index storage process for storing W page information in a WWW page index database that retains information in a searchable form.
【請求項10】 コンピュータネットワーク上に存在す
るWWWページの集合から所望の文書を発見するための
文書検索サービス提供プログラムであって、 検索利用者の検索利用者端末からのアクセスに対して検
索キーワードの入力を促し、該検索利用者端末から入力
された検索キーワードに関連するWWWページ群を検索
し、WWWサイト毎にグループ化し、WWWサイト情報
及び情報登録者名を付加した検索結果を該検索利用者端
末に表示する検索プロセスとを有することを特徴とする
文書検索サービス提供プログラム。
10. A document search service providing program for finding a desired document from a set of WWW pages existing on a computer network, wherein a search keyword is provided for access from a search user terminal of a search user. Prompting for input, searching for WWW page groups related to the search keyword input from the search user terminal, grouping by WWW site, and adding the WWW site information and information registrant name to the search result. A document search service providing program, comprising: a search process for displaying on a terminal.
【請求項11】 時間を計測するタイマが一定の時間を
計数する度に、前記WWWページ収集プロセスにおいて
収集されたWWWページで、前記WWWページ索引デー
タベースに保持されているWWWページ情報を更新する
更新プロセスとを更に有する請求項9または、10記載
の文書検索サービス提供プログラム。
11. An update for updating WWW page information held in the WWW page index database with a WWW page collected in the WWW page collection process every time a timer for measuring time counts a certain time. The document search service providing program according to claim 9, further comprising a process.
【請求項12】 コンピュータネットワーク上に存在す
るWWWページの集合から所望の文書を発見するための
文書検索サービス提供プログラムを格納した記憶媒体で
あって、 情報登録者の認証を行なう会員認証プロセスと、 前記会員認証プロセスにより認証された情報登録者から
URL、タイトル、紹介文を含むWWWサイト情報を受
け付けるWWWサイト情報入力プロセスと、 前記WWWサイト情報入力プロセスからのWWWサイト
情報及び情報登録者名を保持するWWWサイト情報デー
タベースに保持された前記WWWサイト情報に基づい
て、WWWページ情報を収集するWWWページ収集プロ
セスと、 前記WWWページ収集プロセスによって収集されたWW
Wページの情報を検索可能な形で保持するWWWページ
索引データベースに格納するWWWページ索引格納プロ
セスとを有することを特徴とする文書検索サービス提供
プログラムを格納した記憶媒体。
12. A storage medium storing a document search service providing program for discovering a desired document from a set of WWW pages existing on a computer network, and a member authentication process for authenticating an information registrant, WWW site information input process for receiving WWW site information including URL, title, and introduction from the information registrant authenticated by the member authentication process, and holding WWW site information and information registrant name from the WWW site information input process A WWW page collection process for collecting WWW page information based on the WWW site information held in the WWW site information database, and a WW collected by the WWW page collection process
A storage medium storing a document search service providing program, comprising: a WWW page index storage process for storing information of W pages in a searchable manner in a WWW page index database.
【請求項13】 コンピュータネットワーク上に存在す
るWWWページの集合から所望の文書を発見するための
文書検索サービス提供プログラムを格納した記憶媒体で
あって、 検索利用者の検索利用者端末からのアクセスに対して検
索キーワードの入力を促し、該検索利用者端末から入力
された検索キーワードに関連するWWWページ群を検索
し、WWWサイト毎にグループ化し、WWWサイト情報
及び情報登録者名を付加した検索結果を該検索利用者端
末に表示する検索プロセスとを有することを特徴とする
文書検索サービス提供プログラムを格納した記憶媒体。
13. A storage medium storing a program for providing a document search service for finding a desired document from a set of WWW pages existing on a computer network, which is accessible from a search user terminal of a search user. A search result that prompts the user to enter a search keyword, searches for WWW page groups related to the search keyword input from the search user terminal, groups them by WWW site, and adds WWW site information and information registrant name. And a search process for displaying the document on the search user terminal.
【請求項14】 時間を計測するタイマが一定の時間を
計数する度に、前記WWWページ収集プロセスにおいて
収集されたWWWページで、前記WWWページ索引デー
タベースに保持されているWWWページ情報を更新する
更新プロセスとを更に有する請求項12記載の文書検索
サービス提供プログラムを格納した記憶媒体。
14. An update for updating WWW page information held in the WWW page index database with a WWW page collected in the WWW page collection process every time a timer for counting time counts a certain time. The storage medium storing the document search service providing program according to claim 12, further comprising a process.
JP2001210873A 2001-07-11 2001-07-11 Document search service providing method and apparatus, document search service providing program, and storage medium storing document search service providing program Pending JP2003030231A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001210873A JP2003030231A (en) 2001-07-11 2001-07-11 Document search service providing method and apparatus, document search service providing program, and storage medium storing document search service providing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001210873A JP2003030231A (en) 2001-07-11 2001-07-11 Document search service providing method and apparatus, document search service providing program, and storage medium storing document search service providing program

Publications (1)

Publication Number Publication Date
JP2003030231A true JP2003030231A (en) 2003-01-31

Family

ID=19046275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001210873A Pending JP2003030231A (en) 2001-07-11 2001-07-11 Document search service providing method and apparatus, document search service providing program, and storage medium storing document search service providing program

Country Status (1)

Country Link
JP (1) JP2003030231A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006058948A (en) * 2004-08-17 2006-03-02 Yafoo Japan Corp Content information collecting apparatus, content information collecting method, and content information collecting program for causing computer to execute content information collecting method
JP2006127123A (en) * 2004-10-28 2006-05-18 Mitsubishi Electric Corp Application server, database server, web search system, search result acquisition method, search result response method, search result acquisition program, and search result response program
WO2010062791A3 (en) * 2008-11-26 2010-08-26 Microsoft Corporation Providing suggested sites associated with target sites
JP2011013841A (en) * 2009-06-30 2011-01-20 Naver Japan Corp Device and service system for retrieving information

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006058948A (en) * 2004-08-17 2006-03-02 Yafoo Japan Corp Content information collecting apparatus, content information collecting method, and content information collecting program for causing computer to execute content information collecting method
JP2006127123A (en) * 2004-10-28 2006-05-18 Mitsubishi Electric Corp Application server, database server, web search system, search result acquisition method, search result response method, search result acquisition program, and search result response program
WO2010062791A3 (en) * 2008-11-26 2010-08-26 Microsoft Corporation Providing suggested sites associated with target sites
US8244740B2 (en) 2008-11-26 2012-08-14 Microsoft Corporation Providing suggested sites associated with target sites
JP2011013841A (en) * 2009-06-30 2011-01-20 Naver Japan Corp Device and service system for retrieving information

Similar Documents

Publication Publication Date Title
US10929487B1 (en) Customization of search results for search queries received from third party sites
US8849842B2 (en) Task/domain segmentation in applying feedback to command control
US6564210B1 (en) System and method for searching databases employing user profiles
US6338058B1 (en) Method for providing more informative results in response to a search of electronic documents
EP1341099B1 (en) Subject specific search engine
WO2007051397A1 (en) An information retrieval system and information retrieval method
US20030120654A1 (en) Metadata search results ranking system
JP5318125B2 (en) Systems and methods for complex search
JP2012212455A (en) Ranking method and ranking system
US9275145B2 (en) Electronic document retrieval system with links to external documents
US20070239692A1 (en) Logo or image based search engine for presenting search results
CA2713932C (en) Automated boolean expression generation for computerized search and indexing
US20100005088A1 (en) Using An Encyclopedia To Build User Profiles
JP2004029943A (en) Retrieval support method
JP4875911B2 (en) Content identification method and apparatus
JP2003030231A (en) Document search service providing method and apparatus, document search service providing program, and storage medium storing document search service providing program
US20020062341A1 (en) Interested article serving system and interested article serving method
US8190603B2 (en) Information providing system, information providing method and information providing record medium
KR20010097722A (en) Internet Hompage Multi-searching System
JP5286007B2 (en) Document search device, document search method, and document search program
JP2007034772A (en) Optimum display system for web site search result, its method and its program
KR100371805B1 (en) Method and system for providing related web sites for the current visitting of client
JP2010122932A (en) Document retrieval device, document retrieval method, and document retrieval program
JP2003173351A (en) Information analysis, collection, search method, apparatus, program, and recording medium
JP4146067B2 (en) Document search system and document search method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070807