[go: up one dir, main page]

JP2009282913A - Personal-adaptive web information search device, method, and program - Google Patents

Personal-adaptive web information search device, method, and program Download PDF

Info

Publication number
JP2009282913A
JP2009282913A JP2008136861A JP2008136861A JP2009282913A JP 2009282913 A JP2009282913 A JP 2009282913A JP 2008136861 A JP2008136861 A JP 2008136861A JP 2008136861 A JP2008136861 A JP 2008136861A JP 2009282913 A JP2009282913 A JP 2009282913A
Authority
JP
Japan
Prior art keywords
feature word
profile information
information storage
url
word group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008136861A
Other languages
Japanese (ja)
Inventor
Shuichi Nakawatase
秀一 中渡瀬
Minako Izawa
味奈子 井沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008136861A priority Critical patent/JP2009282913A/en
Publication of JP2009282913A publication Critical patent/JP2009282913A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】個人の興味に応じたインターネット情報検索ができるようにするために、個人のプロファイル情報を適切に取得することによって個人適応検索を行う。
【解決手段】本発明は、ある利用者のプロファイル情報となる特徴語の組を当該利用者のブックマークに含まれるURLの指し示すWebページ本文及びそのページが参照するリンク先のWebページからも抽出し、ブックマークの更新による変化に追随して、プロファイル情報(特徴語群)を更新前、更新後で比較して共通部分となる特徴語群を生成し、プロファイル情報を更新する。更新されたプロファイル情報及び更新されたリンク先のプロファイル情報のある一定以上の類似度を有するプロファイル情報に基づいて、検索結果をソートして出力する。
【選択図】図1
Personal adaptive search is performed by appropriately acquiring personal profile information in order to enable Internet information search according to personal interests.
The present invention also extracts a set of feature words as profile information of a user from a Web page text indicated by a URL included in the user's bookmark and a linked Web page to which the page refers. Following the change due to the bookmark update, the profile information (feature word group) is compared before and after the update to generate a feature word group as a common part, and the profile information is updated. The search results are sorted and output based on profile information having a certain degree of similarity or higher in the updated profile information and the updated link destination profile information.
[Selection] Figure 1

Description

本発明は、個人適応型Web情報検索装置及び方法及びプログラムに係り、特に、個人のプロファイルによってWeb検索結果の得点付けを行う場合のプロファイル情報の更新が可能な個人適応型Web情報検索装置及び方法及びプログラムに関する。   The present invention relates to a personal adaptive Web information search apparatus, method, and program, and more particularly to a personal adaptive Web information search apparatus and method capable of updating profile information when scoring Web search results based on a personal profile. And the program.

従来の個人適応型情報検索技術において、個人の興味内容に応じて作成されたプロファイル情報を用いて、情報検索結果の適合度順位を変更する手法としては以下のようなものがある。   In the conventional personal adaptive information search technology, there are the following methods for changing the suitability ranking of information search results using profile information created according to the personal interest content.

通常の情報検索において利用者が使用した検索式、その検索結果に表示された文字列やその検索結果のうちユーザが保存した文書の内容文に含まれる単語からストップワードを除いて得られる語や高頻度の語(特徴語)の組を当該利用者のプロファイル情報とし、それと情報検索の結果として得られる文書の文書ベクトルとの類似度順位を検索結果の順位とする(例えば、非特許文献1参照)。
野美山浩"個人適応型情報検索システム:個人の興味を学習する階層記憶モデルとその協調的フィルタリングへの適用"情報処理学会研究報告、情報学基礎研究会報告 IPSJ SIG Notes Vol. 96, No.70 pp. 49-56 (1996)
The search formula used by the user in normal information search, the character string displayed in the search result and the word obtained by removing the stop word from the word included in the content sentence of the document saved by the user A set of frequently used words (feature words) is used as the profile information of the user, and a similarity ranking between the user and the document vector of the document obtained as a result of the information search is set as the search result rank (for example, Non-Patent Document 1). reference).
Namiyama Hiroshi "Personal Adaptive Information Retrieval System: Hierarchical Memory Model for Learning Individual Interests and Its Application to Collaborative Filtering" IPSJ SIG Notes Vol. 96, No. 70 pp. 49-56 (1996)

しかしながら、上記従来の方法には以下のような問題点がある。   However, the conventional method has the following problems.

上記の方法では、検索結果全体には利用者要求に適合しないWebページも多く含まれるので、そこから抽出される特徴語には利用者の興味に合致しない特徴語も多く抽出されてしまう。   In the above method, since the entire search result includes many Web pages that do not match the user request, many feature words that do not match the user's interest are extracted from the feature words extracted therefrom.

また、Webページの保存は通常、永続的なWebサイトについては行われていないことが多い。そのため、上述した従来の方法では、その対象Webページからプロファイル情報として適切な特徴語を抽出することが困難であるため、それを用いた検索結果の個人適応化も適切に行われていない。   In addition, Web pages are not usually saved for permanent Web sites. For this reason, in the conventional method described above, it is difficult to extract an appropriate feature word as profile information from the target Web page, and thus personal adaptation of search results using it is not appropriately performed.

本発明は、上記の点に鑑みなされたもので、個人の興味に応じたインターネット情報検索ができるようにするために、個人のプロファイル情報を適切に取得することによって個人適応検索を行うことが可能な個人適応型Web情報検索装置及び方法及びプログラムを提供することを目的とする。   The present invention has been made in view of the above points. In order to enable Internet information search according to personal interests, it is possible to perform personal adaptive search by appropriately acquiring personal profile information. An object of the present invention is to provide a personal adaptive web information retrieval apparatus, method and program.

図1は、本発明の原理を説明するための図である。   FIG. 1 is a diagram for explaining the principle of the present invention.

本発明(請求項1)は、個人の興味応じたWebページの情報検索を行うための個人適応型情報検索方法であって、
URL抽出手段が、ブックマーク記憶手段から、利用者が過去に閲覧し、保存したWebページのうち有用なものとして保存されているURLを取得するURL抽出ステップ(ステップ1)と、
第1の特徴語抽出手段が、URLに基づいてWebページを取得し、該Webページの本文から抽出された特徴語群WAaを第1のプロファイル情報記憶手段に格納する特徴語抽出ステップ(ステップ2)と、
第1の更新手段が、前回の特徴語群WBaが格納されている第2のプロファイル情報記憶手段と第1のプロファイル情報記憶手段に格納されている特徴語群WAa,WBaとを比較してそれらの共通部分となる特徴語群WCaを生成し、該第2のプロファイル情報記憶手段に格納することにより、該第2のプロファイル情報記憶手段の内容を更新する第1の更新ステップ(ステップ3)と、
第2の特徴語抽出手段が、取得したURLに基づいて参照先Webページを取得し、該参照先Webページの本文から抽出された特徴語群WAbを第1の追加プロファイル情報記憶手段に格納する参照先ページ取得ステップ(ステップ4)と、
第2の更新手段が、前回の特徴語群WBbが格納されている第2の追加プロファイル情報記憶手段と第1の追加プロファイル記憶手段に格納されているWAb、WBbとを比較してそれらの共通部分となる特徴語群WCbを生成し、該第2の追加プロファイル情報記憶手段に格納することにより、該第2の追加プロファイル情報記憶手段の内容を更新する第2の更新ステップ(ステップ5)と、
特徴語合成手段が、第2のプロファイル情報記憶手段と第2の追加プロファイル情報記憶手段に格納されている特徴語群WAa、WAbの個々に対して類似度を比較し、所定の類似度以上の特徴語群WDを抽出する特徴語合成ステップ(ステップ6)と、
検索結果ソート手段が、検索式が入力されると(ステップ7)検索された結果を特徴語群WDに基づいて検索結果をソートして出力する検索結果ソートステップ(ステップ8)と、を行う。
The present invention (Claim 1) is a personal adaptive information retrieval method for retrieving information on a Web page according to an individual's interest,
A URL extracting step (step 1) in which the URL extracting unit obtains a URL stored as a useful Web page that the user browsed and stored in the past from the bookmark storing unit;
A first feature word extraction unit acquires a Web page based on the URL, and stores a feature word group WAa extracted from the text of the Web page in the first profile information storage unit (step 2) )When,
The first updating means compares the second profile information storage means storing the previous feature word group WBa with the feature word groups WAa and WBa stored in the first profile information storage means, and compares them. A first update step (step 3) for updating the contents of the second profile information storage unit by generating a feature word group WCa that is a common part of the second profile information and storing it in the second profile information storage unit ,
The second feature word extraction unit acquires a reference destination Web page based on the acquired URL, and stores the feature word group WAb extracted from the text of the reference destination Web page in the first additional profile information storage unit. A reference page acquisition step (step 4);
The second updating unit compares the second additional profile information storage unit storing the previous feature word group WBb with the WAb and WBb stored in the first additional profile storage unit, and uses them in common. A second update step (step 5) for updating the contents of the second additional profile information storage means by generating a feature word group WCb to be a part and storing it in the second additional profile information storage means; ,
The feature word synthesizing unit compares the similarity with each of the feature word groups WAa and WAb stored in the second profile information storage unit and the second additional profile information storage unit, A feature word synthesis step (step 6) for extracting a feature word group WD;
When a search expression is input (step 7), the search result sorting means performs a search result sorting step (step 8) in which the search result is sorted and output based on the feature word group WD.

また、本発明(請求項2)は、参照先ページ取得ステップ(ステップ4)において、
取得した参照先のURLとその参照レベルnに基づいて、該URLの示すソースを取得する処理を参照レベルが、所定のレベルNになるまで繰り返す。
Further, the present invention (Claim 2) provides a reference page acquisition step (Step 4).
Based on the acquired URL of the reference destination and the reference level n, the process of acquiring the source indicated by the URL is repeated until the reference level reaches a predetermined level N.

また、本発明(請求項3)は、検索結果ソートステップ(ステップ8)において、
検索結果に含まれる各文書から文書ベクトルを生成し、
特徴語群WDによるベクトルとの内積を計算して、該内積の大きい順に文書をソートする。
Further, the present invention (Claim 3) provides a search result sorting step (Step 8).
Generate a document vector from each document included in the search results,
An inner product with a vector based on the feature word group WD is calculated, and the documents are sorted in descending order of the inner product.

図2は、本発明の原理構成図である。   FIG. 2 is a principle configuration diagram of the present invention.

本発明(請求項4)は、個人の興味応じたWebページの情報検索を行うための個人適応型情報検索装置であって、
利用者により選択されたWebページをブックマークとして格納されているブックマーク記憶手段1と、
ブックマーク記憶手段1から、利用者が過去に閲覧し、保存したWebページのうち有用なものとして保存されているURLを取得するURL抽出手段2と、
URLに基づいてWebページを取得するページ取得手段3と、
Webページの本文から抽出された特徴語群WAaを第1のプロファイル情報記憶手段9に格納する第1の特徴語抽出手段4と、
前回の特徴語群WBaが格納されている第2のプロファイル情報記憶手段8と第1のプロファイル情報記憶手段に格納されている特徴語群WAa,WBaとを比較してそれらの共通部分となる特徴語群WCaを生成し、該第2のプロファイル情報記憶手段8に格納することにより、該第2のプロファイル情報記憶手段8の内容を更新する第1の更新手段10と、
ページ取得手段5で取得したWebページから参照先のURLを抽出し、参照先Webページを取得する参照先ページ取得手段13と、
参照先Webページの本文から抽出された特徴語群WAbを第1の追加プロファイル情報記憶手段17に格納する第2の特徴語抽出手段11と、
前回の特徴語群WBbが格納されている第2の追加プロファイル情報記憶手段16と第1の追加プロファイル記憶手段17に格納されているWAb、WBbとを比較してそれらの共通部分となる特徴語群WCbを生成し、該第2の追加プロファイル情報記憶手段16に格納することにより、該第2の追加プロファイル情報記憶手段16の内容を更新する第2の更新手段18、
第2のプロファイル情報記憶手段8と第2の追加プロファイル情報記憶手段16に格納されている特徴語群WAa、WAbの個々に対して類似度を比較し、所定の類似度以上の特徴語群WDを抽出する特徴語合成手段19と、
入力された検索式により検索手段21により検索された結果を特徴語群WDに基づいて検索結果をソートして出力する検索結果ソート手段22と、を有する。
The present invention (Claim 4) is a personal adaptive information retrieval apparatus for performing information retrieval of Web pages according to personal interests,
Bookmark storage means 1 storing a Web page selected by the user as a bookmark;
URL extraction means 2 for acquiring a URL stored as a useful Web page from the bookmark storage means 1 that the user browsed and saved in the past;
Page acquisition means 3 for acquiring a web page based on the URL;
First feature word extraction means 4 for storing the feature word group WAa extracted from the text of the Web page in the first profile information storage means 9;
The second profile information storage means 8 in which the previous feature word group WBa is stored and the feature word groups WAa and WBa stored in the first profile information storage means are compared to form a common part of them. A first updating unit 10 for generating the word group WCa and storing the word group WCa in the second profile information storage unit 8 to update the contents of the second profile information storage unit 8;
A reference destination page acquisition unit 13 that extracts a reference destination URL from the Web page acquired by the page acquisition unit 5 and acquires a reference destination Web page;
A second feature word extraction unit 11 that stores the feature word group WAb extracted from the text of the reference destination Web page in the first additional profile information storage unit 17;
The feature word that is the common part of the second additional profile information storage means 16 storing the previous feature word group WBb and the WAb and WBb stored in the first additional profile storage means 17 are compared. A second updating unit 18 for updating the contents of the second additional profile information storage unit 16 by generating a group WCb and storing it in the second additional profile information storage unit 16;
Similarity levels are compared for each of the feature word groups WAa and WAb stored in the second profile information storage unit 8 and the second additional profile information storage unit 16, and a feature word group WD having a predetermined similarity or higher is compared. Feature word synthesizing means 19 for extracting
And search result sorting means 22 for sorting the search results based on the feature word group WD and outputting the results searched by the search means 21 based on the input search formula.

また、本発明(請求項5)は、ページ取得手段5において、
取得したWebページの参照先URLと参照レベルnを参照先ページ取得手段13に出力する手段を含み、
参照先ページ取得手段13は、
取得した参照先のURLと参照レベルnに基づいて、該URLの示すソースを取得する処理を参照レベルが、所定のレベルNになるまで繰り返す手段を含む。
Further, the present invention (Claim 5) is provided in the page acquisition means 5,
Means for outputting the reference URL and reference level n of the acquired web page to the reference page acquisition means 13;
The reference page acquisition means 13
Based on the acquired URL of the reference destination and the reference level n, means for repeating the process of acquiring the source indicated by the URL until the reference level reaches a predetermined level N is included.

また、本発明(請求項6)は、検索結果ソート手段22において、
検索結果に含まれる各文書から文書ベクトルを生成する手段と、
特徴語群WDによるベクトルとの内積を計算して、該内積の大きい順に文書をソートする手段を含む。
Further, the present invention (Claim 6) is provided in the search result sorting means 22,
Means for generating a document vector from each document included in the search results;
Means for calculating an inner product with a vector based on the feature word group WD and sorting the documents in descending order of the inner product.

本発明(請求項7)は、請求項4乃至6のいずれか1項記載の個人適応型Web情報検索装置を構成する各手段としてコンピュータを機能させるための個人適応型Web情報検索プログラムである。   The present invention (Claim 7) is a personal adaptive Web information search program for causing a computer to function as each means constituting the personal adaptive Web information search apparatus according to any one of Claims 4 to 6.

上述のように本発明によれば、利用者がインターネット検索途中に一時的に閲覧した検索結果ページ全体や保存したWebページの本文から抽出するという従来の特徴語抽出法に比べ、ブックマークに含まれるURLの指し示すWebページ及び、そのページが参照する別のWebページから特徴語を抽出することで、より利用者に個人適合したプロファイル情報を作成できるようになり、その結果、それを用いた検索結果の適合度順位付けがより個人適応化される。   As described above, according to the present invention, the bookmark is included in the bookmark as compared with the conventional feature word extraction method in which the user extracts the entire search result page temporarily browsed during the Internet search or the text of the saved Web page. By extracting feature words from the Web page indicated by the URL and another Web page referenced by the page, profile information more personally suited to the user can be created. As a result, search results using the profile information can be created. The fitness ranking is more personalized.

また、その後ブックマークが更新され、内容が変化してもそれに応じて変化する特徴語群を更新前後の特徴語群の比較から適切に計算することによってプロファイル情報の内容を適切に更新することができる。   In addition, the content of the profile information can be appropriately updated by appropriately calculating the feature word group that changes in accordance with the change of the content from the comparison of the feature word groups before and after the update after the bookmark is updated. .

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図3は、本発明の一実施の形態における個人適応型インターネット情報検索装置の構成を示す。   FIG. 3 shows the configuration of a personal adaptive Internet information retrieval apparatus according to an embodiment of the present invention.

同図に示す装置は、ブックマーク記憶部1、URL抽出部2、タイミング制御部3、URLフィルタリング部4、基本HTML取得部5、本文抽出部6、特徴語取得部7、基本特徴語保存部A8、基本特徴語保存部B9,比較更新部10、リンク取得部11、URLフィルタリング部12、HTML取得部13、本文抽出部14、特徴語取得部15、追加特徴語保存部A16、追加特徴語保存部B17、比較更新部18、特徴語合成部19、検索式入力部20、検索エンジン部21、検索結果ソート部22、結果表示部23から構成される。   The apparatus shown in the figure includes a bookmark storage unit 1, a URL extraction unit 2, a timing control unit 3, a URL filtering unit 4, a basic HTML acquisition unit 5, a text extraction unit 6, a feature word acquisition unit 7, and a basic feature word storage unit A8. , Basic feature word storage unit B9, comparison update unit 10, link acquisition unit 11, URL filtering unit 12, HTML acquisition unit 13, text extraction unit 14, feature word acquisition unit 15, additional feature word storage unit A16, additional feature word storage A part B 17, a comparison / update part 18, a feature word composition part 19, a search expression input part 20, a search engine part 21, a search result sort part 22, and a result display part 23.

上記の構成における動作を以下に示す。   The operation in the above configuration is shown below.

個人適応型インターネット情報検索装置は、利用者が過去に保存したWebページのうち有用なものをとしてブックマークに保存されているURLなど、Webページの情報をインタねっとブラウザのブックマークから取得し、そのURLのWebページ及びそのページ参照先Webページ本文中からそれらの特徴語群を抽出して、それらをプロファイル情報とする。さらに、ブックマークがその後、更新された場合には更新前後の参照先Webページから得られる特徴語群を比較してプロファイル情報をより適切なものに更新する。   The personal adaptive Internet information retrieval device acquires Web page information, such as a URL stored in a bookmark as a useful Web page stored by the user in the past, from the browser bookmark, and the URL These feature word groups are extracted from the web page and the page reference destination web page body, and are used as profile information. Further, when the bookmark is subsequently updated, the feature word groups obtained from the reference Web pages before and after the update are compared to update the profile information to a more appropriate one.

そして検索の際には、情報検索結果をこのプロファイル情報中の特徴語群によって個人適応化した適合度順位にソートする。   At the time of retrieval, the information retrieval results are sorted into suitability rankings that are personally adapted by the feature word group in the profile information.

図4は、本発明の一実施の形態における全体処理のフローチャートである。   FIG. 4 is a flowchart of the overall processing in one embodiment of the present invention.

予め利用者は情報検索に先立って自分にとって興味のあるWebページをブックマーク記憶部1に格納しておくものとする。   It is assumed that the user stores in advance in the bookmark storage unit 1 a web page that is of interest to the user prior to information retrieval.

ステップ101) URL抽出部2は、ブックマーク記憶部1に保存されているURLを抽出して、URLフィルタリング部に送る。このURL抽出を行うタイミングはタイミング制御部3により指定される利用者の指定する時点、もしくはX時間おきなど予めスケジューリングされたタイミングに基づいて指定される。   Step 101) The URL extraction unit 2 extracts the URL stored in the bookmark storage unit 1 and sends it to the URL filtering unit. The timing for extracting the URL is specified based on a timing specified by the user specified by the timing control unit 3 or a timing scheduled in advance such as every X hours.

ステップ102) URLフィルタリング部4は、URLにフィルタリングを行い、不要なURLは除去し、そうでないものは基本HTML取得部5に送る。フィルタリングの具体的方法には、例えば、予め作成したURLブラックリストに一致するURLを除去する方法や、URL文字列パターンによるマッチングルールに基づいて方法などを用いる。   Step 102) The URL filtering unit 4 performs filtering on the URL, removes unnecessary URLs, and sends other URLs to the basic HTML acquisition unit 5. As a specific filtering method, for example, a method of removing a URL that matches a URL black list created in advance or a method based on a matching rule based on a URL character string pattern is used.

なお、本ステップの処理については図5で詳述する。   The processing in this step will be described in detail with reference to FIG.

ステップ103) 基本HTML取得部5は、指定されたURLのWebページ(基本ページ)をインターネットから取得し、そのページのHTMLソースを本文抽出部6とリンク抽出部11へ送る。このとき、参照レベルの情報を付加する。   Step 103) The basic HTML acquisition unit 5 acquires the Web page (basic page) of the designated URL from the Internet, and sends the HTML source of the page to the text extraction unit 6 and the link extraction unit 11. At this time, reference level information is added.

ステップ104) 本文抽出部6では、基本ページのHTMLソースからタグなどを取り除いて文章の本文だけを抽出して、特徴語取得部7に送る。   Step 104) The text extracting unit 6 removes the tag from the HTML source of the basic page, extracts only the text of the sentence, and sends it to the feature word acquiring unit 7.

ステップ105) 特徴語抽出部7では、抽出された本文を解析して単語を抽出し、それからストップワードを除去した後、特徴語抽出手法によって、それらの単語から特徴語を選び出す。そして、基本特徴語保存部B9に保存する。但し、ここで用いる特徴語抽出手法としてはTFIDF法のような既存の方法であれば何でもよい。   Step 105) The feature word extraction unit 7 analyzes the extracted text to extract words, removes stop words from the extracted word, and then selects feature words from those words by a feature word extraction method. And it preserve | saves at basic feature word preservation | save part B9. However, the feature word extraction method used here may be any existing method such as the TFIDF method.

ステップ106) 比較更新部10において、基本特徴語保存部B9から特徴語群WBを取得し、もし、基本特徴語保存部A8に何も保存されていない場合には、取得した特徴語群WBを基本特徴語保存部A8に保存する。しかし、既に、基本特徴語保存部A8に特徴語群が存在する場合はその特徴語群WAを取得し、WA,WBの両者を比較してそれらの共通部分となる特徴語群WCを生成し、WCで基本特徴語保存部A8の内容を更新する。   Step 106) The comparison / update unit 10 acquires the feature word group WB from the basic feature word storage unit B9. If nothing is stored in the basic feature word storage unit A8, the acquired feature word group WB is Save in the basic feature word storage A8. However, if a feature word group already exists in the basic feature word storage unit A8, the feature word group WA is acquired, and both the WA and WB are compared to generate a feature word group WC that is a common part of them. The content of the basic feature word storage unit A8 is updated with WC.

ステップ107) リンク抽出部11において、ステップ103において、基本HTML取得部5から送られた対象となるHTMLソースからアンカータグによって示されるリンク先URLを取得し、URLフィルタリング部12に送る。なお、本ステップの処理については図6で詳述する。   Step 107) In the link extraction unit 11, in step 103, the link destination URL indicated by the anchor tag is acquired from the target HTML source sent from the basic HTML acquisition unit 5 and sent to the URL filtering unit 12. The processing in this step will be described in detail with reference to FIG.

ステップ108) URLフィルタリング部12では、URLフィルタリング部4と同様にリンク先URLをフィルタリングし、得られたURLをHTML取得部13に送る。   Step 108) The URL filtering unit 12 filters the link destination URL in the same manner as the URL filtering unit 4, and sends the obtained URL to the HTML acquisition unit 13.

なお、本ステップの処理については図5で詳述する。   The processing in this step will be described in detail with reference to FIG.

ステップ109) HTML取得部13は、指定されたURLのWebページをインターネットから取得し、そのページのHTMLソースを本文抽出部14に送り、また、そのURLが基本ページから予め決められたNリンク以内のURLであれば、そのHTMLソースをリンク抽出部11に送る。ここでは、リンク抽出部11、URLフィルタリング部12、HTML取得部13で基本ページからNリンク以内のWebページを反復取得しているが、同等の処理結果を得るためにこれらのブロックをN段連続して構成したものでもよい。当該ステップの処理については図7で詳述する。   Step 109) The HTML acquisition unit 13 acquires the Web page of the specified URL from the Internet, sends the HTML source of the page to the text extraction unit 14, and the URL is within a predetermined N link from the basic page. Is sent to the link extraction unit 11. Here, the link extraction unit 11, the URL filtering unit 12, and the HTML acquisition unit 13 repeatedly acquire Web pages within N links from the basic page. However, in order to obtain an equivalent processing result, these blocks are continuously arranged in N stages. It may be configured as follows. The processing of this step will be described in detail with reference to FIG.

ステップ110) 本文抽出部14では、HTML取得部13で取得されたHTMLソースからタグなどを取り除いて文章の本文だけを抽出して特徴語取得部15に送る。   Step 110) The text extracting unit 14 removes the tag from the HTML source acquired by the HTML acquiring unit 13, extracts only the text of the sentence, and sends it to the feature word acquiring unit 15.

ステップ111) 特徴語抽出部15では抽出された本文を解析して単語を抽出し、それからストップワードを除去した後、特徴語抽出手法によって、それらの単語から特徴語を選び出し、追加特徴語保存部B17に格納する。但し、ここで用いる特徴語抽出手法としてはTFIDF法のような既存の方法であれば何を用いてもよい。   Step 111) The feature word extraction unit 15 analyzes the extracted text to extract words, removes stop words from the extracted word, selects feature words from those words by a feature word extraction method, and adds an additional feature word storage unit. Store in B17. However, as a feature word extraction method used here, any existing method such as the TFIDF method may be used.

ステップ112) 比較更新部18において、追加特徴語保存部B17から特徴語群WBを取得し、もし追加特徴語保存部A16に何も保存されていない場合には、取得した特徴語群を追加特徴語保存部A16に保存する。しかし、既に追加特徴語保存部A16に特徴語群が存在する場合は、その特徴語群WAを取得し、WA,WBの両者を比較してそれらの共通部分となる特徴語群WCを生成し、WCで追加特徴語保存部A16の内容を更新する。   Step 112) The comparison / update unit 18 acquires the feature word group WB from the additional feature word storage unit B17. If nothing is stored in the additional feature word storage unit A16, the acquired feature word group is added to the additional feature word storage unit A16. Save in the word storage unit A16. However, if a feature word group already exists in the additional feature word storage unit A16, the feature word group WA is acquired, and both the WA and WB are compared to generate a feature word group WC that is a common part of them. The content of the additional feature word storage unit A16 is updated with WC.

ステップ113) 特徴語合成部19では、基本特徴語保存部A8の特徴語群WAを取得し、検索結果ソート部17に送る。追加特徴語保存部A16に含まれる特徴語も取得し、それら個々に対して特徴語群WA中の全ての語との類似度を比較し、WAのいずれかの特徴語とある一定の類似度以上があるものは検索結果ソート部17に送る。但し、ここで用いる類似度としては余弦類似度など既存の何を用いてもよい。当該ステップの詳細な処理は図8で詳述する。   Step 113) The feature word synthesis unit 19 acquires the feature word group WA of the basic feature word storage unit A8 and sends it to the search result sorting unit 17. The feature words included in the additional feature word storage unit A16 are also acquired, the degree of similarity is compared with all the words in the feature word group WA for each of them, and a certain degree of similarity with any feature word of the WA Those having the above are sent to the search result sorting unit 17. However, any existing similarity such as cosine similarity may be used as the similarity used here. Detailed processing of this step will be described in detail with reference to FIG.

ステップ114) 検索式入力部20において、利用者から検索式の入力を受け付けて、得られた検索式を検索エンジン部21に送る。   Step 114) The search expression input unit 20 receives the input of the search expression from the user, and sends the obtained search expression to the search engine unit 21.

ステップ115) 検索エンジン部21では、検索式入力部20で得られた検索式によってインターネット検索を行い、その検索結果を検索結果ソート部17に送る。   Step 115) The search engine unit 21 performs an Internet search using the search formula obtained by the search formula input unit 20, and sends the search result to the search result sorting unit 17.

ステップ116) 検索結果ソート部17では、検索エンジン部21から得られる検索結果に含まれる各文書から文書ベクトルを生成し、特徴語合成部19から得られる特徴語群によるベクトルとの内積を計算して、その内積の大きさの順に元の文書をソートし、その結果を結果表示部23に送る。   Step 116) The search result sorting unit 17 generates a document vector from each document included in the search result obtained from the search engine unit 21, and calculates an inner product with the vector based on the feature word group obtained from the feature word synthesis unit 19. Then, the original documents are sorted in the order of the inner product, and the result is sent to the result display unit 23.

ステップ117) 最後に結果表示部23では検索結果ソート部22によって得られた検索結果を利用者に表示する。   Step 117) Finally, the result display unit 23 displays the search results obtained by the search result sorting unit 22 to the user.

次に、上記のステップ102,108におけるURLのフィルタリングについて説明する。以下ではブラックリスト方式の例を説明する。   Next, URL filtering in steps 102 and 108 will be described. Hereinafter, an example of the black list method will be described.

図5は、本発明の一実施の形態におけるURLフィルタリング処理のフローチャートである。以下では、URLフィルタリング部4の例を示すが、リンク先のURLのフィルタリングを行うURLフィルタリング部12も同様の処理を行う。   FIG. 5 is a flowchart of URL filtering processing according to an embodiment of the present invention. Below, although the example of the URL filtering part 4 is shown, the URL filtering part 12 which filters URL of a link destination performs the same process.

ステップ201) URL抽出部2からURLを取得する。   Step 201) The URL is acquired from the URL extraction unit 2.

ステップ202) 取得したURLを除去すべきURLの登録されたブラックリストデータベース(図示せず)と照合する。   Step 202) The acquired URL is checked against a black list database (not shown) in which the URL to be removed is registered.

ステップ203) 照合の結果、URLがブラックリストにマッチすれば、本処理終了する。マッチしなければステップ204に移行する。   Step 203) If the URL matches the black list as a result of the collation, this processing ends. If no match is found, the process proceeds to step 204.

ステップ204) 当該URLを基本HTML取得部5に出力する。   Step 204) The URL is output to the basic HTML acquisition unit 5.

次に、上記のステップ107のリンク取得部11における動作を説明する。   Next, the operation in the link acquisition unit 11 in step 107 will be described.

図6は、本発明の一実施の形態におけるリンク取得処理のフローチャートである。   FIG. 6 is a flowchart of link acquisition processing according to an embodiment of the present invention.

ステップ301) リンク取得部11は、基本HTML取得部5からHTML文書とその参照レベルn=kを取得する。   Step 301) The link acquisition unit 11 acquires an HTML document and its reference level n = k from the basic HTML acquisition unit 5.

ステップ302) HTML文書中の全てのアンカータグについてそのHREF属性をURLとして抽出する。   Step 302) The HREF attribute is extracted as a URL for all anchor tags in the HTML document.

ステップ303) それぞれのURLに対してその参照レベルnをk+1として出力する。   Step 303) For each URL, output its reference level n as k + 1.

次に、上記のステップ109のHTML取得部13の動作を説明する。   Next, the operation of the HTML acquisition unit 13 in step 109 will be described.

図7は、本発明の一実施の形態におけるHTML取得部の処理を示すフローチャートである。   FIG. 7 is a flowchart showing processing of the HTML acquisition unit in the embodiment of the present invention.

ステップ401) URLフィルタリング部12からURLとその参照レベルを取得する。   Step 401) The URL and its reference level are acquired from the URL filtering unit 12.

ステップ402) URLの指し示すWebページのソースを取得する。   Step 402) The source of the Web page indicated by the URL is acquired.

ステップ403) 参照レベルnとN(予め設定された参照レベルの最大値)とを比較し、n<Nであればページソースと参照レベルnとをリンク取得部11に出力してステップ404に移行する。n≧Nであればステップ404に移行する。   Step 403) The reference level n is compared with N (a preset maximum value of the reference level). If n <N, the page source and the reference level n are output to the link acquisition unit 11 and the process proceeds to Step 404. To do. If n ≧ N, the process proceeds to step 404.

ステップ404) ページソースを本文抽出部14に出力する。   Step 404) The page source is output to the text extracting unit 14.

次に、上記のステップ113の特徴語合成部19の処理を説明する。   Next, the processing of the feature word synthesis unit 19 in step 113 will be described.

図8は、本発明の一実施の形態における特徴語合成処理のフローチャートである。   FIG. 8 is a flowchart of the feature word synthesis process according to the embodiment of the present invention.

ステップ501) 基本特徴語保存部A8から基本特徴語W1,…,Wnを取得し、これらを出力する
ステップ502) ループ変数k,iを1に初期化する。
Step 501) Basic feature words W1,..., Wn are acquired from the basic feature word storage unit A8, and these are output. Step 502) Loop variables k and i are initialized to 1.

ステップ503) i>m(追加特徴語数の最大値)であれば終了する。そうなければステップ504に移行する。   Step 503) If i> m (the maximum number of additional feature words), the process ends. Otherwise, the process proceeds to step 504.

ステップ504) k>n(基本特徴語数の最大値)であればステップ509に移行する。そうでなければステップ505に移行する。   Step 504) If k> n (the maximum number of basic feature words), the process proceeds to Step 509. Otherwise, the process proceeds to step 505.

ステップ505) 基本特徴語Wkと追加特徴語Tiとの類似度であるSkiを計算する。   Step 505) Ski, which is the similarity between the basic feature word Wk and the additional feature word Ti, is calculated.

ステップ506) 類似度Skiが予め決められた閾値C以上であるならば、ステップ507に移行する。そうでなければ、ステップ508に移行する。   Step 506) If the similarity Ski is equal to or greater than a predetermined threshold C, the process proceeds to Step 507. Otherwise, the process proceeds to step 508.

ステップ507) 追加特徴語Tiを出力してステップ509に移行する。   Step 507) The additional feature word Ti is output and the process proceeds to Step 509.

ステップ508) k=k+1とし、ステップ504に移行する。   Step 508) Set k = k + 1 and proceed to Step 504.

ステップ509) i=i+1とし、ステップ503に移行する。   Step 509) Set i = i + 1, and proceed to Step 503.

上記の図3に示す構成要素の動作をプログラムとして構築し、個人適応型インターネット情報検索装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。   The operations of the components shown in FIG. 3 described above can be constructed as a program and installed in a computer used as a personal adaptive Internet information retrieval apparatus for execution or distributed via a network.

また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。   Further, the constructed program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and can be installed or distributed in a computer.

なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.

本発明は、インターネットのWeb検索技術に適用可能である。   The present invention is applicable to Internet Web search technology.

本発明の原理を説明するための図である。It is a figure for demonstrating the principle of this invention. 本発明の原理構成図である。It is a principle block diagram of this invention. 本発明の一実施の形態における個人適応型Web情報検索装置の構成図である。It is a block diagram of the personal adaptive type | mold web information search device in one embodiment of this invention. 本発明の一実施の形態における全体処理のフローチャートである。It is a flowchart of the whole process in one embodiment of this invention. 本発明の一実施の形態におけるURLフィルタリング処理のフローチャートである。It is a flowchart of the URL filtering process in one embodiment of this invention. 本発明の一実施の形態におけるリンク取得部の処理を示すフローチャートである。It is a flowchart which shows the process of the link acquisition part in one embodiment of this invention. 本発明の一実施の形態におけるHTML取得部の処理を示すフローチャートである。It is a flowchart which shows the process of the HTML acquisition part in one embodiment of this invention. 本発明の一実施の形態における特徴語合成部の処理を示すフローチャートである。It is a flowchart which shows the process of the feature word synthetic | combination part in one embodiment of this invention.

符号の説明Explanation of symbols

1 ブックマーク記憶手段、ブックマーク記憶部
2 URL抽出手段、URL抽出部
3 タイミング制御部
4 URLファイルタリング部
5 ページ取得手段
6 本文抽出部
7 第1の特徴語抽出手段、特徴語取得部
8 第2のプロファイル情報記憶部、基本特徴語保存部A
9 第1のプロファイル情報記憶手段、基本特徴語保存部B
10 第1の更新手段、比較更新部
11 第2の特徴語抽出手段、リンク取得部
12 URLフィルタリング部
13 参照先ページ取得手段、HTML取得部
14 本文抽出部
15 特徴語取得部
16 第2の追加プロファイル情報記憶手段、追加特徴語保存部A
17 第1の追加プロファイル情報記憶手段、追加特徴語保存部B
18 第2の更新手段、比較更新部
19 特徴語合成手段、特徴語合成部
20 検索式入力部
21 検索手段、検索エンジン
22 検索結果ソート手段、検索結果ソート部
23 結果出力部
DESCRIPTION OF SYMBOLS 1 Bookmark memory | storage means, Bookmark memory | storage part 2 URL extraction means, URL extraction part 3 Timing control part 4 URL file talling part 5 Page acquisition means 6 Text extraction part 7 1st feature word extraction means, feature word acquisition part 8 2nd Profile information storage unit, basic feature word storage unit A
9 First profile information storage means, basic feature word storage B
10 first update means, comparison update section 11 second feature word extraction means, link acquisition section 12 URL filtering section 13 reference page acquisition means, HTML acquisition section 14 text extraction section 15 feature word acquisition section 16 second addition Profile information storage means, additional feature word storage unit A
17 First additional profile information storage means, additional feature word storage B
18 second update means, comparison update section 19 feature word composition means, feature word composition section 20 search expression input section 21 search means, search engine 22 search result sort means, search result sort section 23 result output section

Claims (7)

個人の興味応じたWebページの情報検索を行うための個人適応型情報検索方法であって、
URL抽出手段が、ブックマーク記憶手段から、利用者が過去に閲覧し、保存したWebページのうち有用なものとして保存されているURLを取得するURL抽出ステップと、
第1の特徴語抽出手段が、前記URLに基づいてWebページを取得し、該Webページの本文から抽出された特徴語群WAaを第1のプロファイル情報記憶手段に格納する特徴語抽出ステップと、
第1の更新手段が、前回の特徴語群WBaが格納されている第2のプロファイル情報記憶手段と前記第1のプロファイル情報記憶手段に格納されている特徴語群WAa,WBaとを比較してそれらの共通部分となる特徴語群WCaを生成し、該第2のプロファイル情報記憶手段に格納することにより、該第2のプロファイル情報記憶手段の内容を更新する第1の更新ステップと、
第2の特徴語抽出手段が、取得した前記URLに基づいて参照先Webページを取得し、該参照先Webページの本文から抽出された特徴語群WAbを第1の追加プロファイル情報記憶手段に格納する参照先ページ取得ステップと、
第2の更新手段が、前回の特徴語群WBbが格納されている第2の追加プロファイル情報記憶手段と前記第1の追加プロファイル記憶手段に格納されているWAb、WBbとを比較してそれらの共通部分となる特徴語群WCbを生成し、該第2の追加プロファイル情報記憶手段に格納することにより、該第2の追加プロファイル情報記憶手段の内容を更新する第2の更新ステップと、
特徴語合成手段が、前記第2のプロファイル情報記憶手段と前記第2の追加プロファイル情報記憶手段に格納されている特徴語群WAa、WAbの個々に対して類似度を比較し、所定の類似度以上の特徴語群WDを抽出する特徴語合成ステップと、
検索結果ソート手段が、入力された検索式により検索された結果を前記特徴語群WDに基づいて検索結果をソートして出力する検索結果ソートステップと、
を行うことを特徴とする個人適応型Web情報検索方法。
A personal adaptive information retrieval method for retrieving information on a web page according to an individual's interest,
A URL extracting step in which the URL extracting means acquires from the bookmark storage means a URL that the user has browsed in the past and saved as a useful Web page;
A first feature word extraction unit that acquires a Web page based on the URL and stores a feature word group WAa extracted from the text of the Web page in the first profile information storage unit;
The first updating means compares the second profile information storage means storing the previous feature word group WBa with the feature word groups WAa and WBa stored in the first profile information storage means. A first update step of updating the contents of the second profile information storage unit by generating a feature word group WCa serving as a common part thereof and storing it in the second profile information storage unit;
The second feature word extraction unit acquires a reference destination Web page based on the acquired URL, and stores the feature word group WAb extracted from the text of the reference destination Web page in the first additional profile information storage unit. A reference page acquisition step to be performed;
The second updating unit compares the second additional profile information storage unit storing the previous feature word group WBb with the WAb and WBb stored in the first additional profile storage unit, and compares them. A second update step of updating the contents of the second additional profile information storage unit by generating a feature word group WCb to be a common part and storing it in the second additional profile information storage unit;
The feature word synthesizing unit compares the similarity with each of the feature word groups WAa and WAb stored in the second profile information storage unit and the second additional profile information storage unit to obtain a predetermined similarity A feature word synthesis step for extracting the above feature word group WD;
A search result sorting step, wherein the search result sorting means sorts the search results based on the feature word group WD and outputs the results searched by the input search formula;
A personal adaptive Web information retrieval method characterized by:
前記参照先ページ取得ステップにおいて、
取得した参照先のURLとその参照レベルnに基づいて、該URLの示すソースを取得する処理を参照レベルが、所定のレベルNになるまで繰り返す
請求項1記載の個人適応型Web情報検索方法。
In the reference page acquisition step,
The personal adaptive Web information search method according to claim 1, wherein the process of acquiring the source indicated by the URL is repeated until the reference level reaches a predetermined level N based on the acquired URL of the reference destination and the reference level n.
前記検索結果ソートステップにおいて、
前記検索結果に含まれる各文書から文書ベクトルを生成し、
前記特徴語群WDによるベクトルとの内積を計算して、該内積の大きい順に前記文書をソートする
請求項1記載の個人適応型Web情報検索方法。
In the search result sorting step,
Generating a document vector from each document included in the search results;
2. The personal adaptive Web information retrieval method according to claim 1, wherein inner products with vectors by the feature word group WD are calculated, and the documents are sorted in descending order of the inner products.
個人の興味応じたWebページの情報検索を行うための個人適応型情報検索装置であって、
利用者により選択されたWebページをブックマークとして格納されているブックマーク記憶手段と、
前記ブックマーク記憶手段から、利用者が過去に閲覧し、保存したWebページのうち有用なものとして保存されているURLを取得するURL抽出手段と、
前記URLに基づいてWebページを取得するページ取得手段と、
前記Webページの本文から抽出された特徴語群WAaを第1のプロファイル情報記憶手段に格納する第1の特徴語抽出手段と、
前回の特徴語群WBaが格納されている第2のプロファイル情報記憶手段と前記第1のプロファイル情報記憶手段に格納されている特徴語群WAa,WBaとを比較してそれらの共通部分となる特徴語群WCaを生成し、該第2のプロファイル情報記憶手段に格納することにより、該第2のプロファイル情報記憶手段の内容を更新する第1の更新手段と、
前記ページ取得手段で取得したWebページから参照先のURLを抽出し、参照先Webページを取得する参照先ページ取得手段と、
前記参照先Webページの本文から抽出された特徴語群WAbを第1の追加プロファイル情報記憶手段に格納する第2の特徴語抽出手段と、
前回の特徴語群WBbが格納されている第2の追加プロファイル情報記憶手段と前記第1の追加プロファイル記憶手段に格納されているWAb、WBbとを比較してそれらの共通部分となる特徴語群WCbを生成し、該第2の追加プロファイル情報記憶手段に格納することにより、該第2の追加プロファイル情報記憶手段の内容を更新する第2の更新手段と、
前記第2のプロファイル情報記憶手段と前記第2の追加プロファイル情報記憶手段に格納されている特徴語群WAa、WAbの個々に対して類似度を比較し、所定の類似度以上の特徴語群WDを抽出する特徴語合成手段と、
入力された検索式により検索手段により検索された結果を前記特徴語群WDに基づいて検索結果をソートして出力する検索結果ソート手段と、
を有することを特徴とする個人適応型Web情報検索装置。
A personal adaptive information retrieval device for retrieving information on a web page according to an individual's interest,
Bookmark storage means for storing a web page selected by the user as a bookmark;
URL extraction means for obtaining a URL stored as a useful one of the Web pages that the user browsed and saved in the past from the bookmark storage means;
Page acquisition means for acquiring a web page based on the URL;
First feature word extraction means for storing in the first profile information storage means a feature word group WAa extracted from the text of the Web page;
A feature that is a common part of the second profile information storage means storing the previous feature word group WBa and the feature word groups WAa, WBa stored in the first profile information storage means. A first updating means for updating the contents of the second profile information storage means by generating a word group WCa and storing it in the second profile information storage means;
A reference destination page acquisition unit that extracts a reference destination URL from the Web page acquired by the page acquisition unit and acquires a reference destination Web page;
Second feature word extraction means for storing in the first additional profile information storage means the feature word group WAb extracted from the text of the reference Web page;
The feature word group which is the common part of the second additional profile information storage means storing the previous feature word group WBb and the WAb and WBb stored in the first additional profile storage means A second updating means for updating the contents of the second additional profile information storage means by generating a WCb and storing it in the second additional profile information storage means;
Similarity levels are compared for each of the feature word groups WAa and WAb stored in the second profile information storage unit and the second additional profile information storage unit, and a feature word group WD having a predetermined similarity or higher is compared. Feature word synthesis means for extracting
Search result sorting means for sorting and outputting the search results based on the feature word group WD based on the input search expression;
A personal adaptive Web information retrieval apparatus characterized by comprising:
前記ページ取得手段は、
取得した前記Webページの参照先URLと参照レベルnを前記参照先ページ取得手段に出力する手段を含み、
前記参照先ページ取得手段は、
取得した前記参照先のURLと前記参照レベルnに基づいて、該URLの示すソースを取得する処理を参照レベルが、所定のレベルNになるまで繰り返す手段を含む
請求項4記載の個人適応型Web情報検索装置。
The page acquisition means
Means for outputting the reference URL and reference level n of the acquired web page to the reference page acquisition means;
The reference page acquisition means includes
5. The personal adaptive Web according to claim 4, further comprising means for repeating the process of acquiring the source indicated by the URL based on the acquired URL of the reference destination and the reference level n until the reference level reaches a predetermined level N. Information retrieval device.
前記検索結果ソート手段は、
前記検索結果に含まれる各文書から文書ベクトルを生成する手段と、
前記特徴語群WDによるベクトルとの内積を計算して、該内積の大きい順に前記文書をソートする手段を含む
請求項4記載の個人適応型Web情報検索方法。
The search result sorting means includes:
Means for generating a document vector from each document included in the search results;
5. The personal adaptive Web information retrieval method according to claim 4, further comprising means for calculating an inner product with a vector based on the feature word group WD and sorting the documents in descending order of the inner product.
請求項4乃至6のいずれか1項記載の個人適応型Web情報検索装置を構成する各手段としてコンピュータを機能させるための個人適応型Web情報検索プログラム。   A personal adaptive Web information search program for causing a computer to function as each means constituting the personal adaptive Web information search device according to any one of claims 4 to 6.
JP2008136861A 2008-05-26 2008-05-26 Personal-adaptive web information search device, method, and program Pending JP2009282913A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008136861A JP2009282913A (en) 2008-05-26 2008-05-26 Personal-adaptive web information search device, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008136861A JP2009282913A (en) 2008-05-26 2008-05-26 Personal-adaptive web information search device, method, and program

Publications (1)

Publication Number Publication Date
JP2009282913A true JP2009282913A (en) 2009-12-03

Family

ID=41453272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008136861A Pending JP2009282913A (en) 2008-05-26 2008-05-26 Personal-adaptive web information search device, method, and program

Country Status (1)

Country Link
JP (1) JP2009282913A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013518323A (en) * 2010-01-21 2013-05-20 マグネット システムズ, インコーポレイテッド Social and contextual search for enterprise business applications
JP2013546052A (en) * 2011-02-24 2013-12-26 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 Method and apparatus for playing video
US10698971B2 (en) 2016-08-03 2020-06-30 Samsung Electronics Co., Ltd. Method and apparatus for storing access log based on keyword

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013518323A (en) * 2010-01-21 2013-05-20 マグネット システムズ, インコーポレイテッド Social and contextual search for enterprise business applications
JP2013546052A (en) * 2011-02-24 2013-12-26 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 Method and apparatus for playing video
US10698971B2 (en) 2016-08-03 2020-06-30 Samsung Electronics Co., Ltd. Method and apparatus for storing access log based on keyword

Similar Documents

Publication Publication Date Title
US8271502B2 (en) Presenting multiple document summarization with search results
US8037051B2 (en) Matching and recommending relevant videos and media to individual search engine results
KR101450358B1 (en) Searching structured geographical data
US8117185B2 (en) Media discovery and playlist generation
CN108280114B (en) Deep learning-based user literature reading interest analysis method
US8655648B2 (en) Identifying topically-related phrases in a browsing sequence
US20080154886A1 (en) System and method for summarizing search results
CN109800350A (en) A kind of Personalize News recommended method and system, storage medium
KR20080031262A (en) Relationship network
CN101546587A (en) Method and device for automatically displaying visual elements in song-playing process
KR102256007B1 (en) System and method for searching documents and providing an answer to a natural language question
JP2011103075A (en) Method for extracting excerpt sentence
JP4466334B2 (en) Information classification method and apparatus, program, and storage medium storing program
EP1910943A1 (en) Method and apparatus for constructing a link structure between documents
JP2009282913A (en) Personal-adaptive web information search device, method, and program
JP2017072885A (en) Information search device, dictionary creation device, method, and program
US8745078B2 (en) Control computer and file search method using the same
KR101140724B1 (en) Method and system of configuring user profile based on a concept network and personalized query expansion system using the same
KR20200117542A (en) Apparatus and method for generating information link
JP5869948B2 (en) Passage dividing method, apparatus, and program
JP2008197952A (en) Text segmentation method, apparatus thereof, program thereof, and computer-readable recording medium
JP2012104051A (en) Document index creating device
JP2009265822A (en) Personal-adapted internet information retrieval device and program
JP3788254B2 (en) Information filtering system, filtering method therefor, and information filtering program
JP2011159100A (en) Successive similar document retrieval apparatus, successive similar document retrieval method and program