[go: up one dir, main page]

JP2011227731A - Query selection device and program - Google Patents

Query selection device and program Download PDF

Info

Publication number
JP2011227731A
JP2011227731A JP2010097256A JP2010097256A JP2011227731A JP 2011227731 A JP2011227731 A JP 2011227731A JP 2010097256 A JP2010097256 A JP 2010097256A JP 2010097256 A JP2010097256 A JP 2010097256A JP 2011227731 A JP2011227731 A JP 2011227731A
Authority
JP
Japan
Prior art keywords
query
score
click log
storage means
click
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010097256A
Other languages
Japanese (ja)
Other versions
JP5410359B2 (en
Inventor
Yoshihiko Kazuhara
良彦 数原
Shinji Miyahara
伸二 宮原
Shunsuke Konagai
俊介 小長井
Ryoji Kataoka
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010097256A priority Critical patent/JP5410359B2/en
Publication of JP2011227731A publication Critical patent/JP2011227731A/en
Application granted granted Critical
Publication of JP5410359B2 publication Critical patent/JP5410359B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 高精度なランキング関数生成装置の前段の処理である正解抽出処理における正解DBを生成する際に、ノイズとなるクエリを除去したクリックログを抽出する。
【解決手段】 本発明は、クリックログ記憶手段に含まれるクエリのエントロピー記述量が短いほど高い値になるクエリスコアを求め、クエリスコア記憶手段に格納し、当該クエリスコア記憶手段からスコアが最大のクエリを取得し、該クエリを含むレコードをクリックログ記憶手段から取得して選択クリックログ記憶手段に格納する。これにより、ランキング関数生成のための正解抽出処理において、選択クリックログ記憶手段からランキング関数生成に有益なクエリを選択して正解DBを生成する。
【選択図】 図1
PROBLEM TO BE SOLVED: To extract a click log from which a query that becomes a noise is removed when generating a correct DB in a correct answer extraction process that is a preceding process of a highly accurate ranking function generator.
The present invention obtains a query score having a higher value as the entropy description amount of a query included in a click log storage means is shorter, stores the query score in the query score storage means, and stores the maximum score from the query score storage means. A query is acquired, a record including the query is acquired from the click log storage unit, and stored in the selected click log storage unit. As a result, in the correct answer extraction process for generating the ranking function, a query useful for ranking function generation is selected from the selected click log storage means to generate a correct DB.
[Selection] Figure 1

Description

本発明は、クエリ選択装置及びプログラムに係り、特に、ウェブ検索システムにおいて、検索結果のランキングを実現するためのスコアを算出するランキング関数を自動的に生成するためのクエリ選択装置及びプログラムに関する。   The present invention relates to a query selection device and a program, and more particularly, to a query selection device and a program for automatically generating a ranking function for calculating a score for realizing a ranking of search results in a web search system.

図7は、従来のランキング関数生成システムの構成を示す。   FIG. 7 shows a configuration of a conventional ranking function generation system.

従来技術の概要を簡単に述べる。   An outline of the prior art will be briefly described.

ランキング関数生成システムは、Webページデータベース(DB)10、クリックログDB110、正解DB30、特徴DB40、特徴抽出装置20、正解抽出装置120、ランキング関数生成装置90から構成される。   The ranking function generation system includes a Web page database (DB) 10, a click log DB 110, a correct answer DB 30, a feature DB 40, a feature extraction device 20, a correct answer extraction device 120, and a ranking function generation device 90.

WebページDB10には、図8に示すように、検索対象となるWebページの情報(ページ識別子、URL、本文)が格納されている。   As shown in FIG. 8, the Web page DB 10 stores information (page identifier, URL, text) of a Web page to be searched.

クリックログDB110には、図9に示すように入力されたクエリに対して提示された検索結果のうち、クリックされた文書の情報(ページ識別子)が格納されている。   The click log DB 110 stores information (page identifier) of the clicked document among the search results presented for the input query as shown in FIG.

正解データベース30には、図10に示すように、各クエリに対して、各ページのランキング情報が格納されている。   As shown in FIG. 10, the correct answer database 30 stores ranking information of each page for each query.

正解抽出装置120は、クリックログDB110を入力として、正解DB30を生成する。正解DB30を生成する手法として、クエリ・文書ペアに対するクリックログを全て足しこむことによって得られる総クリック数を用いる(例えば、非特許文献2参照)。   The correct answer extraction device 120 receives the click log DB 110 and generates a correct answer DB 30. As a method for generating the correct DB 30, the total number of clicks obtained by adding all the click logs for the query / document pair is used (for example, see Non-Patent Document 2).

特徴抽出装置20は、正解DB30とWebページDB10を入力として、特徴を抽出し(例えば、非特許文献2参照)、特徴DB40を生成する。特徴DB40の例を図11に示す。具体的にはクエリが当該ウェブページに何回出現するか、という単語頻度 (Term Frequency; TF) や、当該ウェブページの重要度のようなものを特徴と呼び、その値を特徴値と呼ぶ。また、ある検索クエリにおいてウェブページが何回クリックされたかといったクリックログを用いた情報を用いることができる。ここで、クリックログとは検索システムのログのことで、ユーザが入力した検索クエリの検索結果に対して、ユーザのクリック情報を記録したものである。   The feature extraction apparatus 20 receives the correct DB 30 and the Web page DB 10 as inputs, extracts features (see, for example, Non-Patent Document 2), and generates a feature DB 40. An example of the feature DB 40 is shown in FIG. Specifically, a word frequency (Term Frequency; TF) indicating how many times a query appears on the web page and the importance of the web page are called features, and the value is called a feature value. Further, information using a click log such as how many times a web page is clicked in a certain search query can be used. Here, the click log is a log of the search system, and records the user's click information for the search result of the search query input by the user.

特徴DB40と正解DB30を元に、ランキング関数生成装置90において、ランキング関数を生成する。ランキング関数生成機能としては、非特許文献2などが挙げられ、その実装としては非特許文献3などが挙げられる。   Based on the feature DB 40 and the correct answer DB 30, the ranking function generation device 90 generates a ranking function. Examples of the ranking function generation function include Non-Patent Document 2 and the like, and implementation thereof includes Non-Patent Document 3 and the like.

Z. Dou、 R. Song、 X. Yuan and J.-R. Wen: Are click-through data adequate for learning web search rankings? In Proceedings of the 17th ACM Conference on Information and Knowledge Management (CIKM), pp.73-83, 2008.Z. Dou, R. Song, X. Yuan and J.-R. Wen: Are click-through data adequate for learning web search rankings? In Proceedings of the 17th ACM Conference on Information and Knowledge Management (CIKM), pp.73 -83, 2008. T. Joachims、 Optimizing Search Engines Using Clickthrough Data、 Proceedings of the ACM Conference on Knowledge Discovery and Data Mining (KDD)、 ACM、 2002T. Joachims, Optimizing Search Engines Using Clickthrough Data, Proceedings of the ACM Conference on Knowledge Discovery and Data Mining (KDD), ACM, 2002 svm_rank (http://www.cs.cornell.edu/People/tj/svm_light/svm_rank.html)svm_rank (http://www.cs.cornell.edu/People/tj/svm_light/svm_rank.html)

しかしながら、上記従来技術のクリックログDB110の中には、アダルトクエリのように検索結果の適合性に関わらず多数の検索結果をクリックされるようなログが含まれており、このようなクリックログの情報はランキング関数生成に悪影響を与えると推察される。   However, the click log DB 110 of the above prior art includes a log in which many search results are clicked regardless of the suitability of the search results, such as an adult query. Information is presumed to have an adverse effect on ranking function generation.

本発明は、上記の点に鑑みなされたもので、ランキング関数生成に有益なクエリを選択することで、高精度なランキング関数生成が可能なクエリ選択装置及びプログラムを提供することを目的とする。   The present invention has been made in view of the above points, and an object of the present invention is to provide a query selection device and a program capable of generating a ranking function with high accuracy by selecting a query useful for ranking function generation.

図1は、本発明の原理構成図である。   FIG. 1 is a principle configuration diagram of the present invention.

本発明(請求項1)は、ランキング関数生成のための正解データベースを生成するために用いるクエリを選択するためのクエリ選択装置であって、
検索ログを元に入力クエリとユーザによってクリックされた文書の情報を格納するクリックログ記憶手段110と、
クリックログ記憶手段110に含まれるクエリのエントロピー記述量が短いほど高い値になるクエリスコアを求め、クエリスコア記憶手段160に格納するクエリスコア計算手段150と、
クエリスコア記憶手段160からスコアが最大のクエリを取得し、該クエリを含むレコードをクリックログ記憶手段110から取得して選択クリックログ記憶手段140に格納するクエリ選択手段130と、を有する。
The present invention (Claim 1) is a query selection device for selecting a query used to generate a correct database for generating a ranking function,
Click log storage means 110 for storing an input query and information of a document clicked by a user based on a search log;
A query score calculation unit 150 that obtains a query score that increases as the entropy description amount of the query included in the click log storage unit 110 is short, and stores the query score in the query score storage unit 160;
A query selection unit 130 that acquires a query having the maximum score from the query score storage unit 160, acquires a record including the query from the click log storage unit 110, and stores it in the selection click log storage unit 140.

また、本発明(請求項2)は、請求項1のクエリスコア計算手段150は、
クリックログ記憶手段110からクエリによって検索された文書数を取得し、文書空間内における情報量、該クエリの該クリックログ記憶手段110における出現確率、及び該クエリによって文書がクリックされた頻度を該クエリにおけるクリック総数で除した値から求められたクリックエントロピーを用いて、クエリスコアを求める手段を含む。
In the present invention (claim 2), the query score calculation means 150 of claim 1
The number of documents searched by the query is acquired from the click log storage unit 110, and the amount of information in the document space, the appearance probability of the query in the click log storage unit 110, and the frequency at which the document is clicked by the query are obtained. Means for obtaining a query score using the click entropy obtained from the value divided by the total number of clicks.

本発明(請求項3)は、請求項1または2に記載のクエリ選択装置を構成する各手段としてコンピュータを機能させるためのクエリ選択プログラムである。   The present invention (Claim 3) is a query selection program for causing a computer to function as each means constituting the query selection apparatus according to Claim 1 or 2.

上記のように、クリックログDBに含まれるログ全てを用いるのではなく、クエリ選択装置により予めノイズとなるクエリを除去し、ランキング関数生成に有益なクエリを選択することで、高精度なランキング関数を生成することができる。   As described above, it is not necessary to use all the logs included in the click log DB, but the query selection device removes queries that cause noise in advance and selects a query that is useful for ranking function generation. Can be generated.

本発明の原理構成図である。It is a principle block diagram of this invention. 本発明の一実施の形態におけるシステム構成図である。1 is a system configuration diagram according to an embodiment of the present invention. 本発明の一実施の形態におけるクエリスコアDBの例である。It is an example of query score DB in one embodiment of this invention. 本発明の一実施の形態における選択クリックログDBの例である。It is an example of the selection click log DB in one embodiment of the present invention. 本発明の一実施の形態におけるクエリスコア計算分処理のフローチャートである。It is a flowchart of the query score calculation part process in one embodiment of this invention. 本発明の一実施の形態におけるクエリ選択部の処理のフローチャートである。It is a flowchart of the process of the query selection part in one embodiment of this invention. 従来のランキング関数生成技術におけるランキング関数生成システムの構成図である。It is a block diagram of the ranking function generation system in the conventional ranking function generation technique. 従来のランキング関数生成システムにおけるWebページDBの例である。It is an example of Web page DB in the conventional ranking function generation system. 従来のランキング関数生成システムにおけるクリックログDBの例である。It is an example of the click log DB in the conventional ranking function generation system. 従来のランキング関数生成システムにおける正解DBの例である。It is an example of correct answer DB in the conventional ranking function generation system. 従来のランキング関数生成システムにおける特徴DBの例である。It is an example of characteristic DB in the conventional ranking function generation system.

以下図面と共に、本発明の実施の形態を説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図2は、本発明の一実施の形態におけるシステム構成を示す。   FIG. 2 shows a system configuration in an embodiment of the present invention.

同図において、図7の構成と同一構成要素については同一符号を付し、その説明を省略する。   In the figure, the same components as those in FIG. 7 are denoted by the same reference numerals, and description thereof is omitted.

従来手法ではクリックログDB110を正解抽出装置120の入力として正解DB30を生成していたが、本発明では選択クリックログDB140を用いて正解DB30を生成する点が異なる。   In the conventional method, the correct log DB 30 is generated using the click log DB 110 as an input to the correct answer extracting device 120. However, the present invention is different in that the correct DB 30 is generated using the selected click log DB 140.

まず、クエリ選択装置100の概要を述べる。   First, an overview of the query selection device 100 will be described.

クエリ選択装置100は、クエリスコア計算部150、クエリ選択部130、クエリスコアDB160を有する。   The query selection device 100 includes a query score calculation unit 150, a query selection unit 130, and a query score DB 160.

クエリスコアDB160は、クエリがどれだけランキング関数生成に有益であるかという情報を保持しており、図3に示すように、クリックログDB110に保持されたクエリ全てについてスコアを格納している。   The query score DB 160 holds information about how useful the query is for generating the ranking function, and stores the scores for all the queries held in the click log DB 110 as shown in FIG.

クエリスコア計算部150は、クリックログDB110を入力として、クエリ毎のスコアを算出してクエリスコアDB160に出力する。詳細については後述する。   The query score calculation unit 150 receives the click log DB 110 as an input, calculates a score for each query, and outputs it to the query score DB 160. Details will be described later.

クエリ選択部130は、クエリスコアDB130に格納されたスコア情報を元に、予め設定されたクエリ数のクリックログ情報を選択クリックログDB140に出力する。選択クリックログDB140に格納されるデータの例を図4に示す。選択クリックログDB140が保持するデータ構造はクリックログDB110と本質的に同じであるため、選択クリックログDB140を用いて従来技術と同じ枠組みでランキング関数生成を行うことも可能である。   The query selection unit 130 outputs click log information of a preset number of queries to the selected click log DB 140 based on the score information stored in the query score DB 130. An example of data stored in the selected click log DB 140 is shown in FIG. Since the data structure held by the selected click log DB 140 is essentially the same as that of the click log DB 110, it is possible to generate a ranking function using the selected click log DB 140 in the same framework as the conventional technology.

以下に、クエリスコア計算部150の詳細と処理の流れについて述べる。   The details of the query score calculation unit 150 and the flow of processing will be described below.

図5は、本発明の一実施の形態におけるクエリスコア計算部の処理のフローチャートである。   FIG. 5 is a flowchart of the process of the query score calculation unit according to the embodiment of the present invention.

ステップ11) クリックログDB110に含まれる文書総数を取得し、これをDtotalとしメモリ(図示せず)に格納する。 Step 11) The total number of documents included in the click log DB 110 is acquired, and this is stored as D total in a memory (not shown).

ステップ12) クリックログDB110に含まれるクエリ総数を取得し、これをQtotalとし、メモリ(図示せず)に格納する。 Step 12) The total number of queries included in the click log DB 110 is acquired, and this is set as Q total and stored in a memory (not shown).

ステップ13) クリックログDB110に未処理のクエリが含まれる場合は、ステップ14に移行し、そうでない場合は処理を終了する。   Step 13) If the unprocessed query is included in the click log DB 110, the process proceeds to step 14, and if not, the process ends.

ステップ14) クリックログDB110から未処理のクエリqを取得する。   Step 14) An unprocessed query q is acquired from the click log DB 110.

ステップ15) クエリqによって検索された文書数D(q)を取得し、ステップ11で取得した文書総数Dtotalを用いて、文書空間内における情報量h(p)を以下の式により計算し、メモリ(図示せず)に格納する。 Step 15) Obtain the number of documents D (q) retrieved by the query q, calculate the information amount h (p) in the document space using the total number of documents D total obtained in Step 11 by the following formula, Store in a memory (not shown).

Figure 2011227731
で計算される。ここでpは、
Figure 2011227731
Calculated by Where p is

Figure 2011227731
を用いて求めることができる。
Figure 2011227731
Can be obtained using

ステップ16) クエリqのクリックログDB110における出現頻度|q|を取得し、クエリ出現確率pを、ステップ12で取得したQtotalを用いて次のように計算し、メモリ(図示せず)に格納する。 Step 16) The appearance frequency | q | in the click log DB 110 of the query q is acquired, and the query appearance probability p q is calculated as follows using the Q total acquired in Step 12 and stored in a memory (not shown). Store.

Figure 2011227731
ステップ17) クエリqの検索によってクリックされた文書集合を元にp(d|q)を次のように計算する。
Figure 2011227731
Step 17) Calculate p (d | q) as follows based on the set of documents clicked by the query q.

Figure 2011227731
ここでfreq(d,q)はクエリqによって文書dがクリックされた頻度を表している。分母はクエリqにおけるクリック総数を表している。これを用いて、クリックエントロピーH(p(q))を
Figure 2011227731
Here, freq (d, q) represents the frequency with which the document d is clicked by the query q. The denominator represents the total number of clicks in query q. Using this, click entropy H (p (q))

Figure 2011227731
によって算出し、メモリ(図示せず)に格納する。
Figure 2011227731
And is stored in a memory (not shown).

ステップ18) 上記のステップ15,16,17で得られ、メモリ(図示せず)に格納されているp,p,H(p(q))を取得して、クエリqの一文書あたりの記述長DL(q)、すなわちクエリスコアを以下の式により求める。 Step 18) Obtain p, p q , H (p (q)) obtained in the above steps 15, 16, and 17 and stored in a memory (not shown) to obtain the query q per document. The description length DL (q), that is, the query score is obtained by the following equation.

Figure 2011227731
上記の式で算出されたクエリスコアDL(q)をクエリスコアDB160に書き出し、ステップ13に移行する。
Figure 2011227731
The query score DL (q) calculated by the above formula is written in the query score DB 160, and the process proceeds to step 13.

次に、クエリ選択部130の処理の流れについて説明する。   Next, the processing flow of the query selection unit 130 will be described.

図6は、本発明の一実施の形態におけるクエリ選択部の処理のフローチャートである。   FIG. 6 is a flowchart of the process of the query selection unit according to the embodiment of the present invention.

ステップ21) クエリ選択部130は、選択するクエリの総数Qselectを設定する。 Step 21) The query selection unit 130 sets a total number Q select of queries to be selected.

ステップ22) 選択済みのクエリ数S > Qselectの場合、処理を終了する。それ以外の場合、ステップ23に移行する。 Step 22) If the number of selected queries S> Q select , the process is terminated. Otherwise, the process proceeds to step 23.

ステップ23) クエリスコアDB160から未選択であり、スコアが最大のクエリqを取得する。   Step 23) A query q that is not selected from the query score DB 160 and has the maximum score is acquired.

ステップ24) クリックログDB110からクエリqを含むレコードを取得し、選択クリックログDB140に出力し、ステップ22に移行する。   Step 24) Acquire a record including the query q from the click log DB 110, output it to the selected click log DB 140, and proceed to Step 22.

以上の処理によって、選択クリックログDB140を生成することができるため、正解抽出装置120においてノイズとなるクエリを除去した有益なクエリを用いて正解DB30を生成することが可能となる。これにより、ランキング関数生成装置90では、当該正解DB30を用いて効率のよいランキング関数を生成することが可能となる。   Since the selected click log DB 140 can be generated by the above processing, the correct answer DB 30 can be generated using a useful query in which a query that causes noise is removed in the correct answer extracting device 120. As a result, the ranking function generation device 90 can generate an efficient ranking function using the correct answer DB 30.

なお、上記のクエリ選択装置100の動作をプログラムとして構築し、クエリ選択装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。   Note that the operation of the query selection device 100 described above can be constructed as a program, installed in a computer used as the query selection device, executed, or distributed via a network.

また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。   Further, the constructed program can be stored in a portable storage medium such as a hard disk, a flexible disk, or a CD-ROM, and can be installed or distributed in a computer.

なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.

10 WebページDB
20 特徴抽出装置
30 正解DB
40 特徴DB
90 ランキング関数生成装置
100 クエリ選択装置
110 クロックログ記憶手段、クリックログDB
120 正解抽出装置
130 クエリ選択手段、クエリ選択部
140 選択クリックログ記憶手段、選択クリックログDB
150 クエリスコア計算手段、クエリスコア計算部
160 クエリスコア記憶手段、クエリスコアDB
10 Web page DB
20 Feature Extractor 30 Correct DB
40 Feature DB
90 ranking function generation device 100 query selection device 110 clock log storage means, click log DB
120 correct answer extraction device 130 query selection means, query selection unit 140 selected click log storage means, selected click log DB
150 Query score calculation means, query score calculation section 160 Query score storage means, query score DB

Claims (3)

ランキング関数生成のための正解データベースを生成するために用いるクエリを選択するためのクエリ選択装置であって、
検索ログを元に入力クエリとユーザによってクリックされた文書の情報を格納するクリックログ記憶手段と、
前記クリックログ記憶手段に含まれるクエリのエントロピー記述量が短いほど高い値になるクエリスコアを求め、クエリスコア記憶手段に格納するクエリスコア計算手段と、
前記クエリスコア記憶手段からスコアが最大のクエリを取得し、該クエリを含むレコードを前記クリックログ記憶手段から取得して選択クリックログ記憶手段に格納するクエリ選択手段と、
を有することを特徴とするクエリ選択装置。
A query selection device for selecting a query used to generate a correct database for generating a ranking function,
Click log storage means for storing the input query and information of the document clicked by the user based on the search log;
A query score calculating means for obtaining a query score that is higher as the entropy description amount of the query included in the click log storing means is shorter, and storing the query score in the query score storing means;
Query selection means for obtaining a query having the maximum score from the query score storage means, obtaining a record including the query from the click log storage means, and storing it in the selected click log storage means;
A query selection device characterized by comprising:
前記クエリスコア計算手段は、
前記クリックログ記憶手段からクエリによって検索された文書数を取得し、文書空間内における情報量、該クエリの該クリックログ記憶手段における出現確率、及び該クエリによって文書がクリックされた頻度を該クエリにおけるクリック総数で除した値から求められたクリックエントロピーを用いて、前記クエリスコアを求める手段を含む
請求項1記載のクエリ選択装置。
The query score calculation means includes
The number of documents searched by the query is acquired from the click log storage means, and the amount of information in the document space, the appearance probability of the query in the click log storage means, and the frequency that the document was clicked by the query are obtained in the query. The query selection device according to claim 1, further comprising means for obtaining the query score using click entropy obtained from a value divided by the total number of clicks.
請求項1または2に記載のクエリ選択装置を構成する各手段としてコンピュータを機能させるためのクエリ選択プログラム。   The query selection program for functioning a computer as each means which comprises the query selection apparatus of Claim 1 or 2.
JP2010097256A 2010-04-20 2010-04-20 Query selection apparatus and program Active JP5410359B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010097256A JP5410359B2 (en) 2010-04-20 2010-04-20 Query selection apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010097256A JP5410359B2 (en) 2010-04-20 2010-04-20 Query selection apparatus and program

Publications (2)

Publication Number Publication Date
JP2011227731A true JP2011227731A (en) 2011-11-10
JP5410359B2 JP5410359B2 (en) 2014-02-05

Family

ID=45042997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010097256A Active JP5410359B2 (en) 2010-04-20 2010-04-20 Query selection apparatus and program

Country Status (1)

Country Link
JP (1) JP5410359B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2021234775A1 (en) * 2020-05-18 2021-11-25

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236345A (en) * 2005-02-25 2006-09-07 Microsoft Corp System and method for learning data ranking functions
US20080059508A1 (en) * 2006-08-30 2008-03-06 Yumao Lu Techniques for navigational query identification
US20090313286A1 (en) * 2008-06-17 2009-12-17 Microsoft Corporation Generating training data from click logs
JP2009294836A (en) * 2008-06-04 2009-12-17 Yahoo Japan Corp Search processing device, method and program in which pseudo feedback processing is selectively applied in web search
US20090327270A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Using Variation in User Interest to Enhance the Search Experience
JP2010033377A (en) * 2008-07-29 2010-02-12 Yahoo Japan Corp Search device for automatically estimating search request attribute to web query, and retrieving method and program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006236345A (en) * 2005-02-25 2006-09-07 Microsoft Corp System and method for learning data ranking functions
US20080059508A1 (en) * 2006-08-30 2008-03-06 Yumao Lu Techniques for navigational query identification
JP2009294836A (en) * 2008-06-04 2009-12-17 Yahoo Japan Corp Search processing device, method and program in which pseudo feedback processing is selectively applied in web search
US20090313286A1 (en) * 2008-06-17 2009-12-17 Microsoft Corporation Generating training data from click logs
US20090327270A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Using Variation in User Interest to Enhance the Search Experience
JP2010033377A (en) * 2008-07-29 2010-02-12 Yahoo Japan Corp Search device for automatically estimating search request attribute to web query, and retrieving method and program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSND200900734015; 岡野原大輔: '第3章 高度な検索技術 ランキング、性能評価、大規模検索、リアルタイム検索' WEB+DB PRESS 第53巻, 20091125, p.119-127, (株)技術評論社 *
JPN6013052765; 岡野原大輔: '第3章 高度な検索技術 ランキング、性能評価、大規模検索、リアルタイム検索' WEB+DB PRESS 第53巻, 20091125, p.119-127, (株)技術評論社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2021234775A1 (en) * 2020-05-18 2021-11-25
WO2021234775A1 (en) * 2020-05-18 2021-11-25 日本電信電話株式会社 Ranking function generation device, ranking function generation method, and program
JP7355237B2 (en) 2020-05-18 2023-10-03 日本電信電話株式会社 Ranking function generation device, ranking function generation method and program

Also Published As

Publication number Publication date
JP5410359B2 (en) 2014-02-05

Similar Documents

Publication Publication Date Title
JP5078674B2 (en) Analysis system, information processing apparatus, activity analysis method, and program
JP6487201B2 (en) Method and apparatus for generating recommended pages
JP6266080B2 (en) Method and system for evaluating matching between content item and image based on similarity score
JP5727512B2 (en) Cluster and present search suggestions
JP5340751B2 (en) Document processing apparatus and document processing method
US7519588B2 (en) Keyword characterization and application
US20110314011A1 (en) Automatically generating training data
US20140358911A1 (en) Search and discovery system
CN102016787A (en) Determining relevant information for domains of interest
CN109960721B (en) Constructing content based on multiple compression of source content
US20130297621A1 (en) Decomposable ranking for efficient precomputing
KR100954842B1 (en) Web page classification method using category tag information, system and recording medium recording the same
US10956409B2 (en) Relevance model for session search
US20170255653A1 (en) Method for categorizing images to be associated with content items based on keywords of search queries
US20080222138A1 (en) Method and Apparatus for Constructing a Link Structure Between Documents
US20130325852A1 (en) Searching based on an identifier of a searcher
Perea-Ortega et al. Application of text summarization techniques to the geographical information retrieval task
JP4912384B2 (en) Document search device, document search method, and document search program
JP5410359B2 (en) Query selection apparatus and program
JP2010055164A (en) Sentence retrieval device, sentence retrieval method, sentence retrieval program and its storage medium
JP5321258B2 (en) Information collecting system, information collecting method and program thereof
JP6488399B2 (en) Information presentation system and information presentation method
JP2006318398A (en) Vector generation method and apparatus, information classification method and apparatus, program, and computer-readable storage medium storing program
JP2009211429A (en) Information provision method, information provision apparatus, information provision program and recording medium having the program recorded in computer
JP5199968B2 (en) Keyword type determination device, keyword type determination method, and keyword type determination program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121204

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20131001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131106

R150 Certificate of patent or registration of utility model

Ref document number: 5410359

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131126

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350