JP2017168110A - Information processing apparatus, information processing method, and information processing program - Google Patents
Information processing apparatus, information processing method, and information processing program Download PDFInfo
- Publication number
- JP2017168110A JP2017168110A JP2017079037A JP2017079037A JP2017168110A JP 2017168110 A JP2017168110 A JP 2017168110A JP 2017079037 A JP2017079037 A JP 2017079037A JP 2017079037 A JP2017079037 A JP 2017079037A JP 2017168110 A JP2017168110 A JP 2017168110A
- Authority
- JP
- Japan
- Prior art keywords
- model
- prediction model
- information processing
- user
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
【課題】ユーザがユーザ端末を操作して行うインターネット上の行動の予測にかかる計算時間を短縮できる情報処理装置、情報処理方法、および情報処理プログラムを提供する。
【解決手段】情報処理装置1は、ユーザがユーザ端末2を操作して行うインターネット上の行動の実行確率に関する予測値を算出する予測モデルを、ユーザをユーザ情報に基づいてグループ分けしたグループ毎に生成するモデル生成手段23と、予測モデルから、ユーザに適合する予測モデルを選択するモデル選択手段24と、行動から素性情報の値を取得し、モデル選択手段24で選択された予測モデルを用いて、予測値を算出する予測値算出手段25とを備える。モデル選択手段24は、行動に関する素性情報の値と予測モデルとの関係を示す関係情報を用いて、取得された素性情報の値に対応する予測モデルを選択する。
【選択図】図1An information processing apparatus, an information processing method, and an information processing program capable of reducing the calculation time required for predicting behavior on the Internet performed by a user operating a user terminal are provided.
An information processing apparatus includes: a prediction model for calculating a prediction value related to an execution probability of an action on the Internet performed by a user operating a user terminal; and a group of users classified into groups based on user information. Using the prediction model selected by the model selection unit 24, the model generation unit 23 to generate, the model selection unit 24 that selects a prediction model that matches the user from the prediction model, and the value of the feature information is acquired from the behavior. And a predicted value calculating means 25 for calculating a predicted value. The model selection means 24 selects the prediction model corresponding to the acquired feature information value using the relationship information indicating the relationship between the value of the feature information related to the behavior and the prediction model.
[Selection] Figure 1
Description
本発明は、ユーザがユーザ端末を操作して行うインターネット上の行動を予測する情報処理装置、情報処理方法、および情報処理プログラムに関する。 The present invention relates to an information processing apparatus, an information processing method, and an information processing program for predicting behavior on the Internet performed by a user operating a user terminal.
従来、インターネットを介してユーザに広告を提供する情報提供装置が知られている(特許文献1参照)。
このような情報提供装置の中には、広告効果を向上させるため、ウェブページ上でユーザが広告をクリックする確率の予測値を算出し、算出した予測値に応じて広告をユーザに提供するものがある。そして、予測値の算出には、ユーザ属性や、ユーザ属性と広告との関連性等を示す素性情報に基づいて予測値を算出する予測モデルが用いられている。
Conventionally, an information providing apparatus that provides an advertisement to a user via the Internet is known (see Patent Document 1).
Among such information providing devices, in order to improve the advertising effect, a prediction value of the probability that the user clicks the advertisement on the web page is calculated, and the advertisement is provided to the user according to the calculated prediction value There is. And the prediction model which calculates a prediction value based on the feature information which shows a user attribute, the relevance of a user attribute, and an advertisement etc. is used for calculation of a prediction value.
しかしながら、従来は、すべてのユーザに対して共通の予測モデルを用いて予測値が算出されている。このため、予測モデルには、様々な属性を持ったユーザに対応するため、膨大な数の素性情報を盛り込む必要があった。これにより、予測値の計算時間が長くなるという問題があった。 However, conventionally, a predicted value is calculated using a common prediction model for all users. For this reason, in order to cope with users having various attributes, it is necessary to include a huge number of feature information in the prediction model. As a result, there is a problem that the calculation time of the predicted value becomes long.
本発明は、ユーザがユーザ端末を操作して行うインターネット上の行動の予測にかかる計算時間を短縮できる情報処理装置、情報処理方法、および情報処理プログラムを提供することを目的とする。 An object of the present invention is to provide an information processing apparatus, an information processing method, and an information processing program that can reduce a calculation time required for predicting behavior on the Internet performed by a user operating a user terminal.
本発明の情報処理装置は、ユーザがユーザ端末を操作して行うインターネット上の行動の実行確率に関する予測値を算出する予測モデルを、ユーザをユーザ情報に基づいてグループ分けしたグループ毎に生成するモデル生成手段と、前記予測モデルから、ユーザに適合する予測モデルを選択するモデル選択手段と、前記行動から素性情報の値を取得し、前記モデル選択手段で選択された予測モデルを用いて、前記予測値を算出する予測値算出手段と、を備え、前記モデル選択手段は、前記行動に関する素性情報の値と前記予測モデルとの関係を示す関係情報を用いて、取得された素性情報の値に対応する予測モデルを選択することを特徴とする。 The information processing apparatus according to the present invention generates a prediction model for calculating a prediction value related to an execution probability of an action on the Internet performed by a user operating a user terminal for each group in which users are grouped based on user information. A generation unit; a model selection unit that selects a prediction model suitable for a user from the prediction model; and a value of feature information is acquired from the behavior, and the prediction model selected by the model selection unit is used to perform the prediction Prediction value calculation means for calculating a value, and the model selection means corresponds to the value of the acquired feature information by using relationship information indicating a relationship between the value of the feature information related to the behavior and the prediction model. A prediction model to be selected is selected.
本発明では、予測モデルは、ユーザをユーザ情報に基づいてグループ分けしたグループ毎に生成される。これによれば、各予測モデルは、比較的近い属性を持ったユーザに対して予測値を算出することとなるため、予測値の算出に用いられる素性情報の数は、すべてのユーザに対して予測値を算出する場合と比べて低減できる。
そして、本発明では、このようなグループ毎に生成された予測モデルから選択された予測モデルを用いて予測値が算出されるため、すべてのユーザに共通する予測モデルを用いて予測値を算出する場合と比べて、予測値の計算時間を短縮できる。
In the present invention, the prediction model is generated for each group in which users are grouped based on user information. According to this, since each prediction model calculates a predicted value for a user having a relatively close attribute, the number of feature information used for calculating the predicted value is the same for all users. This can be reduced compared to the case of calculating the predicted value.
And in this invention, since a predicted value is calculated using the prediction model selected from the prediction model produced | generated for every such group, a predicted value is calculated using the prediction model common to all the users. Compared to the case, the calculation time of the predicted value can be shortened.
[第1実施形態]
以下、本発明の第1実施形態を図面に基づいて説明する。
[情報処理装置]
図1は、第1実施形態に係る情報処理装置の構成を示す図である。
第1実施形態の情報処理装置1は、コンピュータにより構成され、記憶装置10、および、制御装置20を備えている。情報処理装置1は、複数のユーザ端末2が通信接続可能なネットワーク3に接続されている。
[First Embodiment]
DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, a first embodiment of the invention will be described with reference to the drawings.
[Information processing device]
FIG. 1 is a diagram illustrating the configuration of the information processing apparatus according to the first embodiment.
The information processing apparatus 1 according to the first embodiment is configured by a computer, and includes a
[記憶装置]
記憶装置10は、HDD(Hard Disk Drive)やフラッシュメモリー等により構成され、制御装置20の動作に必要な各種プログラムおよび情報を記憶する。
記憶装置10は、モデル記憶部11、クリック履歴蓄積部12、モデル割当情報記憶部13、関係情報蓄積部14を備える。
[Storage device]
The
The
モデル記憶部11は、ウェブページ上で特定のユーザが特定の広告をクリックする確率(CTR:Click-Through rate)の予測値である予測CTRを算出する予測モデルを記憶する。
予測モデルは、例えば、次式(1)で示される。式(1)において、A,Bは定数を示す。yは、次式(2)で示される。nは変数を示し、Xnは素性情報の数値を示し、Wnは、Xnが予測CTRに貢献する貢献度を決める重み係数を示す。
The
A prediction model is shown by following Formula (1), for example. In the formula (1), A and B are constants. y is shown by following Formula (2). n represents a variable, Xn represents a numerical value of the feature information, and Wn represents a weighting factor that determines a contribution degree by which Xn contributes to the predicted CTR.
素性情報は、ユーザや広告に関する様々な情報であり、例えば、ユーザ属性や、配信対象のページと広告の類似度や、ユーザ属性と広告の関連性や、広告そのものの情報や、過去の配信実績等を示す情報である。
なお、予測モデルは、クリック確率に関する予測値を求めるものであれば、クリック確率そのものを求めるものでなくてもよい。例えば、式(2)で示されるyを求めるものであってもよい。
The feature information is various information related to the user and the advertisement. For example, the user attribute, the similarity between the delivery target page and the advertisement, the relevance between the user attribute and the advertisement, the information of the advertisement itself, and the past delivery results. It is information which shows etc.
In addition, as long as the prediction model calculates | requires the predicted value regarding a click probability, it does not need to calculate the click probability itself. For example, y indicated by the expression (2) may be obtained.
ここで、モデル記憶部11には、ユーザをユーザ属性に基づいてグループ分けしたグループ毎に生成された予測モデル(局所モデルとも称す)と、すべてのグループに共通する共通の予測モデル(共通モデルとも称す)とが記憶される。
例えば、局所モデルとしては、主婦のグループを対象として生成される主婦モデルや、富裕層のグループを対象として生成されるリッチモデル等が例示できる。
Here, the
For example, examples of the local model include a housewife model generated for a housewife group, a rich model generated for a wealthy group, and the like.
クリック履歴蓄積部12(本発明の行動履歴蓄積部を構成)は、過去にユーザが所定のウェブページにアクセスした際の、配信広告のクリック結果を示すクリック履歴(本発明の行動履歴を構成)を蓄積する。クリック履歴には、ユーザID(IDentifiers:識別情
報)、ウェブページID、広告ID、クリックの有無、クリック日時等の情報が含まれる。
ここで、クリック履歴蓄積部12には、クリック履歴が、局所モデルおよび共通モデルのいずれかの予測モデルが対応付けられて蓄積される。
The click history accumulation unit 12 (which constitutes the action history accumulation unit of the present invention) is a click history indicating the click result of the distributed advertisement when the user has accessed a predetermined web page in the past (configures the action history of the present invention). Accumulate. The click history includes information such as user ID (IDentifiers: identification information), web page ID, advertisement ID, presence / absence of click, and click date / time.
Here, the click
モデル割当情報記憶部13は、ユーザIDと、後述するモデル割当処理によってユーザに対して割り当てられた予測モデルとが関係付けられたモデル割当情報を記憶する。
The model assignment
関係情報蓄積部14は、後述するモデル割当処理によって取得される素性情報の値と、当該モデル割当処理によって割り当てられた予測モデルとが関係付けられた関係情報を蓄積する。
The relationship
[制御装置]
制御装置20は、情報処理装置1の動作を制御するものであり、CPU(Central Processing Unit)等の演算装置により構成されている。
制御装置20は、演算装置が記憶装置10に記憶された情報処理プログラムを実行することにより、モデル割当手段21、クリック履歴蓄積制御手段22、モデル生成手段23、モデル選択手段24、予測値算出手段25、配信手段26として機能する。
[Control device]
The
In the
モデル割当手段21は、ユーザ毎に、共通モデルおよびグループ毎に生成された局所モデルから、ユーザに適合する予測モデルを割り当てる。また、ユーザと割り当てた予測モデルとを関係付けたモデル割当情報をモデル割当情報記憶部13に格納する。
また、モデル割当手段21は、ユーザ毎に、クリック履歴蓄積部12から、蓄積されたクリック履歴を読み出し、読み出したクリック履歴に基づいて素性情報の値を取得する。そして、取得した素性情報の値と、割り当てた予測モデルとを関係付けた関係情報を、関係情報蓄積部14に蓄積する。
The model assigning means 21 assigns a prediction model suitable for the user from the common model and the local model generated for each group for each user. In addition, model assignment information that associates the user with the assigned prediction model is stored in the model assignment
Further, the model assigning means 21 reads the accumulated click history from the click
クリック履歴蓄積制御手段22(本発明の行動履歴蓄積制御手段を構成)は、ユーザが所定のウェブページにアクセスした際に得られる配信広告のクリック履歴を取得すると、取得したクリック履歴を、後述するモデル選択手段24で選択された予測モデルに対応付けてクリック履歴蓄積部12に蓄積する。
When the click history accumulation control means 22 (which constitutes the action history accumulation control means of the present invention) acquires the click history of the distribution advertisement obtained when the user accesses a predetermined web page, the acquired click history will be described later. The click
モデル生成手段23は、各予測モデルを、クリック履歴蓄積部12に蓄積されている対応するクリック履歴に基づいて生成し、モデル記憶部11に格納する。
具体的には、モデル生成手段23は、蓄積されたクリック履歴に基づいて、素性情報の値とクリック実績との組を多数取得して、予測CTRに対する素性情報の貢献度(Wn)を学習し、予測モデルを生成する。
ここで、モデル生成手段23は、定期的に予測モデルを生成し、新たに生成した予測モデルをモデル記憶部11に上書きして格納する。
The
Specifically, the
Here, the
モデル選択手段24は、モデル割当情報記憶部13に記憶されたモデル割当情報、または、関係情報蓄積部14に蓄積された関係情報に基づいて、ユーザに適合する予測モデルを選択する。
The
予測値算出手段25は、ユーザが所定のウェブページにアクセスしたことを示すページアクセス情報を取得すると、モデル選択手段24で選択された予測モデルを用いて、配信候補の広告毎に予測CTRを算出する。
When the predicted
配信手段26は、予測値算出手段25で算出された予測CTRに基づいて、ユーザに配信する広告を決定して配信する。
例えば、配信候補の広告のうち、予測CTRが最も高い広告をユーザに配信する。
The
For example, an advertisement with the highest predicted CTR among advertisements of distribution candidates is distributed to the user.
[モデル割当処理]
次に、モデル割当処理について説明する。
図2は、モデル割当処理を示すフローチャートである。モデル割当処理は、例えば1週間等の所定期間間隔で実行される。
図2に示すように、モデル割当処理が実行されると、モデル割当手段21は、クリック履歴蓄積部12にクリック履歴が蓄積されているユーザの中から、一人のユーザを選択する(ステップS11)。
[Model assignment process]
Next, the model assignment process will be described.
FIG. 2 is a flowchart showing the model assignment process. The model assignment process is executed at predetermined time intervals such as one week.
As shown in FIG. 2, when the model allocation process is executed, the
次に、モデル割当手段21は、クリック履歴蓄積部12から、選択したユーザの蓄積されたクリック履歴を読み出して取得し(ステップS12)、さらに、取得したクリック履歴に基づいて、素性情報の値を取得する(ステップS13)。 Next, the model assigning means 21 reads and acquires the click history accumulated for the selected user from the click history accumulation unit 12 (step S12), and further, based on the obtained click history, the value of the feature information is obtained. Obtain (step S13).
次に、モデル割当手段21は、モデル記憶部11に記憶されている複数の予測モデルを、取得した素性情報の値を用いてテストし、ユーザに適合する予測モデルを割り当てる(ステップS14)。
具体的には、モデル割当手段21は、各予測モデルに対して、取得した素性情報の値を入力し、予測CTRを算出する。そして、算出した予測CTRと取得したクリック履歴から得られる実績値とを比較することで、複数の予測モデルからユーザに適合する予測モデルを割り当てる。
例えば、モデル割当手段21は、算出した予測CTRが実績値と最も近くなる予測モデルをユーザに割り当てる。
すなわち、モデル割当手段21は、ユーザに対して、局所モデルのいずれかが適合すれば、適合した局所モデルを割り当て、局所モデルがいずれも適合せずに共通モデルが適合すれば、共通モデルを割り当てる。
Next, the
Specifically, the model assigning means 21 inputs the acquired feature information value for each prediction model, and calculates a prediction CTR. Then, by comparing the calculated prediction CTR and the actual value obtained from the acquired click history, a prediction model that matches the user is assigned from a plurality of prediction models.
For example, the
That is, the
次に、モデル割当手段21は、ユーザと、割り当てた予測モデルとを関係付けたモデル割当情報を、モデル割当情報記憶部13に格納する(ステップS15)。なお、ユーザに対応するモデル割当情報が既にモデル割当情報記憶部13に記憶されている場合には、新しいモデル割当情報で古いモデル割当情報を上書きする。
さらに、モデル割当手段21は、取得した素性情報の値と、割り当てた予測モデルとを関係付けた関係情報を、関係情報蓄積部14に蓄積する(ステップS16)。
Next, the
Further, the
次に、モデル割当手段21は、クリック履歴蓄積部12にクリック履歴が蓄積されているユーザをすべて選択したか否かを判定する(ステップS17)。
モデル割当手段21は、ステップS17でNOと判定された場合は、処理をステップS11に戻し、ステップS11〜S17の処理を再度実行する。そして、すべてのユーザが選択され、ステップS17でYESと判定されると、モデル割当処理を終了する。
Next, the
If it is determined NO in step S17, the
[予測処理]
次に、予測処理について説明する。
図3は、予測処理を示すフローチャートである。予測処理は、例えば、ユーザが所定のウェブページにアクセスした際に実行される。
図3に示すように、予測処理が実行されると、予測値算出手段25は、ユーザが所定のウェブページにアクセスしたことを示すページアクセス情報を取得し、取得したページアクセス情報に基づいて、配信候補の広告毎に、素性情報の値を取得する(ステップS21)。
[Prediction processing]
Next, the prediction process will be described.
FIG. 3 is a flowchart showing the prediction process. The prediction process is executed, for example, when the user accesses a predetermined web page.
As illustrated in FIG. 3, when the prediction process is executed, the predicted
次に、予測値算出手段25は、モデル割当情報記憶部13に、対象のユーザのモデル割当情報が記憶されているか否かを判定する(ステップS22)。
ステップS22でYESと判定された場合、モデル選択手段24は、当該モデル割当情報で関係付けられている予測モデル(局所モデルおよび共通モデルのいずれかの予測モデル)を選択する(ステップS23)。
一方、ステップS22でNOと判定された場合、モデル選択手段24は、関係情報蓄積部14が蓄積している関係情報に基づいて、取得した素性情報の値との相関性が高い予測モデルを選択する。
すなわち、モデル選択手段24は、取得した素性情報の値との相関性が高い局所モデルがあれば、その局所モデルを選択し、なければ、共通モデルを選択する。
Next, the predicted value calculation means 25 determines whether or not the model assignment information of the target user is stored in the model assignment information storage unit 13 (step S22).
When it determines with YES by step S22, the model selection means 24 selects the prediction model (predictive model of a local model and a common model) related by the said model allocation information (step S23).
On the other hand, when it is determined NO in step S22, the
That is, if there is a local model having a high correlation with the value of the acquired feature information, the
ステップS23、または、ステップS24の処理の後、予測値算出手段25は、配信候補の広告毎に、ステップS23、または、ステップS24で選択された予測モデルを用いて、取得した素性情報の値に基づいて予測CTRを算出する(ステップS25)。 After the processing of step S23 or step S24, the predicted value calculation means 25 uses the prediction model selected in step S23 or step S24 for each distribution candidate advertisement to set the acquired feature information value. Based on this, a predicted CTR is calculated (step S25).
次に、配信手段26は、配信候補の広告毎に算出された予測CTRに基づいて、ユーザに配信する広告を決定する。例えば、配信手段26は、予測CTRが最も高い広告を、配信広告に決定する。そして、配信手段26は、当該広告をユーザに配信する(ステップS26)。なお、配信される広告は、複数選択されてもよい。
Next, the
次に、クリック履歴蓄積制御手段22は、配信された広告に対するクリック履歴を取得し、取得したクリック履歴を、クリック履歴蓄積部12に蓄積する(ステップS27)。
ここで、クリック履歴蓄積制御手段22は、ステップS23、または、ステップS24で選択された予測モデルが、局所モデルである場合は、取得したクリック履歴を、共通モデル、および、選択された局所モデルに対応付けてクリック履歴蓄積部12に蓄積する。
また、選択された予測モデルが、共通モデルである場合は、取得したクリック履歴を、共通モデルに対応付けてクリック履歴蓄積部12に蓄積する。
そして、制御装置20は、予測処理を終了する。
Next, the click history
Here, when the prediction model selected in Step S23 or Step S24 is a local model, the click history
In addition, when the selected prediction model is a common model, the acquired click history is stored in the click
And the
[第1実施形態の作用効果]
グループ毎に生成された予測モデル(局所モデル)に基づいて予測CTRが算出されるため、共通モデルを用いて予測CTRを算出する場合と比べて、算出に用いる素性情報の数を少なくでき、予測CTRの計算時間を短縮できる。
また、ユーザに適合する局所モデルを用いて予測CTRが算出されるため、様々な属性を持ったユーザを対象とする共通モデルを用いて予測CTRを算出する場合と比べて予測CTRの精度を向上できる。
[Effects of First Embodiment]
Since the prediction CTR is calculated based on the prediction model (local model) generated for each group, the number of feature information used for the calculation can be reduced compared with the case where the prediction CTR is calculated using the common model. CTR calculation time can be shortened.
In addition, since the predicted CTR is calculated using a local model that matches the user, the accuracy of the predicted CTR is improved compared to the case where the predicted CTR is calculated using a common model for users having various attributes. it can.
モデル生成手段23は、予測モデルとして、グループ間で共通する共通モデルを生成する。これによれば、どのグループにも属さないユーザに対しても、共通モデルによって予測CTRを算出できる。 The model generation means 23 generates a common model that is common among groups as a prediction model. According to this, the predicted CTR can be calculated by the common model for users who do not belong to any group.
モデル割当手段21は、グループ毎に生成された予測モデルを、ユーザのクリック履歴を用いてテストすることで、ユーザに適合する予測モデルを割り当てる。そして、モデル選択手段24は、モデル割当手段21がユーザに割り当てた予測モデルを選択する。
これによれば、ユーザのクリック実績に基づいて予測モデルを選択できるため、ユーザに適合する予測モデルを精度よく選択できる。
The
According to this, since a prediction model can be selected based on a user's click performance, a prediction model suitable for the user can be selected with high accuracy.
モデル選択手段24は、モデル割当情報記憶部13にユーザのモデル割当情報がない場合、素性情報の値と予測モデルとが関係付けられた関係情報に基づいて、ユーザに適合する予測モデルを選択する。
これによれば、クリック履歴が蓄積されておらず、モデル割当情報がないユーザに対しても、適合する予測モデルを選択できる。
また、予測モデルをテストする必要がないため、ユーザに適合する予測モデルを直ちに選択でき、かつ、テストにかかる制御装置20の処理負荷を低減できる。
When there is no model assignment information of the user in the model assignment
According to this, it is possible to select a suitable prediction model even for a user who does not accumulate click history and has no model assignment information.
Further, since it is not necessary to test the prediction model, a prediction model suitable for the user can be immediately selected, and the processing load on the
クリック履歴蓄積制御手段22は、ユーザのクリック履歴を、モデル選択手段24で選択された予測モデルに対応付けてクリック履歴蓄積部12に蓄積し、モデル生成手段23は、各予測モデルを、クリック履歴蓄積部12に蓄積された対応するクリック履歴に基づいて生成する。
これによれば、クリック履歴が蓄積されていくに従って、各予測モデルを生成するための学習情報が増加するため、各予測モデルの予測精度を向上できる。
The click history
According to this, since the learning information for generating each prediction model increases as the click history is accumulated, the prediction accuracy of each prediction model can be improved.
各グループは、ユーザ属性に基づいてグループ分けされている。これによれば、例えば、情報処理装置1の管理者が、ユーザ属性とクリック確率との関係を経験から把握していれば、経験に応じて効果的なグループ分けを行うことができる。 Each group is grouped based on user attributes. According to this, for example, if the administrator of the information processing apparatus 1 grasps the relationship between the user attribute and the click probability from experience, effective grouping can be performed according to the experience.
[第2実施形態]
次に、本発明の第2実施形態を図面に基づいて説明する。
第1実施形態では、ユーザのグループは、例えば情報処理装置1の管理者によって予め決定されるが、第2実施形態では、ユーザを、ユーザ情報に基づいて統計的手法であるディリクレ過程を用いて自動的にグループ分けしている。その他の構成は、第1実施形態と同様である。
[Second Embodiment]
Next, 2nd Embodiment of this invention is described based on drawing.
In the first embodiment, a group of users is determined in advance by, for example, an administrator of the information processing apparatus 1, but in the second embodiment, a user is identified using a Dirichlet process that is a statistical method based on user information. Automatically grouped. Other configurations are the same as those of the first embodiment.
図4は、第2実施形態の情報処理装置の構成を示す図である。
図4に示すように、第2実施形態の情報処理装置1Aの制御装置20Aは、第1実施形態と同じモデル割当手段21、クリック履歴蓄積制御手段22、モデル生成手段23、モデル選択手段24、予測値算出手段25、配信手段26に加えて、グループ分け手段27を備える。
FIG. 4 is a diagram illustrating the configuration of the information processing apparatus according to the second embodiment.
As shown in FIG. 4, the
グループ分け手段27は、ユーザを、ユーザに関する情報であるユーザ情報(ユーザ属性や、クリック履歴蓄積部12に蓄積されたクリック履歴の数(ログ数)等)に基づいて、ディリクレ過程を用いてグループ分けする。
ここで、グループ分け手段27は、ディリクレ過程における集まり度を決めるパラメータ(ハイパーパラメータとも称す)の値を複数段階に設定した複数通りのグループ分けを行う。
例えば、ハイパーパラメータの値を、「0.01」、「1」、「100」に設定した3通りのグループ分けを行う。
The
Here, the grouping means 27 performs a plurality of groupings in which values of parameters (also referred to as hyperparameters) that determine the degree of gathering in the Dirichlet process are set in a plurality of stages.
For example, three types of grouping are performed in which the hyperparameter values are set to “0.01”, “1”, and “100”.
そして、本実施形態では、モデル生成手段23は、グループ分け手段27による複数通りのグループ分けのそれぞれに対して、グループ毎に予測モデルを生成し、生成した予測モデルをモデル記憶部11に格納する。
In the present embodiment, the
[第2実施形態の作用効果]
グループ分け手段27は、ユーザを、ユーザ情報に基づいて、統計的手法であるディリクレ過程を用いてグループ分けするため、ユーザ情報に応じて自動的に適切なグループ分けを行うことができる。これにより、情報処理装置1の管理者の経験に依らずに、予測モデルの予測精度を向上できる。
[Effects of Second Embodiment]
Since the grouping means 27 groups users based on the user information using the Dirichlet process, which is a statistical technique, the grouping means 27 can automatically perform appropriate grouping according to the user information. Thereby, the prediction accuracy of the prediction model can be improved without depending on the experience of the administrator of the information processing apparatus 1.
[第3実施形態]
次に本発明の第3実施形態について説明する。
第1実施形態では、モデル割当手段21は、複数の予測モデルを、ユーザのクリック履歴から取得した素性情報の値を用いてテストして、ユーザに適合する予測モデルを割り当てているが、第3実施形態では、モデル割当手段21は、モデル割当処理が最初に実行されてから所定期間は、第1実施形態と同様の方法で予測モデルの割り当てを行い、当該所定期間経過後は、当該所定期間に蓄積された関係情報に基づいて予測モデルの割り当てを行う。その他の構成は、第1実施形態と同様である。
[Third Embodiment]
Next, a third embodiment of the present invention will be described.
In the first embodiment, the model assigning means 21 tests a plurality of prediction models using the value of the feature information acquired from the user's click history and assigns a prediction model suitable for the user. In the embodiment, the
すなわち、本実施形態では、モデル割当処理が最初に実行されてから所定期間(例えば、2週間)までは、ステップS14において、モデル割当手段21は、第1実施形態と同様に、モデル記憶部11に記憶されている複数の予測モデルを、ユーザのクリック履歴から取得した素性情報の値を用いてテストすることで、ユーザに適合する予測モデルを割り当てる。
これにより、ステップS16において、ステップS13で取得された素性情報の値と、ステップS14で割り当てられた予測モデルとが関係付けられた関係情報が、前記所定期間分、関係情報蓄積部14に蓄積される。
In other words, in the present embodiment, until the predetermined period (for example, two weeks) after the model assignment process is first executed, the model assigning means 21 in step S14, the
Thereby, in step S16, the relationship information in which the value of the feature information acquired in step S13 and the prediction model assigned in step S14 are related is stored in the relationship
そして、モデル割当処理が最初に実行されてから前記所定期間経過した後は、ステップS14において、モデル割当手段21は、関係情報蓄積部14に蓄積された前記所定期間分の関係情報における素性情報と予測モデルとの関係の規則性に基づいて、取得した素性情報との相関性が高い予測モデルを抽出してユーザに割り当てる。
Then, after the predetermined period has elapsed since the model allocation process was first executed, in step S14, the
[第3実施形態の作用効果]
モデル割当手段21は、モデル割当処理が最初に実行されてから所定期間経過した後は、関係情報に基づいてユーザに適合する予測モデルを割り当てるため、予測モデルをテストする必要がなく、予測モデルの割り当てに要する計算時間を短縮できる。
[Effects of Third Embodiment]
The
なお、本発明は、上述した実施形態に限定されるものではなく、本発明の目的を達成できる範囲で、以下に示される変形をも含むものである。 In addition, this invention is not limited to embodiment mentioned above, In the range which can achieve the objective of this invention, the deformation | transformation shown below is also included.
[変形例1]
前記各実施形態では、予測モデルは、ユーザが広告をクリックする確率に関する予測値を算出するものであったが、本発明はこれに限定されない。すなわち、ユーザがユーザ端末2を操作して行うインターネット上の行動の実行確率に関する予測値を算出するものであればよい。このような行動としては、商品の購入等が例示できる。
そして、情報処理装置1は、算出した予測値に基づいて、例えば、ユーザに各種レコメンドやサジェスチョンを行ってもよい。
[Modification 1]
In each said embodiment, although the prediction model calculated the predicted value regarding the probability that a user clicks an advertisement, this invention is not limited to this. That is, what is necessary is just to calculate the predicted value regarding the execution probability of the action on the Internet performed by the user operating the
Then, the information processing apparatus 1 may perform various recommendations and suggestions to the user based on the calculated predicted value, for example.
[変形例2]
前記各実施形態では、モデル割当処理は、クリック履歴蓄積部12にクリック履歴が蓄積されているすべてのユーザに対して行われているが、本発明はこれに限定されない。すなわち、一部のユーザに対してのみ行われてもよい。
[Modification 2]
In each of the above embodiments, the model assignment process is performed for all users whose click history is stored in the click
[変形例3]
前記第2実施形態では、グループ分け手段27は、ディリクレ過程を用いてグループ分けを行っていたが、本発明はこれに限定されない。例えば、他の統計的手法を用いてグループ分けを行ってもよい。
[Modification 3]
In the second embodiment, the grouping means 27 performs grouping using the Dirichlet process, but the present invention is not limited to this. For example, grouping may be performed using other statistical methods.
[変形例4]
前記第3実施形態では、モデル割当手段21は、モデル割当処理が最初に実行されてから所定期間までは、複数の予測モデルをユーザのクリック履歴から取得した素性情報の値を用いてテストすることで、ユーザに適合する予測モデルを割り当てているが、本発明はこれに限定されない。例えば、情報処理装置1の管理者の経験等から、予め素性情報と予測モデルとが関係付けられた関係情報を作成しておけば、モデル割当処理が最初に実行されたときから、当該関係情報に基づいて予測モデルを抽出してユーザに割り当ててもよい。
[Modification 4]
In the third embodiment, the
1…情報処理装置、2…ユーザ端末、10…記憶装置、11…モデル記憶部、12…クリック履歴蓄積部、13…モデル割当情報記憶部、14…関係情報蓄積部、1A…情報処理装置、20…制御装置、20A…制御装置、21…モデル割当手段、22…クリック履歴蓄積制御手段、23…モデル生成手段、24…モデル選択手段、25…予測値算出手段、26…配信手段、27…グループ分け手段。
DESCRIPTION OF SYMBOLS 1 ... Information processing apparatus, 2 ... User terminal, 10 ... Storage device, 11 ... Model storage part, 12 ... Click history storage part, 13 ... Model allocation information storage part, 14 ... Relation information storage part, 1A ... Information processing apparatus, DESCRIPTION OF
Claims (7)
前記予測モデルから、ユーザに適合する予測モデルを選択するモデル選択手段と、
前記行動から素性情報の値を取得し、前記モデル選択手段で選択された予測モデルを用いて、前記予測値を算出する予測値算出手段と、を備え、
前記モデル選択手段は、前記行動に関する素性情報の値と前記予測モデルとの関係を示す関係情報を用いて、取得された素性情報の値に対応する予測モデルを選択する
ことを特徴とする情報処理装置。 A model generation means for generating a prediction model for calculating a prediction value related to an execution probability of an action on the Internet performed by a user operating a user terminal for each group into which users are grouped based on user information;
Model selection means for selecting a prediction model suitable for the user from the prediction model;
Obtaining a value of feature information from the behavior, and using a prediction model selected by the model selection unit, and a prediction value calculation unit that calculates the prediction value,
The model selection means selects a prediction model corresponding to the acquired feature information value using relationship information indicating a relationship between the value of the feature information related to the behavior and the prediction model. apparatus.
前記モデル生成手段は、前記予測モデルとして、すべての前記グループに共通する共通モデルを生成する
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 1,
The information processing apparatus, wherein the model generation unit generates a common model common to all the groups as the prediction model.
前記行動の履歴である行動履歴を記憶装置に蓄積する行動履歴蓄積制御手段を備え、
前記行動履歴蓄積制御手段は、前記行動履歴を、前記モデル選択手段で選択された予測モデルに対応付けて前記記憶装置に蓄積し、
前記モデル生成手段は、前記予測モデルを、前記記憶装置に蓄積された対応する行動履歴に基づいて生成する
ことを特徴とする情報処理装置。 The information processing apparatus according to claim 1 or 2,
Comprising an action history accumulation control means for accumulating an action history as a history of the action in a storage device;
The behavior history accumulation control means accumulates the behavior history in the storage device in association with the prediction model selected by the model selection means,
The information processing apparatus, wherein the model generation unit generates the prediction model based on a corresponding action history stored in the storage device.
前記モデル生成手段は、ユーザをユーザ属性に基づいてグループ分けしたグループ毎に前記予測モデルを生成する
ことを特徴とする情報処理装置。 The information processing apparatus according to any one of claims 1 to 3,
The model generation means generates the prediction model for each group in which users are grouped based on user attributes.
統計的手法であるディリクレ過程を用いて、ユーザをユーザ情報に基づいてグループ分けするグループ分け手段を備え、
前記グループ分け手段は、ディリクレ過程における集まり度を決めるパラメータの値を複数段階に設定して、複数通りのグループ分けを行い、
前記モデル生成手段は、前記グループ分け手段による前記複数通りのグループ分けのそれぞれに対して、グループ毎に前記予測モデルを生成する
ことを特徴とする情報処理装置。 The information processing apparatus according to any one of claims 1 to 3,
A grouping means for grouping users based on user information using the Dirichlet process, which is a statistical method,
The grouping means sets a parameter value that determines the degree of gathering in the Dirichlet process in a plurality of stages, performs a plurality of groupings,
The information processing apparatus, wherein the model generation unit generates the prediction model for each group for each of the plurality of groupings by the grouping unit.
ユーザがユーザ端末を操作して行うインターネット上の行動の実行確率に関する予測値を算出する予測モデルを、ユーザをユーザ情報に基づいてグループ分けしたグループ毎に生成し、
前記行動から素性情報の値を取得し、
前記予測モデルから、前記行動に関する素性情報の値と前記予測モデルとの関係を示す関係情報を用いて、取得された素性情報の値に対応する予測モデルを選択し、
選択した予測モデルを用いて、前記予測値を算出する
ことを特徴とする情報処理方法。 An information processing method executed by a computer,
A prediction model for calculating a prediction value related to an execution probability of an action on the Internet performed by a user operating a user terminal is generated for each group in which users are grouped based on user information,
Obtain the value of the feature information from the action,
From the prediction model, using the relationship information indicating the relationship between the value of the feature information related to the behavior and the prediction model, a prediction model corresponding to the value of the acquired feature information is selected,
An information processing method, wherein the predicted value is calculated using a selected prediction model.
ことを特徴とする情報処理プログラム。 An information processing program for causing a computer to function as the information processing apparatus according to any one of claims 1 to 5.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017079037A JP2017168110A (en) | 2017-04-12 | 2017-04-12 | Information processing apparatus, information processing method, and information processing program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017079037A JP2017168110A (en) | 2017-04-12 | 2017-04-12 | Information processing apparatus, information processing method, and information processing program |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2014191931A Division JP6129802B2 (en) | 2014-09-19 | 2014-09-19 | Information processing apparatus, information processing method, and information processing program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2017168110A true JP2017168110A (en) | 2017-09-21 |
Family
ID=59909023
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017079037A Pending JP2017168110A (en) | 2017-04-12 | 2017-04-12 | Information processing apparatus, information processing method, and information processing program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2017168110A (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2023094249A (en) * | 2021-12-23 | 2023-07-05 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
| JP2023094251A (en) * | 2021-12-23 | 2023-07-05 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002149944A (en) * | 2000-11-14 | 2002-05-24 | G Plan Kk | Method of transmitting electronic mail using computer two-way communication network and communication system therefor |
| WO2009060829A1 (en) * | 2007-11-05 | 2009-05-14 | Nec Corporation | Advertisement presentation method, advertisement presentation system, and program |
| JP2010198243A (en) * | 2009-02-24 | 2010-09-09 | Oki Electric Ind Co Ltd | Device and method for action prediction |
| JP2013210940A (en) * | 2012-03-30 | 2013-10-10 | Kddi Corp | Advertisement distribution support device, advertisement distribution device, advertisement distribution method and program |
-
2017
- 2017-04-12 JP JP2017079037A patent/JP2017168110A/en active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002149944A (en) * | 2000-11-14 | 2002-05-24 | G Plan Kk | Method of transmitting electronic mail using computer two-way communication network and communication system therefor |
| WO2009060829A1 (en) * | 2007-11-05 | 2009-05-14 | Nec Corporation | Advertisement presentation method, advertisement presentation system, and program |
| JP2010198243A (en) * | 2009-02-24 | 2010-09-09 | Oki Electric Ind Co Ltd | Device and method for action prediction |
| JP2013210940A (en) * | 2012-03-30 | 2013-10-10 | Kddi Corp | Advertisement distribution support device, advertisement distribution device, advertisement distribution method and program |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2023094249A (en) * | 2021-12-23 | 2023-07-05 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
| JP2023094251A (en) * | 2021-12-23 | 2023-07-05 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
| JP7459040B2 (en) | 2021-12-23 | 2024-04-01 | Lineヤフー株式会社 | Information processing device, information processing method, and information processing program |
| JP7507140B2 (en) | 2021-12-23 | 2024-06-27 | Lineヤフー株式会社 | Information processing device, information processing method, and information processing program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6129802B2 (en) | Information processing apparatus, information processing method, and information processing program | |
| US11010690B2 (en) | Machine learning for determining confidence for reclamation of storage volumes | |
| AU2019202867B2 (en) | Smart advisory for distributed and composite testing teams based on production data and analytics | |
| KR101999471B1 (en) | Information recommendation methods and devices | |
| US20170300497A1 (en) | Cloud Platform Application-Orientated Service Recommendation Method, Device, and System | |
| US9953262B2 (en) | Application recommending method and apparatus | |
| JP2016522475A (en) | Method and device for testing multiple versions | |
| GB2596741A (en) | Method for accessing data records of a master data management system | |
| CN110147514B (en) | Resource display method, device and equipment thereof | |
| US20140379488A1 (en) | Advertisement distribution management apparatus, advertisement distribution system, and advertisement distribution management method | |
| US11822965B2 (en) | Machine learning task compartmentalization and classification | |
| WO2020189371A1 (en) | Parameter tuning apparatus, parameter tuning method, computer program, and recording medium | |
| US20180330001A1 (en) | Method and apparatus for processing user behavior data | |
| AU2019202454A1 (en) | Smart advisory for distributed and composite testing teams based on production data and analytics | |
| CN110389817B (en) | Scheduling method, device and computer readable medium of multi-cloud system | |
| JP2017168110A (en) | Information processing apparatus, information processing method, and information processing program | |
| US20180039901A1 (en) | Predictor management system, predictor management method, and predictor management program | |
| JP7262359B2 (en) | Data analysis device and data analysis method | |
| KR101811212B1 (en) | Method and apparatus for diy usability test | |
| CN114791877A (en) | Recommendation algorithm testing method and advertisement recommendation system | |
| CN113902460A (en) | Method and device for analyzing predictability of goods sales data and computer equipment | |
| US20170344633A1 (en) | Unified classification and ranking strategy | |
| JP2017151731A (en) | Demand amount prediction program, demand amount prediction method, and information processing apparatus | |
| JP7639834B2 (en) | Accuracy calculation program, accuracy calculation method, and information processing device | |
| JP6327950B2 (en) | Predicted value calculation device, predicted value calculation method, and predicted value calculation program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170824 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180821 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181012 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190319 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190513 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20191029 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191112 |