JP2024028005A - Extraction device, extraction method and extraction program - Google Patents
Extraction device, extraction method and extraction program Download PDFInfo
- Publication number
- JP2024028005A JP2024028005A JP2022131298A JP2022131298A JP2024028005A JP 2024028005 A JP2024028005 A JP 2024028005A JP 2022131298 A JP2022131298 A JP 2022131298A JP 2022131298 A JP2022131298 A JP 2022131298A JP 2024028005 A JP2024028005 A JP 2024028005A
- Authority
- JP
- Japan
- Prior art keywords
- user
- operation rate
- content
- users
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、抽出装置、抽出方法及び抽出プログラムに関する。 The present invention relates to an extraction device, an extraction method, and an extraction program.
近年、インターネットを介した情報配信が盛んに行われている。このような情報配信の一例として、配信対象となる広告の類似度や、広告配信先となる利用者の情報等に基づいて、CTR(Click Through Rate)等のクリック率を推定し、推定されたクリック率に応じて、配信対象となる広告を選択する技術が知られている。 In recent years, information distribution via the Internet has become popular. As an example of such information distribution, a click rate such as CTR (Click Through Rate) is estimated based on the similarity of advertisements to be distributed and information on users to whom advertisements are distributed. 2. Description of the Related Art There is a known technology for selecting advertisements to be distributed according to click rate.
例えば、配信対象となる広告の構成要素や広告同士の類似度に基づいて、CTRを予測し、予測したCTRを用いて配信対象となる広告を選択する技術が知られている。また、広告を選択した利用者の属性に基づいて、仮想CTRを算出し、広告の配信先となる利用者の属性と算出した仮想CTRとに応じて、配信対象となる広告を選択する技術が知られている。 For example, a technique is known in which the CTR is predicted based on the constituent elements of advertisements to be distributed or the similarity between advertisements, and the predicted CTR is used to select advertisements to be distributed. In addition, the technology calculates the virtual CTR based on the attributes of the user who selected the advertisement, and selects the advertisement to be distributed according to the attributes of the user to whom the advertisement is distributed and the calculated virtual CTR. Are known.
しかしながら、広告の配信先となる利用者の属性に基づいて広告の配信を行っても、利用者の中には、クリック率が低い利用者が存在するため、広告の構成要素と利用者の属性とに関連性があったとしても、このような利用者への広告の配信は、クリック率の低下につながり易くなる。つまり、配信された広告に対して選択等の操作を行わない利用者は、広告を配信しても広告に対して操作を行う可能性が低いため、広告に対して操作を行わない利用者に対して広告を配信しても、配信した広告の数に対する広告効果が低くなり易くなる。これらのように、配信された広告等のコンテンツに対してクリック等の操作を行わない利用者は、コンテンツを配信してもコンテンツを選択して視認する等の操作を行う可能性が低いため、コンテンツに対して操作を行わない利用者に対してコンテンツを配信しても、配信をする効果が低くなり易くなる。 However, even if advertisements are distributed based on the attributes of the users to whom the advertisements are distributed, some users have low click-through rates, so Even if there is a correlation between the two, distributing advertisements to such users is likely to lead to a decrease in click rate. In other words, users who do not perform operations such as selection on distributed advertisements are unlikely to perform operations on advertisements even if advertisements are distributed, so users who do not perform operations on advertisements On the other hand, even if advertisements are distributed, the advertising effect tends to be low relative to the number of distributed advertisements. As mentioned above, users who do not perform operations such as clicking on distributed content such as advertisements are unlikely to perform operations such as selecting and viewing content even if the content is distributed. Even if content is distributed to users who do not perform operations on the content, the effectiveness of the distribution is likely to be reduced.
本願は、上記に鑑みてなされたものであって、コンテンツの配信効果を高めることのできる利用者を抽出することのできる抽出装置、抽出方法及び抽出プログラムを提供することを目的とする。 The present application has been made in view of the above, and aims to provide an extraction device, an extraction method, and an extraction program that can extract users who can enhance the effectiveness of content distribution.
本願に係る抽出装置は、利用者の行動履歴を取得する取得部と、前記利用者に対して配信をするコンテンツの特徴を特定する特定部と、前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出部と、前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出部と、前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出部と、を有することを特徴とする。 The extraction device according to the present application includes an acquisition unit that acquires the behavior history of a user, a specification unit that identifies the characteristics of content to be distributed to the user, and a determination unit that determines the similarity of the behavior history to the characteristics of the content. a score calculation unit that calculates a similarity score for each user based on the action history; and an operation rate that shows the rate at which the user performed an operation on the content distributed to the user. The present invention is characterized in that it includes an operation rate calculation unit that calculates the operation rate for each user, and an extraction unit that extracts the user with the high operation rate from among the plurality of users who have the high similarity score.
実施形態の一態様によれば、コンテンツの配信効果を高めることのできる利用者を抽出することができる、という効果を奏する。 According to one aspect of the embodiment, it is possible to extract users who can enhance the content distribution effect.
以下に、本願に係る抽出装置、抽出方法及び抽出プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。 EMBODIMENT OF THE INVENTION Below, the extraction apparatus, the extraction method, and the form (henceforth described as an "embodiment") for implementing the extraction program which concern on this application are demonstrated in detail, referring drawings. Note that the extraction device, extraction method, and extraction program according to the present application are not limited to this embodiment. Further, in each of the embodiments below, the same parts are given the same reference numerals, and redundant explanations will be omitted.
[実施形態]
〔1.情報提供装置が表示する処理について〕
まず、図1を用いて、抽出装置の一例となる情報提供装置10が実行する抽出処理の一例について説明する。図1は、実施形態に係る情報提供装置が実行する抽出処理の一例を示す図である。
[Embodiment]
[1. Regarding the processing displayed by the information providing device]
First, an example of an extraction process executed by an
なお、以下の説明では、情報提供装置10が実行する抽出処理として、利用者の行動履歴や広告に関するコンテンツの配信履歴、配信されたコンテンツに対する操作履歴(以下、「ログ」と記載する。)から、利用者の行動履歴とコンテンツの特徴との類似性を算出し、コンテンツを操作する操作率が高い利用者を抽出する処理の一例について記載するが、実施形態は、これに限定されるものではない。情報提供装置10は、ニュースフィードや画像等、任意のコンテンツの配信履歴とコンテンツに対するログから、コンテンツを操作する操作率が高い利用者を抽出してもよい。
In the following explanation, the extraction process executed by the
また、以下の説明において、広告とは、営利若しくは非営利の広告だけではなく、ボランティアの募集、公共広告、公共に対する通知、その他任意のコンテンツを含む概念である。また、広告は、いわゆる広告関連の情報を含むコンテンツのみならず、利用者に興味を抱かせ、任意の対象に関する情報、または、任意の対象と関連するコンテンツ(例えば、ランディングページ等)に含まれる情報を広く報知するものであれば、画像、動画像、テキスト、図形、記号、ハイパーリンク、その他任意のコンテンツがテキストと共に含まれていてよい。 Furthermore, in the following description, advertisement is a concept that includes not only commercial or non-commercial advertisements, but also volunteer recruitment, public advertisements, notifications to the public, and other arbitrary content. In addition, advertisements are not only content that includes so-called advertising-related information, but also information that arouses the user's interest and is included in information about or related to an arbitrary target (for example, a landing page, etc.) Images, moving images, text, graphics, symbols, hyperlinks, and other arbitrary content may be included along with the text as long as the information is widely disseminated.
〔1-1.情報提供装置の一例〕
情報提供装置10は、インターネット等の所定のネットワークN(例えば、図2を参照。)を介して、ログサーバ100や配信サーバ200、利用者が使用する端末装置300と通信可能な情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。なお、情報提供装置10は、ネットワークNを介して、任意の数のログサーバ100や配信サーバ200と通信可能であってもよく、例えば、図示を省略した各種の外部サーバと通信可能であってよい。また、図1では、端末装置300は、1つのみが図示されているが、端末装置300は、ネットワークNを介して多数の端末装置300が通信可能になっている。
[1-1. Example of information providing device]
The
ログサーバ100は、ログを管理するサーバ装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、ログサーバ100は、利用者が端末装置300によってアクセスしたウェブサイト、利用者が使用する端末装置300に配信されたウェブコンテンツ、利用者が使用する端末装置300に配信された広告のコンテンツ、配信されたコンテンツのうち利用者が端末装置300によって選択したコンテンツ、利用者のデモグラフィック属性やサイコグラフィック属性等、コンテンツの配信に伴う各種のログデータを取得、管理する。なお、ログサーバ100が発揮する機能は、周知のログサーバと同様であるものとして、詳細な説明を省略する。
The
配信サーバ200は、利用者が使用する端末装置300に対してコンテンツの配信を行う情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、配信サーバ200は、ウェブコンテンツにアクセスした利用者の各種属性や行動履歴に基づいて、利用者が選択して操作をする可能性が高いコンテンツを選択し、選択したコンテンツの配信を行う。より具体的な例を挙げると、配信サーバ200は、利用者の行動履歴に基づいて広告のリスティングを行い、リスティングの結果選択される広告の配信を行う。
The
端末装置300は、デスクトップ型のPC(Personal Computer)やノート型のPC、スマートフォンやタブレット等のスマートデバイスであり、ネットワークNを介して任意のサーバ装置と通信を行うことができる装置である。端末装置300は、利用者が入力操作を行う入力装置と、利用者に対して出力を行う出力装置とを有している。出力装置は、利用者に対して情報を表示する表示部になっている。入力装置は、例えば、マウスやキーボードが用いられたり、表示部と一体となったタッチパネルが用いられたりしてもよい。
The
ここで、端末装置300は、利用者の操作によりウェブページなどのウェブコンテンツを表示する場合は、ウェブコンテンツの配信を行うウェブサーバに対してウェブコンテンツの配信要求を送信する。かかる場合、端末装置300は、ウェブコンテンツの配信を受け付けると、ウェブコンテンツ内に配置される広告の配信要求を配信サーバ200に送信する。
Here, when displaying web content such as a web page by a user's operation, the
かかる場合、配信サーバ200は広告画像を端末装置300に配信する。そして、端末装置300は、配信サーバ200から受け付けた広告画像をウェブページ内に配置して表示する。また、端末装置300は、カーソルを広告画像とあわせてクリックしたり、広告画像を利用者がタップしたりした場合等、広告画像を選択する操作が行われた場合は、広告画像と対応するランディングページの表示を行うとともに、かかる広告画像が選択された旨の通知を配信サーバ200に送信する。また、これらのように利用者が端末装置300に対して行った操作は、ログデータとしてログサーバ100で取得する。
In such a case, the
〔1-2.抽出処理の一例〕
ここで、利用者が選択等の操作をする可能性が高いコンテンツを配信するため、利用者の属性や行動履歴とコンテンツの特徴とを比較し、利用者の行動履歴に対する関連性が高い特徴を有するコンテンツを、当該利用者に対して配信するといった態様が考えられる。しかしながら、利用者の中には、配信されたコンテンツに対してあまり操作を行わない利用者も存在する。このような、コンテンツに対して操作を行わない利用者は、行動履歴に対して関連性の高いコンテンツが配信されたとしても、選択等の操作をコンテンツに対して行わないため、コンテンツの配信効果が低くなり易くなる。そこで、本実施形態に係る情報提供装置10は、以下の抽出処理を実行する。
[1-2. Example of extraction process]
Here, in order to deliver content that is likely to be selected or otherwise performed by the user, we compare the attributes and behavior history of the user with the features of the content, and select features that are highly relevant to the user's behavior history. A possible mode is to distribute the content that the user has to the user. However, some users do not perform many operations on the distributed content. Such users who do not perform operations on content will not perform operations such as selection on the content even if content that is highly relevant to their behavior history is distributed, so the effectiveness of content distribution will be reduced. becomes low. Therefore, the
〔1-3.利用者の行動履歴について〕
まず、情報提供装置10は、利用者の行動履歴を取得する。この場合における利用者の行動履歴は、例えば、利用者がネットワーク上で検索を行った際の検索キーワードや、利用者が検索結果に基づいて操作を行った際における遷移先ドメインや、ドメインを遷移した際における遷移元ドメインから遷移先ドメインへの流れ等が挙げられる。これらのように取得する利用者の行動履歴は、利用者ごとに設定される利用者の識別情報であるIDに紐づけられる。
[1-3. Regarding user behavior history]
First, the
〔1-4.コンテンツの特徴の特定について〕
また、情報提供装置10は、利用者に対して配信をするコンテンツの特徴を特定する。コンテンツの特徴は、例えば、コンテンツによって示される商品やサービス、イベント情報の属性等のコンテンツによって示される情報の属性や、コンテンツが利用者に対して興味を催させるものであったり購買を促すものであったりする等のコンテンツ自体の属性等が挙げられる。
[1-4. Regarding identification of content characteristics]
Furthermore, the
〔1-5.類似度スコアの算出について〕
また、情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度の度合いを示す類似度スコアを、利用者の行動履歴に基づいて利用者ごとに算出する。類似度スコアは、コンテンツの特徴と利用者の行動履歴との類似度、或いは関連性を、数値化したものになっており、コンテンツの特徴に対する利用者の行動履歴の類似度を、数値の大小に応じて利用者間で比較することができるようにしたものになっている。算出した類似度スコアは、利用者のIDに付与される。また、類似度スコアは、利用者の行動履歴に対して、コンテンツの特徴ごとに算出される。このため、利用者のIDに付与される類似度スコアは、利用者に配信されるコンテンツの特徴ごとに、それぞれのコンテンツの特徴に応じたスコアが付与される。
[1-5. Regarding calculation of similarity score]
Further, the
〔1-6.操作率の算出について〕
また、情報提供装置10は、利用者に配信したコンテンツに対して利用者が操作を行った割合を示す操作率を、利用者ごとに算出する。利用者に配信したコンテンツに対する利用者の操作率としては、例えば、配信されたコンテンツを利用者が選択する率であるクリック率、即ち、CTR(Click Through Rate)が挙げられる。コンテンツに対する利用者の操作率としては、他に、配信されたコンテンツに基づいて購買操作を行う率や、飲食店や宿泊施設、イベント等の予約操作を行う率などが挙げられる。利用者に配信したコンテンツに対する利用者の操作率を算出する際には、コンテンツに対して利用者が行った操作の内容ごとに操作率を算出する。算出した操作率は、コンテンツに対して利用者が行った操作の内容ごとの操作率が、利用者のIDに付与される。
[1-6. Regarding calculation of operation rate]
Further, the
〔1-7.操作率が高い利用者の抽出について〕
また、情報提供装置10は、類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する。例えば、任意のコンテンツに対する任意の操作の操作率が高い利用者を抽出する際には、利用者のIDに付与される、当該コンテンツの特徴に対する類似スコアが高い複数の利用者の中から、当該任意の操作率が高い利用者を抽出する。これを実現するため、情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度スコアについて、複数の利用者のIDに付与されるコンテンツの特徴ごとの類似度スコアを、スコアの高い順にリスト化する。即ち、IDに付与されている類似度スコアがスコアの高い順となる、複数の利用者のIDのリストを作成する。類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する際には、操作率を抽出するコンテンツの特徴に対応する類似度スコアが高い順に作成したIDのリストより、操作率が高い利用者を抽出する。
[1-7. Regarding extraction of users with high operation rate]
Furthermore, the
これにより、複数の利用者に対して広告等のコンテンツを配信する際において、コンテンツに対して興味を示す可能性が高い利用者を抽出することができ、コンテンツを配信した際に利用者がコンテンツを視認したり商品を購入したりする等の、コンテンツの配信効果を高めることができる利用者を抽出することができる。例えば、コンテンツが広告である場合は、コンテンツの配信効果として広告効果を高めることができる。 As a result, when distributing content such as advertisements to multiple users, it is possible to extract users who are likely to be interested in the content. It is possible to extract users who can increase the effectiveness of content distribution, such as by viewing the content or purchasing the product. For example, if the content is an advertisement, the advertising effect can be enhanced as the content distribution effect.
〔1-8.抽出処理の一例について〕
次に、図1を用いて、情報提供装置10が実行する抽出処理の一例について説明する。まず、情報提供装置10は、ログサーバ100で管理されているログデータより、利用者の行動履歴を取得する(ステップS1)。即ち、情報提供装置10は、利用者が端末装置300を用いてネットワーク上で検索を行った際の検索キーワードや、利用者が検索結果に基づいて端末装置300を操作した際における遷移先ドメインや、ドメインを遷移した際における遷移元ドメインから遷移先ドメインへの流れ等を、利用者の行動履歴としてログサーバ100より取得する。これらのように利用者の行動履歴を取得する情報提供装置10は、ログデータに含まれる多数の利用者の行動履歴をそれぞれ取得する。
[1-8. Regarding an example of extraction processing]
Next, an example of the extraction process executed by the
また、情報提供装置10は、利用者に対して配信をするコンテンツの特徴を特定する(ステップS2)。情報提供装置10は、配信サーバ200から配信される予定のあるコンテンツに含まれる情報の分野や種類等のコンテンツの特徴を、コンテンツに基づいて特定する。利用者に対して配信をするコンテンツが広告である場合は、広告で表示する商品やサービスの分野等の広告の特徴を特定する。
Furthermore, the
利用者の行動履歴を取得し、コンテンツの特徴を特定した情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度スコアを算出してリスト化する(ステップS3)。類似度スコアは、コンテンツの特徴ごとに算出する。また、類似度スコアは利用者ごとに算出し、利用者のIDに付与する。このため、利用者のIDには、コンテンツの特徴ごとにコンテンツの特徴に対する類似度スコアが付与される。類似度スコアのリスト化は、各利用者のIDに付与されるコンテンツの特徴ごとの類似度スコアを、コンテンツの特徴ごとにリストにすることにより行われる。
The
つまり、各利用者のIDには、コンテンツの特徴ごとに複数の類似度スコアが付与されているが、これらの類似度スコアのうち、各利用者のIDにおける同じコンテンツの特徴に対する類似度スコアのリストを、IDと対応させたIDリスト50として作成する。各利用者のIDと類似度スコアとを対応させたIDリスト50は、例えば、類似度スコアが高い順にして作成する。これにより、任意のコンテンツの特徴に対する利用者の行動履歴の類似の相対的な度合いを、IDリスト50上で類似度スコア同士を比較することにより判断することを可能にできる。
In other words, each user's ID is assigned multiple similarity scores for each content feature, but among these similarity scores, the similarity score for the same content feature in each user's ID is A list is created as an
IDリスト50を作成したら、情報提供装置10は、配信されたコンテンツに対する利用者の操作率を算出する(ステップS4)。情報提供装置10は、利用者の操作率を、ログサーバ100で管理されているログデータに基づいて、コンテンツの特徴ごとに算出する。つまり、IDリスト50は、コンテンツの特徴ごとに作成されているため、利用者の操作率をコンテンツの特徴ごとに算出することより、IDリスト50に示される類似度スコアに対応する特徴を有するコンテンツの操作率を算出する。この場合におけるコンテンツに利用者の操作率としては、例えば、コンテンツが広告である場合、配信された広告を利用者が選択する率であるクリック率、即ち、CTR(Click Through Rate)が挙げられる。配信されたコンテンツに対する利用者の操作率として広告のクリック率を算出する場合は、利用者ごとにクリック率を算出する。このため、IDリスト50に挙げられるIDごとに、当該IDリスト50に対応する特徴を有する広告のクリック率を算出する。
After creating the
コンテンツに対する利用者の操作率を算出したら、情報提供装置10は、操作率が高い利用者を抽出する(ステップS5)。詳しくは、情報提供装置10は、IDリスト50の中から、類似度スコアが高く、且つ、操作率が高い利用者のIDを抽出する。例えば、IDリスト50における類似度スコアと操作率とにそれぞれ閾値が設定され、類似度スコアが類似度スコアに対して設定される閾値以上で、操作率が操作率に対して設定される閾値以上となる利用者を、操作率が高い利用者として抽出する。つまり、IDリスト50における類似度スコアには、閾値としてScore1が設定され、操作率であるクリック率にはCTR1が設定される場合は、類似度スコアがScore1以上で、クリック率がCTR1以上の複数の利用者のIDを、類似度スコアが高く、且つ、クリック率が高い利用者のIDである高操作率ID55として抽出する。
After calculating the user's operation rate for the content, the
高操作率ID55を抽出したら、抽出した利用者のIDのリストを配信サーバ200に提供する(ステップS6)。つまり、高操作率ID55には、類似度スコアが高く、且つ、クリック率が高い、即ち、操作率が高い複数の利用者のIDであるため、情報提供装置10は、抽出した高操作率ID55のリストを配信サーバ200に提供することにより、類似度スコアが高く、且つ、操作率が高い複数の利用者のIDを提供する。
After extracting the high
高操作率ID55が提供された配信サーバ200は、抽出された利用者に向けてコンテンツを配信する(ステップS7)。つまり、高操作率ID55として抽出された利用者のIDは、コンテンツに対する興味が高く、且つ、クリックして選択を行う等の操作を行う可能性が高いIDになっている。このため、例えば、コンテンツが広告である場合は、高操作率ID55として抽出されたIDを使用する利用者は、広告の内容に対する興味が高く、且つ、広告をクリックして閲覧を行う等の操作を行う可能性が高くなっている。従って、高操作率ID55として抽出されたIDを用いて使用される端末装置300に対して、高操作率ID55が抽出されたIDリスト50の作成に用いられた特徴を有するコンテンツを配信することにより、配信されたコンテンツに対して利用者がクリック等の操作を行う可能性を高めることができる。
The
〔2.情報提供装置の構成〕
以下、上記した情報提供装置10が有する機能構成の一例について説明する。図2は、実施形態に係る情報提供装置の構成例を示す図である。図2に示すように、情報提供装置10は、通信部20、記憶部30及び制御部40を有する。
[2. Configuration of information providing device]
An example of the functional configuration of the
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、ログサーバ100や配信サーバ200、端末装置300との間で情報の送受信を行う。
The communication unit 20 is realized by, for example, a NIC (Network Interface Card). The communication unit 20 is connected to the network N by wire or wirelessly, and transmits and receives information between the
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、利用者データベース31及びコンテンツデータベース32を記憶する。
The
利用者データベース31には、利用者に関する各種の情報が登録される。利用者データベース31には、例えば、「利用者ID」、「利用者特徴情報」、「アクセス先」、「アクセス日時」、「配信コンテンツ」、「検索キーワード」等といった情報が登録されている。 Various types of information regarding users are registered in the user database 31. In the user database 31, for example, information such as "user ID", "user characteristic information", "access destination", "access date and time", "distribution content", "search keyword", etc. is registered.
ここで、「利用者ID」とは、利用者を識別する識別子である。また、「利用者特徴情報」とは、利用者のデモグラフィック属性やサイコグラフィック属性等、コンテンツのリスティングに用いられる各種利用者の特徴である。また、「アクセス先」とは、対応付けられた「利用者ID」が示す利用者がアクセスしたウェブサイト等のアクセス先を示す情報である。また、「アクセス日時」とは、対応付けられた「利用者ID」が示す利用者が対応付けられた「アクセス先」が示すウェブサイト等にアクセスした日時を示す情報である。また、「配信コンテンツ」とは、対応付けられた「利用者ID」が示す利用者が対応付けられた「アクセス先」が示すウェブサイト等にアクセスした際に配信されたコンテンツのコンテンツIDである。また、「検索キーワード」とは、利用者がウェブサイト上で検索を行った際に用いたキーワードである。 Here, the "user ID" is an identifier that identifies a user. Furthermore, "user characteristic information" refers to various user characteristics used in content listing, such as user demographic attributes and psychographic attributes. Further, the "access destination" is information indicating the access destination, such as a website, accessed by the user indicated by the associated "user ID." Furthermore, the "access date and time" is information indicating the date and time when the user indicated by the associated "user ID" accessed the website etc. indicated by the associated "access destination". Furthermore, "distributed content" is the content ID of the content distributed when the user indicated by the associated "user ID" accesses the website etc. indicated by the associated "access destination". . Moreover, the "search keyword" is the keyword used when the user performed a search on the website.
コンテンツデータベース32には、コンテンツに関する各種の情報が登録される。コンテンツデータベース32には、例えば、「コンテンツID」、「コンテンツの種類」、「コンテンツの内容」、「コンテンツのキーワード」等といった情報が登録されている。 Various types of information related to content are registered in the content database 32. In the content database 32, for example, information such as "content ID", "content type", "content content", "content keyword", etc. is registered.
ここで、「コンテンツID」とは、コンテンツを識別する識別子である。また、「コンテンツの種類」は、広告やニュース等、コンテンツの種類を示す情報である。また、「コンテンツの内容」は、コンテンツにより表示される内容についての情報であり、例えば、コンテンツが広告の場合は、広告によって表示される商品の種類の情報であり、コンテンツがニュースの場合は、ニュースのジャンルについての情報である。また、「コンテンツのキーワード」は、コンテンツの内容やジャンルを代表するキーワードについての情報である。 Here, the "content ID" is an identifier that identifies content. Further, "content type" is information indicating the type of content, such as advertisement or news. In addition, "content content" is information about the content displayed by the content. For example, if the content is an advertisement, it is information about the type of product displayed by the advertisement, and if the content is news, it is information about the content displayed by the content. This is information about the genre of news. Furthermore, the "keyword of content" is information about keywords that represent the content or genre of the content.
制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報提供装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
The
制御部40は、取得部41、特定部42、スコア算出部43、操作率算出部44、抽出部45を有する。取得部41は、利用者に関する各種の情報とコンテンツに関する各種の情報とをログサーバ100から取得する。その際に、取得部41は、利用者のIDごとに、利用者の特徴情報やアクセス先、アクセス日時、配信コンテンツ、検索キーワード等を取得し、取得した利用者に関する情報を、利用者のIDに対応付けて利用者データベース31に登録する。これにより、取得部41は、利用者の行動履歴を取得する。つまり、取得部41は、ログサーバ100によって管理されている、利用者が検索を行った際の検索キーワードやアクセス先、アクセス日時、配信コンテンツ等を利用者の行動履歴として取得し、利用者のIDに対応付けて利用者データベース31に登録する。
The
また、取得部41は、コンテンツのIDごとに、コンテンツの種類やコンテンツの内容、コンテンツのキーワード等を取得し、取得したコンテンツに関する情報を、のIDに対応付けてコンテンツデータベース32に登録する。
Further, the
特定部42は、利用者に対して配信をするコンテンツの特徴を特定する。より具体的には、特定部42は、配信サーバ200から配信される予定のあるコンテンツに含まれる情報の分野や種類等のコンテンツの特徴を、コンテンツに基づいて特定する。例えば、特定部42は、コンテンツデータベース32を参照し、コンテンツによって示される商品やサービス、イベント情報の属性等のコンテンツによって示される情報の属性や、コンテンツが利用者に対して興味を催させるものであったり購買を促すものであったりする等のコンテンツ自体の属性等を、コンテンツの特徴として特定する。
The specifying unit 42 specifies the characteristics of content to be distributed to users. More specifically, the identifying unit 42 identifies characteristics of the content, such as fields and types of information included in the content scheduled to be distributed from the
スコア算出部43は、特定部42で特定したコンテンツの特徴に対する、取得部41で取得した利用者の行動履歴の類似度スコアを、利用者の行動履歴に基づいて利用者ごとに算出する。その際に、スコア算出部43は、コンテンツの特徴ごとに利用者の行動履歴の類似度スコアを算出し、算出した類似度スコアをそれぞれ利用者のIDに付与する。さらに、スコア算出部43は、算出した類似度スコアに基づいて利用者のIDのリストを作成する。
The
図3は、利用者のIDリストの模式図である。利用者のIDリスト50は、各利用者のIDに付与されるコンテンツの特徴ごとの類似度スコアを、コンテンツの特徴ごとにリストにすることにより作成する。コンテンツの特徴ごとに、各利用者のIDと類似度スコアとを対応させたIDリスト50は、類似度スコアが高い順にして作成する。これにより、任意のコンテンツの特徴に対する各利用者の行動履歴の類似の相対的な度合いを、利用者同士の間で比較することができ、例えば、相対的に類似度スコアが高い利用者を抽出することができる。
FIG. 3 is a schematic diagram of a user ID list. The
操作率算出部44は、利用者に配信したコンテンツに対する利用者の操作率を、利用者ごとに算出する。例えば、操作率算出部44は、利用者データベース31を参照し、利用者に対して配信されたコンテンツを利用者が選択する率であるクリック率(CTR)や、配信されたコンテンツに基づいて購買操作を行う率や、飲食店や宿泊施設、イベント等の予約操作を行う率を、コンテンツに対する利用者の操作率として算出する。その際に、操作率算出部44は、クリックによってコンテンツを選択する際の操作率や、コンテンツに基づいて商品の購入する際の操作率等をそれぞれ算出することにより、コンテンツに対する操作率を、操作の種類ごとに算出する。また、操作率算出部44は、コンテンツに対する利用者の操作率を、コンテンツの特徴ごとに算出する。算出した操作率は、コンテンツの特徴と、コンテンツに対する操作の種類とを対応づけて利用者にIDに付与し、利用者データベース31に登録する。 The operation rate calculating unit 44 calculates, for each user, the user's operation rate for the content distributed to the user. For example, the operation rate calculation unit 44 refers to the user database 31 and calculates the click rate (CTR), which is the rate at which users select content distributed to users, and the purchase rate based on the distributed content. The rate of operations and the rate of reservations for restaurants, accommodation facilities, events, etc. are calculated as the user's operation rate for the content. At this time, the operation rate calculation unit 44 calculates the operation rate when selecting content by clicking, the operation rate when purchasing a product based on the content, etc., to calculate the operation rate for the content. Calculated for each type. Furthermore, the operation rate calculation unit 44 calculates the user's operation rate for the content for each feature of the content. The calculated operation rate is assigned to the ID of the user in association with the characteristics of the content and the type of operation on the content, and is registered in the user database 31.
抽出部45は、類似度スコアが高い複数の利用者の中から、配信されたコンテンツに対する操作率が高い利用者を抽出する。具体的には、抽出部45は、類似度スコアが高い順に作成した利用者のIDリスト50を参照し、IDリスト50の中から、配信されたコンテンツに対する操作率が高い利用者を抽出する。
The
図4は、図3示す利用者のIDリストより高操作率IDを抽出する際の説明図である。IDリスト50は、コンテンツの特徴ごとに作成されるため、抽出部45は、操作率が高い利用者を抽出しようとしているコンテンツの特徴に対応して作成されたIDリスト50の中から、配信されたコンテンツに対する操作率が高い利用者のIDを抽出する。例えば、コンテンツに対する操作率が、コンテンツであるに広告に対するクリック率(CTR)である場合は、抽出部45は、広告に対する類似度スコアに基づいて作成されたIDリスト50の中から、広告に対するクリック率が高い利用者のIDを抽出する。
FIG. 4 is an explanatory diagram when extracting high operation rate IDs from the user ID list shown in FIG. 3. Since the
具体的には、抽出部45は、類似度スコアと操作率とに対してそれぞれ閾値を設定し、類似度スコアが類似度スコアに対して設定される閾値以上で、且つ、操作率が操作率に対して設定される閾値以上となる利用者を、操作率が高い利用者として抽出する。これにより、操作率が高い利用者を抽出する際に、類似度スコアが小さい利用者や、操作率が小さい利用者を抽出することを抑制する。例えば、IDリスト50における類似度スコアには、閾値としてScore1を設定し、操作率であるクリック率には、閾値としてCTR1を設定する。このように、類似度スコアとクリック率とに対して設定される閾値に対して、抽出部45は、利用者のIDに付与されるCTRが、CTR≧CTR1で、IDに付与される類似度スコアが、類似度スコア≧Score1となる複数の利用者のIDを、類似度スコアが高く、且つ、クリック率が高い利用者のIDである高操作率ID55として抽出する。
Specifically, the
また、抽出部45は、複数の利用者の平均の操作率である平均操作率を、目標となる操作率である目標操作率に近付けることのできる複数の利用者を抽出することも可能になっている。複数の利用者の平均操作率を目標操作率に近付けることのできる複数の利用者を抽出する際には、操作率の閾値を変化させすることにより、抽出する複数の利用者の平均操作率を目標操作率に近付ける。例えば、目標操作率として、目標となるクリック率である目標CTRを設定する場合は、クリック率の閾値であるCTR1を変化させることにより、抽出する複数の利用者の平均操作率である平均CTRを、目標CTRに近付ける。
Furthermore, the
具体的には、IDリスト50に含まれる利用者のIDの件数をNとし、目標CTRをCTRGOALとする場合、下記の式(1)に示すように、N件のIDのそれぞれのCTRの平均である平均CTRを、CTRGOALに近付けるようにCTR1を変化させる。
Specifically, when the number of user IDs included in the
さらに、抽出部45は、複数の利用者の平均操作率を、目標操作率に近付ける際には、類似度スコアの閾値も変化させる。つまり、抽出部45は、類似度スコアの閾値であるScore1も変化させることにより、平均CTRをCTRGOALに近付ける。抽出部45は、これらのように、操作率の閾値や類似度スコアの閾値を繰り返し変化させることにより、複数の利用者の平均操作率を目標操作率に近付ける。
Furthermore, when bringing the average operation rate of a plurality of users closer to the target operation rate, the
なお、抽出部45は、コンテンツに対する操作率が高い利用者を抽出する際には、類似度スコアと操作率との乗算に基づいて算出される値が、類似度スコアと操作率との乗算に基づいて算出される値に対して設定される下限値A以上の利用者の中から、操作率が高い利用者を抽出するのが好ましい。
Note that when extracting users with a high interaction rate with respect to content, the
つまり、複数の類似度スコアと複数のCTRとの乗算に基づいて算出される複数の値をIDリスト50上に表すと、高操作率ID55におけるCTR1となる部分とScore1となる部分とを結ぶ曲線部56により示される(図4参照)。このため、コンテンツに対する操作率が高い利用者を抽出する際には、CTRが曲線部56よりも高く、類似度スコアも曲線部56より高いIDを、高操作率ID55として抽出する。このように、曲線部56も用いて高操作率ID55を抽出する際において、類似度スコアと操作率との乗算に基づいて算出される値に対して下限値Aを設定することにより、曲線部56を調節できるため、高操作率ID55に含まれるIDを調節することができる。
In other words, if multiple values calculated based on the multiplication of multiple similarity scores and multiple CTRs are expressed on the
また、曲線部56も用いて高操作率ID55を抽出する際において、複数の利用者の平均操作率を目標操作率に近付ける場合には、操作率の閾値であるCTR1や、類似度スコアの閾値であるScore1を変化させる他に、類似度スコアと操作率との乗算に基づいて算出される値に対して設定される下限値Aも変化させる。つまり、曲線部56が、類似度スコア×CTRを示すものである場合は、類似度スコアとCTRと下限値Aとの関係は、類似度スコア×CTR≧Aになるため、下限値Aを変化させることにより、抽出される類似度スコアやCTRを変化させることができる。これにより、平均操作率を変化させることができるため、平均操作率を変化させて平均操作率を目標操作率に近付けることができる。
In addition, when extracting the high operation rate ID55 using the
〔3.情報提供装置が実行する処理の流れの一例〕
続いて、図5を用いて、情報提供装置10が実行する抽出処理の流れについて説明する。図5は、実施形態に係る情報提供装置が実行する抽出処理の流れの一例を示すフローチャートである。
[3. An example of the flow of processing executed by the information providing device]
Next, the flow of the extraction process executed by the
例えば、情報提供装置10は、利用者の行動履歴を取得する(ステップS101)。そして、情報提供装置10は、利用者に対して配信をするコンテンツの特徴を特定する(ステップS102)。利用者の行動履歴を取得し、コンテンツの特徴を特定したら、コンテンツの特徴に対する、利用者の行動履歴の類似度スコアを算出する(ステップS103)。類似度スコアを算出したら、情報提供装置10は、類似度スコアが高い順となる利用者のIDリスト50を作成する(ステップST104)。
For example, the
また、情報提供装置10は、配信されたコンテンツに対する利用者の操作率を算出する(ステップS105)。利用者の操作率を算出したら、情報提供装置10は、操作率が高い利用者を抽出する(ステップS106)。つまり、情報提供装置10は、IDリスト50に含まれる複数の利用者の中から、類似度スコアが高く、且つ、操作率が高い複数の利用者のIDである高操作率ID55を抽出する。高操作率ID55を抽出したら、抽出した利用者のIDに向けて、コンテンツを配信する(ステップS107)。これにより、情報提供装置10は、類似度スコアが高く、且つ、コンテンツに対する操作率が高い利用者にコンテンツを配信することができる。
Furthermore, the
〔4.変形例〕
上記では、情報提供装置10による抽出処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報提供装置10が実行する抽出処理のバリエーションについて説明する。
[4. Modified example]
An example of the extraction process by the
〔4-1.コンテンツに対する操作率について〕
上述した例では、情報提供装置10の抽出部45で、コンテンツに対する操作率が高い利用者を抽出する際に、クリック率が高い利用者を抽出していたが、抽出部45では、コンテンツに対する複数の操作率が高い利用者を抽出してもよい。つまり、情報提供装置10の制御部40が有する操作率算出部44は、利用者がコンテンツに対して行った複数の異なる操作に対してそれぞれ操作率を算出し、抽出部45は、類似度スコアが高い複数の利用者の中から、操作率算出部44で算出した複数の操作率のいずれもが高い利用者を抽出してもよい。
[4-1. About the operation rate for content]
In the above example, the
図6は、広告のクリック率と広告コンバージョン率が高い利用者のIDを抽出する際の説明図である。操作率算出部44は、コンテンツに対する操作率として、例えば、図6に示すように、広告のクリック率(CTR)の他に、広告のコンバージョン率(CVI)を算出してもよい。この場合、抽出部45は、CTRに対しては閾値として下限CTRを設定し、CVIに対しては閾値として下限CVIを設定し、類似度スコアが類似度スコアに対して設定される閾値である下限類似度スコア以上となる複数の利用者のIDのうち、CTRが下限CTR以上で、CVIが下限CVIとなる利用者のIDを、高操作率ID55として抽出する。
FIG. 6 is an explanatory diagram when extracting IDs of users with high advertisement click rate and advertisement conversion rate. The operation rate calculation unit 44 may calculate an advertisement conversion rate (CVI) in addition to the advertisement click rate (CTR), as shown in FIG. 6, for example, as the operation rate for the content. In this case, the
また、抽出部45は、利用者の平均CTRが目標CTRに近付くように下限CTRを変化させて調整し、利用者の平均CVIが目標CVIに近付くように下限CVIを変化させて調整する。これにより、平均CTRや平均CVIを、目標CTRや目標CVIに近付けることのできる高操作率ID55を抽出することができる。
Further, the
〔4-2.コンテンツに対する操作率の種類について〕
また、類似度スコアが高い複数の利用者の中から、複数の操作率のいずれもが高い利用者を抽出する際における操作率は、広告のクリック率(CTR)や広告のコンバージョン率(CVI)以外であってもよい。
[4-2. Regarding the types of operation rates for content]
In addition, when extracting users with high interaction rates from multiple users with high similarity scores, the interaction rate is determined by the advertisement click rate (CTR) and advertisement conversion rate (CVI). It may be other than that.
図7は、操作率の指標1と指標2が高い利用者のIDを抽出する際の説明図である。コンテンツに対する操作率は、広告のクリック率(CTR)や広告のコンバージョン率(CVI)の他に、様々な操作に対する操作率が想定されるが、類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する際には、操作率の種類ごとに下限値と目標値を設定するのが好ましい。例えば、操作率が高い利用者を抽出する際における複数の操作率が、図7に示すように指標1と指標2とである場合は、指標1に対しては指標1の下限値と目標値が設定され、指標2に対しては指標2の下限値と目標値が設定される。この場合、抽出部45は、類似度スコアが類似度スコアに対して設定される下限類似度スコア以上となる複数の利用者のIDのうち、指標1が指標1の下限値で、指標2が指標2の下限値となる利用者のIDを、高操作率ID55として抽出する。
FIG. 7 is an explanatory diagram when extracting IDs of users with high index 1 and index 2 of operation rate. In addition to the advertising click rate (CTR) and advertising conversion rate (CVI), the interaction rate for content is assumed to be the interaction rate for various operations. When extracting users with a high rate, it is preferable to set a lower limit value and a target value for each type of operation rate. For example, if multiple operation rates when extracting users with a high operation rate are index 1 and index 2 as shown in FIG. 7, for index 1, the lower limit value of index 1 and the target value is set, and for index 2, the lower limit value and target value of index 2 are set. In this case, the
また、抽出部45は、指標1の平均値が指標1の目標値に近付くように指標1の下限値を変化させて調整し、指標2の平均値が指標2の目標値に近付くように指標2の下限値を変化させて調整する。これにより、指標1の平均値や指標2の平均値を、指標1の目標値や指標2の目標値に近付けることのできる高操作率ID55を抽出することができる。
The
類似度スコアが高い複数の利用者の中から、複数の操作率のいずれもが高い利用者を抽出する際には、類似度スコアと、複数の操作率の指標とより抽出するため、図7に示すように、IDリスト50を、複数の操作率の指標の数N+1次元空間で作成することにより、高操作率ID55を抽出することができる。
When extracting a user with a high number of operation rates from among multiple users with a high similarity score, the extraction is performed using the similarity score and multiple indexes of operation rates. As shown in the figure, by creating the
〔4-3.装置構成〕
情報提供装置10は、フロントエンドサーバと、バックエンドサーバとで実現されてもよい。このような場合、フロントエンドサーバには、図2に示す取得部41、特定部42が配置され、バックエンドサーバには、スコア算出部43、操作率算出部44、抽出部45が配置される。また、記憶部30に登録された各データベース31、32は、外部のストレージサーバに保持されていてもよい。
[4-3. Device configuration〕
The
〔4-4.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[4-4. others〕
Further, among the processes described in the above embodiments, all or part of the processes described as being performed automatically can be performed manually, and conversely, the processes described as being performed manually can be performed manually. All or part of this can also be performed automatically using known methods. In addition, information including the processing procedures, specific names, and various data and parameters shown in the above documents and drawings may be changed arbitrarily, unless otherwise specified. For example, the various information shown in each figure is not limited to the illustrated information.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each device shown in the drawings is functionally conceptual, and does not necessarily need to be physically configured as shown in the drawings. In other words, the specific form of distributing and integrating each device is not limited to what is shown in the diagram, and all or part of the devices can be functionally or physically distributed or integrated in arbitrary units depending on various loads and usage conditions. Can be integrated and configured.
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Furthermore, the embodiments described above can be combined as appropriate within a range that does not conflict with the processing contents.
〔4-5.プログラム〕
また、上述した実施形態に係る情報提供装置10は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[4-5. program〕
Further, the
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
The arithmetic unit 1030 operates based on programs stored in the
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
The output IF 1060 is an interface for transmitting information to be output to an
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
Note that the
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。 Network IF 1080 receives data from other devices via network N and sends it to computing device 1030, and also sends data generated by computing device 1030 to other devices via network N.
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
Arithmetic device 1030 controls
例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。
For example, when the
〔5.効果〕
上述したように、情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度の度合いを示す類似度スコアを利用者の行動履歴に基づいて利用者ごとに算出し、利用者に配信したコンテンツに対して利用者が操作を行った割合を示す操作率を利用者ごとに算出する。そして、情報提供装置10は、類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。従って、情報提供装置10で抽出した利用者に向けてコンテンツを配信することにより、コンテンツの特徴に対する行動履歴の類似度スコアが高くても、コンテンツに対する操作を行う可能性が低い利用者に対してコンテンツを配信することを抑制できる。
[5. effect〕
As described above, the
また、情報提供装置10は、利用者がコンテンツに対して行った複数の異なる操作に対してそれぞれ操作率を算出し、類似度スコアが高い複数の利用者の中から、複数の操作率のいずれもが高い利用者を抽出する。このため、コンテンツに対する操作として複数の種類の操作が想定される場合でも、それぞれの操作に対する操作率が高い利用者を抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
In addition, the
また、情報提供装置10は、複数の利用者の平均の操作率である平均操作率を、目標となる操作率である目標操作率に近付けることのできる複数の利用者を抽出する。このため、コンテンツに対する操作率が高い操作率が高い利用者を効果的に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
Further, the
また、情報提供装置10は、操作率が操作率に対して設定される閾値以上となる利用者を操作率が高い利用者として抽出するため、コンテンツに対する操作率が高い利用者を適切に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
Furthermore, the
また、情報提供装置10は、操作率の閾値を変化させることにより、抽出する複数の利用者の平均操作率を目標操作率に近付ける。このため、コンテンツに対する操作率が高い操作率が高い利用者を効果的に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
Furthermore, the
また、情報提供装置10は、類似度スコアが類似度スコアに対して設定される閾値以上の利用者の中から操作率が高い利用者を抽出する。このため、コンテンツの特徴に対する類似度スコアが高く、コンテンツに対する操作率が高い利用者を適切に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
Furthermore, the
また、情報提供装置10は、類似度スコアの閾値を変化させることにより、抽出する複数の利用者の平均操作率を目標操作率に近付ける。このため、コンテンツの特徴に対する類似度スコアが高く、コンテンツに対する操作率が高い操作率が高い利用者を効果的に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
Furthermore, the
また、情報提供装置10は、類似度スコアと操作率との乗算に基づいて算出される値が、類似度スコアと操作率との乗算に基づいて算出される値に対して設定される下限値以上の利用者の中から操作率が高い利用者を抽出する。このため、コンテンツの特徴に対する類似度スコアが高く、コンテンツに対する操作率が高い操作率が高い利用者を適切に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。
Further, the
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Some of the embodiments of the present application have been described above in detail based on the drawings, but these are merely examples, and various modifications and variations may be made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure section of the invention. It is possible to carry out the invention in other forms with modifications.
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、提供部は、提供手段や提供回路に読み替えることができる。 Furthermore, the above-mentioned "section, module, unit" can be read as "means", "circuit", etc. For example, the providing unit can be read as providing means or providing circuit.
10 情報提供装置
20 通信部
30 記憶部
31 利用者データベース
32 コンテンツデータベース
40 制御部
41 取得部
42 特定部
43 スコア算出部
44 操作率算出部
45 抽出部
50 IDリスト
55 高操作率ID
56 曲線部
100 ログサーバ
200 配信サーバ
300 端末装置
10 information providing device 20
56
Claims (10)
前記利用者に対して配信をするコンテンツの特徴を特定する特定部と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出部と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出部と、
前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出部と、
を有することを特徴とする抽出装置。 an acquisition unit that acquires the user's action history;
a specifying unit that specifies the characteristics of the content to be distributed to the user;
a score calculation unit that calculates a similarity score for each of the users based on the action history, which indicates the degree of similarity of the action history with respect to the feature of the content;
an operation rate calculation unit that calculates, for each user, an operation rate indicating the rate at which the user performed operations on the content distributed to the user;
an extraction unit that extracts the user with the high operation rate from among the multiple users with the high similarity score;
An extraction device characterized by having:
前記抽出部は、前記類似度スコアが高い複数の前記利用者の中から、前記操作率算出部で算出した複数の前記操作率のいずれもが高い前記利用者を抽出する請求項1に記載の抽出装置。 The operation rate calculation unit calculates the operation rate for each of a plurality of different operations performed by the user on the content,
2. The extraction unit extracts the users with high all of the plurality of operation rates calculated by the operation rate calculation unit from among the plurality of users with high similarity scores. Extraction device.
利用者の行動履歴を取得する取得工程と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定工程と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出工程と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出工程と、
前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出工程と、
を含むことを特徴とする抽出方法。 An extraction method performed by an extraction device, comprising:
an acquisition step of acquiring the user's behavior history;
a specifying step of specifying the characteristics of the content to be distributed to the user;
a score calculation step of calculating a similarity score for each user based on the action history, which indicates the degree of similarity of the action history to the feature of the content;
an operation rate calculation step of calculating for each user an operation rate indicating the rate at which the user performed an operation on the content distributed to the user;
an extraction step of extracting the user with the high operation rate from among the multiple users with the high similarity score;
An extraction method characterized by comprising:
前記利用者に対して配信をするコンテンツの特徴を特定する特定手順と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出手順と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出手順と、
前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出手順と、
をコンピュータに実行させるための抽出プログラム。 an acquisition procedure for acquiring the user's behavior history;
a specific procedure for specifying the characteristics of the content to be distributed to the user;
a score calculation procedure for calculating a similarity score for each user based on the action history, which indicates the degree of similarity of the action history to the feature of the content;
an operation rate calculation procedure for calculating, for each user, an operation rate indicating the rate at which the user performed operations on the content distributed to the user;
an extraction procedure for extracting the user with the high operation rate from among the multiple users with the high similarity score;
An extraction program that allows a computer to execute
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022131298A JP7335405B1 (en) | 2022-08-19 | 2022-08-19 | Extraction device, extraction method and extraction program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022131298A JP7335405B1 (en) | 2022-08-19 | 2022-08-19 | Extraction device, extraction method and extraction program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP7335405B1 JP7335405B1 (en) | 2023-08-29 |
| JP2024028005A true JP2024028005A (en) | 2024-03-01 |
Family
ID=87764122
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022131298A Active JP7335405B1 (en) | 2022-08-19 | 2022-08-19 | Extraction device, extraction method and extraction program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7335405B1 (en) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002123739A (en) * | 2000-10-12 | 2002-04-26 | Sony Corp | Information processing apparatus and method, and recording medium |
| JP2013125468A (en) * | 2011-12-15 | 2013-06-24 | Yahoo Japan Corp | Advertisement distribution device |
| JP2016062297A (en) * | 2014-09-18 | 2016-04-25 | ヤフー株式会社 | Advertisement tender management system, method, and program |
| WO2017072873A1 (en) * | 2015-10-28 | 2017-05-04 | 楽天株式会社 | Document distribution device, document distribution method, program, and non-temporary recording medium |
| JP2018101323A (en) * | 2016-12-21 | 2018-06-28 | ヤフー株式会社 | Calculation device, calculation method, and calculation program |
-
2022
- 2022-08-19 JP JP2022131298A patent/JP7335405B1/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002123739A (en) * | 2000-10-12 | 2002-04-26 | Sony Corp | Information processing apparatus and method, and recording medium |
| JP2013125468A (en) * | 2011-12-15 | 2013-06-24 | Yahoo Japan Corp | Advertisement distribution device |
| JP2016062297A (en) * | 2014-09-18 | 2016-04-25 | ヤフー株式会社 | Advertisement tender management system, method, and program |
| WO2017072873A1 (en) * | 2015-10-28 | 2017-05-04 | 楽天株式会社 | Document distribution device, document distribution method, program, and non-temporary recording medium |
| JP2018101323A (en) * | 2016-12-21 | 2018-06-28 | ヤフー株式会社 | Calculation device, calculation method, and calculation program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP7335405B1 (en) | 2023-08-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6784499B2 (en) | Decision device, decision method and decision program | |
| JP6872851B2 (en) | Information selection device, information selection method and information selection program | |
| US20110093520A1 (en) | Automatically identifying and summarizing content published by key influencers | |
| CN110059256B (en) | Systems, methods and devices for displaying information | |
| US11016633B2 (en) | Intelligent support recommendations for snap-ins | |
| US20130297408A1 (en) | Determining advertisement preferences | |
| JP2018045553A (en) | Selection device, selection method, and selection program | |
| JP7122286B2 (en) | Decision device, decision method and decision program | |
| JP2016153972A (en) | Extraction device, extraction method and extraction program | |
| JP7443280B2 (en) | Provision device, method and program | |
| JP7174743B2 (en) | Information selection device, information selection method and information selection program | |
| CN113127683A (en) | Content recommendation method and device, electronic equipment and medium | |
| JP7335405B1 (en) | Extraction device, extraction method and extraction program | |
| US8566156B2 (en) | Combining segments of users into vertically indexed super-segments | |
| JP7042787B2 (en) | Judgment device, judgment method, and judgment program | |
| JP2020140242A (en) | Information processing equipment, information processing methods and information processing programs | |
| US20180165741A1 (en) | Information providing device, information providing method, information providing program, and computer-readable storage medium storing the program | |
| US10832276B2 (en) | Systems and methods for ad placement in content streams | |
| JP7082085B2 (en) | Decision device, decision method and decision program | |
| JP6695267B2 (en) | Determination device, determination method, and determination program | |
| JP7033864B2 (en) | Judgment device, judgment method and judgment program | |
| JP7164683B1 (en) | Information processing device, information processing method, and information processing program | |
| JP7443432B2 (en) | Determination device, determination method and determination program | |
| JP7260439B2 (en) | Extraction device, extraction method and extraction program | |
| JP2019149200A (en) | Provision device, provision method, and provision program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220916 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220916 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230104 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230306 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230425 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230623 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230718 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230817 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7335405 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |