[go: up one dir, main page]

JP2024028005A - Extraction device, extraction method and extraction program - Google Patents

Extraction device, extraction method and extraction program Download PDF

Info

Publication number
JP2024028005A
JP2024028005A JP2022131298A JP2022131298A JP2024028005A JP 2024028005 A JP2024028005 A JP 2024028005A JP 2022131298 A JP2022131298 A JP 2022131298A JP 2022131298 A JP2022131298 A JP 2022131298A JP 2024028005 A JP2024028005 A JP 2024028005A
Authority
JP
Japan
Prior art keywords
user
operation rate
content
users
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022131298A
Other languages
Japanese (ja)
Other versions
JP7335405B1 (en
Inventor
信一郎 瀬賀
Shinichiro Sega
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2022131298A priority Critical patent/JP7335405B1/en
Application granted granted Critical
Publication of JP7335405B1 publication Critical patent/JP7335405B1/en
Publication of JP2024028005A publication Critical patent/JP2024028005A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

To extract users who can increase the distribution effect of a content.SOLUTION: An extracting apparatus of the present application has an acquiring unit, a specifying unit, a score calculating unit, an operation rate calculating unit, and an extracting unit. The acquiring unit acquires an action history of a user. The identifying unit identifies features of a content to be distributed to the user. The score calculating unit calculates, for each user, a similarity score indicating the degree of similarity of the action history to features of the content based on the action history. The operation rate calculation unit calculates, for each user, an operation rate indicating a ratio of operations performed by the user on the content distributed to the user. The extraction unit extracts users with a high operation rate from a plurality of users with a high similarity score.SELECTED DRAWING: Figure 2

Description

本発明は、抽出装置、抽出方法及び抽出プログラムに関する。 The present invention relates to an extraction device, an extraction method, and an extraction program.

近年、インターネットを介した情報配信が盛んに行われている。このような情報配信の一例として、配信対象となる広告の類似度や、広告配信先となる利用者の情報等に基づいて、CTR(Click Through Rate)等のクリック率を推定し、推定されたクリック率に応じて、配信対象となる広告を選択する技術が知られている。 In recent years, information distribution via the Internet has become popular. As an example of such information distribution, a click rate such as CTR (Click Through Rate) is estimated based on the similarity of advertisements to be distributed and information on users to whom advertisements are distributed. 2. Description of the Related Art There is a known technology for selecting advertisements to be distributed according to click rate.

例えば、配信対象となる広告の構成要素や広告同士の類似度に基づいて、CTRを予測し、予測したCTRを用いて配信対象となる広告を選択する技術が知られている。また、広告を選択した利用者の属性に基づいて、仮想CTRを算出し、広告の配信先となる利用者の属性と算出した仮想CTRとに応じて、配信対象となる広告を選択する技術が知られている。 For example, a technique is known in which the CTR is predicted based on the constituent elements of advertisements to be distributed or the similarity between advertisements, and the predicted CTR is used to select advertisements to be distributed. In addition, the technology calculates the virtual CTR based on the attributes of the user who selected the advertisement, and selects the advertisement to be distributed according to the attributes of the user to whom the advertisement is distributed and the calculated virtual CTR. Are known.

特開2014-006684号公報Japanese Patent Application Publication No. 2014-006684 特開2014-182473号公報Japanese Patent Application Publication No. 2014-182473

しかしながら、広告の配信先となる利用者の属性に基づいて広告の配信を行っても、利用者の中には、クリック率が低い利用者が存在するため、広告の構成要素と利用者の属性とに関連性があったとしても、このような利用者への広告の配信は、クリック率の低下につながり易くなる。つまり、配信された広告に対して選択等の操作を行わない利用者は、広告を配信しても広告に対して操作を行う可能性が低いため、広告に対して操作を行わない利用者に対して広告を配信しても、配信した広告の数に対する広告効果が低くなり易くなる。これらのように、配信された広告等のコンテンツに対してクリック等の操作を行わない利用者は、コンテンツを配信してもコンテンツを選択して視認する等の操作を行う可能性が低いため、コンテンツに対して操作を行わない利用者に対してコンテンツを配信しても、配信をする効果が低くなり易くなる。 However, even if advertisements are distributed based on the attributes of the users to whom the advertisements are distributed, some users have low click-through rates, so Even if there is a correlation between the two, distributing advertisements to such users is likely to lead to a decrease in click rate. In other words, users who do not perform operations such as selection on distributed advertisements are unlikely to perform operations on advertisements even if advertisements are distributed, so users who do not perform operations on advertisements On the other hand, even if advertisements are distributed, the advertising effect tends to be low relative to the number of distributed advertisements. As mentioned above, users who do not perform operations such as clicking on distributed content such as advertisements are unlikely to perform operations such as selecting and viewing content even if the content is distributed. Even if content is distributed to users who do not perform operations on the content, the effectiveness of the distribution is likely to be reduced.

本願は、上記に鑑みてなされたものであって、コンテンツの配信効果を高めることのできる利用者を抽出することのできる抽出装置、抽出方法及び抽出プログラムを提供することを目的とする。 The present application has been made in view of the above, and aims to provide an extraction device, an extraction method, and an extraction program that can extract users who can enhance the effectiveness of content distribution.

本願に係る抽出装置は、利用者の行動履歴を取得する取得部と、前記利用者に対して配信をするコンテンツの特徴を特定する特定部と、前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出部と、前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出部と、前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出部と、を有することを特徴とする。 The extraction device according to the present application includes an acquisition unit that acquires the behavior history of a user, a specification unit that identifies the characteristics of content to be distributed to the user, and a determination unit that determines the similarity of the behavior history to the characteristics of the content. a score calculation unit that calculates a similarity score for each user based on the action history; and an operation rate that shows the rate at which the user performed an operation on the content distributed to the user. The present invention is characterized in that it includes an operation rate calculation unit that calculates the operation rate for each user, and an extraction unit that extracts the user with the high operation rate from among the plurality of users who have the high similarity score.

実施形態の一態様によれば、コンテンツの配信効果を高めることのできる利用者を抽出することができる、という効果を奏する。 According to one aspect of the embodiment, it is possible to extract users who can enhance the content distribution effect.

図1は、実施形態に係る情報提供装置が実行する抽出処理の一例を示す図である。FIG. 1 is a diagram illustrating an example of an extraction process executed by an information providing apparatus according to an embodiment. 図2は、実施形態に係る情報提供装置の構成例を示す図である。FIG. 2 is a diagram illustrating a configuration example of an information providing apparatus according to an embodiment. 図3は、利用者のIDリストの模式図である。FIG. 3 is a schematic diagram of a user ID list. 図4は、図3示す利用者のIDリストより高操作率IDを抽出する際の説明図である。FIG. 4 is an explanatory diagram when extracting high operation rate IDs from the user ID list shown in FIG. 3. 図5は、実施形態に係る情報提供装置が実行する抽出処理の流れの一例を示すフローチャートである。FIG. 5 is a flowchart illustrating an example of the flow of extraction processing executed by the information providing apparatus according to the embodiment. 図6は、広告のクリック率と広告コンバージョン率が高い利用者のIDを抽出する際の説明図である。FIG. 6 is an explanatory diagram when extracting IDs of users with high advertisement click rate and advertisement conversion rate. 図7は、操作率の指標1と指標2が高い利用者のIDを抽出する際の説明図である。FIG. 7 is an explanatory diagram when extracting IDs of users with high index 1 and index 2 of operation rate. 図8は、ハードウェア構成の一例を示す図である。FIG. 8 is a diagram showing an example of the hardware configuration.

以下に、本願に係る抽出装置、抽出方法及び抽出プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。 EMBODIMENT OF THE INVENTION Below, the extraction apparatus, the extraction method, and the form (henceforth described as an "embodiment") for implementing the extraction program which concern on this application are demonstrated in detail, referring drawings. Note that the extraction device, extraction method, and extraction program according to the present application are not limited to this embodiment. Further, in each of the embodiments below, the same parts are given the same reference numerals, and redundant explanations will be omitted.

[実施形態]
〔1.情報提供装置が表示する処理について〕
まず、図1を用いて、抽出装置の一例となる情報提供装置10が実行する抽出処理の一例について説明する。図1は、実施形態に係る情報提供装置が実行する抽出処理の一例を示す図である。
[Embodiment]
[1. Regarding the processing displayed by the information providing device]
First, an example of an extraction process executed by an information providing apparatus 10, which is an example of an extraction apparatus, will be described using FIG. FIG. 1 is a diagram illustrating an example of an extraction process executed by an information providing apparatus according to an embodiment.

なお、以下の説明では、情報提供装置10が実行する抽出処理として、利用者の行動履歴や広告に関するコンテンツの配信履歴、配信されたコンテンツに対する操作履歴(以下、「ログ」と記載する。)から、利用者の行動履歴とコンテンツの特徴との類似性を算出し、コンテンツを操作する操作率が高い利用者を抽出する処理の一例について記載するが、実施形態は、これに限定されるものではない。情報提供装置10は、ニュースフィードや画像等、任意のコンテンツの配信履歴とコンテンツに対するログから、コンテンツを操作する操作率が高い利用者を抽出してもよい。 In the following explanation, the extraction process executed by the information providing device 10 will be based on the user's behavior history, the distribution history of advertising-related content, and the operation history for distributed content (hereinafter referred to as "log"). , an example of the process of calculating the similarity between the user's action history and the characteristics of the content and extracting the users who have a high operation rate of operating the content will be described, but the embodiment is not limited to this. do not have. The information providing device 10 may extract users who have a high content manipulation rate from the distribution history of arbitrary content such as news feeds and images and logs for the content.

また、以下の説明において、広告とは、営利若しくは非営利の広告だけではなく、ボランティアの募集、公共広告、公共に対する通知、その他任意のコンテンツを含む概念である。また、広告は、いわゆる広告関連の情報を含むコンテンツのみならず、利用者に興味を抱かせ、任意の対象に関する情報、または、任意の対象と関連するコンテンツ(例えば、ランディングページ等)に含まれる情報を広く報知するものであれば、画像、動画像、テキスト、図形、記号、ハイパーリンク、その他任意のコンテンツがテキストと共に含まれていてよい。 Furthermore, in the following description, advertisement is a concept that includes not only commercial or non-commercial advertisements, but also volunteer recruitment, public advertisements, notifications to the public, and other arbitrary content. In addition, advertisements are not only content that includes so-called advertising-related information, but also information that arouses the user's interest and is included in information about or related to an arbitrary target (for example, a landing page, etc.) Images, moving images, text, graphics, symbols, hyperlinks, and other arbitrary content may be included along with the text as long as the information is widely disseminated.

〔1-1.情報提供装置の一例〕
情報提供装置10は、インターネット等の所定のネットワークN(例えば、図2を参照。)を介して、ログサーバ100や配信サーバ200、利用者が使用する端末装置300と通信可能な情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。なお、情報提供装置10は、ネットワークNを介して、任意の数のログサーバ100や配信サーバ200と通信可能であってもよく、例えば、図示を省略した各種の外部サーバと通信可能であってよい。また、図1では、端末装置300は、1つのみが図示されているが、端末装置300は、ネットワークNを介して多数の端末装置300が通信可能になっている。
[1-1. Example of information providing device]
The information providing device 10 is an information processing device that can communicate with a log server 100, a distribution server 200, and a terminal device 300 used by a user via a predetermined network N such as the Internet (see FIG. 2, for example). For example, it is realized by a server device, a cloud system, etc. Note that the information providing device 10 may be able to communicate with an arbitrary number of log servers 100 and distribution servers 200 via the network N, and may be able to communicate with various external servers (not shown), for example. good. Further, although only one terminal device 300 is illustrated in FIG. 1, the terminal device 300 is capable of communicating with a large number of terminal devices 300 via the network N.

ログサーバ100は、ログを管理するサーバ装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、ログサーバ100は、利用者が端末装置300によってアクセスしたウェブサイト、利用者が使用する端末装置300に配信されたウェブコンテンツ、利用者が使用する端末装置300に配信された広告のコンテンツ、配信されたコンテンツのうち利用者が端末装置300によって選択したコンテンツ、利用者のデモグラフィック属性やサイコグラフィック属性等、コンテンツの配信に伴う各種のログデータを取得、管理する。なお、ログサーバ100が発揮する機能は、周知のログサーバと同様であるものとして、詳細な説明を省略する。 The log server 100 is a server device that manages logs, and is realized by, for example, a server device, a cloud system, or the like. For example, the log server 100 can store websites accessed by the user using the terminal device 300, web content distributed to the terminal device 300 used by the user, advertisement content distributed to the terminal device 300 used by the user, It acquires and manages various log data associated with content distribution, such as the content selected by the user using the terminal device 300 from among the distributed content, the demographic attributes and psychographic attributes of the user, and the like. Note that the functions performed by the log server 100 are the same as those of well-known log servers, and detailed description thereof will be omitted.

配信サーバ200は、利用者が使用する端末装置300に対してコンテンツの配信を行う情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、配信サーバ200は、ウェブコンテンツにアクセスした利用者の各種属性や行動履歴に基づいて、利用者が選択して操作をする可能性が高いコンテンツを選択し、選択したコンテンツの配信を行う。より具体的な例を挙げると、配信サーバ200は、利用者の行動履歴に基づいて広告のリスティングを行い、リスティングの結果選択される広告の配信を行う。 The distribution server 200 is an information processing device that distributes content to the terminal device 300 used by the user, and is realized by, for example, a server device, a cloud system, or the like. For example, the distribution server 200 selects content that is likely to be selected and operated by the user based on various attributes and behavior history of the user who has accessed the web content, and distributes the selected content. To give a more specific example, the distribution server 200 lists advertisements based on the user's behavior history, and distributes advertisements selected as a result of the listing.

端末装置300は、デスクトップ型のPC(Personal Computer)やノート型のPC、スマートフォンやタブレット等のスマートデバイスであり、ネットワークNを介して任意のサーバ装置と通信を行うことができる装置である。端末装置300は、利用者が入力操作を行う入力装置と、利用者に対して出力を行う出力装置とを有している。出力装置は、利用者に対して情報を表示する表示部になっている。入力装置は、例えば、マウスやキーボードが用いられたり、表示部と一体となったタッチパネルが用いられたりしてもよい。 The terminal device 300 is a smart device such as a desktop PC (Personal Computer), a notebook PC, a smartphone, or a tablet, and is a device that can communicate with any server device via the network N. The terminal device 300 includes an input device through which a user performs input operations, and an output device through which an output is output to the user. The output device is a display unit that displays information to the user. As the input device, for example, a mouse or a keyboard may be used, or a touch panel integrated with a display unit may be used.

ここで、端末装置300は、利用者の操作によりウェブページなどのウェブコンテンツを表示する場合は、ウェブコンテンツの配信を行うウェブサーバに対してウェブコンテンツの配信要求を送信する。かかる場合、端末装置300は、ウェブコンテンツの配信を受け付けると、ウェブコンテンツ内に配置される広告の配信要求を配信サーバ200に送信する。 Here, when displaying web content such as a web page by a user's operation, the terminal device 300 transmits a web content distribution request to a web server that distributes the web content. In such a case, upon receiving the distribution of the web content, the terminal device 300 transmits a distribution request for an advertisement placed in the web content to the distribution server 200.

かかる場合、配信サーバ200は広告画像を端末装置300に配信する。そして、端末装置300は、配信サーバ200から受け付けた広告画像をウェブページ内に配置して表示する。また、端末装置300は、カーソルを広告画像とあわせてクリックしたり、広告画像を利用者がタップしたりした場合等、広告画像を選択する操作が行われた場合は、広告画像と対応するランディングページの表示を行うとともに、かかる広告画像が選択された旨の通知を配信サーバ200に送信する。また、これらのように利用者が端末装置300に対して行った操作は、ログデータとしてログサーバ100で取得する。 In such a case, the distribution server 200 distributes the advertisement image to the terminal device 300. Then, the terminal device 300 arranges and displays the advertisement image received from the distribution server 200 within the web page. In addition, when an operation to select an advertisement image is performed, such as when the user clicks the cursor on the advertisement image or when the user taps the advertisement image, the terminal device 300 displays the landing page corresponding to the advertisement image. While displaying the page, a notification to the effect that the advertisement image has been selected is transmitted to the distribution server 200. Further, operations performed by the user on the terminal device 300 as described above are acquired by the log server 100 as log data.

〔1-2.抽出処理の一例〕
ここで、利用者が選択等の操作をする可能性が高いコンテンツを配信するため、利用者の属性や行動履歴とコンテンツの特徴とを比較し、利用者の行動履歴に対する関連性が高い特徴を有するコンテンツを、当該利用者に対して配信するといった態様が考えられる。しかしながら、利用者の中には、配信されたコンテンツに対してあまり操作を行わない利用者も存在する。このような、コンテンツに対して操作を行わない利用者は、行動履歴に対して関連性の高いコンテンツが配信されたとしても、選択等の操作をコンテンツに対して行わないため、コンテンツの配信効果が低くなり易くなる。そこで、本実施形態に係る情報提供装置10は、以下の抽出処理を実行する。
[1-2. Example of extraction process]
Here, in order to deliver content that is likely to be selected or otherwise performed by the user, we compare the attributes and behavior history of the user with the features of the content, and select features that are highly relevant to the user's behavior history. A possible mode is to distribute the content that the user has to the user. However, some users do not perform many operations on the distributed content. Such users who do not perform operations on content will not perform operations such as selection on the content even if content that is highly relevant to their behavior history is distributed, so the effectiveness of content distribution will be reduced. becomes low. Therefore, the information providing apparatus 10 according to the present embodiment executes the following extraction process.

〔1-3.利用者の行動履歴について〕
まず、情報提供装置10は、利用者の行動履歴を取得する。この場合における利用者の行動履歴は、例えば、利用者がネットワーク上で検索を行った際の検索キーワードや、利用者が検索結果に基づいて操作を行った際における遷移先ドメインや、ドメインを遷移した際における遷移元ドメインから遷移先ドメインへの流れ等が挙げられる。これらのように取得する利用者の行動履歴は、利用者ごとに設定される利用者の識別情報であるIDに紐づけられる。
[1-3. Regarding user behavior history]
First, the information providing device 10 acquires the user's behavior history. In this case, the user's action history includes, for example, the search keyword when the user performed a search on the network, the destination domain when the user performed an operation based on the search results, and the domain to which the user changed. Examples include the flow from the transition source domain to the transition destination domain when the transition occurs. The user's action history acquired in this manner is linked to an ID that is user identification information set for each user.

〔1-4.コンテンツの特徴の特定について〕
また、情報提供装置10は、利用者に対して配信をするコンテンツの特徴を特定する。コンテンツの特徴は、例えば、コンテンツによって示される商品やサービス、イベント情報の属性等のコンテンツによって示される情報の属性や、コンテンツが利用者に対して興味を催させるものであったり購買を促すものであったりする等のコンテンツ自体の属性等が挙げられる。
[1-4. Regarding identification of content characteristics]
Furthermore, the information providing device 10 specifies the characteristics of the content to be distributed to the user. The characteristics of content include, for example, the attributes of the information shown by the content, such as the attributes of products, services, and event information shown by the content, and whether the content arouses interest in users or encourages purchase. Examples include attributes of the content itself, such as whether the content is present or not.

〔1-5.類似度スコアの算出について〕
また、情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度の度合いを示す類似度スコアを、利用者の行動履歴に基づいて利用者ごとに算出する。類似度スコアは、コンテンツの特徴と利用者の行動履歴との類似度、或いは関連性を、数値化したものになっており、コンテンツの特徴に対する利用者の行動履歴の類似度を、数値の大小に応じて利用者間で比較することができるようにしたものになっている。算出した類似度スコアは、利用者のIDに付与される。また、類似度スコアは、利用者の行動履歴に対して、コンテンツの特徴ごとに算出される。このため、利用者のIDに付与される類似度スコアは、利用者に配信されるコンテンツの特徴ごとに、それぞれのコンテンツの特徴に応じたスコアが付与される。
[1-5. Regarding calculation of similarity score]
Further, the information providing device 10 calculates a similarity score for each user based on the user's action history, which indicates the degree of similarity of the user's action history to the content feature. The similarity score is a numerical representation of the similarity or relationship between the content features and the user's behavior history. It is designed to allow comparisons between users depending on the situation. The calculated similarity score is assigned to the user's ID. Furthermore, the similarity score is calculated for each content feature with respect to the user's behavior history. Therefore, the similarity score assigned to the user ID is assigned a score corresponding to each feature of the content distributed to the user.

〔1-6.操作率の算出について〕
また、情報提供装置10は、利用者に配信したコンテンツに対して利用者が操作を行った割合を示す操作率を、利用者ごとに算出する。利用者に配信したコンテンツに対する利用者の操作率としては、例えば、配信されたコンテンツを利用者が選択する率であるクリック率、即ち、CTR(Click Through Rate)が挙げられる。コンテンツに対する利用者の操作率としては、他に、配信されたコンテンツに基づいて購買操作を行う率や、飲食店や宿泊施設、イベント等の予約操作を行う率などが挙げられる。利用者に配信したコンテンツに対する利用者の操作率を算出する際には、コンテンツに対して利用者が行った操作の内容ごとに操作率を算出する。算出した操作率は、コンテンツに対して利用者が行った操作の内容ごとの操作率が、利用者のIDに付与される。
[1-6. Regarding calculation of operation rate]
Further, the information providing device 10 calculates, for each user, an operation rate that indicates the rate at which users perform operations on content distributed to users. An example of the user operation rate for the content distributed to the user is the click rate, that is, the click through rate (CTR), which is the rate at which the users select the distributed content. Other examples of the user operation rate for content include the rate of purchasing operations based on distributed content, the rate of making reservations for restaurants, accommodation facilities, events, etc. When calculating the user's operation rate for the content distributed to the user, the operation rate is calculated for each operation performed by the user on the content. As for the calculated operation rate, the operation rate for each operation performed by the user on the content is assigned to the user's ID.

〔1-7.操作率が高い利用者の抽出について〕
また、情報提供装置10は、類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する。例えば、任意のコンテンツに対する任意の操作の操作率が高い利用者を抽出する際には、利用者のIDに付与される、当該コンテンツの特徴に対する類似スコアが高い複数の利用者の中から、当該任意の操作率が高い利用者を抽出する。これを実現するため、情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度スコアについて、複数の利用者のIDに付与されるコンテンツの特徴ごとの類似度スコアを、スコアの高い順にリスト化する。即ち、IDに付与されている類似度スコアがスコアの高い順となる、複数の利用者のIDのリストを作成する。類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する際には、操作率を抽出するコンテンツの特徴に対応する類似度スコアが高い順に作成したIDのリストより、操作率が高い利用者を抽出する。
[1-7. Regarding extraction of users with high operation rate]
Furthermore, the information providing device 10 extracts a user with a high operation rate from among a plurality of users with a high similarity score. For example, when extracting a user who has a high operation rate for a given operation on a given piece of content, select the user who has a high similarity score for the feature of the content given to the user ID. Extract users with high arbitrary operation rate. In order to achieve this, the information providing device 10 calculates the similarity score for each content feature assigned to the IDs of multiple users with respect to the similarity score of the user's behavior history with respect to the content feature. List them in order. That is, a list of IDs of a plurality of users is created in which the similarity scores assigned to the IDs are arranged in descending order of the scores. When extracting a user with a high operation rate from among multiple users with high similarity scores, the operation Extract users with high rate.

これにより、複数の利用者に対して広告等のコンテンツを配信する際において、コンテンツに対して興味を示す可能性が高い利用者を抽出することができ、コンテンツを配信した際に利用者がコンテンツを視認したり商品を購入したりする等の、コンテンツの配信効果を高めることができる利用者を抽出することができる。例えば、コンテンツが広告である場合は、コンテンツの配信効果として広告効果を高めることができる。 As a result, when distributing content such as advertisements to multiple users, it is possible to extract users who are likely to be interested in the content. It is possible to extract users who can increase the effectiveness of content distribution, such as by viewing the content or purchasing the product. For example, if the content is an advertisement, the advertising effect can be enhanced as the content distribution effect.

〔1-8.抽出処理の一例について〕
次に、図1を用いて、情報提供装置10が実行する抽出処理の一例について説明する。まず、情報提供装置10は、ログサーバ100で管理されているログデータより、利用者の行動履歴を取得する(ステップS1)。即ち、情報提供装置10は、利用者が端末装置300を用いてネットワーク上で検索を行った際の検索キーワードや、利用者が検索結果に基づいて端末装置300を操作した際における遷移先ドメインや、ドメインを遷移した際における遷移元ドメインから遷移先ドメインへの流れ等を、利用者の行動履歴としてログサーバ100より取得する。これらのように利用者の行動履歴を取得する情報提供装置10は、ログデータに含まれる多数の利用者の行動履歴をそれぞれ取得する。
[1-8. Regarding an example of extraction processing]
Next, an example of the extraction process executed by the information providing device 10 will be described using FIG. 1. First, the information providing device 10 acquires a user's behavior history from log data managed by the log server 100 (step S1). That is, the information providing device 10 uses the search keyword when the user searches on the network using the terminal device 300, the transition destination domain and the like when the user operates the terminal device 300 based on the search results. , the flow from the transition source domain to the transition destination domain when the domain is transitioned, etc. is acquired from the log server 100 as the user's action history. The information providing device 10 that acquires the user's behavior history in this manner acquires the behavior history of a large number of users included in the log data.

また、情報提供装置10は、利用者に対して配信をするコンテンツの特徴を特定する(ステップS2)。情報提供装置10は、配信サーバ200から配信される予定のあるコンテンツに含まれる情報の分野や種類等のコンテンツの特徴を、コンテンツに基づいて特定する。利用者に対して配信をするコンテンツが広告である場合は、広告で表示する商品やサービスの分野等の広告の特徴を特定する。 Furthermore, the information providing device 10 specifies the characteristics of the content to be distributed to the user (step S2). The information providing device 10 identifies characteristics of the content, such as fields and types of information included in the content scheduled to be distributed from the distribution server 200, based on the content. If the content to be distributed to users is an advertisement, the characteristics of the advertisement, such as the field of products or services displayed in the advertisement, are specified.

利用者の行動履歴を取得し、コンテンツの特徴を特定した情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度スコアを算出してリスト化する(ステップS3)。類似度スコアは、コンテンツの特徴ごとに算出する。また、類似度スコアは利用者ごとに算出し、利用者のIDに付与する。このため、利用者のIDには、コンテンツの特徴ごとにコンテンツの特徴に対する類似度スコアが付与される。類似度スコアのリスト化は、各利用者のIDに付与されるコンテンツの特徴ごとの類似度スコアを、コンテンツの特徴ごとにリストにすることにより行われる。 The information providing device 10 that has acquired the user's behavior history and identified the content features calculates and lists the similarity score of the user's behavior history with respect to the content features (step S3). A similarity score is calculated for each feature of content. Further, a similarity score is calculated for each user and assigned to the user's ID. Therefore, a similarity score for each content feature is assigned to the user ID for each content feature. Listing of similarity scores is performed by listing similarity scores for each content feature assigned to each user's ID for each content feature.

つまり、各利用者のIDには、コンテンツの特徴ごとに複数の類似度スコアが付与されているが、これらの類似度スコアのうち、各利用者のIDにおける同じコンテンツの特徴に対する類似度スコアのリストを、IDと対応させたIDリスト50として作成する。各利用者のIDと類似度スコアとを対応させたIDリスト50は、例えば、類似度スコアが高い順にして作成する。これにより、任意のコンテンツの特徴に対する利用者の行動履歴の類似の相対的な度合いを、IDリスト50上で類似度スコア同士を比較することにより判断することを可能にできる。 In other words, each user's ID is assigned multiple similarity scores for each content feature, but among these similarity scores, the similarity score for the same content feature in each user's ID is A list is created as an ID list 50 that is associated with IDs. The ID list 50 in which each user's ID and similarity score are associated is created, for example, in descending order of similarity score. This makes it possible to determine the relative degree of similarity of the user's behavior history with respect to the feature of any content by comparing the similarity scores on the ID list 50.

IDリスト50を作成したら、情報提供装置10は、配信されたコンテンツに対する利用者の操作率を算出する(ステップS4)。情報提供装置10は、利用者の操作率を、ログサーバ100で管理されているログデータに基づいて、コンテンツの特徴ごとに算出する。つまり、IDリスト50は、コンテンツの特徴ごとに作成されているため、利用者の操作率をコンテンツの特徴ごとに算出することより、IDリスト50に示される類似度スコアに対応する特徴を有するコンテンツの操作率を算出する。この場合におけるコンテンツに利用者の操作率としては、例えば、コンテンツが広告である場合、配信された広告を利用者が選択する率であるクリック率、即ち、CTR(Click Through Rate)が挙げられる。配信されたコンテンツに対する利用者の操作率として広告のクリック率を算出する場合は、利用者ごとにクリック率を算出する。このため、IDリスト50に挙げられるIDごとに、当該IDリスト50に対応する特徴を有する広告のクリック率を算出する。 After creating the ID list 50, the information providing device 10 calculates the user's operation rate for the distributed content (step S4). The information providing device 10 calculates a user's operation rate for each content feature based on log data managed by the log server 100. In other words, since the ID list 50 is created for each content feature, by calculating the user's operation rate for each content feature, content that has the feature corresponding to the similarity score shown in the ID list 50 is calculated. Calculate the operation rate. In this case, the user's operation rate for the content includes, for example, when the content is an advertisement, the click rate, or CTR (Click Through Rate), which is the rate at which the user selects the distributed advertisement. When calculating the click rate of an advertisement as a user's interaction rate with distributed content, the click rate is calculated for each user. Therefore, for each ID listed in the ID list 50, the click rate of an advertisement having characteristics corresponding to the ID list 50 is calculated.

コンテンツに対する利用者の操作率を算出したら、情報提供装置10は、操作率が高い利用者を抽出する(ステップS5)。詳しくは、情報提供装置10は、IDリスト50の中から、類似度スコアが高く、且つ、操作率が高い利用者のIDを抽出する。例えば、IDリスト50における類似度スコアと操作率とにそれぞれ閾値が設定され、類似度スコアが類似度スコアに対して設定される閾値以上で、操作率が操作率に対して設定される閾値以上となる利用者を、操作率が高い利用者として抽出する。つまり、IDリスト50における類似度スコアには、閾値としてScore1が設定され、操作率であるクリック率にはCTR1が設定される場合は、類似度スコアがScore1以上で、クリック率がCTR1以上の複数の利用者のIDを、類似度スコアが高く、且つ、クリック率が高い利用者のIDである高操作率ID55として抽出する。 After calculating the user's operation rate for the content, the information providing device 10 extracts users with a high operation rate (step S5). Specifically, the information providing device 10 extracts the IDs of users with high similarity scores and high operation rates from the ID list 50. For example, thresholds are set for each of the similarity score and operation rate in the ID list 50, and the similarity score is equal to or greater than the threshold set for the similarity score, and the operation rate is equal to or greater than the threshold set for the operation rate. Users with a high operation rate are extracted. In other words, if Score1 is set as a threshold for the similarity score in the ID list 50 and CTR1 is set for the click rate, which is the operation rate, then if the similarity score is Score1 or more and the click rate is CTR1 or more, then The ID of the user is extracted as the high operation rate ID55, which is the ID of the user with a high similarity score and a high click rate.

高操作率ID55を抽出したら、抽出した利用者のIDのリストを配信サーバ200に提供する(ステップS6)。つまり、高操作率ID55には、類似度スコアが高く、且つ、クリック率が高い、即ち、操作率が高い複数の利用者のIDであるため、情報提供装置10は、抽出した高操作率ID55のリストを配信サーバ200に提供することにより、類似度スコアが高く、且つ、操作率が高い複数の利用者のIDを提供する。 After extracting the high operation rate ID 55, the list of extracted user IDs is provided to the distribution server 200 (step S6). In other words, since the high operation rate ID55 includes the IDs of multiple users who have a high similarity score and a high click rate, that is, a high operation rate, the information providing device 10 uses the extracted high operation rate ID55. By providing the list to the distribution server 200, IDs of a plurality of users with high similarity scores and high operation rates are provided.

高操作率ID55が提供された配信サーバ200は、抽出された利用者に向けてコンテンツを配信する(ステップS7)。つまり、高操作率ID55として抽出された利用者のIDは、コンテンツに対する興味が高く、且つ、クリックして選択を行う等の操作を行う可能性が高いIDになっている。このため、例えば、コンテンツが広告である場合は、高操作率ID55として抽出されたIDを使用する利用者は、広告の内容に対する興味が高く、且つ、広告をクリックして閲覧を行う等の操作を行う可能性が高くなっている。従って、高操作率ID55として抽出されたIDを用いて使用される端末装置300に対して、高操作率ID55が抽出されたIDリスト50の作成に用いられた特徴を有するコンテンツを配信することにより、配信されたコンテンツに対して利用者がクリック等の操作を行う可能性を高めることができる。 The distribution server 200 provided with the high operation rate ID 55 distributes the content to the extracted users (step S7). In other words, the ID of the user extracted as the high operation rate ID 55 is an ID that has a high interest in the content and is likely to perform an operation such as clicking and making a selection. For this reason, for example, if the content is an advertisement, a user who uses the ID extracted as high operation rate ID 55 has a high interest in the content of the advertisement, and also performs operations such as clicking and viewing the advertisement. are more likely to do so. Therefore, by distributing content having the characteristics used in creating the ID list 50 from which the high operation rate ID 55 was extracted to the terminal device 300 that is used using the ID extracted as the high operation rate ID 55. , it is possible to increase the possibility that a user will perform an operation such as a click on the distributed content.

〔2.情報提供装置の構成〕
以下、上記した情報提供装置10が有する機能構成の一例について説明する。図2は、実施形態に係る情報提供装置の構成例を示す図である。図2に示すように、情報提供装置10は、通信部20、記憶部30及び制御部40を有する。
[2. Configuration of information providing device]
An example of the functional configuration of the information providing device 10 described above will be described below. FIG. 2 is a diagram illustrating a configuration example of an information providing apparatus according to an embodiment. As shown in FIG. 2, the information providing device 10 includes a communication section 20, a storage section 30, and a control section 40.

通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、ログサーバ100や配信サーバ200、端末装置300との間で情報の送受信を行う。 The communication unit 20 is realized by, for example, a NIC (Network Interface Card). The communication unit 20 is connected to the network N by wire or wirelessly, and transmits and receives information between the log server 100, the distribution server 200, and the terminal device 300.

記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、利用者データベース31及びコンテンツデータベース32を記憶する。 The storage unit 30 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. The storage unit 30 also stores a user database 31 and a content database 32.

利用者データベース31には、利用者に関する各種の情報が登録される。利用者データベース31には、例えば、「利用者ID」、「利用者特徴情報」、「アクセス先」、「アクセス日時」、「配信コンテンツ」、「検索キーワード」等といった情報が登録されている。 Various types of information regarding users are registered in the user database 31. In the user database 31, for example, information such as "user ID", "user characteristic information", "access destination", "access date and time", "distribution content", "search keyword", etc. is registered.

ここで、「利用者ID」とは、利用者を識別する識別子である。また、「利用者特徴情報」とは、利用者のデモグラフィック属性やサイコグラフィック属性等、コンテンツのリスティングに用いられる各種利用者の特徴である。また、「アクセス先」とは、対応付けられた「利用者ID」が示す利用者がアクセスしたウェブサイト等のアクセス先を示す情報である。また、「アクセス日時」とは、対応付けられた「利用者ID」が示す利用者が対応付けられた「アクセス先」が示すウェブサイト等にアクセスした日時を示す情報である。また、「配信コンテンツ」とは、対応付けられた「利用者ID」が示す利用者が対応付けられた「アクセス先」が示すウェブサイト等にアクセスした際に配信されたコンテンツのコンテンツIDである。また、「検索キーワード」とは、利用者がウェブサイト上で検索を行った際に用いたキーワードである。 Here, the "user ID" is an identifier that identifies a user. Furthermore, "user characteristic information" refers to various user characteristics used in content listing, such as user demographic attributes and psychographic attributes. Further, the "access destination" is information indicating the access destination, such as a website, accessed by the user indicated by the associated "user ID." Furthermore, the "access date and time" is information indicating the date and time when the user indicated by the associated "user ID" accessed the website etc. indicated by the associated "access destination". Furthermore, "distributed content" is the content ID of the content distributed when the user indicated by the associated "user ID" accesses the website etc. indicated by the associated "access destination". . Moreover, the "search keyword" is the keyword used when the user performed a search on the website.

コンテンツデータベース32には、コンテンツに関する各種の情報が登録される。コンテンツデータベース32には、例えば、「コンテンツID」、「コンテンツの種類」、「コンテンツの内容」、「コンテンツのキーワード」等といった情報が登録されている。 Various types of information related to content are registered in the content database 32. In the content database 32, for example, information such as "content ID", "content type", "content content", "content keyword", etc. is registered.

ここで、「コンテンツID」とは、コンテンツを識別する識別子である。また、「コンテンツの種類」は、広告やニュース等、コンテンツの種類を示す情報である。また、「コンテンツの内容」は、コンテンツにより表示される内容についての情報であり、例えば、コンテンツが広告の場合は、広告によって表示される商品の種類の情報であり、コンテンツがニュースの場合は、ニュースのジャンルについての情報である。また、「コンテンツのキーワード」は、コンテンツの内容やジャンルを代表するキーワードについての情報である。 Here, the "content ID" is an identifier that identifies content. Further, "content type" is information indicating the type of content, such as advertisement or news. In addition, "content content" is information about the content displayed by the content. For example, if the content is an advertisement, it is information about the type of product displayed by the advertisement, and if the content is news, it is information about the content displayed by the content. This is information about the genre of news. Furthermore, the "keyword of content" is information about keywords that represent the content or genre of the content.

制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報提供装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。 The control unit 40 is a controller, and for example, various programs stored in a storage device inside the information providing device 10 are stored in a RAM or the like by a processor such as a CPU (Central Processing Unit) or an MPU (Micro Processing Unit). This is achieved by executing this as a work area. Further, the control unit 40 is a controller, and may be realized by, for example, an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

制御部40は、取得部41、特定部42、スコア算出部43、操作率算出部44、抽出部45を有する。取得部41は、利用者に関する各種の情報とコンテンツに関する各種の情報とをログサーバ100から取得する。その際に、取得部41は、利用者のIDごとに、利用者の特徴情報やアクセス先、アクセス日時、配信コンテンツ、検索キーワード等を取得し、取得した利用者に関する情報を、利用者のIDに対応付けて利用者データベース31に登録する。これにより、取得部41は、利用者の行動履歴を取得する。つまり、取得部41は、ログサーバ100によって管理されている、利用者が検索を行った際の検索キーワードやアクセス先、アクセス日時、配信コンテンツ等を利用者の行動履歴として取得し、利用者のIDに対応付けて利用者データベース31に登録する。 The control unit 40 includes an acquisition unit 41 , a specification unit 42 , a score calculation unit 43 , an operation rate calculation unit 44 , and an extraction unit 45 . The acquisition unit 41 acquires various types of information regarding users and various types of information regarding content from the log server 100. At that time, the acquisition unit 41 acquires the user's characteristic information, access destination, access date and time, distributed content, search keywords, etc. for each user ID, and uses the acquired information about the user with the user ID. It is registered in the user database 31 in association with. Thereby, the acquisition unit 41 acquires the user's action history. In other words, the acquisition unit 41 acquires search keywords, access destinations, access dates and times, distributed contents, etc. when the user searches, which are managed by the log server 100, as the user's action history, and acquires the user's behavior history. It is registered in the user database 31 in association with the ID.

また、取得部41は、コンテンツのIDごとに、コンテンツの種類やコンテンツの内容、コンテンツのキーワード等を取得し、取得したコンテンツに関する情報を、のIDに対応付けてコンテンツデータベース32に登録する。 Further, the acquisition unit 41 acquires the content type, content content, content keyword, etc. for each content ID, and registers the information regarding the acquired content in the content database 32 in association with the ID.

特定部42は、利用者に対して配信をするコンテンツの特徴を特定する。より具体的には、特定部42は、配信サーバ200から配信される予定のあるコンテンツに含まれる情報の分野や種類等のコンテンツの特徴を、コンテンツに基づいて特定する。例えば、特定部42は、コンテンツデータベース32を参照し、コンテンツによって示される商品やサービス、イベント情報の属性等のコンテンツによって示される情報の属性や、コンテンツが利用者に対して興味を催させるものであったり購買を促すものであったりする等のコンテンツ自体の属性等を、コンテンツの特徴として特定する。 The specifying unit 42 specifies the characteristics of content to be distributed to users. More specifically, the identifying unit 42 identifies characteristics of the content, such as fields and types of information included in the content scheduled to be distributed from the distribution server 200, based on the content. For example, the specifying unit 42 refers to the content database 32 and determines the attributes of information indicated by the content, such as the attributes of products, services, and event information indicated by the content, and whether the content arouses interest in the user. The attributes of the content itself, such as whether it is available or encourages purchase, are identified as characteristics of the content.

スコア算出部43は、特定部42で特定したコンテンツの特徴に対する、取得部41で取得した利用者の行動履歴の類似度スコアを、利用者の行動履歴に基づいて利用者ごとに算出する。その際に、スコア算出部43は、コンテンツの特徴ごとに利用者の行動履歴の類似度スコアを算出し、算出した類似度スコアをそれぞれ利用者のIDに付与する。さらに、スコア算出部43は、算出した類似度スコアに基づいて利用者のIDのリストを作成する。 The score calculation unit 43 calculates the similarity score of the user's behavior history acquired by the acquisition unit 41 with respect to the content feature specified by the identification unit 42 for each user based on the user's behavior history. At this time, the score calculation unit 43 calculates the similarity score of the user's action history for each feature of the content, and assigns the calculated similarity score to each user's ID. Furthermore, the score calculation unit 43 creates a list of user IDs based on the calculated similarity score.

図3は、利用者のIDリストの模式図である。利用者のIDリスト50は、各利用者のIDに付与されるコンテンツの特徴ごとの類似度スコアを、コンテンツの特徴ごとにリストにすることにより作成する。コンテンツの特徴ごとに、各利用者のIDと類似度スコアとを対応させたIDリスト50は、類似度スコアが高い順にして作成する。これにより、任意のコンテンツの特徴に対する各利用者の行動履歴の類似の相対的な度合いを、利用者同士の間で比較することができ、例えば、相対的に類似度スコアが高い利用者を抽出することができる。 FIG. 3 is a schematic diagram of a user ID list. The user ID list 50 is created by creating a list of similarity scores for each content feature, which are assigned to each user's ID, for each content feature. An ID list 50 in which each user's ID and similarity score are associated with each other for each content feature is created in descending order of similarity score. This makes it possible to compare the relative degree of similarity of each user's behavior history with respect to the characteristics of a given content, and for example, to extract users with relatively high similarity scores. can do.

操作率算出部44は、利用者に配信したコンテンツに対する利用者の操作率を、利用者ごとに算出する。例えば、操作率算出部44は、利用者データベース31を参照し、利用者に対して配信されたコンテンツを利用者が選択する率であるクリック率(CTR)や、配信されたコンテンツに基づいて購買操作を行う率や、飲食店や宿泊施設、イベント等の予約操作を行う率を、コンテンツに対する利用者の操作率として算出する。その際に、操作率算出部44は、クリックによってコンテンツを選択する際の操作率や、コンテンツに基づいて商品の購入する際の操作率等をそれぞれ算出することにより、コンテンツに対する操作率を、操作の種類ごとに算出する。また、操作率算出部44は、コンテンツに対する利用者の操作率を、コンテンツの特徴ごとに算出する。算出した操作率は、コンテンツの特徴と、コンテンツに対する操作の種類とを対応づけて利用者にIDに付与し、利用者データベース31に登録する。 The operation rate calculating unit 44 calculates, for each user, the user's operation rate for the content distributed to the user. For example, the operation rate calculation unit 44 refers to the user database 31 and calculates the click rate (CTR), which is the rate at which users select content distributed to users, and the purchase rate based on the distributed content. The rate of operations and the rate of reservations for restaurants, accommodation facilities, events, etc. are calculated as the user's operation rate for the content. At this time, the operation rate calculation unit 44 calculates the operation rate when selecting content by clicking, the operation rate when purchasing a product based on the content, etc., to calculate the operation rate for the content. Calculated for each type. Furthermore, the operation rate calculation unit 44 calculates the user's operation rate for the content for each feature of the content. The calculated operation rate is assigned to the ID of the user in association with the characteristics of the content and the type of operation on the content, and is registered in the user database 31.

抽出部45は、類似度スコアが高い複数の利用者の中から、配信されたコンテンツに対する操作率が高い利用者を抽出する。具体的には、抽出部45は、類似度スコアが高い順に作成した利用者のIDリスト50を参照し、IDリスト50の中から、配信されたコンテンツに対する操作率が高い利用者を抽出する。 The extraction unit 45 extracts a user who has a high interaction rate with the distributed content from among the multiple users who have a high similarity score. Specifically, the extraction unit 45 refers to the user ID list 50 created in descending order of similarity score, and extracts from the ID list 50 the users who have a high interaction rate with the distributed content.

図4は、図3示す利用者のIDリストより高操作率IDを抽出する際の説明図である。IDリスト50は、コンテンツの特徴ごとに作成されるため、抽出部45は、操作率が高い利用者を抽出しようとしているコンテンツの特徴に対応して作成されたIDリスト50の中から、配信されたコンテンツに対する操作率が高い利用者のIDを抽出する。例えば、コンテンツに対する操作率が、コンテンツであるに広告に対するクリック率(CTR)である場合は、抽出部45は、広告に対する類似度スコアに基づいて作成されたIDリスト50の中から、広告に対するクリック率が高い利用者のIDを抽出する。 FIG. 4 is an explanatory diagram when extracting high operation rate IDs from the user ID list shown in FIG. 3. Since the ID list 50 is created for each feature of the content, the extraction unit 45 selects the distributed user from among the ID list 50 created corresponding to the feature of the content from which users with high operation rates are to be extracted. IDs of users who have a high rate of operation with respect to content are extracted. For example, if the operation rate for the content is the click rate (CTR) for the advertisement compared to the content, the extraction unit 45 selects the click rate (CTR) for the advertisement from the ID list 50 created based on the similarity score for the advertisement. Extract the IDs of users with high rates.

具体的には、抽出部45は、類似度スコアと操作率とに対してそれぞれ閾値を設定し、類似度スコアが類似度スコアに対して設定される閾値以上で、且つ、操作率が操作率に対して設定される閾値以上となる利用者を、操作率が高い利用者として抽出する。これにより、操作率が高い利用者を抽出する際に、類似度スコアが小さい利用者や、操作率が小さい利用者を抽出することを抑制する。例えば、IDリスト50における類似度スコアには、閾値としてScore1を設定し、操作率であるクリック率には、閾値としてCTR1を設定する。このように、類似度スコアとクリック率とに対して設定される閾値に対して、抽出部45は、利用者のIDに付与されるCTRが、CTR≧CTR1で、IDに付与される類似度スコアが、類似度スコア≧Score1となる複数の利用者のIDを、類似度スコアが高く、且つ、クリック率が高い利用者のIDである高操作率ID55として抽出する。 Specifically, the extraction unit 45 sets thresholds for each of the similarity score and the operation rate, and the similarity score is equal to or greater than the threshold set for the similarity score, and the operation rate is equal to or greater than the operation rate. Users whose operation rate is greater than or equal to the threshold value set for the user are extracted as users with a high operation rate. This suppresses the extraction of users with low similarity scores or users with low operation rates when extracting users with high operation rates. For example, Score1 is set as a threshold for the similarity score in the ID list 50, and CTR1 is set as a threshold for the click rate, which is the operation rate. In this way, with respect to the threshold values set for the similarity score and the click rate, the extraction unit 45 determines that if the CTR given to the user's ID is CTR≧CTR1, the similarity given to the ID is The IDs of a plurality of users whose scores satisfy similarity score≧Score1 are extracted as high operation rate ID55, which is the ID of a user who has a high similarity score and a high click rate.

また、抽出部45は、複数の利用者の平均の操作率である平均操作率を、目標となる操作率である目標操作率に近付けることのできる複数の利用者を抽出することも可能になっている。複数の利用者の平均操作率を目標操作率に近付けることのできる複数の利用者を抽出する際には、操作率の閾値を変化させすることにより、抽出する複数の利用者の平均操作率を目標操作率に近付ける。例えば、目標操作率として、目標となるクリック率である目標CTRを設定する場合は、クリック率の閾値であるCTR1を変化させることにより、抽出する複数の利用者の平均操作率である平均CTRを、目標CTRに近付ける。 Furthermore, the extraction unit 45 can also extract a plurality of users who can bring the average operation rate, which is the average operation rate of a plurality of users, closer to the target operation rate, which is the target operation rate. ing. When extracting multiple users that can bring the average operation rate of multiple users closer to the target operation rate, by changing the operation rate threshold, the average operation rate of the multiple users to be extracted can be reduced. Get closer to the target operation rate. For example, when setting the target CTR, which is the target click rate, as the target operation rate, by changing CTR1, which is the click rate threshold, the average CTR, which is the average operation rate of multiple extracted users, can be set. , get closer to the target CTR.

具体的には、IDリスト50に含まれる利用者のIDの件数をNとし、目標CTRをCTRGOALとする場合、下記の式(1)に示すように、N件のIDのそれぞれのCTRの平均である平均CTRを、CTRGOALに近付けるようにCTR1を変化させる。 Specifically, when the number of user IDs included in the ID list 50 is N and the target CTR is CTR GOAL , the CTR of each of the N IDs is calculated as shown in equation (1) below. CTR1 is changed so that the average CTR approaches the CTR GOAL .

Figure 2024028005000002
Figure 2024028005000002

さらに、抽出部45は、複数の利用者の平均操作率を、目標操作率に近付ける際には、類似度スコアの閾値も変化させる。つまり、抽出部45は、類似度スコアの閾値であるScore1も変化させることにより、平均CTRをCTRGOALに近付ける。抽出部45は、これらのように、操作率の閾値や類似度スコアの閾値を繰り返し変化させることにより、複数の利用者の平均操作率を目標操作率に近付ける。 Furthermore, when bringing the average operation rate of a plurality of users closer to the target operation rate, the extraction unit 45 also changes the threshold of the similarity score. In other words, the extraction unit 45 brings the average CTR closer to the CTR GOAL by also changing Score1, which is the threshold of the similarity score. The extraction unit 45 brings the average operation rate of a plurality of users closer to the target operation rate by repeatedly changing the operation rate threshold and the similarity score threshold as described above.

なお、抽出部45は、コンテンツに対する操作率が高い利用者を抽出する際には、類似度スコアと操作率との乗算に基づいて算出される値が、類似度スコアと操作率との乗算に基づいて算出される値に対して設定される下限値A以上の利用者の中から、操作率が高い利用者を抽出するのが好ましい。 Note that when extracting users with a high interaction rate with respect to content, the extraction unit 45 calculates that the value calculated based on the multiplication of the similarity score and the interaction rate is based on the multiplication of the similarity score and the interaction rate. It is preferable to extract users with a high operation rate from among the users whose operation rate is equal to or higher than the lower limit value A set for the value calculated based on the calculated value.

つまり、複数の類似度スコアと複数のCTRとの乗算に基づいて算出される複数の値をIDリスト50上に表すと、高操作率ID55におけるCTR1となる部分とScore1となる部分とを結ぶ曲線部56により示される(図4参照)。このため、コンテンツに対する操作率が高い利用者を抽出する際には、CTRが曲線部56よりも高く、類似度スコアも曲線部56より高いIDを、高操作率ID55として抽出する。このように、曲線部56も用いて高操作率ID55を抽出する際において、類似度スコアと操作率との乗算に基づいて算出される値に対して下限値Aを設定することにより、曲線部56を調節できるため、高操作率ID55に含まれるIDを調節することができる。 In other words, if multiple values calculated based on the multiplication of multiple similarity scores and multiple CTRs are expressed on the ID list 50, a curve connecting the portion with CTR 1 and the portion with Score 1 in high operation rate ID 55 56 (see FIG. 4). Therefore, when extracting users with a high operation rate for content, an ID with a higher CTR than the curved portion 56 and a higher similarity score than the curved portion 56 is extracted as the high operation rate ID 55. In this way, when extracting the high operation rate ID 55 using the curve part 56, by setting the lower limit value A for the value calculated based on the multiplication of the similarity score and the operation rate, the curve part 56 can be extracted. 56, it is possible to adjust the IDs included in the high operation rate ID55.

また、曲線部56も用いて高操作率ID55を抽出する際において、複数の利用者の平均操作率を目標操作率に近付ける場合には、操作率の閾値であるCTR1や、類似度スコアの閾値であるScore1を変化させる他に、類似度スコアと操作率との乗算に基づいて算出される値に対して設定される下限値Aも変化させる。つまり、曲線部56が、類似度スコア×CTRを示すものである場合は、類似度スコアとCTRと下限値Aとの関係は、類似度スコア×CTR≧Aになるため、下限値Aを変化させることにより、抽出される類似度スコアやCTRを変化させることができる。これにより、平均操作率を変化させることができるため、平均操作率を変化させて平均操作率を目標操作率に近付けることができる。 In addition, when extracting the high operation rate ID55 using the curve part 56, in order to bring the average operation rate of multiple users closer to the target operation rate, CTR1, which is the operation rate threshold, or the similarity score threshold In addition to changing Score1, the lower limit value A that is set for the value calculated based on the multiplication of the similarity score and the operation rate is also changed. In other words, when the curve part 56 indicates similarity score x CTR, the relationship between similarity score, CTR, and lower limit value A is similarity score x CTR ≧A, so lower limit value A is changed. By doing so, the extracted similarity score and CTR can be changed. Thereby, the average operation rate can be changed, so the average operation rate can be changed to bring the average operation rate closer to the target operation rate.

〔3.情報提供装置が実行する処理の流れの一例〕
続いて、図5を用いて、情報提供装置10が実行する抽出処理の流れについて説明する。図5は、実施形態に係る情報提供装置が実行する抽出処理の流れの一例を示すフローチャートである。
[3. An example of the flow of processing executed by the information providing device]
Next, the flow of the extraction process executed by the information providing device 10 will be described using FIG. 5. FIG. 5 is a flowchart illustrating an example of the flow of an extraction process executed by the information providing apparatus according to the embodiment.

例えば、情報提供装置10は、利用者の行動履歴を取得する(ステップS101)。そして、情報提供装置10は、利用者に対して配信をするコンテンツの特徴を特定する(ステップS102)。利用者の行動履歴を取得し、コンテンツの特徴を特定したら、コンテンツの特徴に対する、利用者の行動履歴の類似度スコアを算出する(ステップS103)。類似度スコアを算出したら、情報提供装置10は、類似度スコアが高い順となる利用者のIDリスト50を作成する(ステップST104)。 For example, the information providing device 10 acquires the user's behavior history (step S101). Then, the information providing device 10 specifies the characteristics of the content to be distributed to the user (step S102). After acquiring the user's behavior history and specifying the content features, a similarity score of the user's behavior history with respect to the content features is calculated (step S103). After calculating the similarity score, the information providing device 10 creates an ID list 50 of users in descending order of similarity score (step ST104).

また、情報提供装置10は、配信されたコンテンツに対する利用者の操作率を算出する(ステップS105)。利用者の操作率を算出したら、情報提供装置10は、操作率が高い利用者を抽出する(ステップS106)。つまり、情報提供装置10は、IDリスト50に含まれる複数の利用者の中から、類似度スコアが高く、且つ、操作率が高い複数の利用者のIDである高操作率ID55を抽出する。高操作率ID55を抽出したら、抽出した利用者のIDに向けて、コンテンツを配信する(ステップS107)。これにより、情報提供装置10は、類似度スコアが高く、且つ、コンテンツに対する操作率が高い利用者にコンテンツを配信することができる。 Furthermore, the information providing device 10 calculates the user's operation rate for the distributed content (step S105). After calculating the user's operation rate, the information providing device 10 extracts users with a high operation rate (step S106). That is, the information providing device 10 extracts high operation rate IDs 55, which are IDs of users with high similarity scores and high operation rates, from among the multiple users included in the ID list 50. After extracting the high operation rate ID 55, content is distributed to the extracted user ID (step S107). Thereby, the information providing apparatus 10 can distribute the content to users who have a high similarity score and a high interaction rate with respect to the content.

〔4.変形例〕
上記では、情報提供装置10による抽出処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報提供装置10が実行する抽出処理のバリエーションについて説明する。
[4. Modified example]
An example of the extraction process by the information providing device 10 has been described above. However, embodiments are not limited thereto. Hereinafter, variations of the extraction process executed by the information providing device 10 will be explained.

〔4-1.コンテンツに対する操作率について〕
上述した例では、情報提供装置10の抽出部45で、コンテンツに対する操作率が高い利用者を抽出する際に、クリック率が高い利用者を抽出していたが、抽出部45では、コンテンツに対する複数の操作率が高い利用者を抽出してもよい。つまり、情報提供装置10の制御部40が有する操作率算出部44は、利用者がコンテンツに対して行った複数の異なる操作に対してそれぞれ操作率を算出し、抽出部45は、類似度スコアが高い複数の利用者の中から、操作率算出部44で算出した複数の操作率のいずれもが高い利用者を抽出してもよい。
[4-1. About the operation rate for content]
In the above example, the extraction unit 45 of the information providing device 10 extracts users with a high click rate when extracting users with a high interaction rate with respect to the content. Users with a high operation rate may be extracted. That is, the operation rate calculation unit 44 included in the control unit 40 of the information providing device 10 calculates the operation rate for each of a plurality of different operations performed by the user on the content, and the extraction unit 45 calculates the similarity score. Users with high operation rates calculated by the operation rate calculation unit 44 may be extracted from among the multiple users with high operation rates.

図6は、広告のクリック率と広告コンバージョン率が高い利用者のIDを抽出する際の説明図である。操作率算出部44は、コンテンツに対する操作率として、例えば、図6に示すように、広告のクリック率(CTR)の他に、広告のコンバージョン率(CVI)を算出してもよい。この場合、抽出部45は、CTRに対しては閾値として下限CTRを設定し、CVIに対しては閾値として下限CVIを設定し、類似度スコアが類似度スコアに対して設定される閾値である下限類似度スコア以上となる複数の利用者のIDのうち、CTRが下限CTR以上で、CVIが下限CVIとなる利用者のIDを、高操作率ID55として抽出する。 FIG. 6 is an explanatory diagram when extracting IDs of users with high advertisement click rate and advertisement conversion rate. The operation rate calculation unit 44 may calculate an advertisement conversion rate (CVI) in addition to the advertisement click rate (CTR), as shown in FIG. 6, for example, as the operation rate for the content. In this case, the extraction unit 45 sets the lower limit CTR as a threshold for CTR, sets the lower limit CVI as a threshold for CVI, and the similarity score is the threshold set for the similarity score. Among the IDs of a plurality of users whose CTR is equal to or higher than the lower limit similarity score, the ID of a user whose CTR is equal to or higher than the lower limit CVI and whose CVI is the lower limit CVI is extracted as a high operation rate ID55.

また、抽出部45は、利用者の平均CTRが目標CTRに近付くように下限CTRを変化させて調整し、利用者の平均CVIが目標CVIに近付くように下限CVIを変化させて調整する。これにより、平均CTRや平均CVIを、目標CTRや目標CVIに近付けることのできる高操作率ID55を抽出することができる。 Further, the extraction unit 45 changes and adjusts the lower limit CTR so that the user's average CTR approaches the target CTR, and changes and adjusts the lower limit CVI so that the user's average CVI approaches the target CVI. Thereby, it is possible to extract a high operation rate ID55 that can bring the average CTR and average CVI closer to the target CTR and target CVI.

〔4-2.コンテンツに対する操作率の種類について〕
また、類似度スコアが高い複数の利用者の中から、複数の操作率のいずれもが高い利用者を抽出する際における操作率は、広告のクリック率(CTR)や広告のコンバージョン率(CVI)以外であってもよい。
[4-2. Regarding the types of operation rates for content]
In addition, when extracting users with high interaction rates from multiple users with high similarity scores, the interaction rate is determined by the advertisement click rate (CTR) and advertisement conversion rate (CVI). It may be other than that.

図7は、操作率の指標1と指標2が高い利用者のIDを抽出する際の説明図である。コンテンツに対する操作率は、広告のクリック率(CTR)や広告のコンバージョン率(CVI)の他に、様々な操作に対する操作率が想定されるが、類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する際には、操作率の種類ごとに下限値と目標値を設定するのが好ましい。例えば、操作率が高い利用者を抽出する際における複数の操作率が、図7に示すように指標1と指標2とである場合は、指標1に対しては指標1の下限値と目標値が設定され、指標2に対しては指標2の下限値と目標値が設定される。この場合、抽出部45は、類似度スコアが類似度スコアに対して設定される下限類似度スコア以上となる複数の利用者のIDのうち、指標1が指標1の下限値で、指標2が指標2の下限値となる利用者のIDを、高操作率ID55として抽出する。 FIG. 7 is an explanatory diagram when extracting IDs of users with high index 1 and index 2 of operation rate. In addition to the advertising click rate (CTR) and advertising conversion rate (CVI), the interaction rate for content is assumed to be the interaction rate for various operations. When extracting users with a high rate, it is preferable to set a lower limit value and a target value for each type of operation rate. For example, if multiple operation rates when extracting users with a high operation rate are index 1 and index 2 as shown in FIG. 7, for index 1, the lower limit value of index 1 and the target value is set, and for index 2, the lower limit value and target value of index 2 are set. In this case, the extraction unit 45 determines that among the IDs of a plurality of users whose similarity scores are equal to or higher than the lower limit similarity score set for the similarity score, index 1 is the lower limit value of index 1 and index 2 is the lower limit value of index 1. The user ID that is the lower limit value of index 2 is extracted as high operation rate ID55.

また、抽出部45は、指標1の平均値が指標1の目標値に近付くように指標1の下限値を変化させて調整し、指標2の平均値が指標2の目標値に近付くように指標2の下限値を変化させて調整する。これにより、指標1の平均値や指標2の平均値を、指標1の目標値や指標2の目標値に近付けることのできる高操作率ID55を抽出することができる。 The extraction unit 45 also changes and adjusts the lower limit value of index 1 so that the average value of index 1 approaches the target value of index 1, and adjusts the lower limit value of index 1 so that the average value of index 2 approaches the target value of index 2. Adjust by changing the lower limit value of 2. Thereby, a high operation rate ID55 that can bring the average value of index 1 and the average value of index 2 close to the target value of index 1 and the target value of index 2 can be extracted.

類似度スコアが高い複数の利用者の中から、複数の操作率のいずれもが高い利用者を抽出する際には、類似度スコアと、複数の操作率の指標とより抽出するため、図7に示すように、IDリスト50を、複数の操作率の指標の数N+1次元空間で作成することにより、高操作率ID55を抽出することができる。 When extracting a user with a high number of operation rates from among multiple users with a high similarity score, the extraction is performed using the similarity score and multiple indexes of operation rates. As shown in the figure, by creating the ID list 50 in the number N+1-dimensional space of a plurality of operation rate indicators, high operation rate IDs 55 can be extracted.

〔4-3.装置構成〕
情報提供装置10は、フロントエンドサーバと、バックエンドサーバとで実現されてもよい。このような場合、フロントエンドサーバには、図2に示す取得部41、特定部42が配置され、バックエンドサーバには、スコア算出部43、操作率算出部44、抽出部45が配置される。また、記憶部30に登録された各データベース31、32は、外部のストレージサーバに保持されていてもよい。
[4-3. Device configuration〕
The information providing device 10 may be realized by a front end server and a back end server. In such a case, the front-end server is provided with the acquisition section 41 and the identification section 42 shown in FIG. 2, and the back-end server is provided with the score calculation section 43, the operation rate calculation section 44, and the extraction section 45. . Furthermore, each of the databases 31 and 32 registered in the storage unit 30 may be held in an external storage server.

〔4-4.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、逆に、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[4-4. others〕
Further, among the processes described in the above embodiments, all or part of the processes described as being performed automatically can be performed manually, and conversely, the processes described as being performed manually can be performed manually. All or part of this can also be performed automatically using known methods. In addition, information including the processing procedures, specific names, and various data and parameters shown in the above documents and drawings may be changed arbitrarily, unless otherwise specified. For example, the various information shown in each figure is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each device shown in the drawings is functionally conceptual, and does not necessarily need to be physically configured as shown in the drawings. In other words, the specific form of distributing and integrating each device is not limited to what is shown in the diagram, and all or part of the devices can be functionally or physically distributed or integrated in arbitrary units depending on various loads and usage conditions. Can be integrated and configured.

また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Furthermore, the embodiments described above can be combined as appropriate within a range that does not conflict with the processing contents.

〔4-5.プログラム〕
また、上述した実施形態に係る情報提供装置10は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[4-5. program〕
Further, the information providing apparatus 10 according to the embodiment described above is realized by, for example, a computer 1000 having a configuration as shown in FIG. FIG. 8 is a diagram showing an example of the hardware configuration. The computer 1000 is connected to an output device 1010 and an input device 1020, and has an arithmetic device 1030, a primary storage device 1040, a secondary storage device 1050, an output IF (Interface) 1060, an input IF 1070, and a network IF 1080 connected by a bus 1090. has.

演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。 The arithmetic unit 1030 operates based on programs stored in the primary storage device 1040 and the secondary storage device 1050, programs read from the input device 1020, and performs various processes. The primary storage device 1040 is a memory device such as a RAM that temporarily stores data used by the arithmetic unit 1030 for various calculations. Further, the secondary storage device 1050 is a storage device in which data used by the arithmetic unit 1030 for various calculations and various databases are registered, and includes ROM (Read Only Memory), HDD (Hard Disk Drive), flash memory, etc. This is realized by

出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。 The output IF 1060 is an interface for transmitting information to be output to an output device 1010 that outputs various information such as a monitor or a printer, and is, for example, a USB (Universal Serial Bus), a DVI (Digital Visual Interface), This is realized using a connector compliant with standards such as HDMI (registered trademark) (High Definition Multimedia Interface). Further, the input IF 1070 is an interface for receiving information from various input devices 1020 such as a mouse, a keyboard, and a scanner, and is realized by, for example, a USB or the like.

なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。 Note that the input device 1020 is, for example, an optical recording medium such as a CD (Compact Disc), a DVD (Digital Versatile Disc), or a PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), or a tape. It may be a device that reads information from a medium, a magnetic recording medium, a semiconductor memory, or the like. Further, the input device 1020 may be an external storage medium such as a USB memory.

ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。 Network IF 1080 receives data from other devices via network N and sends it to computing device 1030, and also sends data generated by computing device 1030 to other devices via network N.

演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。 Arithmetic device 1030 controls output device 1010 and input device 1020 via output IF 1060 and input IF 1070. For example, the arithmetic device 1030 loads a program from the input device 1020 or the secondary storage device 1050 onto the primary storage device 1040, and executes the loaded program.

例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。 For example, when the computer 1000 functions as the information providing device 10, the arithmetic unit 1030 of the computer 1000 realizes the functions of the control unit 40 by executing a program loaded onto the primary storage device 1040.

〔5.効果〕
上述したように、情報提供装置10は、コンテンツの特徴に対する利用者の行動履歴の類似度の度合いを示す類似度スコアを利用者の行動履歴に基づいて利用者ごとに算出し、利用者に配信したコンテンツに対して利用者が操作を行った割合を示す操作率を利用者ごとに算出する。そして、情報提供装置10は、類似度スコアが高い複数の利用者の中から操作率が高い利用者を抽出する。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。従って、情報提供装置10で抽出した利用者に向けてコンテンツを配信することにより、コンテンツの特徴に対する行動履歴の類似度スコアが高くても、コンテンツに対する操作を行う可能性が低い利用者に対してコンテンツを配信することを抑制できる。
[5. effect〕
As described above, the information providing device 10 calculates a similarity score for each user based on the user's action history, which indicates the degree of similarity between the user's action history and the content feature, and distributes the similarity score to the user. An operation rate is calculated for each user, which indicates the rate at which users interacted with the content. Then, the information providing device 10 extracts a user with a high operation rate from among the multiple users with a high similarity score. Thereby, the information providing device 10 can extract users who can enhance the content distribution effect. Therefore, by distributing content to users extracted by the information providing device 10, it is possible to distribute content to users who are unlikely to perform operations on the content even if the similarity score of their behavior history with respect to the features of the content is high. Distribution of content can be suppressed.

また、情報提供装置10は、利用者がコンテンツに対して行った複数の異なる操作に対してそれぞれ操作率を算出し、類似度スコアが高い複数の利用者の中から、複数の操作率のいずれもが高い利用者を抽出する。このため、コンテンツに対する操作として複数の種類の操作が想定される場合でも、それぞれの操作に対する操作率が高い利用者を抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。 In addition, the information providing device 10 calculates operation rates for each of a plurality of different operations performed by the user on the content, and selects one of the plurality of operation rates from among the plurality of users with a high similarity score. Extract users with a high level of comfort. Therefore, even if a plurality of types of operations are assumed to be performed on the content, it is possible to extract users who have a high operation rate for each operation. Thereby, the information providing device 10 can extract users who can enhance the content distribution effect.

また、情報提供装置10は、複数の利用者の平均の操作率である平均操作率を、目標となる操作率である目標操作率に近付けることのできる複数の利用者を抽出する。このため、コンテンツに対する操作率が高い操作率が高い利用者を効果的に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。 Further, the information providing device 10 extracts a plurality of users who can bring the average operation rate, which is the average operation rate of the plurality of users, closer to the target operation rate, which is the target operation rate. Therefore, it is possible to effectively extract users who have a high operation rate with respect to content. Thereby, the information providing device 10 can extract users who can enhance the content distribution effect.

また、情報提供装置10は、操作率が操作率に対して設定される閾値以上となる利用者を操作率が高い利用者として抽出するため、コンテンツに対する操作率が高い利用者を適切に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。 Furthermore, the information providing device 10 extracts users whose operation rate is equal to or higher than a threshold set for the operation rate as users with a high operation rate, and thus appropriately extracts users who have a high operation rate with respect to the content. be able to. Thereby, the information providing device 10 can extract users who can enhance the content distribution effect.

また、情報提供装置10は、操作率の閾値を変化させることにより、抽出する複数の利用者の平均操作率を目標操作率に近付ける。このため、コンテンツに対する操作率が高い操作率が高い利用者を効果的に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。 Furthermore, the information providing device 10 brings the average operation rate of the plurality of users to be extracted closer to the target operation rate by changing the operation rate threshold. Therefore, it is possible to effectively extract users who have a high operation rate with respect to content. Thereby, the information providing device 10 can extract users who can enhance the content distribution effect.

また、情報提供装置10は、類似度スコアが類似度スコアに対して設定される閾値以上の利用者の中から操作率が高い利用者を抽出する。このため、コンテンツの特徴に対する類似度スコアが高く、コンテンツに対する操作率が高い利用者を適切に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。 Furthermore, the information providing device 10 extracts users with a high operation rate from among users whose similarity score is equal to or greater than a threshold set for the similarity score. Therefore, it is possible to appropriately extract users who have a high similarity score with respect to the features of the content and a high operation rate with respect to the content. Thereby, the information providing device 10 can extract users who can enhance the content distribution effect.

また、情報提供装置10は、類似度スコアの閾値を変化させることにより、抽出する複数の利用者の平均操作率を目標操作率に近付ける。このため、コンテンツの特徴に対する類似度スコアが高く、コンテンツに対する操作率が高い操作率が高い利用者を効果的に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。 Furthermore, the information providing device 10 brings the average operation rate of the plurality of users to be extracted closer to the target operation rate by changing the threshold of the similarity score. Therefore, it is possible to effectively extract users who have a high similarity score with respect to the features of the content and a high operation rate with respect to the content. Thereby, the information providing device 10 can extract users who can enhance the content distribution effect.

また、情報提供装置10は、類似度スコアと操作率との乗算に基づいて算出される値が、類似度スコアと操作率との乗算に基づいて算出される値に対して設定される下限値以上の利用者の中から操作率が高い利用者を抽出する。このため、コンテンツの特徴に対する類似度スコアが高く、コンテンツに対する操作率が高い操作率が高い利用者を適切に抽出することができる。これにより、情報提供装置10は、コンテンツの配信効果を高めることのできる利用者を抽出することができる。 Further, the information providing device 10 sets the value calculated based on the multiplication of the similarity score and the operation rate to a lower limit set with respect to the value calculated based on the multiplication of the similarity score and the operation rate. Users with a high operation rate are extracted from the above users. Therefore, it is possible to appropriately extract users who have a high similarity score with respect to the features of the content and a high operation rate with respect to the content. Thereby, the information providing device 10 can extract users who can enhance the content distribution effect.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Some of the embodiments of the present application have been described above in detail based on the drawings, but these are merely examples, and various modifications and variations may be made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure section of the invention. It is possible to carry out the invention in other forms with modifications.

また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、提供部は、提供手段や提供回路に読み替えることができる。 Furthermore, the above-mentioned "section, module, unit" can be read as "means", "circuit", etc. For example, the providing unit can be read as providing means or providing circuit.

10 情報提供装置
20 通信部
30 記憶部
31 利用者データベース
32 コンテンツデータベース
40 制御部
41 取得部
42 特定部
43 スコア算出部
44 操作率算出部
45 抽出部
50 IDリスト
55 高操作率ID
56 曲線部
100 ログサーバ
200 配信サーバ
300 端末装置
10 information providing device 20 communication unit 30 storage unit 31 user database 32 content database 40 control unit 41 acquisition unit 42 identification unit 43 score calculation unit 44 operation rate calculation unit 45 extraction unit 50 ID list 55 high operation rate ID
56 curved section 100 log server 200 distribution server 300 terminal device

Claims (10)

利用者の行動履歴を取得する取得部と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定部と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出部と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出部と、
前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出部と、
を有することを特徴とする抽出装置。
an acquisition unit that acquires the user's action history;
a specifying unit that specifies the characteristics of the content to be distributed to the user;
a score calculation unit that calculates a similarity score for each of the users based on the action history, which indicates the degree of similarity of the action history with respect to the feature of the content;
an operation rate calculation unit that calculates, for each user, an operation rate indicating the rate at which the user performed operations on the content distributed to the user;
an extraction unit that extracts the user with the high operation rate from among the multiple users with the high similarity score;
An extraction device characterized by having:
前記操作率算出部は、前記利用者が前記コンテンツに対して行った複数の異なる操作に対してそれぞれ前記操作率を算出し、
前記抽出部は、前記類似度スコアが高い複数の前記利用者の中から、前記操作率算出部で算出した複数の前記操作率のいずれもが高い前記利用者を抽出する請求項1に記載の抽出装置。
The operation rate calculation unit calculates the operation rate for each of a plurality of different operations performed by the user on the content,
2. The extraction unit extracts the users with high all of the plurality of operation rates calculated by the operation rate calculation unit from among the plurality of users with high similarity scores. Extraction device.
前記抽出部は、複数の前記利用者の平均の前記操作率である平均操作率を、目標となる前記操作率である目標操作率に近付けることのできる複数の前記利用者を抽出する請求項1または2に記載の抽出装置。 2. The extraction unit extracts a plurality of users who can bring an average operation rate, which is the average operation rate of the plurality of users, closer to a target operation rate, which is the operation rate as a target. Or the extraction device according to 2. 前記抽出部は、前記操作率が前記操作率に対して設定される閾値以上となる前記利用者を前記操作率が高い前記利用者として抽出する請求項3に記載の抽出装置。 The extraction device according to claim 3, wherein the extraction unit extracts the user whose operation rate is equal to or higher than a threshold set for the operation rate as the user who has the high operation rate. 前記抽出部は、前記操作率の前記閾値を変化させることにより、抽出する複数の前記利用者の前記平均操作率を前記目標操作率に近付ける請求項4に記載の抽出装置。 The extraction device according to claim 4, wherein the extraction unit brings the average operation rate of the plurality of users to be extracted closer to the target operation rate by changing the threshold value of the operation rate. 前記抽出部は、前記類似度スコアが前記類似度スコアに対して設定される閾値以上の前記利用者の中から前記操作率が高い前記利用者を抽出する請求項3に記載の抽出装置。 The extraction device according to claim 3, wherein the extraction unit extracts the users with the high operation rate from among the users whose similarity scores are equal to or higher than a threshold set for the similarity scores. 前記抽出部は、前記類似度スコアの前記閾値を変化させることにより、抽出する複数の前記利用者の前記平均操作率を前記目標操作率に近付ける請求項6に記載の抽出装置。 The extraction device according to claim 6, wherein the extraction unit brings the average operation rate of the plurality of users to be extracted closer to the target operation rate by changing the threshold value of the similarity score. 前記抽出部は、前記類似度スコアと前記操作率との乗算に基づいて算出される値が、前記類似度スコアと前記操作率との乗算に基づいて算出される値に対して設定される下限値以上の前記利用者の中から前記操作率が高い前記利用者を抽出する請求項3に記載の抽出装置。 The extraction unit is configured such that a value calculated based on the multiplication of the similarity score and the operation rate is a lower limit set with respect to a value calculated based on the multiplication of the similarity score and the operation rate. The extraction device according to claim 3, wherein the user whose operation rate is high is extracted from among the users whose operation rate is higher than a value. 抽出装置が実行する抽出方法であって、
利用者の行動履歴を取得する取得工程と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定工程と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出工程と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出工程と、
前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出工程と、
を含むことを特徴とする抽出方法。
An extraction method performed by an extraction device, comprising:
an acquisition step of acquiring the user's behavior history;
a specifying step of specifying the characteristics of the content to be distributed to the user;
a score calculation step of calculating a similarity score for each user based on the action history, which indicates the degree of similarity of the action history to the feature of the content;
an operation rate calculation step of calculating for each user an operation rate indicating the rate at which the user performed an operation on the content distributed to the user;
an extraction step of extracting the user with the high operation rate from among the multiple users with the high similarity score;
An extraction method characterized by comprising:
利用者の行動履歴を取得する取得手順と、
前記利用者に対して配信をするコンテンツの特徴を特定する特定手順と、
前記コンテンツの特徴に対する前記行動履歴の類似度の度合いを示す類似度スコアを前記行動履歴に基づいて前記利用者ごとに算出するスコア算出手順と、
前記利用者に配信した前記コンテンツに対して前記利用者が操作を行った割合を示す操作率を前記利用者ごとに算出する操作率算出手順と、
前記類似度スコアが高い複数の前記利用者の中から前記操作率が高い前記利用者を抽出する抽出手順と、
をコンピュータに実行させるための抽出プログラム。
an acquisition procedure for acquiring the user's behavior history;
a specific procedure for specifying the characteristics of the content to be distributed to the user;
a score calculation procedure for calculating a similarity score for each user based on the action history, which indicates the degree of similarity of the action history to the feature of the content;
an operation rate calculation procedure for calculating, for each user, an operation rate indicating the rate at which the user performed operations on the content distributed to the user;
an extraction procedure for extracting the user with the high operation rate from among the multiple users with the high similarity score;
An extraction program that allows a computer to execute
JP2022131298A 2022-08-19 2022-08-19 Extraction device, extraction method and extraction program Active JP7335405B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022131298A JP7335405B1 (en) 2022-08-19 2022-08-19 Extraction device, extraction method and extraction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022131298A JP7335405B1 (en) 2022-08-19 2022-08-19 Extraction device, extraction method and extraction program

Publications (2)

Publication Number Publication Date
JP7335405B1 JP7335405B1 (en) 2023-08-29
JP2024028005A true JP2024028005A (en) 2024-03-01

Family

ID=87764122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022131298A Active JP7335405B1 (en) 2022-08-19 2022-08-19 Extraction device, extraction method and extraction program

Country Status (1)

Country Link
JP (1) JP7335405B1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123739A (en) * 2000-10-12 2002-04-26 Sony Corp Information processing apparatus and method, and recording medium
JP2013125468A (en) * 2011-12-15 2013-06-24 Yahoo Japan Corp Advertisement distribution device
JP2016062297A (en) * 2014-09-18 2016-04-25 ヤフー株式会社 Advertisement tender management system, method, and program
WO2017072873A1 (en) * 2015-10-28 2017-05-04 楽天株式会社 Document distribution device, document distribution method, program, and non-temporary recording medium
JP2018101323A (en) * 2016-12-21 2018-06-28 ヤフー株式会社 Calculation device, calculation method, and calculation program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123739A (en) * 2000-10-12 2002-04-26 Sony Corp Information processing apparatus and method, and recording medium
JP2013125468A (en) * 2011-12-15 2013-06-24 Yahoo Japan Corp Advertisement distribution device
JP2016062297A (en) * 2014-09-18 2016-04-25 ヤフー株式会社 Advertisement tender management system, method, and program
WO2017072873A1 (en) * 2015-10-28 2017-05-04 楽天株式会社 Document distribution device, document distribution method, program, and non-temporary recording medium
JP2018101323A (en) * 2016-12-21 2018-06-28 ヤフー株式会社 Calculation device, calculation method, and calculation program

Also Published As

Publication number Publication date
JP7335405B1 (en) 2023-08-29

Similar Documents

Publication Publication Date Title
JP6784499B2 (en) Decision device, decision method and decision program
JP6872851B2 (en) Information selection device, information selection method and information selection program
US20110093520A1 (en) Automatically identifying and summarizing content published by key influencers
CN110059256B (en) Systems, methods and devices for displaying information
US11016633B2 (en) Intelligent support recommendations for snap-ins
US20130297408A1 (en) Determining advertisement preferences
JP2018045553A (en) Selection device, selection method, and selection program
JP7122286B2 (en) Decision device, decision method and decision program
JP2016153972A (en) Extraction device, extraction method and extraction program
JP7443280B2 (en) Provision device, method and program
JP7174743B2 (en) Information selection device, information selection method and information selection program
CN113127683A (en) Content recommendation method and device, electronic equipment and medium
JP7335405B1 (en) Extraction device, extraction method and extraction program
US8566156B2 (en) Combining segments of users into vertically indexed super-segments
JP7042787B2 (en) Judgment device, judgment method, and judgment program
JP2020140242A (en) Information processing equipment, information processing methods and information processing programs
US20180165741A1 (en) Information providing device, information providing method, information providing program, and computer-readable storage medium storing the program
US10832276B2 (en) Systems and methods for ad placement in content streams
JP7082085B2 (en) Decision device, decision method and decision program
JP6695267B2 (en) Determination device, determination method, and determination program
JP7033864B2 (en) Judgment device, judgment method and judgment program
JP7164683B1 (en) Information processing device, information processing method, and information processing program
JP7443432B2 (en) Determination device, determination method and determination program
JP7260439B2 (en) Extraction device, extraction method and extraction program
JP2019149200A (en) Provision device, provision method, and provision program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220916

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230718

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230817

R150 Certificate of patent or registration of utility model

Ref document number: 7335405

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250