[go: up one dir, main page]

JP2008123043A - Information processing apparatus and method, program, and recording medium - Google Patents

Information processing apparatus and method, program, and recording medium Download PDF

Info

Publication number
JP2008123043A
JP2008123043A JP2006303092A JP2006303092A JP2008123043A JP 2008123043 A JP2008123043 A JP 2008123043A JP 2006303092 A JP2006303092 A JP 2006303092A JP 2006303092 A JP2006303092 A JP 2006303092A JP 2008123043 A JP2008123043 A JP 2008123043A
Authority
JP
Japan
Prior art keywords
classification
attribute value
classified
attribute
performer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006303092A
Other languages
Japanese (ja)
Inventor
Naoki Kamimaeda
直樹 上前田
Hiroyuki Koike
宏幸 小池
Toshihiro Tsunoda
智弘 角田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2006303092A priority Critical patent/JP2008123043A/en
Publication of JP2008123043A publication Critical patent/JP2008123043A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】簡単に、より正確に、コンテンツに付与された属性の属性値を分類する。
【解決手段】出演者特徴量ベクトル作成部32は、コンテンツについての情報からコンテンツに付与された属性の属性値についての特徴を示す特徴量を作成する。分類部72−1は、分類の対象となる属性値である対象属性値を、対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、対象属性値の特徴量に類似する特徴量の分類済み属性値の分類に応じて分類する。分類結果修正部91は、所定の条件を満たすコンテンツに付与された、分類済み属性値の分類の偏りに応じて、対象属性値の分類を修正する。本発明は、サーバに適用できる。
【選択図】図10
To easily and more accurately classify attribute values of attributes assigned to content.
A performer feature quantity vector creating unit creates a feature quantity indicating a feature of an attribute value of an attribute given to content from information about the content. The classification unit 72-1 selects a target attribute value that is an attribute value to be classified as an attribute value that has the same attribute as the attribute of the target attribute value, and is a pre-classified attribute value. Of these, classification is performed according to the classification of the attribute values that have been classified into the feature amounts similar to the feature amounts of the target attribute value. The classification result correction unit 91 corrects the classification of the target attribute value according to the classification bias of the classified attribute value assigned to the content that satisfies the predetermined condition. The present invention can be applied to a server.
[Selection] Figure 10

Description

本発明は情報処理装置および方法、プログラム、並びに記録媒体に関し、特に、コンテンツに出演している出演者を分類できるようにした情報処理装置および方法、プログラム、並びに記録媒体に関する。   The present invention relates to an information processing apparatus and method, a program, and a recording medium, and more particularly, to an information processing apparatus and method, a program, and a recording medium that can classify performers who appear in content.

従来、放送される番組を推薦するシステムにおいて、お笑い番組に出演しているお笑い系、いわゆる歌謡曲を歌ったりグラビアに登場するアイドル系、番組を司会する司会者系、恋愛ドラマに出演している恋愛系などのタイプが出演者に人手で付与されて、出演者に付与したタイプを基に、放送される番組が推薦される。   Traditionally, in a system that recommends programs to be broadcast, it has appeared in comedy systems that appear in comedy programs, idols that sing so-called popular songs and gravure, moderators that host programs, and love dramas A type such as romance is manually given to the performer, and a broadcast program is recommended based on the type given to the performer.

ユーザの視聴した番組に出演している出演者のうち、タイプが人手で付与された出演者の出演している番組の視聴履歴を用いて、番組の推薦理由でよく見る人物のタイプを表示するようにしているものもある(例えば、特許文献1参照)   Of the performers who appear in the program that the user has watched, use the viewing history of the program in which the performer whose type has been manually assigned is used to display the type of person often seen for the reason for recommending the program Some have done so (for example, see Patent Document 1)

特開2005−56361号公報JP-A-2005-56361

タイプを出演者に人手で付与する場合、タイプが付与されていない出演者に関しては、例え、ユーザがその出演者が出演する番組を視聴していたとしても、その出演者にはタイプが付与されていないので、その出演者のタイプをユーザのよく見る出演者のタイプに反映することはできなかった。   When a type is manually assigned to a performer, for a performer who is not assigned a type, even if the user is watching a program in which the performer appears, the type is assigned to the performer. Therefore, the type of the performer could not be reflected in the type of performer that the user often sees.

そこで、全ての出演者にタイプを人手で付与しようとすると、膨大な手間がかかることになる。また、多数の出演者にタイプを人手で付与する場合、統一した基準で出演者にタイプを付与することは難しく、出演者を正確に分類することは困難である。個々の出演者は、コンテンツに付与された1つの属性の属性値で示される。   Therefore, if it is attempted to manually give a type to all the performers, it will take enormous effort. Further, when a type is manually assigned to a large number of performers, it is difficult to assign a type to performers based on a unified standard, and it is difficult to accurately classify performers. Each performer is indicated by an attribute value of one attribute assigned to the content.

本発明は、このような状況に鑑みてなされたものであり、簡単に、より正確に、コンテンツに付与された属性の属性値を分類することができるようにするものである。   The present invention has been made in view of such a situation, and makes it possible to classify attribute values of attributes assigned to content easily and more accurately.

本発明の一側面の情報処理装置は、コンテンツについての情報から前記コンテンツに付与された属性の属性値についての特徴を示す特徴量を作成する特徴量作成手段と、分類の対象となる属性値である対象属性値を、前記対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、前記対象属性値の前記特徴量に類似する前記特徴量の分類済み属性値の分類に応じて分類する第1の分類手段と、所定の条件を満たす前記コンテンツに付与された、前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正する修正手段とを備える。   An information processing apparatus according to an aspect of the present invention includes a feature amount creating unit that creates a feature amount indicating a feature of an attribute value of an attribute assigned to the content from information about the content, and an attribute value to be classified. A certain target attribute value is an attribute value of the same attribute as the attribute of the target attribute value, and is similar to the feature amount of the target attribute value among classified attribute values that are pre-classified attribute values A first classification unit configured to classify according to a classification of the classified attribute value of the feature quantity; and the target attribute according to a classification bias of the classified attribute value assigned to the content satisfying a predetermined condition Correction means for correcting the classification of values.

前記修正手段には、全部の前記コンテンツのうちの前記条件を満たす前記コンテンツに付与されている属性の前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正させることができる。   The correction means may correct the classification of the target attribute value according to the classification bias of the classified attribute value of the attribute assigned to the content satisfying the condition among all the contents. it can.

前記修正手段には、前記対象属性値で示される所定の出演者が出演する前記コンテンツの属性を限定する前記条件を満たす前記コンテンツに付与されている属性の前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正させることができる。   In the correction means, in the bias of the classification of the classified attribute value of the attribute that is given to the content that satisfies the condition that satisfies the condition that limits the attribute of the content in which the predetermined performer indicated by the target attribute value appears Accordingly, the classification of the target attribute value can be corrected.

前記修正手段には、前記条件を満たす前記コンテンツに出演している所定の出演者を示す前記対象属性値の分類の偏りが、前記条件を満たす前記コンテンツに出演している出演者を示す前記分類済み属性値の分類の偏りにより近くなるように、前記対象属性値の分類を修正させることができる。   In the correction means, the classification of the target attribute value indicating a predetermined performer who appears in the content that satisfies the condition satisfies the classification indicating a performer that appears in the content that satisfies the condition. The classification of the target attribute value can be corrected so as to be closer to the bias of the classification of the completed attribute value.

前記修正手段には、前記条件を満たす前記コンテンツに出演している出演者を示す前記分類済み属性値の分類の偏りが予め定めた第1の閾値より大きい場合、前記第1の閾値より大きい偏りの前記分類済み属性値の分類に応じて、前記対象属性値の分類を修正させることができる。   The correction means includes a bias larger than the first threshold when the bias of classification of the classified attribute value indicating a performer appearing in the content satisfying the condition is larger than a predetermined first threshold. The classification of the target attribute value can be corrected according to the classification of the classified attribute value.

前記修正手段には、前記条件を満たす前記コンテンツに出演している出演者を示す前記分類済み属性値の分類の偏りが予め定めた第1の閾値より大きく、かつ、前記条件を満たす前記コンテンツに出演している出演者を示す前記分類済み属性値の分類の偏りと前記条件を満たす前記コンテンツに出演している出演者を示す前記対象属性値の分類の偏りとの差が予め定めた第2の閾値より大きい場合、前記第1の閾値より大きい偏りの前記分類済み属性値の分類に応じて、前記対象属性値の分類を修正させることができる。   In the correction means, the bias of classification of the classified attribute value indicating a performer appearing in the content satisfying the condition is larger than a predetermined first threshold value, and the content satisfying the condition is satisfied. A difference between a bias in classification of the classified attribute value indicating a performer and a bias in classification of the target attribute value indicating a performer in the content satisfying the condition is determined in advance. If the threshold value is larger than the first threshold value, the classification of the target attribute value can be corrected according to the classification of the classified attribute value biased larger than the first threshold value.

前記第1の分類手段には、複数の要素からなる前記特徴量の前記要素毎に重みづけした類似度によって、前記対象属性値の前記特徴量に類似するとされた前記特徴量の前記分類済み属性値の分類に応じて前記対象属性値を分類させることができる。   The first classification means includes the classified attribute of the feature quantity that is determined to be similar to the feature quantity of the target attribute value based on a similarity weighted for each element of the feature quantity including a plurality of elements. The target attribute value can be classified according to the value classification.

前記第1の分類手段には、複数のタイプのうちの、所定の出演者を示す前記対象属性値の前記特徴量に類似する前記特徴量の前記分類済み属性値の第1のタイプへの分類に応じて、前記出演者を示す前記対象属性値を前記第1のタイプに分類させることができる。   The first classifying unit classifies the feature value similar to the feature value of the target attribute value indicating a predetermined performer among a plurality of types into the first type of the classified attribute value. Accordingly, the target attribute value indicating the performer can be classified into the first type.

前記第1の分類手段の分類の方式と異なる方式により、前記複数のタイプのうちの、前記出演者を示す前記対象属性値の前記特徴量に類似する前記特徴量の前記分類済み属性値の第2のタイプへの分類に応じて、前記出演者を示す前記対象属性値を前記第2のタイプに分類する第2の分類手段と、前記第1の分類手段または前記第2の分類手段のいずれか一方を、タイプ毎に選択する選択手段とをさらに設けることができる。   The classification attribute value of the feature quantity similar to the feature quantity of the target attribute value indicating the performer among the plurality of types by a scheme different from the classification scheme of the first classification means. A second classification unit that classifies the target attribute value indicating the performer into the second type according to classification into two types, and either the first classification unit or the second classification unit It is possible to further provide selection means for selecting one of the types for each type.

前記特徴量作成手段には、放送される番組である前記コンテンツについての情報から番組である前記コンテンツに出演している出演者を示す前記属性値についての特徴を示す前記特徴量を作成させ、前記修正手段には、所定の放送局から所定の時間帯に放送される番組である前記コンテンツに出演している出演者を示す前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正させることができる。   The feature quantity creating means creates the feature quantity indicating a feature about the attribute value indicating a performer who appears in the content that is a program from information about the content that is a broadcast program, According to the bias of the classification of the classified attribute value indicating the performer who is appearing in the content that is a program broadcast from a predetermined broadcasting station in a predetermined time zone, the correction means Classification can be corrected.

本発明の一側面の情報処理方法は、コンテンツについての情報から前記コンテンツに付与された属性の属性値についての特徴を示す特徴量を作成し、分類の対象となる属性値である対象属性値を、前記対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、前記対象属性値の前記特徴量に類似する前記特徴量の分類済み属性値の分類に応じて分類し、所定の条件を満たす前記コンテンツに付与された、前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正するステップを含む。   According to an information processing method of one aspect of the present invention, a feature amount indicating a feature of an attribute value of an attribute given to the content is created from information about the content, and a target attribute value that is an attribute value to be classified is obtained. The classification of the feature quantity that is similar to the feature quantity of the target attribute value among the sorted attribute values that are the attribute values of the same attribute as the attribute of the target attribute value and are pre-classified attribute values And classifying the target attribute value according to the classification bias of the classified attribute value assigned to the content satisfying a predetermined condition.

本発明の一側面のプログラムは、コンテンツについての情報から前記コンテンツに付与された属性の属性値についての特徴を示す特徴量を作成し、分類の対象となる属性値である対象属性値を、前記対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、前記対象属性値の前記特徴量に類似する前記特徴量の分類済み属性値の分類に応じて分類し、所定の条件を満たす前記コンテンツに付与された、前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正するステップをコンピュータに実行させる。   The program according to one aspect of the present invention creates a feature amount indicating a feature of an attribute value of an attribute given to the content from information about the content, and sets the target attribute value that is an attribute value to be classified as the target attribute value. Of the attribute values of the same attribute as the attribute of the target attribute value, the classified attribute of the feature quantity that is similar to the feature quantity of the target attribute value among the sorted attribute values that are the attribute values that are classified in advance Classifying according to the value classification, and causing the computer to execute a step of correcting the classification of the target attribute value according to the classification bias of the classified attribute value given to the content satisfying a predetermined condition.

本発明の一側面の記録媒体のプログラムは、コンテンツについての情報から前記コンテンツに付与された属性の属性値についての特徴を示す特徴量を作成し、分類の対象となる属性値である対象属性値を、前記対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、前記対象属性値の前記特徴量に類似する前記特徴量の分類済み属性値の分類に応じて分類し、所定の条件を満たす前記コンテンツに付与された、前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正するステップを含む情報処理をコンピュータに実行させる。   A recording medium program according to an aspect of the present invention creates a feature amount indicating a feature of an attribute value of an attribute assigned to the content from information about the content, and a target attribute value that is an attribute value to be classified The attribute value of the same attribute as the attribute of the target attribute value, and among the classified attribute values that are pre-classified attribute values, the feature quantity similar to the feature quantity of the target attribute value Information including a step of classifying according to the classification of the classified attribute value and correcting the classification of the target attribute value according to the classification bias of the classified attribute value given to the content satisfying a predetermined condition Have the computer execute the process.

本発明の一側面においては、コンテンツについての情報から前記コンテンツに付与された属性の属性値についての特徴を示す特徴量が作成され、分類の対象となる属性値である対象属性値が、前記対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、前記対象属性値の前記特徴量に類似する前記特徴量の分類済み属性値の分類に応じて分類され、所定の条件を満たす前記コンテンツに付与された、前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類が修正される。   In one aspect of the present invention, a feature amount indicating a feature of an attribute value of an attribute assigned to the content is created from information about the content, and the target attribute value that is an attribute value to be classified is the target The attribute value having the same attribute as the attribute value attribute, and the classified attribute value of the feature quantity that is similar to the feature quantity of the target attribute value among the classified attribute values that are attribute values that have been classified in advance The classification of the target attribute value is corrected according to the classification bias of the classified attribute value assigned to the content satisfying a predetermined condition.

以上のように、本発明の一側面によれば、出演者を分類することができる。   As described above, according to one aspect of the present invention, performers can be classified.

また、本発明の一側面によれば、簡単に、より正確に、コンテンツに付与された属性の属性値を分類することができる。   Further, according to one aspect of the present invention, it is possible to easily and more accurately classify attribute values of attributes assigned to content.

以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書または図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書または図面に記載されていることを確認するためのものである。従って、明細書または図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。   Embodiments of the present invention will be described below. Correspondences between constituent elements of the present invention and the embodiments described in the specification or the drawings are exemplified as follows. This description is intended to confirm that the embodiments supporting the present invention are described in the specification or the drawings. Therefore, even if there is an embodiment which is described in the specification or the drawings but is not described here as an embodiment corresponding to the constituent elements of the present invention, that is not the case. It does not mean that the form does not correspond to the constituent requirements. Conversely, even if an embodiment is described here as corresponding to a configuration requirement, that means that the embodiment does not correspond to a configuration requirement other than the configuration requirement. It's not something to do.

本発明の一側面の情報処理装置は、コンテンツについての情報から前記コンテンツに付与された属性の属性値についての特徴を示す特徴量を作成する特徴量作成手段(例えば、図10の出演者特徴量ベクトル作成部32)と、分類の対象となる属性値である対象属性値を、前記対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、前記対象属性値の前記特徴量に類似する前記特徴量の分類済み属性値の分類に応じて分類する第1の分類手段(例えば、図10の分類部72−1)と、所定の条件を満たす前記コンテンツに付与された、前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正する修正手段(例えば、図10の分類結果修正部91)とを備える。   The information processing apparatus according to one aspect of the present invention is a feature amount creating unit that creates a feature amount indicating a feature of an attribute value of an attribute given to the content from information about the content (for example, a performer feature amount in FIG. 10). A vector creation unit 32), and a target attribute value that is an attribute value to be classified, an attribute value of the same attribute as the attribute of the target attribute value, and a classified attribute value that is a pre-classified attribute value First classifying means (for example, the classifying unit 72-1 of FIG. 10) for classifying according to the classification of the classified attribute value of the feature quantity similar to the feature quantity of the target attribute value, and a predetermined Correction means (for example, the classification result correction unit 91 in FIG. 10) that corrects the classification of the target attribute value according to the classification bias of the classified attribute value assigned to the content that satisfies the condition .

前記第1の分類手段の分類の方式と異なる方式により、前記複数のタイプのうちの、前記出演者を示す前記対象属性値の前記特徴量に類似する前記特徴量の前記分類済み属性値の第2のタイプへの分類に応じて、前記出演者を示す前記対象属性値を前記第2のタイプに分類する第2の分類手段(例えば、図10の分類部72−N)と、前記第1の分類手段または前記第2の分類手段のいずれか一方を、タイプ毎に選択する選択手段(例えば、図10の選択部71)とをさらに設けることができる。   The classification attribute value of the feature quantity similar to the feature quantity of the target attribute value indicating the performer among the plurality of types by a scheme different from the classification scheme of the first classification means. A second classification unit (for example, the classification unit 72-N in FIG. 10) that classifies the target attribute value indicating the performer into the second type according to the classification into the second type, and the first The selection means (for example, the selection part 71 of FIG. 10) which selects any one of the said classification means or said 2nd classification means for every type can be further provided.

本発明の一側面の情報処理方法およびプログラムは、コンテンツについての情報から前記コンテンツに付与された属性の属性値についての特徴を示す特徴量を作成し(例えば、図2のステップS16)、分類の対象となる属性値である対象属性値を、前記対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、前記対象属性値の前記特徴量に類似する前記特徴量の分類済み属性値の分類に応じて分類し(例えば、図5のステップS37)、所定の条件を満たす前記コンテンツに付与された、前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正する(例えば、図8のステップS56)ステップを含む。   An information processing method and program according to one aspect of the present invention creates a feature amount indicating a feature of an attribute value of an attribute assigned to the content from information about the content (for example, step S16 in FIG. 2), A target attribute value that is a target attribute value is an attribute value of the same attribute as the attribute of the target attribute value, and among the classified attribute values that are pre-classified attribute values, Classification according to the classification of the attribute values that have been classified similar to the feature values (for example, step S37 in FIG. 5), and classification of the classified attribute values that are given to the content that satisfies a predetermined condition The classification of the target attribute value is corrected according to the bias (for example, step S56 in FIG. 8).

図1は、本発明の一実施の形態の情報処理装置11の構成の一例を示すブロック図である。   FIG. 1 is a block diagram illustrating an example of a configuration of an information processing apparatus 11 according to an embodiment of this invention.

情報処理装置11は、コンテンツに付与された属性の属性値を分類する。   The information processing apparatus 11 classifies attribute values of attributes assigned to the content.

ここで、コンテンツは、テレビジョン放送局から放送される番組、ラジオ放送局から放送される番組、映画、若しくは音楽の楽曲などの動画像または音声に限らず、本または静止画像なども含み、使用者にとって有意な情報であればよい。   Here, the contents include not only moving images or sounds such as programs broadcast from television broadcast stations, programs broadcast from radio broadcast stations, movies, or music songs, but also books or still images. Information that is significant for the person is sufficient.

また、コンテンツに付与された属性とは、アーティスト、演奏者、作詞者、作曲者、監督、脚本家、演出家、レーベル、放送局、またはプロダクションなどを示す項目をいう。コンテンツに付与された属性の属性値は、所定のアーティスト、所定の演奏者、所定の作詞者、所定の作曲者、所定の監督、所定の脚本家、所定の演出家、所定のレーベル、所定の放送局、または所定のプロダクションなどを示す。すなわち、例えば、コンテンツに付与された属性のうちのアーティストを示す属性の属性値は、アーティストの中の特定のアーティストを示す。   The attribute assigned to the content refers to an item indicating an artist, a performer, a lyricist, a composer, a director, a screenwriter, a director, a label, a broadcasting station, or a production. The attribute value of the attribute assigned to the content includes a predetermined artist, a predetermined performer, a predetermined lyricist, a predetermined composer, a predetermined director, a predetermined screenwriter, a predetermined director, a predetermined label, a predetermined label, Indicates a broadcasting station or a predetermined production. That is, for example, the attribute value of the attribute indicating the artist among the attributes assigned to the content indicates a specific artist among the artists.

言い換えれば、例えば、情報処理装置11は、コンテンツの創作に関わる者または集団(自然人、法人、または法上の人ではない集団若しくは組織)を示す、コンテンツに付与された属性の属性値を分類する。   In other words, for example, the information processing apparatus 11 classifies attribute values of attributes assigned to the content, which indicate persons or groups involved in the creation of the content (a group or organization that is not a natural person, a corporation, or a legal person). .

より具体的には、例えば、情報処理装置11によって、番組であるコンテンツについて、所定の出演者、所定のプロデューサ、所定のディレクタ、所定の脚本家、所定の原作者、所定のスポンサー、所定のプロダクション、または所定の放送局などが分類される。また、情報処理装置11によって、本であるコンテンツについて、所定の作家、所定の出版社、または所定の編集者などが分類される。さらに、情報処理装置11によって、音楽であるコンテンツについて、演奏者や歌手やアーティスト(グループを含む)などの所定の実演者、所定のプロデューサ、所定の作曲者、所定の作詞者、または所定のレーベルなどが分類される。さらにまた、情報処理装置11によって、映画であるコンテンツについて、特定の監督、特定の原作者、特定の製作会社、または特定の配給会社などが分類される。   More specifically, for example, by the information processing apparatus 11, for a content that is a program, a predetermined performer, a predetermined producer, a predetermined director, a predetermined screenwriter, a predetermined original author, a predetermined sponsor, a predetermined production Or a predetermined broadcast station or the like is classified. Further, the information processing apparatus 11 classifies a predetermined writer, a predetermined publisher, a predetermined editor, or the like for the content that is a book. Further, the information processing apparatus 11 uses a predetermined performer such as a performer, a singer, or an artist (including a group), a predetermined producer, a predetermined composer, a predetermined songwriter, or a predetermined label for content that is music. Etc. are classified. Furthermore, the information processing apparatus 11 classifies a specific director, a specific original author, a specific production company, a specific distribution company, or the like for content that is a movie.

以下、コンテンツとして、テレビジョン放送局である放送局から放送される番組を例に、また、コンテンツに付与された属性の属性値として、所定の出演者を示す属性値を例に説明する。   Hereinafter, as content, a program broadcast from a broadcasting station which is a television broadcasting station will be described as an example, and as an attribute value of an attribute assigned to the content, an attribute value indicating a predetermined performer will be described as an example.

情報処理装置11は、コンテンツ情報データベース31、出演者特徴量ベクトル作成部32、分類部33、および出演者タイプデータベース34からなる。   The information processing apparatus 11 includes a content information database 31, a performer feature vector generation unit 32, a classification unit 33, and a performer type database 34.

コンテンツ情報データベース31は、コンテンツについての情報(以下、コンテンツ情報と称する)を保持する。例えば、コンテンツ情報データベース31は、放送される番組であるコンテンツについて、ジャンル、放送が開始される時刻と放送が終了する時刻と放送時間、放送される放送局、出演者、タイトル、またはサマリなどをそれぞれ示す属性値からなるコンテンツ情報を保持する。例えば、コンテンツ情報データベース31は、番組のメタデータであるコンテンツ情報を保持する。   The content information database 31 holds information about content (hereinafter referred to as content information). For example, the content information database 31 includes the genre, the broadcast start time and the broadcast end time and broadcast time, the broadcast station, performer, title, or summary of the content that is the broadcast program. It holds content information consisting of the attribute values shown. For example, the content information database 31 holds content information that is metadata of a program.

なお、コンテンツ情報の属性は、それぞれ、出演者間の共演関係、出演ジャンル、出演番組、司会やナレーションやレポーターなどの出演番組での役割、番組のサマリや解説文などを含む出演番組情報、または性別や所属事務所などを含む出演者のプロフィールなどを示すものであってもよい。   In addition, the attributes of the content information are the performance relationship between the performers, the appearance genre, the appearance program, the role in the appearance program such as the moderator, narration and reporter, the appearance program information including the summary and commentary of the program, etc. It may be a profile of a performer including gender and affiliated office.

コンテンツ情報データベース31に保持されているコンテンツ情報のそれぞれの属性値には、重要度が付与されている。例えば、予め、半年間または1年間といった一定期間について、全ての出演者が出演する番組であるコンテンツについて、コンテンツ情報が解析され、タイトルやジャンル、出演者等の属性値にTF-IDF(term frequency-inverse document frequency)などの重要度がそれぞれ付与される。   Importance is given to each attribute value of the content information held in the content information database 31. For example, content information is analyzed in advance for content that is a program in which all performers appear for a certain period of time, such as half a year or one year, and the attribute values such as title, genre, and performer are set to TF-IDF (term frequency -inverse document frequency) and so on.

出演者特徴量ベクトル作成部32は、コンテンツについての情報からコンテンツに付与された属性の属性値についての特徴を示す特徴量を作成する。例えば、出演者特徴量ベクトル作成部32は、コンテンツ情報データベース31よりコンテンツについてのコンテンツ情報を取得して、出演者の特徴量を作成する。例えば、出演者の特徴量は、ベクトル(以下、出演者特徴量ベクトルと称する)で表される。   The performer feature quantity vector creation unit 32 creates a feature quantity indicating a feature about an attribute value of an attribute given to the content from the information about the content. For example, the performer feature value vector creation unit 32 acquires content information about content from the content information database 31 and creates the feature amount of the performer. For example, the feature amount of a performer is represented by a vector (hereinafter referred to as a performer feature amount vector).

すなわち、出演者特徴量ベクトル作成部32は、コンテンツについてのコンテンツ情報からコンテンツに出演している出演者についての特徴を示す特徴量を作成する。例えば、出演者特徴量ベクトル作成部32は、コンテンツについてのコンテンツ情報のうちの、出演者を示す情報である出演者情報や共演情報を取得して、出演者の特徴量を作成する。   That is, the performer feature value vector creation unit 32 creates a feature value indicating the feature of the performer who appears in the content from the content information about the content. For example, the performer feature value vector creation unit 32 acquires performer information and co-starring information, which is information indicating the performer, from the content information about the content, and creates the feature amount of the performer.

分類部33は、分類の対象となる属性値である対象属性値を、対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、対象属性値の特徴量に類似する特徴量の分類済み属性値の分類に応じて分類する。   The classification unit 33 selects a target attribute value that is an attribute value to be classified as an attribute value of the same attribute as the attribute of the target attribute value, and among the classified attribute values that are pre-classified attribute values. Then, the classification is performed according to the classification of the classified attribute value of the feature quantity similar to the feature quantity of the target attribute value.

例えば、分類部33は、出演者を分類する。より具体的には、分類部33は、お笑い番組に出演しているお笑い系、歌ったりグラビアに登場するアイドル系、番組を司会する司会者系、または恋愛ドラマに出演している恋愛系などのタイプに出演者を分類する。   For example, the classification unit 33 classifies performers. More specifically, the classification unit 33 may include a comedy system appearing in a comedy program, an idol system appearing in a song or gravure, a moderator system hosting a program, or a romantic system appearing in a love drama. Classify performers into types.

さらに具体的には、分類部33は、予め分類されている出演者の分類を示す情報を出演者タイプデータベース34から読み出して、読み出した予め分類されている出演者の分類を示す情報を基に、他の出演者を分類する。すなわち、分類部33は、分類の対象となる出演者である対象出演者を、予め分類されている出演者である分類済み出演者のうちの、対象出演者の特徴量に類似する特徴量の分類済み出演者の分類に応じて分類する。分類部33は、出演者の分類の結果を出演者タイプデータベース34に供給するか、外部に出力する。   More specifically, the classification unit 33 reads out information indicating the classification of performers classified in advance from the performer type database 34, and based on the read information indicating the classification of performers classified in advance. Categorize other performers. That is, the classification unit 33 selects a target performer that is a subject to be classified as a feature amount similar to the feature amount of the target performer among the classified performers that are pre-classified performers. Categorize according to the categorized performers. The classification unit 33 supplies the performer classification result to the performer type database 34 or outputs it to the outside.

出演者タイプデータベース34は、出演者の分類の結果を保持する。また、出演者タイプデータベース34は、予め決められたタイプに人手で分類された出演者の分類を示す情報を学習データとして保持する。   The performer type database 34 holds the result of performer classification. In addition, the performer type database 34 holds information indicating the classification of performers classified manually by a predetermined type as learning data.

まず、コンテンツ情報から出演者特徴量ベクトルを作成する処理を説明する。   First, a process for creating a performer feature vector from content information will be described.

図2は、出演者特徴量ベクトルの作成の処理を説明するフローチャートである。ステップS11において、出演者特徴量ベクトル作成部32は、全ての出演者のリストである出演者リストを取得する。   FIG. 2 is a flowchart for explaining a process for creating a performer feature quantity vector. In step S11, the performer feature vector generation unit 32 acquires a performer list that is a list of all performers.

ステップS11において、出演者特徴量ベクトル作成部32は、コンテンツ情報データベース31よりコンテンツについてのコンテンツ情報を取得して、コンテンツ情報から出演者情報または共演情報を取得することにより、全ての出演者のリストを生成するようにしてもよい。   In step S11, the performer feature vector generation unit 32 acquires content information about the content from the content information database 31, and acquires performer information or co-star information from the content information, thereby listing all performers. May be generated.

ステップS12において、出演者特徴量ベクトル作成部32は、出演者リストの全ての出演者のそれぞれの出演者特徴量ベクトルを作成したか否かを判定し、出演者リストの全ての出演者のそれぞれの出演者特徴量ベクトルを作成していないと判定された場合、手続きはステップS13に進む。ステップS13において、出演者特徴量ベクトル作成部32は、出演者リストの出演者から、出演者特徴量ベクトルをまだ作成していない1人の出演者を選択する。   In step S12, the performer feature vector generation unit 32 determines whether or not each performer feature vector of all performers in the performer list has been created, and each performer in the performer list is determined. If it is determined that no performer feature vector has been created, the procedure proceeds to step S13. In step S <b> 13, the performer feature vector generation unit 32 selects one performer who has not yet created a performer feature vector from the performers in the performer list.

ステップS14において、出演者特徴量ベクトル作成部32は、選択された出演者が出演している番組のリストである番組リストを取得する。   In step S14, the performer feature vector generation unit 32 acquires a program list that is a list of programs in which the selected performer has appeared.

ステップS14において、出演者特徴量ベクトル作成部32は、コンテンツ情報データベース31よりコンテンツについてのコンテンツ情報を取得して、コンテンツ情報に含まれる出演者情報または共演情報と選択された出演者とを照合することにより、選択された出演者が出演している番組を特定して、選択された出演者が出演している全ての番組のリストである番組リストを生成するようにしてもよい。   In step S14, the performer feature vector generation unit 32 acquires content information about the content from the content information database 31, and collates the performer information or co-starring information included in the content information with the selected performer. Thus, a program in which the selected performer has appeared may be specified, and a program list that is a list of all programs in which the selected performer has appeared may be generated.

ステップS15において、出演者特徴量ベクトル作成部32は、番組リストの全ての番組のコンテンツ情報をコンテンツ情報データベース31から取得する。   In step S <b> 15, the performer feature vector generation unit 32 acquires content information of all programs in the program list from the content information database 31.

図3は、コンテンツ情報の例を示す図である。例えば、コンテンツ情報は、コンテンツを特定するためのコンテンツID、属性を特定するための属性ID、コンテンツの属性の値を示す属性値、属性値が更新された回数を示す更新回数、および属性値の重要度からなる。図3に示されるコンテンツ情報において、図3の上側の横1列に示されるコンテンツ情報の1つの属性の例は、2000114789142であるコンテンツID、1である属性ID、153144である属性値、1である更新回数、および1.58454294474である重要度からなる。すなわち、2000114789142であるコンテンツIDで特定されるコンテンツの、1である属性IDで特定される属性の属性値は、153144であり、その属性値は、1回更新され、その属性値の重要度は、1.58454294474であることが、図3のコンテンツ情報のうちの上側の横1列によって示されている。   FIG. 3 is a diagram illustrating an example of content information. For example, content information includes a content ID for specifying content, an attribute ID for specifying an attribute, an attribute value indicating the value of the content attribute, an update count indicating the number of times the attribute value has been updated, and an attribute value It consists of importance. In the content information shown in FIG. 3, examples of one attribute of the content information shown in the upper one row in FIG. 3 are a content ID of 2000114789142, an attribute ID of 1, an attribute value of 153144, and 1 It consists of a certain number of updates and an importance level of 1.58454294474. That is, the attribute value of the attribute specified by the attribute ID of 1 of the content specified by the content ID of 2000114789142 is 153144, the attribute value is updated once, and the importance of the attribute value is 1.58454294474 is shown by the upper horizontal row in the content information of FIG.

ステップS16において、出演者特徴量ベクトル作成部32は、取得した全ての番組のコンテンツ情報を、属性毎に、属性値に予め定めた重みで重み付けして足し合わせる。この場合、例えば、属性値に重み付けするための重みは、属性毎に異なる値とされる。重み付けすることにより、属性毎に、属性の効き目を変えることができる。そして、出演者特徴量ベクトル作成部32は、選択された出演者が出演している全ての番組のそれぞれについての、複数の属性値からなるコンテンツ情報を、属性毎に足し合わせて、属性毎に、それぞれの属性値の和からなる結果を得る。   In step S <b> 16, the performer feature vector generation unit 32 adds the content information of all the acquired programs by weighting the attribute value with a predetermined weight for each attribute. In this case, for example, the weight for weighting the attribute value is different for each attribute. By weighting, the effect of the attribute can be changed for each attribute. And the performer feature-value vector preparation part 32 adds together the content information which consists of a some attribute value about each of all the programs in which the selected performer appears for every attribute, and for every attribute. , And obtain a result consisting of the sum of the respective attribute values.

すなわち、ステップS16において、出演者特徴量ベクトル作成部32は、コンテンツについての情報からコンテンツに付与された属性の属性値についての特徴を示す特徴量を作成する。   That is, in step S <b> 16, the performer feature quantity vector creation unit 32 creates a feature quantity indicating a feature about the attribute value of the attribute given to the content from the information about the content.

ステップS17において、出演者特徴量ベクトル作成部32は、ステップS16において足し合わせた結果を、選択された出演者の出演者特徴量ベクトルとして出演者タイプデータベース34に格納する。すなわち、出演者特徴量ベクトル作成部32は、属性毎に、コンテンツ情報のそれぞれの属性値の和からなる結果を、それぞれの属性値の和を要素とする出演者特徴量ベクトルとして出演者タイプデータベース34に格納する。   In step S17, the performer feature vector generation unit 32 stores the result of adding in step S16 in the performer type database 34 as the performer feature vector of the selected performer. That is, the performer feature vector generation unit 32 performs, for each attribute, the result of the sum of the attribute values of the content information as the performer feature vector having the sum of the attribute values as an element. 34.

ステップS17の後、手続きは、ステップS12に戻る。   After step S17, the procedure returns to step S12.

ステップS12において、出演者リストの全ての出演者のそれぞれの出演者特徴量ベクトルを作成したと判定された場合、出演者特徴量ベクトルの作成の処理は終了する。   If it is determined in step S12 that the performer feature quantity vectors of all the performers in the performer list have been created, the process of creating the performer feature quantity vectors ends.

図4は、出演者タイプデータベース34に格納されている出演者特徴量ベクトルの例を示す図である。例えば、出演者特徴量ベクトルは、出演者を特定するための出演者ID、属性を特定するための属性ID、出演者の属性の値を示す属性値、および属性値の重要度で表される。   FIG. 4 is a diagram illustrating an example of performer feature quantity vectors stored in the performer type database 34. For example, the performer feature vector is represented by a performer ID for identifying a performer, an attribute ID for identifying an attribute, an attribute value indicating the attribute value of the performer, and the importance of the attribute value. .

図4に示される出演者特徴量ベクトルにおいて、図4の上側の横1列に示されるコンテンツ情報の1つの属性の例は、3である出演者ID、4である属性ID、1である属性値、および6.822980305192である重要度からなる。すなわち、3である出演者IDで特定される出演者の、4である属性IDで特定される属性の属性値は、1であり、その属性値の重要度は、6.822980305192であることが、図4の出演者特徴量ベクトルのうちの上側の横1列によって示されている。   In the performer feature vector shown in FIG. 4, examples of one attribute of the content information shown in the upper horizontal row of FIG. 4 are performer ID 3, attribute ID 4, and attribute 1 Consists of a value and an importance level of 6.822980305192. That is, the attribute value of the attribute identified by the attribute ID of 4 of the performer identified by the performer ID of 3 is 1, and the importance of the attribute value is 6.822980305192. This is indicated by the upper horizontal row of the four performer feature vectors.

次に、図5のフローチャートを参照して、分類部33による出演者の分類の処理を説明する。ステップS31において、分類部33は、全ての出演者にタイプベクトルを付与したか否かを判定し、全ての出演者にタイプベクトルを付与していないと判定された場合、分類されていない出演者が存在するので、手続きは、ステップS32に進む。   Next, the process of classifying performers by the classifying unit 33 will be described with reference to the flowchart of FIG. In step S31, the classification unit 33 determines whether or not a type vector has been assigned to all performers. If it is determined that no type vector has been assigned to all performers, the performer is not classified. Therefore, the procedure proceeds to step S32.

ここで、タイプベクトルは、出演者の分類を示す情報であり、1または複数の要素であって、それぞれ出演者のタイプを示す要素からなる。例えば、タイプベクトルは、お笑い番組に出演しているお笑い系であるか否かを示す要素、歌ったりグラビアに登場するアイドル系であるか否かを示す要素、番組を司会する司会者系であるか否かを示す要素、および恋愛ドラマに出演している恋愛系であるか否かを示す要素からなる。   Here, the type vector is information indicating the classification of performers, and includes one or a plurality of elements, each of which indicates the type of performer. For example, a type vector is an element that indicates whether or not a comedy system appears in a comedy program, an element that indicates whether or not an idol system appears on a singing or gravure, and a moderator system that moderates the program It is composed of an element indicating whether or not and an element indicating whether or not it is a romance system appearing in a love drama.

なお、タイプベクトルのそれぞれの要素は、そのタイプであることを示す1とされるか、またはそのタイプではないことを示す0とされる。   Each element of the type vector is set to 1 indicating that it is the type or 0 indicating that it is not the type.

また、タイプベクトルのそれぞれの要素を、0乃至1の範囲の何れかの値であって、そのタイプであることの度合いまたは確率を示す値とするようにしてもよい。   In addition, each element of the type vector may be any value in the range of 0 to 1 and a value indicating the degree or probability of the type.

ステップS32において、分類部33は、タイプベクトルを付与する出演者、すなわち分類する出演者を、まだタイプベクトルが付与されていない出演者(分類されていない出演者)から選択する。   In step S32, the classification unit 33 selects performers to which the type vector is assigned, that is, performers to be classified from performers to which the type vector is not yet assigned (performers not classified).

ステップS33において、分類部33は、選択された出演者である対象出演者の出演者特徴量ベクトルを出演者タイプデータベース34から取得する。   In step S <b> 33, the classification unit 33 acquires the performer feature value vector of the target performer who is the selected performer from the performer type database 34.

ステップS34において、分類部33は、タイプベクトルが予め付与された出演者である分類済み出演者のそれぞれの出演者特徴量ベクトルのそれぞれと、対象出演者の出演者特徴量ベクトルとの類似度を計算する。   In step S <b> 34, the classification unit 33 determines the similarity between each performer feature value vector of each classified performer who is a performer to which a type vector has been assigned in advance, and the performer feature value vector of the target performer. calculate.

ここで、分類済み出演者は、予め決められたタイプに人手で分類され、分類されたタイプを示すタイプベクトルが学習データとして出演者タイプデータベース34に予め保持されている。   Here, the classified performers are manually classified into predetermined types, and a type vector indicating the classified type is stored in advance in the performer type database 34 as learning data.

すなわち、ステップS34において、分類部33は、分類済み出演者のそれぞれの出演者特徴量ベクトルを出演者タイプデータベース34から読み出す。そして、分類部33は、出演者タイプデータベース34から読み出した、分類済み出演者のそれぞれの出演者特徴量ベクトルと、対象出演者の出演者特徴量ベクトルとの類似度を計算する。   That is, in step S <b> 34, the classification unit 33 reads each performer feature value vector of the classified performers from the performer type database 34. And the classification | category part 33 calculates the similarity degree of each performer feature-value vector of the classified performer read from the performer type database 34, and the performer feature-value vector of an object performer.

例えば、分類部33は、式(1)で示される演算により、類似度sim(X,Y)としてコサイン尺度を求める。

Figure 2008123043
For example, the classification unit 33 obtains a cosine measure as the similarity sim (X, Y) by the calculation represented by the equation (1).
Figure 2008123043

式(1)において、Xは、対象出演者の出演者特徴量ベクトルを示し、Yは、分類済み出演者の出演者特徴量ベクトルを示す。また、aは、出演者特徴量ベクトルの属性を示し、Aは、属性aの集合を示し、Xaは、出演者特徴量ベクトルXの属性aの属性値を示す。同様に、Yaは、出演者特徴量ベクトルYの属性aの属性値を示す。さらに、Waは、属性aの重みを示す。 In Expression (1), X represents a performer feature value vector of the target performer, and Y represents a performer feature value vector of the classified performer. Further, a indicates an attribute of the performer feature value vector, A indicates a set of attributes a, and X a indicates an attribute value of the attribute a of the performer feature value vector X. Similarly, Y a indicates the attribute value of the attribute a of the performer feature value vector Y. Further, W a indicates the weight of the attribute a.

ステップS35において、分類部33は、ステップS34における類似度の計算結果から、類似している順に、K人(Kは正の整数)の分類済み出演者を選ぶ。   In step S35, the classification unit 33 selects K performers (K is a positive integer) in order of similarity from the similarity calculation results in step S34.

ステップS36において、分類部33は、選択されたK人の分類済み出演者のタイプベクトルを出演者タイプデータベース34から取得する。   In step S <b> 36, the classification unit 33 acquires the type vector of the selected K performers that have been classified from the performer type database 34.

ステップS37において、分類部33は、選択されたK人の分類済み出演者のタイプベクトルから、対象出演者のタイプベクトルを計算する。   In step S <b> 37, the classification unit 33 calculates the type vector of the target performer from the type vectors of the selected K performers.

例えば、分類部33は、K-nearest Neighbor法により、対象出演者のタイプベクトルを計算する。式(2)は、K-nearest Neighbor法による、対象出演者のタイプベクトルの計算を示す式である。なお、式(2)は、タイプベクトルの要素のうちの1つの要素の計算を示す。

Figure 2008123043
式(2)において、iは、タイプベクトルの要素を示し、fx(Ci)は、所定の閾値tiを超える場合、1を出力し、閾値ti以下である場合、0を出力する関数を示す。また、fk(Ci)は、所定の閾値tiを超える場合、1を出力し、閾値ti以下である場合、0を出力する関数を示す。閾値tiは、i毎に異なるか、または同じ値のi毎の値とされる。 For example, the classification unit 33 calculates the type vector of the target performer by the K-nearest Neighbor method. Expression (2) is an expression showing the calculation of the type vector of the target performer by the K-nearest Neighbor method. Equation (2) represents the calculation of one element of the type vector elements.
Figure 2008123043
In Expression (2), i represents an element of the type vector, and f x (C i ) outputs 1 when it exceeds a predetermined threshold value t i , and outputs 0 when it is equal to or less than the threshold value t i. Indicates a function. Further, f k (C i ) represents a function that outputs 1 when it exceeds a predetermined threshold value t i and outputs 0 when it is equal to or less than the threshold value t i . The threshold value t i is different for each i or the same value for each i.

式(2)において、fk(Ci)は、K人の分類済み出演者のうちのk番目の分類済み出演者のタイプベクトルの要素iの、0または1のいずれかである値を示す。すなわち、選択されたK人の分類済み出演者のタイプベクトルの要素iの平均値が、対象出演者のタイプベクトルの要素iの値とされる。 In equation (2), f k (C i ) indicates a value that is either 0 or 1 of the element i of the type vector of the kth classified performer among the K classified performers. . That is, the average value of the element i of the type vector of the selected K performers is set as the value of the element i of the type vector of the target performer.

このように、ステップS37において、分類部33は、分類の対象となる属性値である対象属性値を、対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、対象属性値の特徴量に類似する特徴量の分類済み属性値の分類に応じて分類する。   In this way, in step S37, the classification unit 33 sets the target attribute value, which is the attribute value to be classified, as the attribute value having the same attribute as the attribute of the target attribute value, The classification is performed according to the classification of the classified attribute value of the feature quantity similar to the feature quantity of the target attribute value among the classified attribute values.

ステップS38において、分類部33は、ステップS37において計算したタイプベクトルを、対象出演者に付与し、出演者タイプデータベース34に格納する。   In step S <b> 38, the classification unit 33 assigns the type vector calculated in step S <b> 37 to the target performer and stores it in the performer type database 34.

ステップS38の後、手続きは、ステップS31に戻る。   After step S38, the procedure returns to step S31.

ステップS31において、全ての出演者にタイプベクトルを付与したと判定された場合、出演者の分類の処理は終了する。   If it is determined in step S31 that the type vector has been assigned to all performers, the performer classification process ends.

このように、出演者を分類することができる。   In this way, performers can be classified.

なお、例えば、分類部33は、ナイーブ・ベイズ分類器として、式(3)により、対象出演者のタイプベクトルを計算するようにしてもよい。

Figure 2008123043
式(3)において、iは、タイプベクトルの要素を示し、P(xj|Ci)は、タイプベクトルで示される分類Ciが起きた場合の属性値Xjの起こる確率を示す。 Note that, for example, the classification unit 33 may calculate the type vector of the target performer according to Equation (3) as a naive Bayes classifier.
Figure 2008123043
In Expression (3), i represents an element of the type vector, and P (x j | C i ) represents the probability of occurrence of the attribute value X j when the classification C i indicated by the type vector occurs.

すなわち、分類済み出演者のタイプベクトルの重みを分類Ciが起きた場合の属性値Xjの起こる確率と考えると、式(3)から、事後確率として対象出演者のタイプベクトルが計算できる。 That is, if the weight of the type vector of a performer who has already been classified is considered as the probability of occurrence of the attribute value X j when the classification C i occurs, the type vector of the target performer can be calculated as a posterior probability from equation (3).

また、分類部33は、K-nearest Neighbor法またはナイーブ・ベイズ法に限らず、サポートベクターマシンなど他の方式によって、タイプベクトルを計算し、対象出演者を分類するようにしてもよい。対象出演者の分類は、いわゆる分類問題であり、対象出演者の分類には、ブログの評判情報を分類する手法またはWeb上のテキストを利用して画像を分類する手法などを適用することができる。   Further, the classification unit 33 may classify the target performer by calculating the type vector not only by the K-nearest Neighbor method or the Naive Bayes method but by other methods such as a support vector machine. The classification of target performers is a so-called classification problem, and methods for classifying blog reputation information or images using text on the Web can be applied to target performer classification. .

さらに、タイプベクトルの要素毎に分類部を設けるようにしてもよい。   Furthermore, a classification unit may be provided for each type vector element.

図6は、タイプベクトルの要素毎に分類部を設けるようにした場合の情報処理装置11の構成の他の例を示すブロック図である。図6において、図1に示す場合と同様の部分には同一の符号を付してあり、その説明は省略する。   FIG. 6 is a block diagram illustrating another example of the configuration of the information processing apparatus 11 when a classification unit is provided for each element of a type vector. 6, the same parts as those shown in FIG. 1 are denoted by the same reference numerals, and the description thereof is omitted.

タイプベクトルの要素毎に分類部を設けるようにした場合、情報処理装置11は、コンテンツ情報データベース31、出演者特徴量ベクトル作成部32、出演者タイプデータベース34、および選択分類部51からなる。   When a classification unit is provided for each type vector element, the information processing apparatus 11 includes a content information database 31, a performer feature value vector creation unit 32, a performer type database 34, and a selection classification unit 51.

選択分類部51は、タイプベクトルによって、出演者を分類する。選択分類部51は、選択部71、および分類部72−1乃至分類部72−N(Nは、正の整数)からなる。   The selection classification unit 51 classifies performers based on the type vector. The selection classification unit 51 includes a selection unit 71 and classification units 72-1 to 72 -N (N is a positive integer).

選択部71は、タイプベクトルの要素毎に、分類部72−1乃至分類部72−Nのうちのいずれか1つを選択する。   The selection unit 71 selects any one of the classification units 72-1 to 72-N for each element of the type vector.

分類部72−1乃至分類部72−Nは、それぞれ、相互に異なる方式により出演者を分類する。例えば、分類部72−1は、式(2)で示されるK-nearest Neighbor法により、対象出演者のタイプベクトルを計算することにより、対象出演者を分類する。例えば、分類部72−Nは、ナイーブ・ベイズ分類器として構成され、式(3)により、対象出演者のタイプベクトルを計算することにより、対象出演者を分類する。   The classification units 72-1 to 72-N classify the performers using different methods. For example, the classification unit 72-1 classifies the target performer by calculating the type vector of the target performer by the K-nearest Neighbor method represented by Expression (2). For example, the classifying unit 72-N is configured as a naive Bayes classifier, and classifies the target performer by calculating the type vector of the target performer according to Equation (3).

すなわち、この場合、選択部71による選択に応じて、分類部72−1乃至分類部72−Nのいずれか1つによって求められた値が、対象出演者のタイプベクトルの要素の1つとされることにより、対象出演者のタイプベクトルが求められて、対象出演者が分類されることになる。   That is, in this case, the value obtained by any one of the classification units 72-1 to 72-N according to the selection by the selection unit 71 is set as one of the elements of the type vector of the target performer. Thus, the type vector of the target performer is obtained, and the target performer is classified.

対象出演者のタイプベクトルの要素のそれぞれを求めるのに、分類部72−1乃至分類部72−Nのうちのどれが適しているかが、学習データを用いて、予め学習され、選択部71は、学習の結果に応じて、対象出演者のタイプベクトルの要素毎に、分類部72−1乃至分類部72−Nのいずれか1つを選択する。   Which one of the classification units 72-1 to 72-N is suitable for obtaining each element of the type vector of the target performer is learned in advance using learning data, and the selection unit 71 Depending on the learning result, one of the classifying units 72-1 to 72-N is selected for each element of the type vector of the target performer.

このように、対象出演者のタイプベクトルの要素毎に、その要素に適した方式で、その要素の値が求められる。   Thus, for each element of the target performer's type vector, the value of that element is determined in a manner suitable for that element.

次に、対象出演者の分類の修正について説明する。   Next, correction of the target performer classification will be described.

図7は、対象出演者の分類を修正する場合の情報処理装置11の構成のさらに他の例を示すブロック図である。図7において、図1に示す場合と同様の部分には同一の符号を付してあり、その説明は省略する。   FIG. 7 is a block diagram illustrating still another example of the configuration of the information processing apparatus 11 when correcting the classification of the target performers. In FIG. 7, the same parts as those shown in FIG. 1 are denoted by the same reference numerals, and the description thereof is omitted.

対象出演者の分類を修正する場合、情報処理装置11は、コンテンツ情報データベース31、出演者特徴量ベクトル作成部32、分類部33、出演者タイプデータベース34、および分類結果修正部91からなる。   When correcting the classification of the target performer, the information processing apparatus 11 includes a content information database 31, a performer feature vector generation unit 32, a classification unit 33, a performer type database 34, and a classification result correction unit 91.

分類結果修正部91は、所定の条件を満たす分類済み属性値の分類の偏りに応じて、対象属性値の分類を修正する。すなわち、分類結果修正部91は、分類部33による対象出演者の分類の結果を修正する。   The classification result correction unit 91 corrects the classification of the target attribute value according to the classification bias of the classified attribute value that satisfies the predetermined condition. That is, the classification result correction unit 91 corrects the result of classification of the target performer by the classification unit 33.

例えば、分類結果修正部91は、放送局から放送される番組であるコンテンツについての、放送される時間帯、放送局毎の各タイプの出現割合、ジャンル、出演者の所属する事務所、出演者の年齢、または出演者の性別などの制約条件92を用いて、分類部33による対象出演者の分類の結果を修正し、分類をより正確にする。   For example, the classification result correction unit 91 includes a broadcast time zone, an appearance ratio of each type for each broadcast station, a genre, an office to which the performer belongs, and a performer for content that is a program broadcast from the broadcast station. The result of the classification of the target performer by the classification unit 33 is corrected using the restriction condition 92 such as the age of the performer or the sex of the performer, and the classification is made more accurate.

分類結果修正部91は、修正された出演者の分類の結果を出演者タイプデータベース34に供給するか、外部に出力する。出演者タイプデータベース34は、修正された出演者の分類の結果を保持する。   The classification result correcting unit 91 supplies the corrected performer classification result to the performer type database 34 or outputs it to the outside. The performer type database 34 holds the result of the classification of the modified performers.

図7の情報処理装置11による、出演者特徴量ベクトルの作成の処理および分類の処理は、それぞれ、図2および図5のフローチャートを参照して説明した処理のそれぞれと同様なので、その説明は省略する。   The process of creating the performer feature vector and the process of classification by the information processing apparatus 11 of FIG. 7 are the same as the processes described with reference to the flowcharts of FIGS. To do.

図8は、分類結果修正部91による分類の修正の処理を説明するフローチャートである。ステップS51において、分類結果修正部91は、全ての出演者のタイプベクトルを出演者タイプデータベース34から読み出す。   FIG. 8 is a flowchart for explaining classification correction processing by the classification result correction unit 91. In step S <b> 51, the classification result correction unit 91 reads out the type vectors of all performers from the performer type database 34.

ステップS52において、分類結果修正部91は、放送局のそれぞれの時間帯のそれぞれについて分類の結果の修正を完了したか否かを判定する。ここで、放送局と時間帯とは、制約条件92の一例である。   In step S52, the classification result correction unit 91 determines whether the correction of the classification result has been completed for each time zone of the broadcasting station. Here, the broadcast station and the time zone are examples of the constraint condition 92.

ステップS52において、放送局のそれぞれの時間帯のそれぞれについて分類の結果の修正を完了していないと判定された場合、手続きは、ステップS53に進み、分類結果修正部91は、放送局と時間帯のうち、まだ分類の結果の修正のために選択していない1つの放送局の1つの時間帯を選ぶ。この場合、例えば、コンテンツである番組が放送される放送局の中から1つの放送局が選ばれ、1日を所定の数に分割した複数の時間帯の中から、1つの時間帯が選ばれる。   If it is determined in step S52 that the correction of the classification result has not been completed for each time zone of the broadcasting station, the procedure proceeds to step S53, and the classification result correcting unit 91 determines the broadcasting station and the time zone. Among them, one time zone of one broadcasting station that has not yet been selected for correcting the classification result is selected. In this case, for example, one broadcast station is selected from broadcast stations that broadcast programs that are contents, and one time slot is selected from a plurality of time slots obtained by dividing one day into a predetermined number. .

ステップS54において、分類結果修正部91は、ステップS51において読み出された全ての出演者のタイプベクトルの中から、選択された時間帯において選択された放送局から放送される番組に出演している出演者のタイプベクトルを取得する。   In step S54, the classification result correcting unit 91 appears in a program broadcast from the selected broadcasting station in the selected time zone from among the type vectors of all performers read in step S51. Get the performer's type vector.

ステップS55において、分類結果修正部91は、制約条件92に当てはまるか否かを判定する。   In step S55, the classification result correction unit 91 determines whether or not the constraint condition 92 is satisfied.

なお、分類結果修正部91は、制約条件92に当てはまるか否かを判定する前に、制約条件92を抽出するようにしてもよい。すなわち、分類結果修正部91は、クラスタにおける制約条件92として、各クラスタでの出演者のタイプの出現割合を求める。   The classification result correction unit 91 may extract the constraint condition 92 before determining whether or not the constraint condition 92 is satisfied. That is, the classification result correction unit 91 obtains the appearance ratio of the performer type in each cluster as the constraint condition 92 in the cluster.

より具体的には、例えば、分類結果修正部91は、半年間または1年間の番組表のデータを基に、各放送局および各時間帯(0:00乃至3:00,3:00乃至6:00,6:00乃至9:00,9:00乃至12:00,12:00乃至15:00,15:00乃至18:00,18:00乃至21:00、または21:00乃至0:00などの各時間帯)毎に、それぞれの時間帯にそれぞれの放送局から放送される番組を特定する。そして、分類結果修正部91は、それぞれの時間帯にそれぞれの放送局から放送される番組に、どのようなタイプの出演者が出演しやすいかを示す制約条件92を、出演者タイプデータベース34に格納されている学習データとしての分類済み出演者のタイプベクトルから、式(4)により求める。

Figure 2008123043
More specifically, for example, the classification result correction unit 91 uses each broadcast station and each time zone (0:00 to 3:00, 3:00 to 6) based on the data of the program guide for half a year or one year. : 00,6: 00 to 9: 00,9: 00 to 12: 00,12: 00 to 15: 00,15: 00 to 18: 00,18: 00 to 21:00, or 21:00 to 0: For each time zone such as 00), a program broadcast from each broadcasting station in each time zone is specified. Then, the classification result correction unit 91 stores in the performer type database 34 a restriction condition 92 indicating what type of performers are likely to appear in the programs broadcast from the respective broadcast stations in the respective time zones. From the type vector of the performer who has been classified as the stored learning data, it is obtained by equation (4).
Figure 2008123043

式(4)により求められる制約条件92は、所定の時間帯の所定の放送局から放送される番組に出演している分類済み出演者のタイプの偏りを示す。   The constraint condition 92 obtained by the equation (4) indicates the bias of the type of the classified performer who appears in the program broadcast from the predetermined broadcasting station in the predetermined time zone.

または、放送局と時間帯とに代えて、分類結果修正部91は、半年間または1年間の番組表のデータを基に、バラエティやニュースやドラマなどのジャンル毎に、番組を特定する。そして、分類結果修正部91は、それぞれのジャンルの番組に、どのようなタイプの出演者が出演しやすいかを示す制約条件92を、出演者タイプデータベース34に格納されている学習データとしての分類済み出演者のタイプベクトルから、式(5)により求める。

Figure 2008123043
Alternatively, the classification result correcting unit 91 specifies a program for each genre such as variety, news, or drama based on the data of the program guide for half a year or one year instead of the broadcasting station and the time zone. Then, the classification result correction unit 91 classifies the restriction condition 92 indicating what type of performers are likely to appear in the programs of each genre as learning data stored in the performer type database 34. From the type vector of the performed performer, it is obtained by equation (5).
Figure 2008123043

式(5)により求められる制約条件92は、所定のジャンルの番組に出演している分類済み出演者のタイプの偏りを示す。   The restriction condition 92 obtained by the equation (5) indicates the type bias of the classified performers who appear in programs of a predetermined genre.

そして、分類結果修正部91は、時間帯と放送局や、ジャンルなどのクラスタのそれぞれの制約条件92から、制約に有効なクラスタ(分類の修正に有効なクラスタ)を選択する。例えば、18:00乃至21:00の時間帯で所定の放送局から放送される番組に出演する出演者についての制約条件92として、分類済み出演者のタイプのうち、お笑い番組に出演しているお笑い系であるタイプが70%であり、番組を司会する司会者系であるタイプが30%であり、15:00乃至18:00の時間帯で所定の放送局から放送される番組に出演する出演者についての制約条件92として、分類済み出演者のタイプのうち、お笑い番組に出演しているお笑い系であるタイプが55%であり、番組を司会する司会者系であるタイプが45%である場合には、偏りのある18:00乃至21:00の時間帯で所定の放送局から放送される番組に出演する出演者についての制約条件92が選択される。   Then, the classification result correction unit 91 selects a cluster that is effective for the restriction (a cluster that is effective for correction of the classification) from the restriction conditions 92 of the clusters such as the time zone, the broadcasting station, and the genre. For example, as a restriction condition 92 for a performer appearing in a program broadcast from a predetermined broadcast station during a time period from 18:00 to 21:00, among the types of classified performers, appearing in a comedy program The comedy type is 70%, the moderator type that hosts the program is 30%, and it appears in programs broadcast from a given broadcasting station in the 15:00 to 18:00 period As the restriction condition 92 for performers, among the types of performers that have already been classified, 55% are comedy-types appearing on comedy programs, and 45% are moderator-types that host programs. In some cases, a restriction condition 92 for a performer appearing in a program broadcast from a predetermined broadcast station in a time zone with a bias from 18:00 to 21:00 is selected.

そして、分類結果修正部91は、対象出演者のタイプベクトルによるタイプの出現確率が、選択された制約条件92に当てはまるか否かを判定する。   Then, the classification result correcting unit 91 determines whether or not the type appearance probability based on the type vector of the target performer is applicable to the selected restriction condition 92.

例えば、分類結果修正部91は、選択された制約条件92と同じクラスタにおける対象出演者について、タイプ毎の出現確率を計算する。例えば、分類結果修正部91は、分類済み出演者のタイプベクトルに代えて、対象出演者のタイプベクトルを基にした、式(4)または式(5)で示される演算により、選択された制約条件92と同じクラスタにおける対象出演者について、タイプ毎の出現確率を計算する。   For example, the classification result correction unit 91 calculates the appearance probability for each type for the target performers in the same cluster as the selected restriction condition 92. For example, the classification result correcting unit 91 replaces the type vector of the performer that has been classified, and the constraint selected by the calculation represented by the formula (4) or the formula (5) based on the type vector of the target performer. For the target performers in the same cluster as the condition 92, the appearance probability for each type is calculated.

そして、分類結果修正部91は、選択された制約条件92と同じクラスタにおける対象出演者についてのタイプ毎の出現確率と、選択された制約条件92とを比較することにより、選択された制約条件92に当てはまるか否か、すなわち、選択された制約条件92と同じクラスタにおける対象出演者についてのタイプ毎の出現確率が、選択された制約条件92と同じであるか否かを判定する。   Then, the classification result correction unit 91 compares the selected restriction condition 92 with the selected restriction condition 92 by comparing the appearance probability for each type of the target performers in the same cluster as the selected restriction condition 92. Is determined, that is, whether the appearance probability for each type of the target performers in the same cluster as the selected constraint 92 is the same as the selected constraint 92 is determined.

ステップS55において、対象出演者のタイプベクトルによるタイプの出現確率が、選択された制約条件92に当てはまらないと判定された場合、手続きは、ステップS56に進み、分類結果修正部91は、制約条件92に当てはまるように、対象出演者のそれぞれのタイプベクトルを修正する。   In step S55, when it is determined that the type appearance probability based on the type vector of the target performer does not apply to the selected restriction condition 92, the procedure proceeds to step S56, and the classification result correction unit 91 performs the restriction condition 92. The type vector of each target performer is corrected so that

例えば、式(2)により対象出演者のタイプベクトルが計算される場合、分類結果修正部91は、fxの閾値を変更することにより、制約条件92に当てはまるように、対象出演者のそれぞれのタイプベクトルを修正する。より具体的には、対象出演者についての所定のタイプの出現確率が、制約条件92で示される分類済み出演者についてのそのタイプの出現確率より大きい場合には、分類結果修正部91は、閾値を大きくすることにより、対象出演者についてのそのタイプの出現確率を下げるように、対象出演者のそれぞれのタイプベクトルを修正する。逆に、対象出演者についての所定のタイプの出現確率が、制約条件92で示される分類済み出演者についてのそのタイプの出現確率より小さい場合には、分類結果修正部91は、閾値を小さくすることにより、対象出演者についてのそのタイプの出現確率を上げるように、対象出演者のそれぞれのタイプベクトルを修正する。 For example, if the type vector of the target cast by the formula (2) is calculated, the classification result correction unit 91, by changing the threshold value of f x, as is true in the constraint 92, the target actor's respectively Correct the type vector. More specifically, when the appearance probability of a predetermined type for the target performer is larger than the appearance probability of that type for the classified performer indicated by the restriction condition 92, the classification result correction unit 91 sets a threshold value. Is increased so that the type vector of the target performer is corrected so as to lower the appearance probability of that type for the target performer. On the other hand, when the appearance probability of the predetermined type for the target performer is smaller than the appearance probability of that type for the classified performer indicated by the restriction condition 92, the classification result correction unit 91 decreases the threshold value. Thus, each type vector of the target performer is corrected so as to increase the appearance probability of that type for the target performer.

例えば、18:00乃至21:00の時間帯で所定の放送局から放送される番組に出演する分類済み出演者のうち、お笑い系であるタイプの分類済み出演者が30%であり、恋愛ドラマに出演している恋愛系であるタイプの分類済み出演者が70%である場合、18:00乃至21:00の時間帯でその放送局から放送される番組に出演する対象出演者のうち、お笑い系であるタイプに分類された対象出演者が45%であり、恋愛系であるタイプに分類された対象出演者が55%であるとき、分類結果修正部91は、対象出演者がお笑い系であるタイプに分類される割合が少なくなるように閾値を変更するとともに、対象出演者が恋愛系であるタイプに分類される割合が多くなるように閾値を変更することで、対象出演者のそれぞれのタイプベクトルを修正する。   For example, among the classified performers who appear in programs broadcast from a predetermined broadcast station in the time period from 18:00 to 21:00, 30% of the classified performers are of the comedy type. If there are 70% of categorized performers who are romance types appearing in, among the target performers appearing in programs broadcast from that broadcast station in the time zone from 18:00 to 21:00, When the target performer classified as the type of comedy is 45% and the target performer classified as the type of love is 55%, the classification result correction unit 91 determines that the target performer is a comedy Each of the target performers is changed by changing the threshold so that the ratio of the target performer is classified as a romantic type and the threshold is changed so that the ratio of the target performer is reduced. Correct the type vector.

すなわち、ステップS56において、分類結果修正部91は、所定の条件を満たす分類済み属性値の分類の偏りに応じて、対象属性値の分類を修正する。   That is, in step S56, the classification result correction unit 91 corrects the classification of the target attribute value according to the bias of the classification of the classified attribute value that satisfies the predetermined condition.

なお、分類結果修正部91は、対象出演者をタイプに分類するための閾値を変更するだけでなく、全部の出演者についてのタイプに分類するための閾値を変更することで、全部の出演者のそれぞれのタイプベクトルを修正するようにしてもよい。   The classification result correcting unit 91 not only changes the threshold value for classifying the target performer into a type, but also changes the threshold value for classifying into the type for all performers. Each type vector may be corrected.

例えば、6:00乃至9:00の時間帯で放送される番組には、番組を司会する司会者系であるタイプの出演者が多く、恋愛ドラマに出演している恋愛系であるタイプの出演者は少ないので、分類結果修正部91は、6:00乃至9:00の時間帯で放送される番組に出演している出演者のタイプベクトルの要素のうち、恋愛系を示す要素の値が高い場合、恋愛系であることを示すように、その出演者が恋愛系に分類されるように、その出演者のタイプベクトルを修正する。   For example, there are many types of performers who are moderators in the program that are broadcast from 6:00 to 9:00, and they are appearances of a type that is a romantic type that appears in a love drama. Since the number of performers is small, the classification result correcting unit 91 has a value of an element indicating a romantic system among elements of type vectors of performers appearing in a program broadcast in a time zone from 6:00 to 9:00. If it is higher, the performer's type vector is modified so that the performer is categorized as a romance to indicate that it is a romance.

なお、それぞれの時間帯でそれぞれの放送局から放送される番組について、分類済み出演者の分類の出現確率と対象出演者の分類の出現確率との差を誤差として、全部の時間帯のそれぞれの全部の放送局のそれぞれについての誤差の合計が最小になるように、タイプベクトルが修正される。   In addition, for programs broadcast from each broadcasting station in each time zone, the difference between the appearance probability of the classified performer's classification and the appearance probability of the target performer's classification is taken as the error, and each of all time zones The type vector is modified so that the sum of errors for each of all broadcast stations is minimized.

このように、人手によって付与した学習データで示される分類済み出演者の分類の傾向に合わせるように、分類のための閾値を変更して、出演者の分類を修正することで、より正確に分類することができるようになる。   In this way, it is possible to classify more accurately by changing the threshold for classification and correcting the classification of performers so as to match the classification tendency of the classified performers indicated by the learning data given manually. Will be able to.

ステップS56の後、手続きは、ステップS52に戻る。   After step S56, the procedure returns to step S52.

ステップS55において、制約条件92に当てはまると判定された場合、タイプベクトルを修正する必要はないので、ステップS56はスキップされて、手続きは、ステップS52に戻る。   If it is determined in step S55 that the constraint condition 92 is satisfied, the type vector does not need to be corrected, so step S56 is skipped and the procedure returns to step S52.

ステップS52において、放送局のそれぞれの時間帯のそれぞれについて分類の結果の修正を完了したと判定された場合、分類の修正の処理は終了する。   If it is determined in step S52 that the correction of the classification result has been completed for each time zone of the broadcasting station, the classification correction process ends.

次に、図9のフローチャートを参照して、分類結果修正部91による、より具体的な分類の修正の処理の例を説明する。ステップS71において、分類結果修正部91は、放送局のそれぞれの時間帯のそれぞれについてタイプベクトルの修正を完了したか否かを判定する。   Next, an example of more specific classification correction processing by the classification result correction unit 91 will be described with reference to the flowchart of FIG. In step S71, the classification result correction unit 91 determines whether or not the correction of the type vector is completed for each time zone of the broadcasting station.

ステップS71において、放送局のそれぞれの時間帯のそれぞれについてタイプベクトルの修正を完了していないと判定された場合、手続きはステップS72に進み、分類結果修正部91は、放送局と時間帯との組み合わせのうち、まだ分類の結果の修正のために選択していないものの中から、1つの放送局の1つの時間帯を選ぶ。   If it is determined in step S71 that the correction of the type vector has not been completed for each time zone of the broadcasting station, the procedure proceeds to step S72, and the classification result correcting unit 91 determines whether the broadcasting station and the time zone are One time zone of one broadcasting station is selected from among the combinations that have not yet been selected for correcting the classification result.

ステップS73において、分類結果修正部91は、選択された時間帯において選択された放送局から放送される番組に出演している分類済み出演者のタイプベクトルを出演者タイプデータベース34から取得する。   In step S <b> 73, the classification result correcting unit 91 obtains from the performer type database 34 the type vectors of the classified performers who have appeared in the program broadcast from the selected broadcasting station in the selected time zone.

ステップS74において、分類結果修正部91は、分類済み出演者のタイプベクトルから、選択された時間帯と選択された放送局とにおけるタイプの出現割合を計算する。   In step S74, the classification result correcting unit 91 calculates the appearance ratio of the type in the selected time zone and the selected broadcasting station from the type vector of the classified performer.

ステップS75において、分類結果修正部91は、タイプの出現割合に、予め定めた閾値以上の偏りがあるか否かを判定する。例えば、分類結果修正部91は、お笑い系であるタイプの出現割合から恋愛系であるタイプの出現割合を引き算して、引き算の結果の絶対値と予め定めた閾値とを比較して、引き算の結果の絶対値が閾値を超えるか否かを判定することにより、お笑い系であるタイプと恋愛系であるタイプの出現割合に閾値以上の偏りがあるか否かを判定する。   In step S75, the classification result correcting unit 91 determines whether or not the type appearance ratio has a bias equal to or greater than a predetermined threshold. For example, the classification result correction unit 91 subtracts the appearance ratio of the romantic type from the appearance ratio of the comedy type, compares the absolute value of the subtraction result with a predetermined threshold, By determining whether or not the absolute value of the result exceeds the threshold value, it is determined whether or not the appearance ratio of the type that is a comedy type and the type that is a romance type is more than a threshold value.

ステップS75において、タイプの出現割合に、予め定めた閾値以上の偏りがあると判定された場合、手続きはステップS76に進み、分類結果修正部91は、選択された時間帯において選択された放送局から放送される番組に出演している対象出演者のタイプベクトルを出演者タイプデータベース34から取得する。   If it is determined in step S75 that the type appearance ratio has a bias greater than or equal to a predetermined threshold, the procedure proceeds to step S76, and the classification result correction unit 91 selects the broadcast station selected in the selected time zone. From the performer type database 34, the type vector of the target performer appearing in the program broadcast from is acquired.

ステップS77において、分類結果修正部91は、対象出演者のタイプベクトルから、選択された時間帯と選択された放送局とにおけるタイプの出現の割合を計算する。   In step S77, the classification result correcting unit 91 calculates the appearance ratio of the type in the selected time zone and the selected broadcasting station from the type vector of the target performer.

ステップS78において、分類結果修正部91は、ステップS74において計算された分類済み出演者のタイプの出現割合と、ステップS77において計算された対象出演者のタイプの出現割合とに、予め定めた閾値以上の差があるか否かを判定する。   In step S78, the classification result correcting unit 91 sets the appearance ratio of the type of the already-performed performer calculated in step S74 and the appearance ratio of the type of the target performer calculated in step S77 to a predetermined threshold value or more. It is determined whether there is a difference.

例えば、分類結果修正部91は、同じタイプの、分類済み出演者における出現割合と対象出演者における出現割合とに、予め定めた閾値以上の差があるか否かを判定する。   For example, the classification result correction unit 91 determines whether or not there is a difference equal to or greater than a predetermined threshold value between the appearance ratio of the classified performer and the appearance ratio of the target performer of the same type.

例えば、より具体的には、分類結果修正部91は、分類済み出演者のお笑い系であるタイプの出現割合から対象出演者のお笑い系であるタイプの出現割合を引き算して、引き算の結果の絶対値と予め定めた閾値とを比較して、引き算の結果の絶対値が閾値を超えるか否かを判定することにより、分類済み出演者のお笑い系であるタイプの出現割合と対象出演者のお笑い系であるタイプの出現割合に閾値以上の差があるか否かを判定する。   For example, more specifically, the classification result correcting unit 91 subtracts the appearance ratio of the type that is the comedy type of the target performer from the appearance ratio of the type that is the comedy type of the classified performer, and obtains the result of the subtraction. By comparing the absolute value with a predetermined threshold and determining whether or not the absolute value of the result of the subtraction exceeds the threshold, the appearance ratio of the type that is the comedy type of the classified performer and the target performer It is determined whether there is a difference equal to or greater than a threshold in the appearance ratio of a type that is a comedy type.

ステップS78において、分類済み出演者のタイプの出現割合と対象出演者のタイプの出現割合とに予め定めた閾値以上の差があると判定された場合、手続きはステップS79に進み、分類結果修正部91は、分類済み出演者のタイプの出現割合に応じて、対象出演者のタイプの出現割合を分類済み出演者のタイプの出現割合に合わせるように、対象出演者のそれぞれのタイプベクトルを修正する。   If it is determined in step S78 that there is a difference equal to or greater than a predetermined threshold value between the appearance ratio of the type of the performer that has been classified and the appearance ratio of the type of the target performer, the procedure proceeds to step S79, and the classification result correction unit 91 corrects each type vector of the target performer so that the appearance ratio of the type of the target performer matches the appearance ratio of the type of the classified performer according to the appearance ratio of the type of the classified performer. .

ステップS79の後、手続きはステップS71に戻り、上述した処理を繰り返す。また、ステップS78において、分類済み出演者のタイプの出現割合と対象出演者のタイプの出現割合とに予め定めた閾値以上の差がないと判定された場合、およびステップS75において、タイプの出現割合に、予め定めた閾値以上の偏りがないと判定された場合、対象出演者のそれぞれのタイプベクトルを修正する必要はないので、そのまま、手続きはステップS71に戻り、上述した処理を繰り返す。   After step S79, the procedure returns to step S71 and repeats the above-described processing. Further, when it is determined in step S78 that there is no difference equal to or greater than a predetermined threshold value between the appearance ratio of the type of the classified performer and the appearance ratio of the type of the target performer, and in step S75, the appearance ratio of the type If it is determined that there is no bias greater than or equal to a predetermined threshold value, it is not necessary to correct each type vector of the target performer, so the procedure returns to step S71 and repeats the above-described processing.

ステップS71において、放送局のそれぞれの時間帯のそれぞれについてタイプベクトルの修正を完了したと判定された場合、分類の修正の処理は終了する。   If it is determined in step S71 that the type vector correction has been completed for each time zone of the broadcast station, the classification correction process ends.

このように、分類がより正確になるように、対象出演者の分類を修正することができる。   In this way, the classification of the target performers can be corrected so that the classification becomes more accurate.

なお、放送局と時間帯、またはジャンルに限らず、所属事務所、年齢、または性別などを制約条件92とするようにしてもよい。   Note that the restriction condition 92 may be not limited to the broadcasting station, time zone, or genre, but may be the affiliated office, age, gender, or the like.

このように、分類結果修正部91は、全部のコンテンツのうちの所定の条件を満たすコンテンツに付与されている属性の分類済み属性値の分類の偏りに応じて、対象属性値の分類を修正する。   As described above, the classification result correction unit 91 corrects the classification of the target attribute value according to the bias of the classification of the attribute values already classified for the attributes that satisfy the predetermined condition among all the contents. .

また、分類結果修正部91は、対象属性値で示される所定の出演者が出演するコンテンツの属性を限定する条件を満たすコンテンツに付与されている属性の分類済み属性値の分類の偏りに応じて、対象属性値の分類を修正する。   In addition, the classification result correction unit 91 responds to the bias in the classification of the attribute values that have been assigned to the content that satisfies the conditions that limit the attributes of the content in which the predetermined performer indicated by the target attribute value appears. , Correct the classification of the target attribute value.

分類結果修正部91は、所定の条件を満たすコンテンツに出演している所定の出演者を示す対象属性値の分類の偏りが、条件を満たすコンテンツに出演している出演者を示す分類済み属性値の分類の偏りにより近くなるように、対象属性値の分類を修正する。   The classification result correction unit 91 is a classified attribute value indicating a performer whose content of the target attribute value indicating a predetermined performer who appears in content satisfying a predetermined condition satisfies the condition that satisfies the condition. The classification of the target attribute value is corrected so as to be closer to the bias of the classification.

さらに、分類結果修正部91は、所定の条件を満たすコンテンツに出演している出演者を示す分類済み属性値の分類の偏りが予め定めた閾値より大きい場合、その閾値より大きい偏りの分類済み属性値の分類に応じて、対象属性値の分類を修正する。   Furthermore, when the classification bias of the classified attribute value indicating the performer appearing in the content satisfying the predetermined condition is larger than a predetermined threshold, the classified attribute having a bias larger than the threshold is displayed. The classification of the target attribute value is modified according to the value classification.

さらにまた、分類結果修正部91は、所定の条件を満たすコンテンツに出演している出演者を示す分類済み属性値の分類の偏りが予め定めた第1の閾値より大きく、かつ、条件を満たすコンテンツに出演している出演者を示す分類済み属性値の分類の偏りと条件を満たすコンテンツに出演している出演者を示す対象属性値の分類の偏りとの差が予め定めた第2の閾値より大きい場合、第1の閾値より大きい偏りの分類済み属性値の分類に応じて、対象属性値の分類を修正する。   Furthermore, the classification result correction unit 91 has a classification bias of classified attribute values indicating performers appearing in content satisfying a predetermined condition larger than a predetermined first threshold and satisfies the condition The difference between the classification bias of the classified attribute value indicating the performer who appears in the content and the bias of the classification of the target attribute value indicating the performer appearing in the content satisfying the condition satisfies the predetermined second threshold value. If it is larger, the classification of the target attribute value is corrected according to the classification of the classified attribute value whose bias is larger than the first threshold.

分類結果修正部91は、対象属性値で示される出演者の他の属性を限定する条件を満たす分類済み属性値の分類の偏りに応じて、対象属性値の分類を修正するようにもできる。   The classification result correction unit 91 can also correct the classification of the target attribute value according to the classification bias of the classified attribute value that satisfies the conditions for limiting other attributes of the performer indicated by the target attribute value.

また、分類の修正の処理は、1回に限らず、繰り返し実行するようにしてもよい。分類の修正の処理の計算量は、出演者特徴量ベクトルの作成の処理または分類の処理の計算量に比較して、小さいので(計算が軽いので)、分類の修正の処理を繰り返し実行しても、負荷が大きく増えることはない。   Further, the classification correction process is not limited to one time, and may be repeatedly executed. The amount of classification correction processing is small compared to the amount of performer feature vector creation or classification processing (because the calculation is light), so the classification correction processing is executed repeatedly. However, the load will not increase significantly.

さらに、タイプベクトルの要素毎に分類部を設けて、タイプベクトルの要素毎に異なる方式で要素を求めてから、対象出演者の分類の修正するようにしてもよい。   Furthermore, a classification unit may be provided for each element of the type vector so that the element of the target performer may be corrected after obtaining the element by a different method for each element of the type vector.

図10は、タイプベクトルの要素毎に分類部を設け、対象出演者の分類を修正するようにした場合の情報処理装置11の構成のさらに他の例を示すブロック図である。図10において、図1に示す場合、図6に示す場合、または図7に示す場合と同様の部分には同一の符号を付してあり、その説明は適宜省略する。   FIG. 10 is a block diagram illustrating still another example of the configuration of the information processing apparatus 11 when a classification unit is provided for each element of the type vector and the classification of the target performer is corrected. 10, the same reference numerals are given to the same parts as those shown in FIG. 1, the case shown in FIG. 6, or the case shown in FIG. 7, and the description thereof will be omitted as appropriate.

この場合、情報処理装置11は、コンテンツ情報データベース31、出演者特徴量ベクトル作成部32、出演者タイプデータベース34、選択分類部51、および分類結果修正部91からなる。   In this case, the information processing apparatus 11 includes a content information database 31, a performer feature vector generation unit 32, a performer type database 34, a selection classification unit 51, and a classification result correction unit 91.

図10の情報処理装置11において、対象出演者のタイプベクトルの要素毎に、その要素に適した方式で、その要素の値が求められ、さらに、タイプベクトルによる分類がより正確になるように、対象出演者の分類が修正される。   In the information processing apparatus 11 of FIG. 10, for each element of the type vector of the target performer, the value of the element is obtained in a method suitable for the element, and further, the classification by the type vector is more accurate. The target performer classification is modified.

図10の情報処理装置11による、出演者特徴量ベクトルの作成の処理、分類の処理、および分類の修正の処理は、それぞれ、図2、図5、および図8のフローチャートを参照して説明した処理のそれぞれと同様なので、その説明は省略する。   The process of creating a performer feature value vector, the process of classification, and the process of correcting the classification by the information processing apparatus 11 of FIG. 10 have been described with reference to the flowcharts of FIG. 2, FIG. 5, and FIG. Since it is the same as each processing, its description is omitted.

以上のように、少数の人手で付与したデータを学習データとして、出演者にタイプを自動的に付与することができる。   As described above, the type can be automatically given to the performer by using the data given by a small number of hands as learning data.

このようにすることで、新たに番組に出演しはじめた出演者を、出演している番組を視聴することなく、正しいタイプに分類することができる。   By doing in this way, the performer who has begun to appear in the program can be classified into the correct type without viewing the program in which the program appears.

また、コンテンツ特有の制約条件を用いて分類の結果を修正するので、より正確に分類することができるようになる。   In addition, since the classification result is corrected using the constraint conditions specific to the content, the classification can be performed more accurately.

例えば、視聴者がよく視聴する番組の出演者を分類済み出演者として、視聴者個人が学習データを生成し、その学習データを基に、出演者を分類することができるので、その視聴者の嗜好に合わせて出演者が分類されることになり、この分類を基にして視聴者の好みの番組を特定することで、視聴者への番組などの推薦の精度が向上する。   For example, it is possible to classify performers based on the learning data generated by individual viewers with the performers of programs that viewers often watch as classified performers. Performers are classified according to preferences, and by specifying a viewer's favorite program based on this classification, the accuracy of recommending a program to the viewer is improved.

なお、情報処理装置11は、テレビジョン受像機、チューナ、HDD(Hard Disk Drive)内蔵のビデオレコーダプレーヤ、セットトップボックス、サーバ、またはクライアントである端末装置などとして実現できる。   The information processing apparatus 11 can be realized as a television receiver, a tuner, a video recorder player with a built-in HDD (Hard Disk Drive), a set top box, a server, or a terminal device as a client.

このように、出演者の特徴量を求め、分類済み出演者を予め分類するようにした場合には、出演者の特徴量と分類済み出演者の分類とから、出演者を分類することができる。また、コンテンツについての情報からコンテンツに付与された属性の属性値についての特徴を示す特徴量を作成し、分類の対象となる属性値である対象属性値を、対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、対象属性値の特徴量に類似する特徴量の分類済み属性値の分類に応じて分類し、所定の条件を満たすコンテンツに付与された、分類済み属性値の分類の偏りに応じて、対象属性値の分類を修正するようにした場合には、簡単に、より正確に、コンテンツに付与された属性の属性値を分類することができる。   Thus, when the feature amount of the performer is obtained and the classified performer is classified in advance, the performer can be classified from the feature amount of the performer and the classification of the classified performer. . In addition, a feature quantity indicating a feature of the attribute value of the attribute assigned to the content is created from the information about the content, and the target attribute value that is the attribute value to be classified is set to the same attribute as the attribute of the target attribute value. The attribute value is classified according to the classification of the classified attribute value of the feature quantity similar to the feature quantity of the target attribute value among the classified attribute values that are the attribute values that are classified in advance, and a predetermined condition If the classification of the target attribute value is modified according to the classification bias of the classified attribute value assigned to the content that satisfies the criteria, the attribute attribute assigned to the content can be more easily and accurately Values can be classified.

上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。   The series of processes described above can be executed by hardware or can be executed by software. When a series of processing is executed by software, a program constituting the software executes various functions by installing a computer incorporated in dedicated hardware or various programs. For example, it is installed from a program recording medium in a general-purpose personal computer or the like.

図11は、上述した一連の処理をプログラムにより実行するパーソナルコンピュータの構成の例を示すブロック図である。CPU(Central Processing Unit)201は、ROM(Read Only Memory)202、または記憶部208に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)203には、CPU201が実行するプログラムやデータなどが適宜記憶される。これらのCPU201、ROM202、およびRAM203は、バス204により相互に接続されている。   FIG. 11 is a block diagram showing an example of the configuration of a personal computer that executes the above-described series of processing by a program. A CPU (Central Processing Unit) 201 executes various processes according to a program stored in a ROM (Read Only Memory) 202 or a storage unit 208. A RAM (Random Access Memory) 203 appropriately stores programs executed by the CPU 201 and data. The CPU 201, ROM 202, and RAM 203 are connected to each other via a bus 204.

CPU201にはまた、バス204を介して入出力インタフェース205が接続されている。入出力インタフェース205には、キーボード、マウス、マイクロホンなどよりなる入力部206、ディスプレイ、スピーカなどよりなる出力部207が接続されている。CPU201は、入力部206から入力される指令に対応して各種の処理を実行する。そして、CPU201は、処理の結果を出力部207に出力する。   An input / output interface 205 is also connected to the CPU 201 via the bus 204. Connected to the input / output interface 205 are an input unit 206 made up of a keyboard, mouse, microphone, and the like, and an output unit 207 made up of a display, a speaker, and the like. The CPU 201 executes various processes in response to commands input from the input unit 206. Then, the CPU 201 outputs the processing result to the output unit 207.

入出力インタフェース205に接続されている記憶部208は、例えばハードディスクからなり、CPU201が実行するプログラムや各種のデータを記憶する。通信部209は、インターネットやローカルエリアネットワークなどのネットワークを介して外部の装置と通信する。   A storage unit 208 connected to the input / output interface 205 includes, for example, a hard disk, and stores programs executed by the CPU 201 and various data. The communication unit 209 communicates with an external device via a network such as the Internet or a local area network.

また、通信部209を介してプログラムを取得し、記憶部208に記憶してもよい。   Further, a program may be acquired via the communication unit 209 and stored in the storage unit 208.

入出力インタフェース205に接続されているドライブ210は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア211が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記憶部208に転送され、記憶される。   The drive 210 connected to the input / output interface 205 drives a removable medium 211 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and drives the programs and data recorded therein. Get etc. The acquired program and data are transferred to and stored in the storage unit 208 as necessary.

コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、図11に示すように、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア211、または、プログラムが一時的もしくは永続的に格納されるROM202や、記憶部208を構成するハードディスクなどにより構成される。プログラム記録媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインタフェースである通信部209を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。   As shown in FIG. 11, a program recording medium that stores a program that is installed in a computer and is ready to be executed by the computer includes a magnetic disk (including a flexible disk), an optical disk (CD-ROM (Compact Disc-Read Only). Memory, DVD (Digital Versatile Disc), a magneto-optical disk, a removable medium 211 that is a package medium composed of a semiconductor memory, or the like, a ROM 202 in which a program is temporarily or permanently stored, or a storage unit 208 It is comprised by the hard disk etc. which comprise. The program is stored in the program recording medium using a wired or wireless communication medium such as a local area network, the Internet, or digital satellite broadcasting via a communication unit 209 that is an interface such as a router or a modem as necessary. Done.

なお、本明細書において、プログラム記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。   In the present specification, the step of describing the program stored in the program recording medium is not limited to the processing performed in time series in the described order, but is not necessarily performed in time series. Or the process performed separately is also included.

なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。   The embodiment of the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the gist of the present invention.

本発明の一実施の形態の情報処理装置の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the information processing apparatus of one embodiment of this invention. 出演者特徴量ベクトルの作成の処理を説明するフローチャートである。It is a flowchart explaining the process of preparation of a performer feature-value vector. コンテンツ情報の例を示す図である。It is a figure which shows the example of content information. 出演者特徴量ベクトルの例を示す図である。It is a figure which shows the example of a performer feature-value vector. 出演者の分類の処理を説明するフローチャートである。It is a flowchart explaining the process of performer classification. 情報処理装置の構成の他の例を示すブロック図である。FIG. 12 is a block diagram illustrating another example of the configuration of the information processing apparatus. 情報処理装置の構成のさらに他の例を示すブロック図である。FIG. 22 is a block diagram illustrating still another example of the configuration of the information processing device. 分類の修正の処理を説明するフローチャートである。It is a flowchart explaining the process of correction of classification. より具体的な分類の修正の処理の例を説明するフローチャートである。10 is a flowchart for explaining an example of more specific classification correction processing. 情報処理装置の構成のさらに他の例を示すブロック図である。FIG. 22 is a block diagram illustrating still another example of the configuration of the information processing device. パーソナルコンピュータの構成の例を示すブロック図である。And FIG. 11 is a block diagram illustrating an example of a configuration of a personal computer.

符号の説明Explanation of symbols

11 情報処理装置, 31 コンテンツ情報データベース, 32 出演者特徴量ベクトル作成部, 33 分類部, 34 出演者タイプデータベース, 51 選択分類部, 71 選択部, 72−1乃至72−N 分類部, 91 分類結果修正部, 201 CPU, 202 ROM, 203 RAM, 208 記憶部, 211 リムーバブルメディア   DESCRIPTION OF SYMBOLS 11 Information processing apparatus, 31 Content information database, 32 Performer feature-value vector preparation part, 33 Classification part, 34 Performer type database, 51 Selection classification part, 71 Selection part, 72-1 thru | or 72-N Classification part, 91 classification Result correction unit, 201 CPU, 202 ROM, 203 RAM, 208 storage unit, 211 removable media

Claims (13)

コンテンツについての情報から前記コンテンツに付与された属性の属性値についての特徴を示す特徴量を作成する特徴量作成手段と、
分類の対象となる属性値である対象属性値を、前記対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、前記対象属性値の前記特徴量に類似する前記特徴量の分類済み属性値の分類に応じて分類する第1の分類手段と、
所定の条件を満たす前記コンテンツに付与された、前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正する修正手段と
を備える情報処理装置。
A feature amount creating means for creating a feature amount indicating a feature about an attribute value of an attribute given to the content from information about the content;
The target attribute value that is the attribute value to be classified is the attribute value of the same attribute as the attribute of the target attribute value, and the target attribute of the classified attribute values that are pre-classified attribute values First classification means for classifying according to the classification of the attribute value that has been classified similar to the feature value of the value;
An information processing apparatus comprising: correction means for correcting the classification of the target attribute value according to a classification bias of the classified attribute value assigned to the content that satisfies a predetermined condition.
前記修正手段は、全部の前記コンテンツのうちの前記条件を満たす前記コンテンツに付与されている属性の前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正する
請求項1に記載の情報処理装置。
2. The correction unit corrects the classification of the target attribute value according to a bias in the classification of the classified attribute value of the attribute assigned to the content that satisfies the condition among all the contents. The information processing apparatus described in 1.
前記修正手段は、前記対象属性値で示される所定の出演者が出演する前記コンテンツの属性を限定する前記条件を満たす前記コンテンツに付与されている属性の前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正する
請求項2に記載の情報処理装置。
The correction means responds to a bias in the classification of the classified attribute value of the attribute given to the content that satisfies the condition satisfying the condition that limits the attribute of the content in which the predetermined performer indicated by the target attribute value appears The information processing apparatus according to claim 2, wherein the classification of the target attribute value is corrected.
前記修正手段は、前記条件を満たす前記コンテンツに出演している所定の出演者を示す前記対象属性値の分類の偏りが、前記条件を満たす前記コンテンツに出演している出演者を示す前記分類済み属性値の分類の偏りにより近くなるように、前記対象属性値の分類を修正する
請求項3に記載の情報処理装置。
The correction means is the classified already indicating that the target attribute value classification bias indicating a predetermined performer appearing in the content satisfying the condition satisfies a performer appearing in the content satisfying the condition The information processing apparatus according to claim 3, wherein the classification of the target attribute value is corrected so as to be closer to the bias of the attribute value classification.
前記修正手段は、前記条件を満たす前記コンテンツに出演している出演者を示す前記分類済み属性値の分類の偏りが予め定めた第1の閾値より大きい場合、前記第1の閾値より大きい偏りの前記分類済み属性値の分類に応じて、前記対象属性値の分類を修正する
請求項3に記載の情報処理装置。
When the bias of classification of the classified attribute value indicating a performer who appears in the content that satisfies the condition satisfies a bias that is greater than the first threshold, the correction means has a bias that is greater than the first threshold. The information processing apparatus according to claim 3, wherein the classification of the target attribute value is modified according to the classification of the classified attribute value.
前記修正手段は、前記条件を満たす前記コンテンツに出演している出演者を示す前記分類済み属性値の分類の偏りが予め定めた第1の閾値より大きく、かつ、前記条件を満たす前記コンテンツに出演している出演者を示す前記分類済み属性値の分類の偏りと前記条件を満たす前記コンテンツに出演している出演者を示す前記対象属性値の分類の偏りとの差が予め定めた第2の閾値より大きい場合、前記第1の閾値より大きい偏りの前記分類済み属性値の分類に応じて、前記対象属性値の分類を修正する
請求項3に記載の情報処理装置。
The correction means has a classification bias of the classified attribute value indicating a performer appearing in the content that satisfies the condition that is greater than a predetermined first threshold, and appears in the content that satisfies the condition A difference between a bias in the classification of the classified attribute value indicating the performer performing and a bias in the classification of the target attribute value indicating the performer performing in the content that satisfies the condition is determined in advance. The information processing apparatus according to claim 3, wherein when the threshold value is larger than the threshold value, the classification of the target attribute value is corrected according to the classification of the classified attribute value biased to be larger than the first threshold value.
前記第1の分類手段は、複数の要素からなる前記特徴量の前記要素毎に重みづけした類似度によって、前記対象属性値の前記特徴量に類似するとされた前記特徴量の前記分類済み属性値の分類に応じて前記対象属性値を分類する
請求項1に記載の情報処理装置。
The first classification unit is configured to determine the classified attribute value of the feature amount that is similar to the feature amount of the target attribute value based on a similarity weighted for each element of the feature amount including a plurality of elements. The information processing apparatus according to claim 1, wherein the target attribute value is classified according to the classification.
前記第1の分類手段は、複数のタイプのうちの、所定の出演者を示す前記対象属性値の前記特徴量に類似する前記特徴量の前記分類済み属性値の第1のタイプへの分類に応じて、前記出演者を示す前記対象属性値を前記第1のタイプに分類する
請求項1に記載の情報処理装置。
The first classification unit is configured to classify the feature amount similar to the feature amount of the target attribute value indicating a predetermined performer among a plurality of types into the first type of the classified attribute value. The information processing apparatus according to claim 1, wherein the target attribute value indicating the performer is classified into the first type.
前記第1の分類手段の分類の方式と異なる方式により、前記複数のタイプのうちの、前記出演者を示す前記対象属性値の前記特徴量に類似する前記特徴量の前記分類済み属性値の第2のタイプへの分類に応じて、前記出演者を示す前記対象属性値を前記第2のタイプに分類する第2の分類手段と、
前記第1の分類手段または前記第2の分類手段のいずれか一方を、タイプ毎に選択する選択手段と
をさらに備える請求項8に記載の情報処理装置。
The classification attribute value of the feature quantity similar to the feature quantity of the target attribute value indicating the performer among the plurality of types by a scheme different from the classification scheme of the first classification means. Second classification means for classifying the target attribute value indicating the performer into the second type according to the classification into two types;
The information processing apparatus according to claim 8, further comprising: a selection unit that selects one of the first classification unit and the second classification unit for each type.
前記特徴量作成手段は、放送される番組である前記コンテンツについての情報から番組である前記コンテンツに出演している出演者を示す前記属性値についての特徴を示す前記特徴量を作成し、
前記修正手段は、所定の放送局から所定の時間帯に放送される番組である前記コンテンツに出演している出演者を示す前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正する
請求項1に記載の情報処理装置。
The feature amount creating means creates the feature amount indicating a feature about the attribute value indicating a performer who appears in the content that is a program from information about the content that is a broadcast program,
The correction means is configured to set the target attribute value in accordance with a classification bias of the classified attribute value indicating a performer who appears in the content that is a program broadcast from a predetermined broadcast station in a predetermined time zone. The information processing apparatus according to claim 1, wherein the classification is corrected.
コンテンツについての情報から前記コンテンツに付与された属性の属性値についての特徴を示す特徴量を作成し、
分類の対象となる属性値である対象属性値を、前記対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、前記対象属性値の前記特徴量に類似する前記特徴量の分類済み属性値の分類に応じて分類し、
所定の条件を満たす前記コンテンツに付与された、前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正する
ステップを含む情報処理方法。
Create a feature amount indicating a feature about the attribute value of the attribute given to the content from the information about the content,
The target attribute value that is the attribute value to be classified is the attribute value of the same attribute as the attribute of the target attribute value, and the target attribute of the classified attribute values that are pre-classified attribute values Classifying according to the classification of the attribute value classified attribute value similar to the feature value of the value,
An information processing method including a step of correcting a classification of the target attribute value according to a classification bias of the classified attribute value given to the content satisfying a predetermined condition.
コンテンツについての情報から前記コンテンツに付与された属性の属性値についての特徴を示す特徴量を作成し、
分類の対象となる属性値である対象属性値を、前記対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、前記対象属性値の前記特徴量に類似する前記特徴量の分類済み属性値の分類に応じて分類し、
所定の条件を満たす前記コンテンツに付与された、前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正する
ステップをコンピュータに実行させるプログラム。
Create a feature amount indicating a feature about the attribute value of the attribute given to the content from the information about the content,
The target attribute value that is the attribute value to be classified is the attribute value of the same attribute as the attribute of the target attribute value, and the target attribute of the classified attribute values that are pre-classified attribute values Classifying according to the classification of the attribute value classified attribute value similar to the feature value of the value,
A program that causes a computer to execute a step of correcting the classification of the target attribute value in accordance with the classification bias of the classified attribute value given to the content that satisfies a predetermined condition.
コンテンツについての情報から前記コンテンツに付与された属性の属性値についての特徴を示す特徴量を作成し、
分類の対象となる属性値である対象属性値を、前記対象属性値の属性と同じ属性の属性値であって、予め分類されている属性値である分類済み属性値のうちの、前記対象属性値の前記特徴量に類似する前記特徴量の分類済み属性値の分類に応じて分類し、
所定の条件を満たす前記コンテンツに付与された、前記分類済み属性値の分類の偏りに応じて、前記対象属性値の分類を修正する
ステップを含む情報処理をコンピュータに実行させるプログラムが記録されている記録媒体。
Create a feature amount indicating a feature about the attribute value of the attribute given to the content from the information about the content,
The target attribute value that is the attribute value to be classified is the attribute value of the same attribute as the attribute of the target attribute value, and the target attribute of the classified attribute values that are pre-classified attribute values Classifying according to the classification of the attribute value classified attribute value similar to the feature value of the value,
A program for causing a computer to execute information processing including a step of correcting the classification of the target attribute value according to the classification bias of the classified attribute value assigned to the content satisfying a predetermined condition is recorded. recoding media.
JP2006303092A 2006-11-08 2006-11-08 Information processing apparatus and method, program, and recording medium Withdrawn JP2008123043A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006303092A JP2008123043A (en) 2006-11-08 2006-11-08 Information processing apparatus and method, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006303092A JP2008123043A (en) 2006-11-08 2006-11-08 Information processing apparatus and method, program, and recording medium

Publications (1)

Publication Number Publication Date
JP2008123043A true JP2008123043A (en) 2008-05-29

Family

ID=39507766

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006303092A Withdrawn JP2008123043A (en) 2006-11-08 2006-11-08 Information processing apparatus and method, program, and recording medium

Country Status (1)

Country Link
JP (1) JP2008123043A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012190142A (en) * 2011-03-09 2012-10-04 Ntt Docomo Inc Evaluation device and evaluation method
JP2018194940A (en) * 2017-05-15 2018-12-06 ヤフー株式会社 Information processing apparatus, information processing method and information processing program
JPWO2022044064A1 (en) * 2020-08-24 2022-03-03

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012190142A (en) * 2011-03-09 2012-10-04 Ntt Docomo Inc Evaluation device and evaluation method
JP2018194940A (en) * 2017-05-15 2018-12-06 ヤフー株式会社 Information processing apparatus, information processing method and information processing program
JPWO2022044064A1 (en) * 2020-08-24 2022-03-03
WO2022044064A1 (en) * 2020-08-24 2022-03-03 富士通株式会社 Machine learning data generation program, machine learning data generation method, machine learning data generation device, classification data generation program, classification data generation method, and classification data generation device
JP7409513B2 (en) 2020-08-24 2024-01-09 富士通株式会社 Machine learning data generation program, machine learning data generation method, and machine learning data generation device

Similar Documents

Publication Publication Date Title
US11151145B2 (en) Tag selection and recommendation to a user of a content hosting service
US7769760B2 (en) Information processing apparatus, method and program thereof
JP5740814B2 (en) Information processing apparatus and method
US20200125981A1 (en) Systems and methods for recognizing ambiguity in metadata
US10540396B2 (en) System and method of personalizing playlists using memory-based collaborative filtering
CN102207954B (en) Electronic equipment, content recommendation method and program thereof
CN101674458B (en) Apparatus and method for content recommendation
US7953735B2 (en) Information processing apparatus, method and program
US20190138551A1 (en) Systems and methods of classifying content items
US20150066999A1 (en) Information processing device, information processing method, and program
US20160057496A1 (en) Content recommendations
KR20050120786A (en) Method and apparatus for grouping content items
EP2300980A2 (en) Recommender system
JP2008165759A (en) Information processing apparatus and method, and program
JP2013029872A (en) Information recommendation system, method, and program
CN104182413A (en) Method and system for recommending multimedia content
Bost et al. Remembering winter was coming: Character-oriented video summaries of TV series
US20080183697A1 (en) Information processing apparatus and method, and program
EP3539017A1 (en) Identifying audio-visual media items having a particular audio content
CN108353213A (en) Video content is summarized and class selection
US20240340480A1 (en) Systems and methods for generating alternative content recommendations
EP2336900A2 (en) Search device and search method
JP2008123043A (en) Information processing apparatus and method, program, and recording medium
US20240338743A1 (en) Systems and methods for generating alternative content recommendations
KR20120042245A (en) System and method for assisting creation of image contents using metadata based on user

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100202