JP4359085B2 - コンテンツ特徴量抽出装置 - Google Patents
コンテンツ特徴量抽出装置 Download PDFInfo
- Publication number
- JP4359085B2 JP4359085B2 JP2003186107A JP2003186107A JP4359085B2 JP 4359085 B2 JP4359085 B2 JP 4359085B2 JP 2003186107 A JP2003186107 A JP 2003186107A JP 2003186107 A JP2003186107 A JP 2003186107A JP 4359085 B2 JP4359085 B2 JP 4359085B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- content
- feature amount
- distribution
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、ネットワークや記録媒体を介して流通しているコンテンツの特徴量抽出し、この抽出した特徴量を不正流通検出や類似検索に利用するコンテンツ特徴量抽出装置に関する。
【0002】
【従来の技術】
近年のネットワークの高速化や記録媒体の大容量化に伴い、映像データ、音声データ等からなる大容量のデジタルコンテンツ(以下、コンテンツとする)を、高速のネットワークである公衆通信回線(光ファイバ通信回線、ADSL等)により配信、または、大容量の記録媒体である光ディスク(DVD等)により流通させることを、誰でも容易に行える環境が整備されている。
【0003】
また、ネットワークを介して配信されたコンテンツは蓄積が容易であり、記録媒体に記録されたコンテンツは配送が容易であるので、当該コンテンツの著作権者(以下、単に「著作権者」とする)や当該コンテンツを配信する配信事業者(以下、「コンテンツプロバイダ」とする)の許可を得ることなく、蓄積したコンテンツを複製した後、ネットワークを介して再配信したり、当該コンテンツを改竄(かいざん)したりするなど、不正行為を行うことが容易である。この不正行為がコンテンツを流通させる上での大きな阻害要因となっている。
【0004】
特に、著作権者やコンテンツプロバイダの許可(許諾)を得ることなく、コンテンツの複製、再配信(再送信)を行う不正行為よる不正流通コンテンツは、著作権者やコンテンツプロバイダに多大な金銭的不利益をもたらすので、このような不正流通コンテンツを高精度、且つ、短時間に検出し、不正行為の抑止を図ることができる技術的な手段が模索されている。
【0005】
また、インターネットの普及やデジタル情報機器(ストレージ装置等)の高性能化に伴い、大容量のコンテンツである動画像コンテンツ(大容量マルチメディアデータ)の利用が一般化している。このため、インターネット上やストレージ装置内に保持された膨大な数のコンテンツの中から、利用者が要望する特定のコンテンツを効率よく検索する手段が求められている。
【0006】
不正流通コンテンツの検出や、特定のコンテンツの検索を行うために、コンテンツを構成する映像データの輝度や色情報等から当該コンテンツの特徴を表す特徴量データを抽出し、この抽出した特徴量データをコンテンツ間の同一性や類似性の判定(検定)に利用する特徴量抽出技術が有効な手段として提案されている。
【0007】
従来の特徴量抽出技術の一つに、例えば、非特許文献1に記載されているように、放送番組の輝度及び色信号の時間軌跡を特徴量とし、この特徴量を手がかりにして動画像検索を実現するものがある。この手法では、まず、テレビ放送番組をMPEG−2に変換し、MPEG−2ストリームの各イントラフレームのDC成分を用いて、フレームの平均色情報を求める。続いて、このフレームの平均色情報を3次元の色空間に配置し、このフレームの平均色情報の軌跡を時間軸に投影し波形情報に変換する。そして、この波形情報で特定される波形を拡大縮小して、比較することによって動画像検索(動画像の類似検索)を行っている。
【0008】
ここで、図11を参照して、従来の動画像の類似検索を行う際の特徴量抽出方法および比較方法について説明する。
【0009】
この図11は、従来のコンテンツ特徴量抽出装置のブロック図であり、この図11に示したように、コンテンツ特徴量抽出装置101は、動画像データ輝度・色差データ平均化部103と、参照コンテンツ輝度・色差データ平均化部105と、ダイナミックレンジ調整部107と、波形比較部109と、分散値算出部111と、閾値判定部113とを備えている。
【0010】
動画像データ輝度・色差データ平均化部103は、動画像データを入力として、この動画像データの輝度信号(Y)と、色差信号(Cb、Cr)とを用い、これらの信号をフレーム単位で平均化し、特徴量データ(波形)を出力するものである。
【0011】
参照コンテンツ輝度・色差データ平均化部105は、参照コンテンツを入力として、この参照コンテンツの動画像データの輝度信号(Y)と、色差信号(Cb、Cr)とを用い、これらの信号をフレーム単位で平均化し、比較波形データを出力するものである。
【0012】
ダイナミックレンジ調整部107は、動画像データ輝度・色差データ平均化部103から出力された調整対象の波形である特徴量データの最大値および最小値を、参照コンテンツ輝度・色差データ平均化部105から出力された比較波形データの最大値および最小値に合わせるものである。
【0013】
波形比較部109は、ダイナミックレンジ調整部107で最大値および最小値が調整された特徴量データおよび比較波形データの波形を比較する、つまり、各時点における両波形の差分値を、差分データ系列として出力するものである。
【0014】
分散値算出部111は、波形比較部109から出力された差分データ系列から分散値を算出するものである。
【0015】
閾値判定部113は、分散値算出部111で算出された分散値と、予め設定された閾値とに基づいて、閾値判定を行って、両波形(特徴量データ、比較波形データ)の一致、不一致を判定し、動画像データと参照コンテンツとの類似性を検出するものである。
【0016】
また、コンテンツの特徴量を抽出する従来の技術に関して、例えば、ISO/IEC15938−3「MPEG−7 ビジュアル記述」では、映像データ(映像信号)の特徴を記述し、この記述した特徴を抽出する特徴量抽出アルゴリズムが規定されている。このビジュアル記述は、主として、映像データ(映像信号)ベースでの類似検索・フィルタリングのために用いられることが想定されており、このビジュアル記述の中で、映像データ上の色や形状等の低レベルの特徴量を記述する具体的なものとして、色の空間的な配置を周波数軸上で表現する「色配置記述(Color Layout)」が定義されている。
【0017】
この色配置記述は、人間の視覚特性を反映させたもので、コンテンツを構成する各画像フレームに対して、高精度の検索を可能にしている。つまり、色配置記述によって、コンテンツ同士の類似性を検定する際に、不要な情報を周波数軸上で削除することができる。その結果、コンテンツの特徴を記述するデータ量が減少する。
【0018】
【非特許文献1】
高橋、富永、杉浦、横井、寺島著“特徴的な動画像の画紋を用いた高能率動画像検索法”画像電子学会誌、第29巻、第6号、pp818
−pp825(2000)
【0019】
【発明が解決しようとする課題】
しかしながら、図11に示した従来のコンテンツ特徴量抽出装置101では、時間軸方向の波形データである特徴量データを動画像データの特徴量としているため、長時間の放送番組等のコンテンツでは、特徴量データのデータ量が膨大となってしまうという問題がある。
【0020】
また、コンテンツ特徴量抽出装置101では、時間軸上において、直接、特徴量データと比較波形データとを比較しているので、編集されたコンテンツを検定する場合、例えば、放送番組の冒頭、途中または最後の部分が削除され、元々の放送番組と比較して欠落が生じている場合には、コンテンツの同一性または類似性の検出精度が著しく低下するという問題がある。
【0021】
さらに、従来のビジュアル記述では、映像データ中の1フレームの画像データを対象に特徴量抽出を行っているので、このビジュアル記述を動画像データであるコンテンツに適用する場合、特徴量データのデータ量が膨大となり、さらに、編集されたコンテンツに対する耐性(検出精度を保つこと)が考慮されていない、つまり、コンテンツの同一性または類似性の検出精度が著しく低下するという問題がある。
【0022】
そこで、本発明の目的は前記した従来の技術が有する課題を解消し、特徴量データのデータ量を増加させることなく、コンテンツの同一性または類似性の検出精度を維持することができるコンテンツ特徴量抽出装置、コンテンツ特徴量抽出プログラムおよびコンテンツ特徴量抽出方法を提供することにある。
【0023】
【課題を解決するための手段】
本発明は、前記した目的を達成するため、以下に示す構成とした。
請求項1記載のコンテンツ特徴量抽出装置は、コンテンツを提供するコンテンツ提供事業者から提供され、ネットワークまたは記録媒体を介して流通する流通コンテンツを構成する特定の周波数パターンで表される流通コンテンツ特徴量データを抽出すると共に、この流通コンテンツ特徴量データと、前記コンテンツを構成する特定の周波数パターンで表される参照コンテンツ特徴量データとを比較するコンテンツ特徴量抽出装置であって、参照コンテンツ特徴量データ蓄積手段と、流通コンテンツ特徴量データ抽出手段と、特徴量データ比較手段と、を備え、流通コンテンツ特徴量データ抽出手段は、画素データ平均化手段と、データ並べ替え手段と、周波数変換手段と、周波数データ平均化手段と、周波数データ総和算出手段とを有していることを特徴とする。
【0024】
かかる構成によれば、コンテンツ特徴量抽出装置は、参照コンテンツ特徴量データ蓄積手段に予め、コンテンツの特徴量である参照コンテンツ特徴量データを蓄積しており、まず、流通コンテンツ特徴量データ抽出手段によって、ネットワークまたは記録媒体(例えば、光ディスク(DVD等))を介して流通している流通コンテンツを、当該ネットワークまたは当該記録媒体を介して取得し、この取得した流通コンテンツから流通コンテンツ特徴量データを抽出する。これら参照コンテンツ特徴量データまたは流通コンテンツ特徴量データは、コンテンツまたは流通コンテンツを構成する特定の周波数パターン(固有の波形パターン)を示すものであり、例えば、コンテンツまたは流通コンテンツの各画素の色の配置に基づいて、コンテンツまたは流通コンテンツ毎に一義的に決定されるものである。つまり、コンテンツまたは流通コンテンツの各画素は当該コンテンツまたは当該流通コンテンツの一時系列データであり、参照コンテンツ特徴量データまたは流通コンテンツ特徴量データはこの一時系列データから単一のデータとして生成したものである。また、これら参照コンテンツ特徴量データまたは流通コンテンツ特徴量データは、MPEG−21で提案されている“Finger Print”(画紋)に相当するものである。
【0025】
そして、このコンテンツ特徴量抽出装置は、特徴量データ比較手段によって、参照コンテンツ特徴量データ蓄積手段に蓄積している参照コンテンツ特徴量データと、流通コンテンツ特徴量データ抽出手段で抽出された流通コンテンツ特徴量データとを比較する。この特徴量データ比較手段による比較した結果に基づいて、例えば、流通コンテンツが不正に複写され再送信されたものである場合に、当該流通コンテンツとコンテンツプロバイダの提供したコンテンツとが同一のものであることを特定することができる。
【0027】
また、コンテンツ特徴量抽出装置の流通コンテンツ特徴量データ抽出手段は、画素データ平均化手段によって、流通コンテンツに含まれる各画素に関する画素データを、当該流通コンテンツを構成するフレーム単位またはフィールド単位で平均化し、データ並べ替え手段によって、画素データ平均化手段で平均化された所定単位画素データを並べ替えて時系列データとする。なお、流通コンテンツに含まれる各画素に関する画素データは、輝度データや連続するフレームにおける各画素の色差データ(Cb、Cr等)や、色信号データ(RGB)等であって、これらの組み合わせであってもよい。
【0028】
続いて、このコンテンツ特徴量抽出装置の流通コンテンツ特徴量データ抽出手段は、周波数変換手段によって、データ並べ替え手段で並べ替えられた時系列データを一定長毎に周波数変換し、周波数データとし、この周波数データを周波数データ平均化手段によって、周波数毎に平均化する。そして、このコンテンツ特徴量抽出装置の流通コンテンツ特徴量データ抽出手段は、周波数データ総和算出手段によって、周波数データ平均化手段で平均化された平均化周波数データを周波数全域に亘って総和し、この総和した平均化周波数データを特徴量データとする。つまり、このコンテンツ特徴量抽出装置では、流通コンテンツ特徴量データ抽出手段の周波数変換手段によって、時系列データを周波数データにすることによって、コンテンツの一時系列のデータである輝度データから単一のデータである周波数データを生成しており、この周波数データを平均化し、周波数全域に亘る総和を求めて、この総和を特徴量データ(流通コンテンツ特徴量データ)としている。
【0029】
請求項2記載のコンテンツ特徴量抽出装置は、請求項1に記載のコンテンツ特徴量抽出装置において、前記データ並べ替え手段は、前記所定単位画素データを一定間隔毎に選択して配列し、この配列を1つのフレーム単位または1つのフィールド単位ずつ順次ずらしながら繰り返して、並べ替えることを特徴とする。
【0030】
かかる構成によれば、コンテンツ特徴量抽出装置の流通コンテンツ特徴量データ抽出手段は、データ並べ替え手段によって、所定単位画素データを一定間隔毎に選択して配列し、この配列を1つのフレーム単位または1つのフィールド単位ずつ順次ずらしながら繰り返して並べることで、新たな時系列データ(データ系列)を得ることができる。
【0031】
請求項3記載のコンテンツ特徴量抽出装置は、請求項1又は請求項2に記載のコンテンツ特徴量抽出装置において、前記コンテンツおよび前記流通コンテンツが複数のシーンで構成されており、前記コンテンツの特徴量である参照コンテンツ特徴量データが前記シーンに対応する参照シーン特徴量データを含み、前記流通コンテンツの特徴量である流通コンテンツ特徴量データが前記シーンに対応する流通シーン特徴量データを含むことを特徴とする。
【0032】
かかる構成によれば、コンテンツ特徴量抽出装置は、複数のシーンからなるコンテンツおよび流通コンテンツを取り扱うことが可能であり、参照コンテンツ特徴量データが各シーンに対応する参照シーン特徴量データを含み、流通コンテンツ特徴量データが各シーンに対応する流通シーン特徴量データを含んでいるので、これらの参照シーン特徴量データおよび流通シーン特徴量データに基づいて、所望する流通コンテンツの特定するシーンを検索することができる。
【0033】
請求項4記載のコンテンツ特徴量抽出装置は、請求項1から請求項3のいずれか一項に記載のコンテンツ特徴量抽出装置において、前記特徴量データ比較手段は、前記流通コンテンツの流通コンテンツ特徴量データと前記コンテンツの参照コンテンツ特徴量データとの差の絶対値と、予め設定した特徴量データ同一性閾値とに基づいて、前記流通コンテンツと前記コンテンツとの同一性を検出する同一性検出手段を有していることを特徴とする。
【0034】
かかる構成によれば、コンテンツ特徴量抽出装置は、同一性検出手段によって、特徴量データ同一性閾値に基づいて、流通コンテンツとコンテンツとの同一性を検出する。これによって、不正流通コンテンツを検出することができる。
【0035】
請求項5記載のコンテンツ特徴量抽出装置は、請求項1から請求項4のいずれか一項に記載のコンテンツ特徴量抽出装置において、前記特徴量データ比較手段は、前記流通コンテンツの流通コンテンツ特徴量データと前記コンテンツの参照コンテンツ特徴量データとの差の絶対値と、予め設定した特徴量データ類似性閾値とに基づいて、前記流通コンテンツと前記コンテンツとの類似性を検出する類似性検出手段を有していることを特徴とする。
【0036】
かかる構成によれば、コンテンツ特徴量抽出装置は、類似性検出手段によって、特徴量データ類似性閾値に基づいて、流通コンテンツとコンテンツとの類似性を検出する。これによって、コンテンツと似かよった流通コンテンツを検索することができる。
【0041】
【発明の実施の形態】
以下、本発明の一実施の形態について、図面を参照して詳細に説明する。
(コンテンツ特徴量抽出装置の構成)
図1はコンテンツ特徴量抽出装置のブロック図である。この図1に示すように、コンテンツ特徴量抽出装置1は、参照コンテンツ(参照番組)の特徴量である参照コンテンツ特徴量データを抽出して蓄積していると共に、流通コンテンツの特徴量である流通コンテンツ特徴量データを抽出し、これらの特徴量データを比較して、不正に流通している不正流通コンテンツの検出や番組(コンテンツの一種)の特定シーンを検索するもので、参照コンテンツ特徴量データ抽出・管理部3と、流通コンテンツ特徴量データ抽出・比較部5とを備えている。
【0042】
これら参照コンテンツ特徴量データまたは流通コンテンツ特徴量データは、コンテンツまたは流通コンテンツを構成する特定の周波数パターン(固有の波形パターン)を示すものであり、参照コンテンツまたは流通コンテンツを特定する特徴量、つまり、人物を特定する指紋に当たる「画紋」といえるものである。例えば、参照コンテンツ特徴量データまたは流通コンテンツ特徴量データは、参照コンテンツまたは流通コンテンツの各画素の色(画素データ)の配置に基づいて、コンテンツまたは流通コンテンツ毎に一義的に決定されるものである(詳細は後記する)。
【0043】
なお、このコンテンツ特徴量抽出装置1はネットワークに接続される一般的なサーバをベースに構成されたものであり、各部、各手段は、当該サーバのハードウェア資源(CPU、メモリ、ハードディスク等)を、新たに記述したソフトウェアによって協同的に活用し、この活用した結果を機能的に特定したものである。
【0044】
また、この実施の形態では、これら参照コンテンツ特徴量データ抽出・管理部3と流通コンテンツ特徴量データ抽出・比較部5とは、コンテンツ特徴量抽出装置1の各部として構成されているが、これらは単体の装置(サーバ)とし、データおよび制御信号を送受信可能に構成してもよい。
【0045】
参照コンテンツ特徴量データ抽出・管理部3は、参照コンテンツ(参照番組)の特徴量である参照コンテンツ特徴量データを抽出して蓄積するもので、参照コンテンツ特徴量データ抽出手段7と、参照コンテンツ特徴量データ蓄積手段9と、特徴量データ管理手段11とを備えている。参照コンテンツ(参照番組)が請求項に記載したコンテンツに相当しており、不正流通コンテンツの比較対象、検索対象となる一つまたは複数の参照用のコンテンツ(番組)のことを指している。
【0046】
参照コンテンツ特徴量データ抽出手段7は、参照コンテンツの特徴量である参照コンテンツ特徴量データを当該参照コンテンツから抽出して、参照コンテンツ特徴量データ蓄積手段9に出力するものである。この参照コンテンツ特徴量データ抽出手段7における参照コンテンツ特徴量データの抽出は、後記する流通コンテンツ特徴量データ抽出手段と同様の抽出方法によって行われる。参照コンテンツ特徴量データは、参照コンテンツの各フレーム中の輝度データの当該フレーム毎に平均化したものを、時系列に並べ替えて周波数変換し、この周波数に変換した周波数データを総和したものである。つまり、参照コンテンツ特徴量データは、参照コンテンツ(参照番組)の一時系列データ(各フレームの輝度データ)を単一のものとして取り扱えるようにしたものであるといえる。
【0047】
なお、この実施の形態では、参照コンテンツ特徴量データは、参照コンテンツの各フレーム中の輝度データを使用して求めたが、例えば、色差データ(Cb、Cr等)や色信号データ(RGB)を使用して求めてもよい。つまり、参照コンテンツ特徴量データは、参照コンテンツに含まれている画素に関する画素データに基づいて求めることができる。
【0048】
また、参照コンテンツが複数のシーンから構成されている場合には、参照コンテンツ特徴量データは、各シーンに対応するように求められる。つまり、各シーン毎に振られているメタデータに基づいて、各シーン毎の特徴量である参照シーン特徴量データが割り当てられる。
【0049】
参照コンテンツ特徴量データ蓄積手段9は、参照コンテンツ特徴量データ抽出手段7で抽出された参照コンテンツ特徴量データを蓄積するものである。この参照コンテンツ特徴量データ蓄積手段9は、特徴量データ管理手段11の管理下にあるもので、この特徴量データ管理手段11からの出力された制御信号(参照コンテンツ特徴量データ順次出力信号)に基づいて、蓄積している参照コンテンツ特徴量データを流通コンテンツ特徴量データ抽出・比較部5の特徴量データ比較手段17(後記する)に、順次出力するものである。
【0050】
特徴量データ管理手段11は、参照コンテンツ特徴量データ抽出・管理部3の制御を司るもので、流通コンテンツ特徴量データ抽出・比較部5から出力された制御信号(参照コンテンツ特徴量データ出力開始信号)に基づいて、当該参照コンテンツ特徴量データ抽出・管理部3(参照コンテンツ特徴量データ蓄積手段9)から参照コンテンツ特徴量データを出力するものである。
【0051】
流通コンテンツ特徴量データ抽出・比較部5は、ネットワーク(インターネット、イントラネット等)や記録媒体(光ディスク(DVD等)、VTR等)を介して、流通している流通コンテンツ(検索対象番組/シーン)の特徴量である流通コンテンツ特徴量データを抽出し、この流通コンテンツ特徴量データと参照コンテンツ特徴量データとを比較するもので、流通コンテンツ特徴量データ抽出手段13と、制御手段15と、特徴量データ比較手段17と、結果表示手段19とを備えている。
【0052】
流通コンテンツ特徴量データ抽出手段13は、入力された流通コンテンツ(検索対象番組/シーン)の特徴量である流通コンテンツ特徴量データを抽出するもので、輝度データ平均化手段13aと、データ並べ替え手段13bと、周波数変換手段13cと、周波数データ平均化手段13dと、周波数データ総和算出手段13eとを備えている。この流通コンテンツ特徴量データ抽出手段13は、制御手段15から出力された制御信号(流通コンテンツ特徴量データ出力開始信号)に基づいて、流通コンテンツから流通コンテンツ特徴量データの抽出を開始する。
【0053】
なお、流通コンテンツが複数のシーンから構成されている場合には、流通コンテンツ特徴量データは、各シーンに対応するように求められる。つまり、各シーン毎に振られているメタデータに基づいて、各シーン毎の特徴量である流通シーン特徴量データが割り当てられる。
【0054】
輝度データ平均化手段13aは、流通コンテンツの動画像データを、連続するフレーム(フィールド)における各画素の輝度値(輝度データ)として入力し、この輝度値(輝度データ)を平均化した平均輝度値(所定単位輝度データ)を求めるもの、つまり、輝度値(輝度データ)の平均化処理を行うものである。
【0055】
この輝度データ平均化手段13aによる輝度値(輝度データ)の平均化処理では、各フレーム(各フィールド)について、このフレーム(フィールド)中の全画素の輝度値(輝度データ)の平均値を算出している。ここでは、輝度値(輝度データ)の平均値として、全画素の輝度値(輝度データ)の総和を全画素数で除算した値を用いている。
【0056】
また、任意のブロックサイズ(例えば、水平8画素×垂直8ライン)の小ブロックに分割した全ブロックに対してDCT(Discrete Cosine Transform;離散コサンイン変換)演算処理を施し、小ブロック毎のDC(直流)係数を求め、このDC(直流)係数の平均値を用いてもよい。
【0057】
或いは、各フレーム(フィールド)における全画素を任意数のブロックに分割し、各ブロックにおける全画素の輝度値を平均化して、縮小画像を作成し、当該縮小画像に対してDCT演算処理を施してDC係数を求めてもよい。
【0058】
なお、この実施の形態では、流通コンテンツ特徴量データ抽出手段13へ入力された流通コンテンツの連続するフレーム(フィールド)における各画素の輝度値(輝度データ)としているが、これに限定されず、例えば、連続するフレームにおける各画素の色差データ(Cb、Cr)や色信号データ(RGB)等を用いてもよく、また、これら輝度データ、色差データ、色信号データの任意の組み合わせであってもよい。この輝度値(輝度データ)が請求項に記載した画素データに、平均輝度値(所定単位輝度データ)が所定単位画素データに相当するものである。
【0059】
データ並べ替え手段13bは、輝度データ平均化手段13aで求められた平均輝度値(所定単位輝度データ)を時系列に並べ替えて新規データ系列(時系列データ)とする、データ並べ替え処理を行うものである。つまり、このデータ並べ替え手段13bは、一定間隔毎に平均輝度値(所定単位輝度データ)を選択して配列し、この配列を1つのフレーム単位または1つのフィールド単位ずつ順次ずらしながら繰り返して並べ替える。以下、新規データ系列(時系列データ)の1周期分を平均輝度値サンプル系列とする。なお、このデータ並べ替え手段13bにおける平均輝度値(所定単位輝度データ)の並べ替えの詳細(概念)については後記する(図5を使用)。
【0060】
周波数変換手段13cは、データ並べ替え手段13bで並べ替えられた新規データ系列(時系列データ)の複数の平均輝度値サンプル系列に対して、一定長毎にDFT(Discrete Fourier Transform;離散フーリエ変換)またはFFT(Fast Fourier Transform;高速フーリエ変換)等の周波数変換処理を施すものである。この周波数変換手段13cで周波数変換された新規データ系列(時系列データ)を周波数データとする。
【0061】
なお、輝度データ平均化手段13aによる輝度値(輝度データ)の平均化処理におけるフレーム(フィールド)、データ並べ替え手段13bによるデータ並べ替え処理における平均輝度値(所定単位輝度データ)の選択間隔、周波数変換手段13cによる周波数変換処理における平均輝度値サンプル系列は、コンテンツの同一性または類似性の検出精度や、コンテンツ特徴量抽出装置1の処理速度を勘案して決定されるものである。
【0062】
周波数データ平均化手段13dは、周波数変換手段13cで周波数変換された複数の周波数データを周波数毎に平均化した周波数特性データ(平均化周波数データ)を求める、周波数データ平均化処理を行うものである。この周波数データ平均化手段13dは、求めた平均化周波数データを周波数データ総和算出手段13eに出力する。なお、周波数特性データ(平均化周波数データ)は、周波数における対数表現による電力と、フレーム周波数で正規化した周波数とによって表される。
【0063】
周波数データ総和算出手段13eは、周波数データ平均化手段13dで求められた周波数特性データ(平均化周波数データ)を周波数全域に亘って総和した総和平均化周波数データを、流通コンテンツ特徴量データとして、特徴量データ比較手段17に出力するものである。つまり、この周波数データ総和算出手段13eでは、周波数全域に亘って、全電力の対数値の総和を算出して、この値を流通コンテンツ特徴量データとしている。
【0064】
制御手段15は、コンテンツ特徴量抽出装置1の全体の制御を司るもので、参照コンテンツ特徴量データ抽出・管理部3の特徴量データ管理手段11に制御信号(参照コンテンツ特徴量データ出力開始信号)と、流通コンテンツ特徴量データ抽出手段13に制御信号(流通コンテンツ特徴量データ出力開始信号)と、特徴量データ比較手段17に閾値とを出力するものである。
【0065】
この制御手段15は図示を省略した記録手段に、予め設定した閾値を記録(保持)しており、この閾値は、特徴量データ同一性閾値と、特徴量データ類似性閾値とである。
【0066】
特徴量データ同一性閾値は、特徴量データ比較手段17において、参照コンテンツ特徴量データと流通コンテンツ特徴量データとに基づいて、流通コンテンツが参照コンテンツと同一のものであるかどうかを判定する際の基準となるものである。流通コンテンツが参照コンテンツと同一のものであると判定された場合には、流通コンテンツが正規のルートを経由して配布され、流通しているとは言い難く、不正流通コンテンツであると断定される。
【0067】
特徴量データ類似性閾値は、特徴量データ比較手段17において、参照コンテンツ特徴量データと流通コンテンツ特徴量データとに基づいて、流通コンテンツが参照コンテンツと類似しているものであるかどうかを判定する際の基準となるものである。つまり、この特徴量データ類似性閾値は、所望の流通コンテンツ(検索対象番組)や流通コンテンツの一部であるシーンを検索する際に、参照コンテンツ(参照番組)の参照コンテンツ特徴量データ(参照シーン特徴量データ)と共に利用されるものである。
【0068】
なお、この実施の形態では、制御手段15の図示を省略した記録手段に閾値が記録されているが、特徴量データ比較手段17に記録されている態様であってもよい。この場合、制御信号15から特徴量データ比較手段17には、閾値を活用して、参照コンテンツ特徴量データと流通コンテンツ特徴量データとを比較させる制御信号(閾値活用信号)が出力される。
【0069】
特徴量データ比較手段17は、参照コンテンツ特徴量データ蓄積手段9から出力された参照コンテンツ特徴量データと、流通コンテンツ特徴量データ抽出手段13で抽出された流通コンテンツ特徴量データと、制御手段15から出力された閾値とに基づいて、参照コンテンツと流通コンテンツとが、同一、類似、または非類似であるかを比較するもので、同一性検出手段17aと、類似性検出手段17bとを備えている。
【0070】
同一性検出手段17aは、参照コンテンツ特徴量データと流通コンテンツ特徴量データの差の絶対値と、特徴量データ同一性閾値とに基づいて、参照コンテンツと流通コンテンツとの同一性を検出するものである。
【0071】
類似性検出手段17bは、参照コンテンツ特徴量データと流通コンテンツ特徴量データの差の絶対値と、特徴量データ類似性閾値とに基づいて、参照コンテンツと流通コンテンツとの類似性を検出するものである。
【0072】
つまり、この特徴量データ比較手段17では、同一性検出手段17aと類似性検出手段17bとによって、同一性、類似性が検出されなかった場合には、参照コンテンツと流通コンテンツとは非類似であるとされる。
【0073】
結果表示手段19は、特徴量データ比較手段17による比較結果を表示させるためのものである。この結果表示手段19には、参照コンテンツと流通コンテンツが同一である旨の表示や、参照コンテンツの各シーンの参照シーン特徴量データに基づいて検索された流通コンテンツの数量や当該流通コンテンツのタイトル名等が表示される。
【0074】
このコンテンツ特徴量抽出装置1によれば、参照コンテンツ特徴量データ蓄積手段9に、参照コンテンツの特徴量である参照コンテンツ特徴量データが蓄積されており、流通コンテンツ特徴量データ抽出手段13によって、ネットワークまたは記録媒体を介して流通している流通コンテンツが、当該ネットワークまたは当該記録媒体を介して取得され、この取得された流通コンテンツから流通コンテンツ特徴量データが抽出される。特徴量データ比較手段17によって、参照コンテンツ特徴量データと流通コンテンツ特徴量データとが比較される。これらの特徴量データの比較に基づいて、参照コンテンツと流通コンテンツとの同一性、または、類似性を検出することができる。
【0075】
また、このコンテンツ特徴量抽出装置1によれば、流通コンテンツ特徴量データ抽出手段13の輝度データ平均化手段13aによって、流通コンテンツの輝度データが当該流通コンテンツを構成するフレーム単位またはフィールド単位で平均化され、データ並べ替え手段13bによって、輝度データ平均化手段13aで平均化された所定単位輝度データが並べ替えられて時系列データとされる。続いて、周波数変換手段13cによって、データ並べ替え手段13bで並べ替えられた時系列データが一定長毎に周波数変換され、周波数データとされ、この周波数データが周波数データ平均化手段13dによって、周波数毎に平均化される。そして、周波数データ総和算出手段13eによって、周波数データ平均化手段13dで平均化された平均化周波数データが周波数全域に亘って総和され、この総和された平均化周波数データが特徴量データとされる。
【0076】
つまり、このコンテンツ特徴量抽出装置1では、周波数変換手段13cによって、時系列データを周波数データにすることによって、コンテンツの一時系列のデータである輝度データから複数の周波数データを生成しており、この周波数データを平均化し、周波数全域に亘る総和を求めて、この総和を流通コンテンツ特徴量データとしているので、データ量を増加させることなく、参照コンテンツと流通コンテンツとの同一性または類似性の検出精度を維持することができる。
【0077】
すなわち、このコンテンツ特徴量抽出装置1を、放送番組等のコンテンツ(参照コンテンツ)の提供者であるコンテンツプロバイダが利用することにより、外部のインターネット、或いは、内部のイントラネットを介して、または、光ディスク(例えば、DVD)等の記録媒体を介して、流通する流通コンテンツの特徴量(流通コンテンツ特徴量データ)と、当該コンテンツプロバイダが保有するコンテンツの特徴量(参照コンテンツ特徴量データ)とを比較し、これらの同一性を検出することによって、不正流通コンテンツを検出することができる。
【0078】
また、このコンテンツ特徴量抽出装置1は、検索対象となるコンテンツの特徴量(流通コンテンツ特徴量データ)と、参照するコンテンツ(参照コンテンツ)の特徴量(参照コンテンツ特徴量データ)とを比較し、これらの類似性を検定することにより、コンテンツプロバイダが保存管理している番組群(参照コンテンツの集合)から目的とする検索対象番組やシーンを検索することができる。
【0079】
さらに、このコンテンツ特徴量抽出装置1によれば、流通コンテンツ特徴量データ抽出手段13が、データ並べ替え手段13bによって、所定単位輝度データを一定間隔毎に選択して配列し、この配列を1つのフレーム単位または1つのフィールド単位ずつ順次ずらしながら繰り返して並べることで、新たな時系列データ(データ系列)を得ることができる。
【0080】
さらにまた、このコンテンツ特徴量抽出装置1によれば、複数のシーンからなる参照コンテンツおよび流通コンテンツを取り扱うことが可能であり、参照コンテンツ特徴量データが各シーンに対応する参照シーン特徴量データを含み、流通コンテンツ特徴量データが各シーンに対応する流通シーン特徴量データを含んでいるので、これらの参照シーン特徴量データおよび流通シーン特徴量データに基づいて、所望する流通コンテンツの特定するシーンを検索することができる。
【0081】
そしてまた、このコンテンツ特徴量抽出装置1によれば、特徴量データ比較手段17の同一性検出手段17aによって、特徴量データ同一性閾値に基づいて、参照コンテンツと流通コンテンツとの同一性を検出する。これによって、不正流通コンテンツを検出することができる。
【0082】
或いはまた、このコンテンツ特徴量抽出装置1によれば、特徴量データ比較手段17の類似性検出手段17bによって、特徴量データ類似性閾値に基づいて、流通コンテンツと参照コンテンツとの類似性を検出する。これによって、参照コンテンツと似かよった流通コンテンツ(所望する番組等)を検索することができる。
【0083】
なお、流通コンテンツおよび参照コンテンツのそれぞれに関し、入力する流通コンテンツおよび参照コンテンツである動画像データ系列の振幅レベルが相互に著しく異なり、特徴量データ比較手段17における比較判定に影響を及ぼす場合には、それぞれの動画像データ系列を当該動画像データ系列の各最大値で正規化する処理を施した後に、データ並べ替え手段13bによるデータ並べ替え処理以降の処理を行うことにすればよい。
【0084】
また、この実施の形態では、コンテンツ特徴量抽出装置1が動画像データからなるコンテンツを処理する場合について説明したが、音声データからなる楽曲のコンテンツを処理することも可能であり、動画像データと音声データとを組み合わせて、特徴量データ(参照コンテンツ特徴量データ、流通コンテンツ特徴量データ)の検出を行うことも可能である。なお、音声データからなる楽曲のコンテンツを処理する場合、特徴量データ(参照コンテンツ特徴量データ、流通コンテンツ特徴量データ)は、音声データの波形パターン、周波数スペクトラム等によって表されることとなる。
【0085】
(コンテンツ特徴量抽出装置の動作)
次に、図2に示すフローチャートを参照して、コンテンツ特徴量抽出装置1の動作について説明する(適宜、図1参照)。
まず、コンテンツ特徴量抽出装置1は、参照コンテンツ特徴量データ抽出手段7によって参照コンテンツ特徴量データを抽出する(S1)。この抽出した参照コンテンツ特徴量データを参照コンテンツ特徴量データ蓄積手段9に蓄積する(S2)。
【0086】
そして、制御手段15によって、閾値(特徴量データ同一性閾値Th1、特徴量データ類似性閾値Th2)を特徴量データ比較手段17に入力する(S3)と共に、制御信号(流通コンテンツ特徴量データ出力開始信号)を流通コンテンツ特徴量データ抽出手段13に、制御信号(参照コンテンツ特徴量データ出力開始信号)を特徴量データ管理手段11に入力する。
【0087】
すると、流通コンテンツ特徴量データ抽出手段13によって、流通コンテンツ特徴量データg1を抽出し(S4)、特徴量データ比較手段17に出力する。続いて、特徴量データ管理手段11によって制御信号(参照コンテンツ特徴量データ順次出力信号)を参照コンテンツ特徴量データ蓄積手段9に出力し、この制御信号(参照コンテンツ特徴量データ順次出力信号)によって参照コンテンツ特徴量データ蓄積手段9から蓄積している参照コンテンツ特徴量データg2を特徴量データ比較手段17に出力する(S5)。
【0088】
そして、特徴量データ比較手段17によって、特徴量データ同一性閾値Th1よりも、流通コンテンツ特徴量データg1と参照コンテンツ特徴量データg2との差の絶対値の方が小さい値となるか、または、特徴量データ類似性閾値Th2よりも、流通コンテンツ特徴量データg1と参照コンテンツ特徴量データg2との差の絶対値の方が小さい値となるかが判定される(S6)。
【0089】
特徴量データ同一性閾値Th1よりも、流通コンテンツ特徴量データg1と参照コンテンツ特徴量データg2との差の絶対値の方が小さい値と判定された場合、または、特徴量データ類似性閾値Th2よりも、流通コンテンツ特徴量データg1と参照コンテンツ特徴量データg2との差の絶対値の方が小さい値と判定された場合(S6、Yes)、流通コンテンツと参照コンテンツとは、同一のコンテンツであるか、類似番組(類似しているコンテンツ)であると判定される(S7)。
【0090】
また、特徴量データ同一性閾値Th1よりも、流通コンテンツ特徴量データg1と参照コンテンツ特徴量データg2との差の絶対値の方が小さい値と判定されなかった場合、または、特徴量データ類似性閾値Th2よりも、流通コンテンツ特徴量データg1と参照コンテンツ特徴量データg2との差の絶対値の方が小さい値と判定されなかった場合(S6、No)、流通コンテンツと参照コンテンツとは、別のコンテンツであるか、異種番組(類似していないコンテンツ)であると判定される(S8)。
【0091】
これらS5からS8までの処理が参照コンテンツ特徴量データ蓄積手段9に蓄積されている参照コンテンツ特徴量データのデータ数(所定回数)に至るまで(S9、No)繰り返され、所定回数に至った場合(S9、Yes)動作は終了する。
【0092】
(平均輝度値の時間変化について)
次に、図3、図4を参照して、平均輝度値(所定単位輝度データ)の時間変化について説明する(適宜、図1参照)。
【0093】
この図3、図4は、コンテンツ特徴量抽出装置1の流通コンテンツ特徴量データ抽出手段13の輝度データ平均化手段13aにおいて、輝度値(輝度データ)を平均化処理した後の平均輝度値(所定単位輝度データ)の時間変化を示したものである。
【0094】
より具体的に説明すると、図3は、約10分間の放送番組Aにおける連続するフレーム17920フレームの平均輝度値を求め、冒頭の3000フレームについて、時系列に従ってグラフとしてプロットした事例を示すものである。図4は、図3の波形の一部を拡大したものである。この図3、図4において、縦軸は平均輝度値、横軸は連続するフレーム番号を示している。
【0095】
この事例では、各フレームを水平8ブロック×垂直8ブロックの64ブロックに分割し、各ブロックにおける全画素の輝度値(輝度値データ)を平均化して水平8画素×垂直8ラインの縮小画像を作成し、当該縮小画像に対してDCT演算処理を施し、DC係数を求め、このDC係数を平均値輝度値(所定単位輝度データ)とした。この図3に示すように、得られた平均値輝度値を時系列に並べ替えることにより、平均輝度値の時間変化を把握することができる。
【0096】
また、図4は、図3のグラフの一部(フレーム番号700からフレーム番号1400まで)を、時間軸(フレーム)方向に拡大して示したものである。この図4に示すように、隣接するフレーム同士の平均輝度値の差は小さい。つまり、シーンチェンジ等、画面の大きな変化が発生する場合を除いて、通常、3秒程度(90フレームに相当)の時間内では、平均輝度値の変動が少ないことがわかる。
【0097】
(データ並べ替え処理の概念について)
次に、図5を参照して、データ並べ替え手段13bによるデータ並べ替え処理の概念について説明する。図5は、データ並べ替えの概念を模式的に、記号を使用して説明したものである。
【0098】
この図5に示すように、コンテンツ特徴量抽出装置1のデータ並べ替え手段13bによって、一定間隔毎に、平均値輝度値(所定単位輝度データ)を選択して配列し、この操作を1フレームずつ順次ずらしながら繰り返すことにより、新規データ系列(時系列データ)を得る。
【0099】
つまり、[平均輝度値の時間変化]に示した、時刻1から20までの記号“黒丸”、“三角”、“四角”、“バツ”“回転した四角”が[新規データ系列]では、同一記号同士が連続するように並び替えられており、各同一記号同士の集合により、平均輝度値サンプル系列が構成されている。例えば、新規データ系列における平均輝度値サンプル系列の“黒丸”は、時刻1、時刻6、時刻11、時刻16の平均輝度値の集合である。
【0100】
このデータ並べ替え手段13bによる操作によって、流通コンテンツのデータ量によらず、流通コンテンツ全体の平均輝度値の時間変化を少ないデータ量で表現することができ、流通コンテンツが妥当な長さのデータ系列である場合、このデータ並べ替え手段13b以降の処理、つまり、周波数変換処理を効率的に行うことが可能になる。
【0101】
(平均輝度値サンプル系列の重ね合わせについて)
次に、図6を参照して、平均輝度値サンプル系列の重ね合わせについて説明する。
【0102】
図6は、平均輝度値(所定単位輝度データ)を70フレーム間隔で、図5を使用して説明したデータ並べ替え手段13bによるデータ並べ替え処理を行って、得られた平均輝度サンプル系列を10周期おきに7波形重ねた結果を示したものである。この図6において、縦軸は平均輝度値、横軸は平均輝度サンプル系列1周期内の位置を表している。ここで、div(A,B)はA÷Bの商を意味している。図4を使用して説明したように、隣接するフレームの平均輝度値の差は小さいので、各波形ともほぼ一致している。
【0103】
(番組データの周波数特性について)
次に、図7を参照して、番組データの周波数特性について説明する(適宜、図1参照)。
【0104】
図7は、番組A(以下、コンテンツAとする)と、このコンテンツAの冒頭10%を削減して作成した削減コンテンツA1と、別の番組B(以下、コンテンツBとする)と、このコンテンツBの冒頭10%を削減して作成した削減コンテンツB1と、の4つのコンテンツA、A1、B、B1(動画像データ)について、輝度データ平均化手段13aによる輝度値(輝度データ)の平均化処理、データ並べ替え手段13bによるデータ並べ替え処理、周波数変換手段13cによる周波数変換処理および周波数データ平均化手段13dによる周波数データ平均化処理を施した結果得られた周波数特性の事例を示している。なお、周波数変換手段13cによる周波数変換処理にはFFTを用いている。この図7において、縦軸は各周波数における対数表現による電力、横軸はフレーム周波数で正規化した周波数を表している。
【0105】
この図7に示すように、異なる番組間、つまり、コンテンツAとコンテンツBとの違いを周波数特性によって識別できる。また、コンテンツAとこのコンテンツAの冒頭を10%削減した削減コンテンツA1と、コンテンツBとこのコンテンツB1の冒頭を10%削減した削減コンテンツB1との周波数特性に高い相関を有していることがわかる。
【0106】
(特徴量データの算出結果の事例について)
次に、図8を参照して、特徴量データ(参照コンテンツ特徴量データ、流通コンテンツ特徴量データ)の算出結果の事例について説明する(適宜、図1参照)。
【0107】
図8は、図7を使用して説明したコンテンツA、削減コンテンツA1、コンテンツB、削減コンテンツB1について、これらの輝度データ(輝度信号;Y)および色差データ(色差信号Cb、Cr)をコンテンツ特徴量抽出装置1の流通コンテンツ特徴量データ抽出手段13に入力した場合に得られた流通コンテンツ特徴量データを示したものである。
【0108】
この図8に示すように、輝度データ(輝度信号;Y)および色差データ(色差信号Cb、Cr)について、コンテンツAと削減コンテンツA1とは近接した流通コンテンツ特徴量データをもち、コンテンツBと削減コンテンツB1とは近接した流通コンテンツ特徴量データをもっていることがわかる。
【0109】
(特徴量データによる番組間の距離評価結果の事例について)
次に、図9を参照して、特徴量データ(参照コンテンツ特徴量データ、流通コンテンツ特徴量データ)の番組間(コンテンツ間)の距離評価結果の事例について説明する(適宜、図1参照)。
【0110】
図9は、流通コンテンツ特徴量データ抽出手段13に入力される輝度値(輝度データ)、つまり、輝度信号Y以外に、色差データ(Cb、Cr等)、つまり、色差信号(Cb、Cr)が入力される場合の、コンテンツA、削減コンテンツA1、コンテンツB、削減コンテンツB1の距離評価結果の事例を示したものである。
【0111】
この距離評価結果は、輝度信号Yを用いて求められた流通コンテンツ特徴量データg1Y、輝度信号Yを用いて求められた参照コンテンツ特徴量データg2Y、色差信号Cbを用いて求められた流通コンテンツ特徴量データg1Cb、色差信号Cbを用いて求められた参照コンテンツ特徴量データg2Cb、色差信号Crを用いて求められた流通コンテンツ特徴量データg1Cr、色差信号Crを用いて求められた参照コンテンツ特徴量データg2Crとして、流通コンテンツと参照コンテンツ間の番組間距離(コンテンツ間距離)をDとする場合、
【0112】
【数1】
【0113】
この(1)式によって、コンテンツA、削減コンテンツA1、コンテンツB、削減コンテンツB1の番組間距離(コンテンツ間距離)Dを求め、一覧表にしたものである。
【0114】
この図9に示すように、異なる番組間(コンテンツ間)、つまりコンテンツAとコンテンツBとの距離に比べ、コンテンツAと冒頭10%を削減した削減コンテンツA1との距離、または、コンテンツBと冒頭10%を削減した削減コンテンツB1との距離の方が十分に小さく、適当の閾値(特徴量データ同一性閾値)を設けることによって、番組間(コンテンツ間)の同一性の検出を高精度に行うことができる。
【0115】
(参照コンテンツ特徴量データの抽出と管理の概念について)
次に、図10を参照して、参照コンテンツ特徴量データ抽出・管理部3における参照コンテンツ特徴量データの抽出と管理の概念について説明する。
【0116】
この図10に示すように、番組(参照コンテンツ)が複数のシーン(シーン1、シーン2、・・・シーン(n−1)、シーンn)から構成されており、各シーン毎の特徴量(特徴量1、特徴量2、・・・特徴量(n−1)、特徴量n;参照シーン特徴量データ)が設定されている。
【0117】
これら各シーン毎に特徴量(参照シーン特徴量データ)が纏められて、番組(参照コンテンツ)全体の特徴量(参照コンテンツ特徴量データ)として、参照コンテンツ特徴量データ蓄積手段9に蓄積され、特徴量データ管理手段11によって管理されている。つまり、特徴量データ管理手段11から出力される制御信号によって、参照シーン特徴量データまたは参照コンテンツ特徴量データのいずれかが選択されて、特徴量データ比較部17に出力される。
【0118】
以上、一実施形態に基づいて本発明を説明したが、本発明はこれに限定されるものではない。
例えば、コンテンツ特徴量抽出装置1の各構成の処理を汎用的なコンピュータ言語で記述したコンテンツ特徴量抽出プログラムとみなすこともできるし、各構成の処理を一つずつの過程ととらえたコンテンツ特徴量抽出方法とみなすことも可能である。これらの場合、コンテンツ特徴量抽出装置1と同様の効果を得ることができる。
【0119】
【発明の効果】
請求項1記載の発明によれば、これらの特徴量データの比較に基づいて、コンテンツと流通コンテンツとの同一性、または、類似性を検出することができる。
【0120】
請求項1記載の発明によれば、コンテンツの一時系列のデータである輝度データから単一のデータである周波数データを生成しており、この周波数データを平均化し、周波数全域に亘る総和を求めて、この総和を流通コンテンツ特徴量データとしているので、データ量を増加させることなく、コンテンツと流通コンテンツとの同一性または類似性の検出精度を維持することができる。
【0121】
請求項2記載の発明によれば、所定単位画素データを一定間隔毎に選択して配列し、この配列を1つのフレーム単位または1つのフィールド単位ずつ順次ずらしながら繰り返して並べることで、新たな時系列データ(データ系列)を得ることができ、これ以降の処理、例えば、周波数変換処理等を容易に行うことができる。
【0122】
請求項3記載の発明によれば、参照コンテンツ特徴量データが各シーンに対応する参照シーン特徴量データを含み、流通コンテンツ特徴量データが各シーンに対応する流通シーン特徴量データを含んでいるので、これらの参照シーン特徴量データおよび流通シーン特徴量データに基づいて、所望する流通コンテンツの特定するシーンを検索することができる。
【0123】
請求項4記載の発明によれば、特徴量データ同一性閾値に基づいて、コンテンツと流通コンテンツとの同一性を検出する。これによって、不正流通コンテンツを検出することができる。
【0124】
請求項5記載の発明によれば、特徴量データ類似性閾値に基づいて、流通コンテンツとコンテンツとの類似性を検出する。これによって、コンテンツと似かよった流通コンテンツ(所望する番組等)を検索することができる。
【図面の簡単な説明】
【図1】本発明による一実施の形態であるコンテンツ特徴量抽出装置のブロック図である。
【図2】図1に示したコンテンツ特徴量抽出装置の動作を説明したフローチャートである。
【図3】輝度値を平均化処理した後の平均輝度値の時間変化を示した図である。
【図4】図3に示した平均輝度値の時間変化の一部を拡大して示した図である。
【図5】データ並べ替え処理の概念について説明した図である。
【図6】平均輝度値サンプル系列の重ね合わせについて説明した図である。
【図7】番組データの周波数特性について説明した図である。
【図8】特徴量データの算出結果の事例について説明した図である。
【図9】特徴量データの番組間の距離評価結果の事例について説明した図である。
【図10】参照コンテンツ特徴量データ抽出・管理部における参照コンテンツ特徴量データの抽出と管理の概念について説明した図である。
【図11】従来のコンテンツ特徴量抽出装置のブロック図である。
【符号の説明】
1 コンテンツ特徴量抽出装置
3 参照コンテンツ特徴量データ抽出・管理部
5 流通コンテンツ特徴量データ抽出・比較部
7 参照コンテンツ特徴量データ抽出手段
9 参照コンテンツ特徴量データ蓄積手段
11 特徴量データ管理手段
13 流通コンテンツ特徴量データ抽出手段
15 制御手段
17 特徴量データ比較手段
17a 同一性検出手段
17b 類似性検出手段
19 結果表示手段
Claims (5)
- コンテンツを提供するコンテンツ提供事業者から提供され、ネットワークまたは記録媒体を介して流通する流通コンテンツを構成する特定の周波数パターンで表される流通コンテンツ特徴量データを抽出すると共に、この流通コンテンツ特徴量データと、前記コンテンツを構成する特定の周波数パターンで表される参照コンテンツ特徴量データとを比較するコンテンツ特徴量抽出装置であって、
前記参照コンテンツ特徴量データを蓄積する参照コンテンツ特徴量データ蓄積手段と、
前記流通コンテンツを、前記ネットワークまたは前記記録媒体を介して取得し、この取得した流通コンテンツから流通コンテンツ特徴量データを抽出する流通コンテンツ特徴量データ抽出手段と、
前記参照コンテンツ特徴量データ蓄積手段に蓄積している参照コンテンツ特徴量データと、前記流通コンテンツ特徴量データ抽出手段で抽出された流通コンテンツ特徴量データとを比較する特徴量データ比較手段と、
を備え、
前記流通コンテンツ特徴量データ抽出手段は、
前記流通コンテンツに含まれる各画素に関する画素データを、当該流通コンテンツを構成するフレーム単位またはフィールド単位で平均化する画素データ平均化手段と、
この画素データ平均化手段によって平均化された所定単位画素データを並べ替えて時系列データとするデータ並べ替え手段と、
このデータ並べ替え手段で並べ替えられた時系列データを一定長毎に周波数変換し、周波数データとする周波数変換手段と、
この周波数変換手段で周波数変換された周波数データを周波数毎に平均化する周波数データ平均化手段と、
この周波数データ平均化手段で平均化された平均化周波数データを周波数全域に亘って総和し、この総和した平均化周波数データを前記流通コンテンツ特徴量データとする周波数データ総和算出手段とを有していることを特徴とするコンテンツ特徴量抽出装置。 - 前記データ並べ替え手段は、前記所定単位画素データを一定間隔毎に選択して配列し、この配列を1つのフレーム単位または1つのフィールド単位ずつ順次ずらしながら繰り返して、並べ替えることを特徴とする請求項1に記載のコンテンツ特徴量抽出装置。
- 前記コンテンツおよび前記流通コンテンツが複数のシーンで構成されており、
前記コンテンツの特徴量である参照コンテンツ特徴量データが前記シーンに対応する参照シーン特徴量データを含み、前記流通コンテンツの特徴量である流通コンテンツ特徴量データが前記シーンに対応する流通シーン特徴量データを含むことを特徴とする請求項1又は請求項2に記載のコンテンツ特徴量抽出装置。 - 前記特徴量データ比較手段は、
前記流通コンテンツの流通コンテンツ特徴量データと前記コンテンツの参照コンテンツ特徴量データとの差の絶対値と、予め設定した特徴量データ同一性閾値とに基づいて、前記流通コンテンツと前記コンテンツとの同一性を検出する同一性検出手段を有していることを特徴とする請求項1から請求項3のいずれか一項に記載のコンテンツ特徴量抽出装置。 - 前記特徴量データ比較手段は、
前記流通コンテンツの流通コンテンツ特徴量データと前記コンテンツの参照コンテンツ特徴量データとの差の絶対値と、予め設定した特徴量データ類似性閾値とに基づいて、前記流通コンテンツと前記コンテンツとの類似性を検出する類似性検出手段を有していることを特徴とする請求項1から請求項4のいずれか一項に記載のコンテンツ特徴量抽出装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003186107A JP4359085B2 (ja) | 2003-06-30 | 2003-06-30 | コンテンツ特徴量抽出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003186107A JP4359085B2 (ja) | 2003-06-30 | 2003-06-30 | コンテンツ特徴量抽出装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2005018674A JP2005018674A (ja) | 2005-01-20 |
| JP4359085B2 true JP4359085B2 (ja) | 2009-11-04 |
Family
ID=34185326
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003186107A Expired - Fee Related JP4359085B2 (ja) | 2003-06-30 | 2003-06-30 | コンテンツ特徴量抽出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4359085B2 (ja) |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006285907A (ja) * | 2005-04-05 | 2006-10-19 | Nippon Hoso Kyokai <Nhk> | 指定流通コンテンツ特定装置、指定流通コンテンツ特定プログラムおよび指定流通コンテンツ特定方法 |
| JP4679259B2 (ja) * | 2005-06-23 | 2011-04-27 | アルパイン株式会社 | 映像再生装置 |
| JP4740706B2 (ja) * | 2005-09-28 | 2011-08-03 | ヤフー株式会社 | 不正画像検出装置、方法、プログラム |
| JP2007114885A (ja) * | 2005-10-18 | 2007-05-10 | National Institute Of Information & Communication Technology | 画像の類似性による分類方法及び装置 |
| JP4749139B2 (ja) * | 2005-12-05 | 2011-08-17 | 株式会社日立製作所 | 危険映像検出方法、映像相違検出方法及び装置 |
| CN101385027A (zh) * | 2006-02-10 | 2009-03-11 | 皇家飞利浦电子股份有限公司 | 一种元数据产生方法及装置 |
| JP4976716B2 (ja) * | 2006-03-22 | 2012-07-18 | クラリオン株式会社 | 車載音響機器 |
| JP5085883B2 (ja) * | 2006-04-28 | 2012-11-28 | シャープ株式会社 | コンテンツ管理装置及びコンテンツ管理方法 |
| JP2008236603A (ja) * | 2007-03-23 | 2008-10-02 | Pioneer Electronic Corp | 動画コンテンツ判別装置、映像信号処理ユニット、及び、動画コンテンツ判別方法 |
| JP4916950B2 (ja) * | 2007-05-14 | 2012-04-18 | ヤフー株式会社 | 動画像比較装置、動画像比較方法、及び動画像比較プログラム |
| WO2008149448A1 (ja) * | 2007-06-07 | 2008-12-11 | Fujitsu Limited | 動画像類似判定装置、符号化装置、および特徴量算出方法 |
| CN101350043B (zh) * | 2007-07-17 | 2011-05-11 | 华为技术有限公司 | 数字内容的一致性检测方法及装置 |
| US9177209B2 (en) * | 2007-12-17 | 2015-11-03 | Sinoeast Concept Limited | Temporal segment based extraction and robust matching of video fingerprints |
| US20100085481A1 (en) * | 2008-07-23 | 2010-04-08 | Alexandre Winter | Frame based video matching |
| TWI407322B (zh) * | 2009-06-19 | 2013-09-01 | Ipeer Multimedia Internat Ltd | 多媒體辨識系統與方法,及其應用之多媒體客製化方法 |
| JP2012531130A (ja) * | 2009-06-26 | 2012-12-06 | インテル・コーポレーション | ビデオコピーを検知する技術 |
| EP2690867A4 (en) * | 2011-03-25 | 2014-09-10 | Nec Corp | VIDEO PROCESSING SYSTEM, VIDEO CONTENT MONITORING METHOD, VIDEO PROCESSING DEVICE, ITS CONTROL METHOD AND STORAGE MEDIUM STORING A CONTROL PROGRAM |
| JP6596741B2 (ja) * | 2017-11-28 | 2019-10-30 | エスゼット ディージェイアイ テクノロジー カンパニー リミテッド | 生成装置、生成システム、撮像システム、移動体、生成方法、及びプログラム |
-
2003
- 2003-06-30 JP JP2003186107A patent/JP4359085B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2005018674A (ja) | 2005-01-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4359085B2 (ja) | コンテンツ特徴量抽出装置 | |
| Pan et al. | Automatic detection of replay segments in broadcast sports programs by detection of logos in scene transitions | |
| De Avila et al. | VSUMM: A mechanism designed to produce static video summaries and a novel evaluation method | |
| US8587668B2 (en) | Method and apparatus for detecting near duplicate videos using perceptual video signatures | |
| JP5005154B2 (ja) | 記憶媒体上に記憶された情報信号を再生する装置 | |
| EP2198376B1 (en) | Media fingerprints that reliably correspond to media content | |
| US9177209B2 (en) | Temporal segment based extraction and robust matching of video fingerprints | |
| JP3997749B2 (ja) | 信号処理方法及び装置、信号処理プログラム、並びに記録媒体 | |
| JP5878238B2 (ja) | 映像を比較するための方法および装置 | |
| Chen et al. | Movie scene segmentation using background information | |
| CN101017507A (zh) | 表示图像组的方法和装置 | |
| JP2010518673A (ja) | ビデオの索引付けとビデオシノプシスのための、方法およびシステム | |
| JP2000516435A (ja) | 可視索引付けシステムのための重要情景検出及びフレームフィルタリング | |
| WO2005079510A2 (en) | Generation of a media content database by correlating repeating media content in media streams | |
| GB2464123A (en) | Event-based temporal video fingerprinting | |
| KR102245349B1 (ko) | 비디오로부터의 색상 스키마 추출 방법 및 장치 | |
| CN113569719A (zh) | 视频侵权判定方法、装置、存储介质及电子设备 | |
| JP2006285907A (ja) | 指定流通コンテンツ特定装置、指定流通コンテンツ特定プログラムおよび指定流通コンテンツ特定方法 | |
| Pandey et al. | A passive forensic method for video: Exposing dynamic object removal and frame duplication in the digital video using sensor noise features | |
| Esmaeili et al. | Robust video hashing based on temporally informative representative images | |
| JP4377620B2 (ja) | コンテンツ特徴量抽出装置、コンテンツ特徴量抽出プログラムおよびコンテンツ特徴量抽出方法 | |
| Selvaraj et al. | Inter‐frame forgery detection and localisation in videos using earth mover's distance metric | |
| Su et al. | Efficient copy detection for compressed digital videos by spatial and temporal feature extraction | |
| Han et al. | Real-time video content analysis tool for consumer media storage system | |
| JPH10240626A (ja) | 統計的性質を用いたデータ・ハイディング方法及びシステム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060215 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090210 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090408 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090714 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090807 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120814 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120814 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130814 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140814 Year of fee payment: 5 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |