[go: up one dir, main page]

JP2005115607A - 映像検索装置 - Google Patents

映像検索装置 Download PDF

Info

Publication number
JP2005115607A
JP2005115607A JP2003348187A JP2003348187A JP2005115607A JP 2005115607 A JP2005115607 A JP 2005115607A JP 2003348187 A JP2003348187 A JP 2003348187A JP 2003348187 A JP2003348187 A JP 2003348187A JP 2005115607 A JP2005115607 A JP 2005115607A
Authority
JP
Japan
Prior art keywords
video
scene
subtitle
analysis
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003348187A
Other languages
English (en)
Inventor
Shingo Miyauchi
進吾 宮内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2003348187A priority Critical patent/JP2005115607A/ja
Publication of JP2005115607A publication Critical patent/JP2005115607A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】映像の検索を自動化するために、蓄積された映像コンテンツの中から所望のシーンを抽出する手段が求められている。
【解決手段】映像データに多重化されている字幕(文字放送)情報を取り出し、映像と共に蓄積し、これを手掛りとして映像の検索を行う。
まず、蓄積された字幕情報に対して文字列探索などを行うことにより、ユーザの要求するシーンに適合すると思われる字幕を探し出し、その字幕の提示タイミングに相当する映像を要求シーンの候補とする。さらに、画像解析および音声解析をこの候補シーンに対して適用し、その結果ユーザの要求を満たすと判断されるシーンを抽出する。
【選択図】図1

Description

本発明は、蓄積された映像コンテンツの中から、所望の映像シーンを検索する装置に関するものである。
従来、蓄積された映像コンテンツの中からユーザ所望のシーンを検索するには、映像に対して何らかの画像解析あるいは音声解析を適用し、この結果に基づいて当該シーンを抽出する方法があった。また、コンテンツに関する情報を記述したメタデータを人手により作成し、これを用いて映像の検索を行う手段が取られていた。
特開2001−69437号公報 特開2001−143451号公報
従来の特許文献1に記載の画像解析や特許文献2に記載の音声解析を用いる方法は処理の負荷が大きく、検索に時間がかかるという課題があった。また、コンテンツに関する情報を人手で作成しようとすると、膨大な手間が必要であった。
上記を解決するため、本発明装置は映像データに多重化されている字幕(文字放送)情報を取り出し、映像と共に蓄積し、これを手掛りとして映像の検索を行うことを特徴とするものである。
まず、蓄積された字幕情報に対して文字列探索などを行うことにより、ユーザの要求するシーンに適合すると思われる字幕を探し出し、その字幕の提示タイミングに相当する映像を要求シーンの候補とする。さらに、画像解析および音声解析をこの候補シーンに対して適用し、その結果ユーザの要求を満たすと判断されるシーンを抽出する。
本発明によれば、字幕情報を利用することにより、画像あるいは音声解析のみを用いた従来の映像検索手段より高速に所望のシーンを抽出することが可能となる。また、映像コンテンツに関する情報を人手により作成する手間が省ける。
(実施の形態1)
図1は、本発明の映像検索装置の実施の形態の一例の構成を示したブロック図である。以下、この図を参照し本発明の実施形態を説明する。なお本形態における映像データとは、動画像と音声、およびこれに付随する字幕(発話内容などをテキスト化したもの)が符号化され多重化されたものと定義する。また、ここで抽出対象とするシーンとは、例えばスポーツ中継における得点シーン、ドラマやバラエティにおける特定人物の登場シーン、ニュースにおける特定のトピックなど、意味的なまとまりを有する映像のセグメントを指す。
はじめに、本装置に映像データが入力されると、多重分離処理部100において字幕データが取り出される。この字幕データは字幕データ処理部110に入力され復号化され、また併せて入力された映像の時刻情報と対応付けられる。これにより、発話内容等とその提示タイミング(映像と同期を取るために必要な時刻情報)を含む字幕情報が生成される。得られた字幕情報は映像と共に映像蓄積部200に蓄積される。
蓄積された映像に対し、ユーザ要求受付部400よりユーザから特定シーンの検索要求があると、シーン抽出部300はその要求に合致するシーンの抽出を開始する。まず、シーン抽出部において抽出シーンに関連する字幕的な特徴が設定されると、字幕解析部310は映像蓄積部に蓄積された字幕情報の中からその設定にマッチする箇所を検出する。そして、シーン抽出部は検出された字幕の時刻情報を参照し、このタイミングに相当する映像を候補シーンとして映像蓄積部から選び出す。
字幕情報の中には発話内容や話者名、情景のナレーションなどが含まれていることから、ここでの字幕的な特徴とはシーンに関するキーワードや人物名の有無など、ここでの字幕解析とは文字列探索や自然言語処理などを想定する。例えば処理の一例を図2を用いて説明すると、サッカーのゴールシーンを検索する場合、蓄積された字幕情報の中から「ゴール」という文字列を探し出し、それら字幕の提示タイミングにあたる周辺の映像を当該シーンの候補として選出する、といった方法を取ることが考えられる。
次に画像解析あるいは音声解析、または両者を用いることにより、前記で得られた候補シーンの精査を行う。シーン抽出部において抽出シーンに関連する画像的な特徴が設定されると、画像解析部320は候補シーンがその設定にマッチするかを判別する。ここでの画像解析としては、上記の従来技術にあるようなモデル画像とのマッチングや、オブジェクト/顔認識、輝度や色情報に基づく判定、カット分割、などの利用が考えられる。
本例のサッカーのゴールシーンを検索する場合であれば、まず前記字幕解析により得られた候補映像を、カット分割を用いてカットに分割する。そして、分割されたカットの各先頭フレームと、ゴールポストを特徴とするゴールシーンのモデル画像とのマッチングを行う。この類似度が閾値以上であれば、そのカット(および前後数カット)は所望のシーンに相当すると判断することができる。
同様に音声解析部330は、抽出シーンに関連する音声的な特徴が設定されると、候補シーンがその設定にマッチするかを判別する。ここでの音声解析としては、上記の従来技術にあるような周波数解析や歓声/特定音検出、スペクトル分析、話者判定、などの利用が考えられる。サッカーのゴールシーンを検索する場合を例に挙げると、まず前記字幕解析により得られた候補映像に対して、音声のパワーレベルと周波数の解析を行う。この結果、大きな歓声を含む区間の前後を、所望のシーンに相当すると判断することができる。
シーン抽出部は以上の解析結果から総合的に判断し、ユーザの要求に合致するシーンを映像蓄積部から抽出する。そして、抽出された映像は映像提示部500においてユーザに提示される。
上記のように本発明によれば、字幕情報を利用することにより、画像あるいは音声解析のみを用いた従来の映像検索手段より高速に所望のシーンを抽出することが可能となる。また、映像コンテンツに関する情報を人手により作成する手間を省略することができる。
本発明の映像検索装置は、字幕情報を有する映像コンテンツが蓄積されている環境において、シーンの検索を実現する機能を持つことより、デジタル放送受信端末や映像記録・再生装置、メディアサーバなどの映像機器において有用である。
本発明の実施の形態の構成を示したブロック図 字幕解析の実施例の概観図
符号の説明
100 多重分離処理部
110 字幕データ処理部
200 映像蓄積部
300 シーン抽出部
310 字幕解析部
320 画像解析部
330 音声解析部
400 ユーザ要求受付部
500 映像提示部

Claims (1)

  1. 映像データに多重化された字幕情報を取り出して前記映像と共に蓄積し、蓄積された字幕情報の中からユーザが所望するシーンに適合する箇所を検出し、その字幕の提示タイミングに相当する映像に画像解析あるいは音声解析を適用し、シーンを抽出することを特徴とした映像検索装置。
JP2003348187A 2003-10-07 2003-10-07 映像検索装置 Pending JP2005115607A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003348187A JP2005115607A (ja) 2003-10-07 2003-10-07 映像検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003348187A JP2005115607A (ja) 2003-10-07 2003-10-07 映像検索装置

Publications (1)

Publication Number Publication Date
JP2005115607A true JP2005115607A (ja) 2005-04-28

Family

ID=34540456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003348187A Pending JP2005115607A (ja) 2003-10-07 2003-10-07 映像検索装置

Country Status (1)

Country Link
JP (1) JP2005115607A (ja)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006332765A (ja) * 2005-05-23 2006-12-07 Sharp Corp コンテンツ検索・再生方法、コンテンツ検索・再生装置、並びにプログラムおよび記録媒体
JP2006350477A (ja) * 2005-06-13 2006-12-28 Canon Inc ファイル管理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2007052626A (ja) * 2005-08-18 2007-03-01 Matsushita Electric Ind Co Ltd メタデータ入力装置およびコンテンツ処理装置
JP2008006214A (ja) * 2006-06-30 2008-01-17 Toshiba Corp 電子機器の動作制御装置
JP2008078876A (ja) * 2006-09-20 2008-04-03 Hitachi Ltd 番組録画再生装置、番組再生位置制御方法及び番組情報提供装置
JP2008130050A (ja) * 2006-11-24 2008-06-05 Canon Inc 画像検索装置及びその方法
JP2008141621A (ja) * 2006-12-04 2008-06-19 Nippon Hoso Kyokai <Nhk> 映像抽出装置及び映像抽出プログラム
JP2008172324A (ja) * 2007-01-09 2008-07-24 Sony Corp 情報処理装置、情報処理方法、プログラム
JP2008219285A (ja) * 2007-03-01 2008-09-18 Nintendo Co Ltd 映像コンテンツ表示プログラムおよび映像コンテンツ表示装置
WO2009032639A1 (en) * 2007-09-04 2009-03-12 Apple Inc. Display of video subtitles
WO2009110491A1 (ja) * 2008-03-07 2009-09-11 シャープ株式会社 コンテンツ表示装置、コンテンツ表示方法、プログラム、および記録媒体
JP2010161722A (ja) * 2009-01-09 2010-07-22 Sony Corp データ処理装置、データ処理方法、及び、プログラム
JP2010218385A (ja) * 2009-03-18 2010-09-30 Nippon Hoso Kyokai <Nhk> コンテンツ検索装置及びコンピュータプログラム
JP2011109292A (ja) * 2009-11-16 2011-06-02 Canon Inc 撮像装置、その制御方法及びプログラム並びに記憶媒体
JP2012043422A (ja) * 2010-08-16 2012-03-01 Nhn Corp 字幕情報を用いた検索結果提供方法およびシステム
WO2013037082A1 (en) * 2011-09-12 2013-03-21 Intel Corporation Using gestures to capture multimedia clips
US8693847B2 (en) 2009-02-06 2014-04-08 Sony Corporation Contents processing apparatus and method
JP2015177470A (ja) * 2014-03-17 2015-10-05 富士通株式会社 抽出プログラム、方法、及び装置
JP2019003604A (ja) * 2017-06-09 2019-01-10 富士ゼロックス株式会社 ビデオベースの通信におけるコンテンツキュレーションのための方法、システム及びプログラム
CN110035326A (zh) * 2019-04-04 2019-07-19 北京字节跳动网络技术有限公司 字幕生成、基于字幕的视频检索方法、装置和电子设备

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006332765A (ja) * 2005-05-23 2006-12-07 Sharp Corp コンテンツ検索・再生方法、コンテンツ検索・再生装置、並びにプログラムおよび記録媒体
JP2006350477A (ja) * 2005-06-13 2006-12-28 Canon Inc ファイル管理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2007052626A (ja) * 2005-08-18 2007-03-01 Matsushita Electric Ind Co Ltd メタデータ入力装置およびコンテンツ処理装置
JP2008006214A (ja) * 2006-06-30 2008-01-17 Toshiba Corp 電子機器の動作制御装置
JP2008078876A (ja) * 2006-09-20 2008-04-03 Hitachi Ltd 番組録画再生装置、番組再生位置制御方法及び番組情報提供装置
US8265397B2 (en) 2006-11-24 2012-09-11 Canon Kabushiki Kaisha Image retrieval apparatus and method thereof
JP2008130050A (ja) * 2006-11-24 2008-06-05 Canon Inc 画像検索装置及びその方法
JP2008141621A (ja) * 2006-12-04 2008-06-19 Nippon Hoso Kyokai <Nhk> 映像抽出装置及び映像抽出プログラム
US8879885B2 (en) 2007-01-09 2014-11-04 Sony Corporation Information processing apparatus, information processing method, and program
JP2008172324A (ja) * 2007-01-09 2008-07-24 Sony Corp 情報処理装置、情報処理方法、プログラム
JP2008219285A (ja) * 2007-03-01 2008-09-18 Nintendo Co Ltd 映像コンテンツ表示プログラムおよび映像コンテンツ表示装置
US9602757B2 (en) 2007-09-04 2017-03-21 Apple Inc. Display of video subtitles
WO2009032639A1 (en) * 2007-09-04 2009-03-12 Apple Inc. Display of video subtitles
US10652500B2 (en) 2007-09-04 2020-05-12 Apple Inc. Display of video subtitles
US10003764B2 (en) 2007-09-04 2018-06-19 Apple Inc. Display of video subtitles
WO2009110491A1 (ja) * 2008-03-07 2009-09-11 シャープ株式会社 コンテンツ表示装置、コンテンツ表示方法、プログラム、および記録媒体
JP2010161722A (ja) * 2009-01-09 2010-07-22 Sony Corp データ処理装置、データ処理方法、及び、プログラム
US8693847B2 (en) 2009-02-06 2014-04-08 Sony Corporation Contents processing apparatus and method
JP2010218385A (ja) * 2009-03-18 2010-09-30 Nippon Hoso Kyokai <Nhk> コンテンツ検索装置及びコンピュータプログラム
JP2011109292A (ja) * 2009-11-16 2011-06-02 Canon Inc 撮像装置、その制御方法及びプログラム並びに記憶媒体
JP2012043422A (ja) * 2010-08-16 2012-03-01 Nhn Corp 字幕情報を用いた検索結果提供方法およびシステム
WO2013037082A1 (en) * 2011-09-12 2013-03-21 Intel Corporation Using gestures to capture multimedia clips
JP2015177470A (ja) * 2014-03-17 2015-10-05 富士通株式会社 抽出プログラム、方法、及び装置
US9892320B2 (en) 2014-03-17 2018-02-13 Fujitsu Limited Method of extracting attack scene from sports footage
JP2019003604A (ja) * 2017-06-09 2019-01-10 富士ゼロックス株式会社 ビデオベースの通信におけるコンテンツキュレーションのための方法、システム及びプログラム
JP7069778B2 (ja) 2017-06-09 2022-05-18 富士フイルムビジネスイノベーション株式会社 ビデオベースの通信におけるコンテンツキュレーションのための方法、システム及びプログラム
CN110035326A (zh) * 2019-04-04 2019-07-19 北京字节跳动网络技术有限公司 字幕生成、基于字幕的视频检索方法、装置和电子设备

Similar Documents

Publication Publication Date Title
JP2005115607A (ja) 映像検索装置
CN108305632B (zh) 一种会议的语音摘要形成方法及系统
CN101650958B (zh) 对电影类视频进行场景片段抽取方法及其建立索引的方法
US9798934B2 (en) Method and apparatus for providing combined-summary in imaging apparatus
JP4127668B2 (ja) 情報処理装置、情報処理方法、およびプログラム
KR101265960B1 (ko) 하이라이트 추출 장치 및 그 방법
JP2004152063A (ja) マルチメディアコンテンツ構造化方法、構造化装置および構造化プログラム、ならびに提供方法
JP2002300495A (ja) 発話認識に基づいたキャプションシステム
JP2000350159A (ja) 視覚画像編集システム
US20060136226A1 (en) System and method for creating artificial TV news programs
WO2008050649A1 (fr) Système, procédé et programme de récapitulation de contenu
CN110691271A (zh) 一种新闻视频生成方法、系统、装置和存储介质
JP4192703B2 (ja) コンテンツ処理装置、コンテンツ処理方法及びプログラム
JP2012181358A (ja) テキスト表示時間決定装置、テキスト表示システム、方法およびプログラム
US9666211B2 (en) Information processing apparatus, information processing method, display control apparatus, and display control method
EP1520238A2 (en) Method for segmenting a compressed video
KR101618777B1 (ko) 파일 업로드 후 텍스트를 추출하여 영상 또는 음성간 동기화시키는 서버 및 그 방법
JP2007519321A (ja) 視聴覚データストリームのマルチメディア要約を作成する方法及び回路
KR101137091B1 (ko) 자막 정보를 이용한 검색 결과 제공 방법 및 시스템
JP2006050045A (ja) 動画像データ編集装置及び動画像データ編集方法
KR20060089922A (ko) 음성 인식을 이용한 데이터 추출 장치 및 방법
JP4305921B2 (ja) 動画像話題分割方法
JP2000067085A (ja) 非コ―ド化情報のデ―タベ―ス化方式
US8538244B2 (en) Recording/reproduction apparatus and recording/reproduction method
JP4323937B2 (ja) 映像コメント生成装置及びそのプログラム