JP2010263611A - 映像撮影装置 - Google Patents
映像撮影装置 Download PDFInfo
- Publication number
- JP2010263611A JP2010263611A JP2010023878A JP2010023878A JP2010263611A JP 2010263611 A JP2010263611 A JP 2010263611A JP 2010023878 A JP2010023878 A JP 2010023878A JP 2010023878 A JP2010023878 A JP 2010023878A JP 2010263611 A JP2010263611 A JP 2010263611A
- Authority
- JP
- Japan
- Prior art keywords
- video
- scene
- information
- unit
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Studio Devices (AREA)
Abstract
【課題】撮影した映像から自動的にシーン抽出を行う場合に、光学ズームと電子ズームの特性を認識してシーン抽出を行えていなかった。
【解決手段】映像を撮影する映像撮影装置であって、前記映像撮影時の属性情報を生成する属性情報生成部と、前記属性情報に含まれる前記映像の映像倍率変更方法に関する情報と、映像倍率に関する情報と、前記映像の実質的な解像度に関する情報と、映像倍率の時間変化率に関する情報と、の少なくとも一つに基づいて前記映像をシーン毎に評価するシーン解析部と、前記評価に基づいて、前記映像の再生情報を生成する再生情報生成部と、を備える映像撮影装置。
【選択図】図3
【解決手段】映像を撮影する映像撮影装置であって、前記映像撮影時の属性情報を生成する属性情報生成部と、前記属性情報に含まれる前記映像の映像倍率変更方法に関する情報と、映像倍率に関する情報と、前記映像の実質的な解像度に関する情報と、映像倍率の時間変化率に関する情報と、の少なくとも一つに基づいて前記映像をシーン毎に評価するシーン解析部と、前記評価に基づいて、前記映像の再生情報を生成する再生情報生成部と、を備える映像撮影装置。
【選択図】図3
Description
本発明は映像を撮影する映像撮影装置、または映像を編集する映像編集装置に関するものであり、特に映像の拡大率(ズーム)変更に基づいて重要なシーンを自動的に抽出する技術に関する。
従来より、映画やテレビドラマ等の撮影は、絵コンテなどを元に作成したシナリオ(台本)に基づいて行われている。シナリオにはタイトル(名前)が付けられており、複数のシーンにより構成されている。またシーンは複数のカットより構成されている。
監督はシナリオに従って演出を行ない、俳優、女優、およびエキストラなどの出演者はシナリオの記述に従って演技する。このように、プロによる映画やドラマなどの撮影においては、撮影順序はともあれ、シナリオに示された各シーンの本番内容が撮影される。しかしながら、プロではない世間一般の人々が日常の生活風景を撮影する場合、普通、シナリオなどはなく、ハプニング的な体験を映像記録として残し、後で見る楽しみが現在のビデオカメラ(VC)やデジタルスティルカメラ(DSC)の市場を形成している。
現在、市販されているビデオカメラは、動画の撮影をより容易にする機能が登載されてきている。しかし、撮影された動画を、メタデータ(属性情報)などを用いて容易に編集、視聴する機能は、検討されてはいるが普及するまでに至っていない。
たとえば、ビデオカメラにおいて、従来、メタデータの入力方法と編集システムに関して、特許文献1に記載されたものが知られている。具体的には、コンテンツに関連したメタデータの作成あるいはタグ付けを行う場合に、制作されたコンテンツのシナリオ等から事前に抽出したキーワードが音声で入力される。そして、シナリオに基づいて辞書分野の設定およびキーワードの優先順位付けが行われて、音声認識手段によってメタデータが作成される。同方法によれば、キー入力では困難な数秒間隔でメタデータを付与する場合でも、音声認識を用いることによって効率のよいメタデータの付与が可能である。また、メタデータを検索するキーワードとして、シーン検索もできる。
また、シナリオ情報を解析する装置として、特許文献2に記載されたものが知られている。同装置はシナリオ情報格納部、参照情報格納部、算出部および出力部を備えている。情報格納部はシーン毎に区分されたシナリオ情報を格納する。参照情報格納部はシナリオ情報に含まれるデータに関する参照情報を格納する。算出部はシナリオ情報からデータを抽出し、抽出されたデータおよび参照情報に基づいて出力情報を算出して、出力部に出力する。その結果、撮影スジュールの立案時間の短縮化に加えて、出力された撮影スケジュールに従って撮影を行なうことにより、撮影を早く完了することができるので、撮影費用を低減できる。
特許文献3には、メタデータ(属性情報)に基づいてシーンを評価し、その評価結果に基づいて、撮影した映像のシーンやクリップの数を絞り込んだダイジェスト(要約映像)を簡単に生成する映像撮影装置が開示されている。
上述の特許文献1、特許文献2、および、特許文献3で開示されている装置および方法においては、ビデオカメラ(ムービー)撮影において撮影の開始から終了までの間に、パンやズームなどのカメラワークパターン、収録音、ユーザ操作等に基づいて、特徴のある場面でメタデータ(属性情報)が生成されてリスト化される。そして、記録終了後にリスト中のメタデータを用いて関連したシーンで構成されるダイジェストを作成することができる。
しかし、ズームアップ撮影においては、具体的な属性情報の扱い方について説明されていない。ズーム方式としては、(1)ズームレンズを調整することで受像部上における被写体の大きさを変更する光学ズーム方式と、(2)受像した映像の一部を表示面積を広げる(拡大する)ことで映像を拡張する電子ズーム方式、の2つの方式がよく知られている。なお、電子ズーム方式に関しては、ズーム倍率に応じて映像の解像度が下がるという課題が知られている。そのため、ズームアップのシーンを評価する際には、上記のズームアップ方式の特性を考慮してシーンの評価を行う必要がある。
上述の問題に鑑みて、本出願は、光学ズーム方式と電子ズーム方式の両方を用いて撮影される映像に、好適なシーン評価を行い、それらの評価に基づいてシーン抽出を自動的に行うことを目的とする。
本発明は、映像を撮影する映像撮影装置であって、前記映像撮影時の属性情報を生成する属性情報生成部と、前記属性情報に含まれる前記映像の映像倍率変更方法に関する情報と、映像倍率に関する情報と、前記映像の実質的な解像度に関する情報と、映像倍率の時間変化率に関する情報と、の少なくとも一つに基づいて前記映像をシーン毎に評価するシーン解析部と、前記評価に基づいて、前記映像の再生情報を生成する再生情報生成部と、を備えることを特徴とするものである。
これにより、映像撮影装置は撮影した映像から好ましいシーンを自動的に抽出することが可能となる。
本発明の映像撮影装置は、さらに、被写体からの入射した光を電気信号に変換する撮像部と、前記撮像部へ入射する光を調整するレンズ部と、を備え、前記映像倍率変更方法に関する情報とは、前記レンズ部での光学調整による倍率変更方法と、前記撮像部が出力する電気信号に基づいた信号処理による倍率変更方法と、の少なくとも一つを示す情報であってもよい。
これにより、映像撮影装置は、光学ズームと電子ズームとを区別し、ズーム方式によりシーンを評価することが可能となる。
さらに、前記シーン解析部は、前記映像倍率に関する情報に基づくシーンの評価を、前記映像コンテンツの映像倍率と所定の倍率とを比較して評価するものであってもよい。
これにより、映像倍率を用いたシーンの評価をすることが可能となる。
また、前記シーン解析部は、前記映像コンテンツの実質的な解像度に関する情報に基づくシーンの評価を、前記映像コンテンツの実質的な解像度と所定の解像度とを比較して評価するものであってもよい。
これにより、映像の解像度でシーンを評価することも可能となる。
また、前記シーン解析部は、前記映像倍率の時間変化率に関する情報に基づくシーンの評価を、前記映像コンテンツの時間変化率と所定の時間変化率とを比較して評価するものであってもよい。
これにより、映像撮影時の拡大変更(ズームアップ/ダウン)速度に応じてシーンを評価することが可能となる。
さらにシーン解析部は、該映像撮影装置の撮影状況に応じて、前記評価方法を変えるものであってもよい。
これにより、映像撮影装置の撮影状態に応じてシーンを評価することが可能となる。
さらにシーン解析部は、解像度補完処理の情報に基づいて、前記映像をシーン毎に評価するものであってもよい。
これにより、電子ズーム等で拡大された映像が解像度補完処理によって、擬似的に高解像度表現された場合は、この点も考慮してシーンを評価することが可能となる。
本発明により、光学ズーム方式と電子ズーム方式の両方を用いて撮影される映像に好適なシーン評価を行い、それらの評価に基づいてシーン抽出することが可能となる。
(実施の形態1)
<1.映像撮影装置の構成>
図1は、映像を撮影するムービーやビデオカメラ(映像撮影装置)100の外観図である。本実施の形態では、このビデオカメラを用いて説明を行う。
<1.映像撮影装置の構成>
図1は、映像を撮影するムービーやビデオカメラ(映像撮影装置)100の外観図である。本実施の形態では、このビデオカメラを用いて説明を行う。
図1のビデオカメラ内部のハードウェア構成の概略を図2に示す。ビデオカメラ100は、レンズ群200、撮像素子201、映像ADC(Analog Digital Converter)202、映像信号変換IC203、CPU204、クロック205、レンズ制御モジュール206、姿勢検出センサ207、入力ボタン208、ディスプレイ209、スピーカー210、出力I/F(Interface)211、圧縮伸張IC212、ROM(Read Only Memory)213、RAM(Randam Access Memory)214、HDD(Hard Disk Drive)215、音声ADC(Analo Digital Converter)216、マイクロフォン217、三脚センサ218、を構成要素に持つ。
レンズ群200は、撮像素子201上で被写体像を形成するために、被写体から入射する光を調整するものである。具体的には、焦点距離やズーム(映像の拡大倍率)を様々な特定を持つ複数のレンズ間の距離を変化させることで、調整するものである。これらの調整は、ビデオカメラの撮影者が手動で調整するものでも、後述するレンズ制御モジュール206を通じてCPU204等からの制御により自動的に調整するものであってもよい。
撮像素子201は、レンズ群200を通して入射する光を電気信号に変換するものである。撮像素子にはCCDやC−MOS等を利用することが可能である。
映像ADC202は、撮像素子201が出力する電気信号をアナログからデジタルへの変換するものである。
映像信号変換IC203は、映像ADC202が出力するデジタル信号をNTSCやPALと言った所定の映像信号に変換するものである。
CPU204は、ビデオカメラ100全体を制御するものである。制御の種類としては、例えば、前述のレンズ群200の焦点距離やズームの制御を、レンズ制御モジュール206を通じて撮像素子201への入射光を制御するレンズ制御、入力ボタン208や姿勢検出センサ207等からの外部入力に対する入力制御の制御、圧縮伸張IC212の動作制御等、これらの制御アルゴリズムをソフトウェア等で実行するものである。
クロック205は、ビデオカメラ100内で動作するCPU204等の回路に処理動作の基準となるクロック信号を出力するものである。なお、クロック205は利用する集積回路やまた扱うデータによって、単一または複数のクロックを用いることも可能である。また、ひとつの発振子のクロック信号を任意の倍数に乗じて使用してもよい。
レンズ制御モジュール206はレンズ群200の状態を検出し、CPU204からの制御に基づいてレンズを動作させるものである。レンズ制御モジュール206は、レンズ制御用モータとレンズ位置センサを備える。レンズ位置センサはレンズ群200を構成する複数のレンズ間の距離または位置関係等を検出するものである。レンズ位置センサが検出した複数のレンズ間の位置情報等はCPU204に送信される。CPU204はレンズ位置センサからの情報、撮像素子201等の他の構成要素からの情報に基づいて、複数のレンズを適正に配置させるための信号をレンズ制御用モータに送信する。レンズ制御用モータは、CPU204から送信された制御信号に基づいてレンズを動作させるモータを駆動する。この結果、レンズ群200の複数のレンズ間の距離が変更され、レンズの焦点距離、およびズームを調整することで、レンズ群200を通過した入射光は撮像素子201上で、目的とする被写体像を結ぶものとなる。
なおCPU204は上記以外にも、ビデオカメラ100で映像撮影時の手振れを、レンズ位置センサや後述する姿勢検出センサ等で検出し、レンズ制御用モータを駆動する制御を行うことで、手振れ防止の動作をレンズ制御モジュール206で実行させることも可能である。
姿勢検出センサ207は、ビデオカメラ100の姿勢の状態を検出するものである。姿勢検出センサ207は、加速度センサ、角速度センサ、仰角・俯角センサ等を備える。これらの各種センサにより、ビデオカメラ100がどのような状態で撮影を行っているかをCPU204は検出する。なお、これらのセンサは好ましくはビデオカメラ100の姿勢を詳細に検出するために、3軸方向(垂直方向、水平方向等)についてそれぞれ検出できることが望ましい。
入力ボタン208は、ビデオカメラ100の撮影者が使用する入力インタフェースの一つである。これにより、撮影者が撮影の開始や終了、ビデオ撮影中の映像にマーキングを挿入する等、各種要求をビデオカメラ100に伝えることが可能となる。
ディスプレイ209は、ビデオカメラ100が撮影した映像を見るためや、撮影ファインダー等として利用するために設けられている。これにより、撮影者は撮影した映像をその場で確認することが可能となる。また、それ以外にもビデオカメラ100の各種情報を表示することで、撮影情報等、機器情報等のより詳細な情報を撮影者に伝えることが可能となる。
スピーカー210は、撮影した映像を再生する際の音声出力に使用される。それ以外にも、ビデオカメラ100が出力する警告を音で撮影者へ伝えることも可能である。
出力I/F211は、ビデオカメラ100が撮影した映像を外部機器へ出力するために用いられる。具体的には、外部機器とケーブルで接続する場合のケーブルインタフェースや、撮影した映像をメモリカードに記録する場合のメモリカードインタフェース等などがある。これにより、撮影した映像をビデオカメラ100に備え付けのディスプレイ209よりも大きな外部のディスプレイを用いて視聴等することが可能となる。
圧縮伸張IC212は、撮影した映像または音声を所定のデジタルデータ形式(符号化処理)にするものである。具体的には、撮影した映像・音声データをMPEG(Moving Picture Expoerts Group)やH264等の符号化処理を行い、所定のデータ方式に変換(圧縮)するものである。また、撮影したデータの再生時には、圧縮伸張ICがこれら、所定のデータ形式の映像データを伸張してディスプレイ209等に表示するデータ処理をおこなうものである。
ROM213は、CPU204が処理するソフトウェアのプログラムやプログラムを動作させるための各種データを記録するものである。
RAM214は、CPU204が処理するソフトウェアのプログラム実行時に使用するメモリ領域等として使用される。また、圧縮伸張IC212と共用でこのRAM214を使用してもよい。
HDD215は、圧縮伸張IC212が符号化した映像データやその他撮影した静止画像データを蓄積等する目的で利用される。なお、記録されるデータはこれ以外にも、後述する再生情報のデータ等を記録することも可能である。
音声ADC216は、マイクロフォン217が出力する音声の電気データをアナログからデジタルへ変換処理するものである。
マイクロフォン217は、ビデオカメラ100外部の音声を電気信号に変換して出力するものである。
三脚センサ218は、ビデオカメラ100が三脚に設置されているか否かを検出するものである。具体的には、三脚が固定される部分にスイッチを設けておくことにより、ビデオカメラ100が三脚を使用した撮影か否かを判定できる。
上記のとおりビデオカメラ100のハードウェア構成を示したが、本発明では上記の構成に限定されるものではない。例えば、映像ADC202や映像信号変換IC203等を単一の集積回路として実現することも可能であるし、CPU204が実行するソフトウェアプログラムの一部を別途、FPGA(Field Programmable Gate Array)を用いてハードウェアとして実現することも可能である。
図3にビデオカメラ100の機能構成図を示す。ビデオカメラ100は、機能構成として、レンズ部300、撮像部301、映像AD変換部302、信号処理部303、映像信号圧縮部304、撮像制御部305、映像解析部306、レンズ制御部307、姿勢検出部308、属性情報生成部309、シーン解析部310、再生情報生成部311、音声解析部312、音声信号圧縮部313、多重化部314、記憶部315、ダイジェスト再生部316、映像信号伸張部317、映像表示部318、音声信号伸張部319、音声出力部320、音声AD変換部321、マイク部322、外部入力部323、を備える。
レンズ部300は、被写体から入射した光の焦点距離、ズーム倍率(映像の拡大倍率)を調整するものである。これらはレンズ制御部307からの制御により行われる。レンズ部300は、図2のレンズ群200に該当する。
撮像部301は、レンズ部300を透過した光を電気信号に変換するものである。撮像部301は、撮像制御部305の制御により、撮像素子上の任意の範囲のデータを出力する。また映像データ以外にも、3原色点の色度空間情報、白色の座標、および3原色のうち少なくとも2つのゲイン情報、色温度情報、Δuv(デルタuv)、および3原色または輝度信号のガンマ情報等の情報も出力することが可能である。この場合、これらの情報は、属性情報生成部309へ出力する。撮像部301は、図2の撮像素子201に該当する。
映像AD変換部302は、撮像部301からの電気信号を所定の処理内容にしたがってアナログ・デジタル変換を行う。映像AD変換部302は、図2の映像ADC202に該当する。
信号処理部303は、映像AD変換部302が出力したデジタル信号を所定の映像信号フォーマットに変換するものである。例えば、NTSC(National Television System Committee)で規定された水平線の数、走査線の数、フレームレートに準拠した映像信号とするものなどである。信号処理部303は、図2の映像信号変換IC203に該当する。
映像信号圧縮部304は、デジタル映像信号を所定の符号化変換を行い、データ量の圧縮等を実現する。具体例としては、MPEG2、MPEG4、H264の符号化方式がある。映像信号圧縮部304は、図2の圧縮伸張IC212の圧縮機能に相当する。
撮像制御部305は、撮像部301の動作を制御するものである。撮像部301に対して、撮影時の露出量や撮影速度、感度等を制御するものである。また、これらの制御情報は属性情報生成部309へも併せて出力する。撮像制御部305は、図2のCPU204で処理される制御アルゴリズムの一つである。
映像解析部306は、撮影された映像信号から映像の特徴を抽出するものである。本実施の形態では、色情報(例えば、映像に含まれる色の分布を検出する)や、ホワイトバランス、映像に人物の顔が含まれている場合には、顔検出を行う等、映像信号を解析することで、映像の特徴を抽出するものである。なお、色分布の検出は映像信号を形成するデータに含まれる色情報を確認することで実現可能である。また、顔検出については、パターンマッチング等を用いることにより実現可能である。映像解析部306は、図2のCPU204でソフトウェア処理されるアルゴリズムの一つである。
レンズ制御部307は、レンズ部300の動作を制御するものである。レンズ制御には、ズーム制御、フォーカス制御、また手振れ補正制御等がある。レンズ制御部307はレンズ部300を制御するとともに、これらの制御情報を属性情報生成部309へ出力する。レンズ制御部307は、図2のレンズ制御モジュール206に相当する。
姿勢検出部308は、ビデオカメラ100の加速度、角速度、仰角・俯角等を検出する。こられの情報はビデオカメラ100の姿勢やその変化状況を検出する目的等に用いられる。加速度や角速度については、垂直・水平(2方向)の3方向について検出できることが望ましい。姿勢検出部308は、図2の姿勢検出センサ207に相当する。
マイク部322は、周囲の音を電気信号に変化して音声信号として出力するものである。マイク部322は、図2のマイクロフォン217に相当する。
音声AD変換部321は、マイク部322が出力したアナログの音声信号をデジタル形式の音声データに変換する。音声AD変換部321は、図2の音声ADC216に相当する。
音声解析部312は、音声データから特徴のある音を抽出するものである。ここで特徴のある音とは、例えば、撮影者の声、特定の単語の発音、歓声、銃声等がある。これらの音の識別は、これらの音(音声)が持つ特有の周波数を予め登録しておき、それとの比較結果で判別するなどの方法等を用いることで、抽出が可能である。またこれ以外にも、マイクが捕捉した音の入力レベル等の特徴も検出する。音声解析部312は、図2のCPU204でソフトウェア処理されるアルゴリズムの一つである。
音声信号圧縮部313は、音声AD変換部321が出力した音声データを所定の符号化アルゴリズムで変換するものである。符号化にはMP3(MPEG Audio Layer−3)やAAC(Advanced Audio Coding)等の方法がある。音声信号圧縮部313は、図2の圧縮伸張IC212での圧縮機能の一つである。
外部入力部323は、映像撮影時に外部から受信した各種の情報、例えば、撮影者によるボタン入力、外部から通信経由で受信した撮影インデックス情報等を出力するものである。なお、撮影インデックス情報とは、例えば、映画撮影時における、撮影場面を識別する番号や、撮影回数を示す番号等のそれぞれの撮影を識別するために用いられる識別番号などである。外部入力部323は、図2の入力ボタン208や三脚センサ218等に該当する。
属性情報生成部309は、映像撮影時の撮影情報、外部入力情報及びその他の情報を属性情報(メタデータ)とする。属性情報の一例として以下のような情報が考えられる。
・焦点距離
・ズーム倍率
・露出
・撮影速度
・感度
・3原色点の色空間情報
・ホワイトバランス
・3原色のうち少なくとも2つのゲイン情報
・色温度情報
・Δuv(デルタuv)
・3原色または輝度信号のガンマ情報
・色分布
・顔認識情報
・カメラ姿勢(加速度、角速度、仰角・俯角等)
・撮影時刻(撮影開始時刻、終了時刻)
・撮影インデックス情報
・ユーザ入力
・フレームレート
・サンプリング周波数
・焦点距離
・ズーム倍率
・露出
・撮影速度
・感度
・3原色点の色空間情報
・ホワイトバランス
・3原色のうち少なくとも2つのゲイン情報
・色温度情報
・Δuv(デルタuv)
・3原色または輝度信号のガンマ情報
・色分布
・顔認識情報
・カメラ姿勢(加速度、角速度、仰角・俯角等)
・撮影時刻(撮影開始時刻、終了時刻)
・撮影インデックス情報
・ユーザ入力
・フレームレート
・サンプリング周波数
属性情報には、上記の撮影時の各種情報から算出される映像シーンを特徴づける新たな情報(撮影時の各種情報等を組み合わせ、それらを分析等することで算出される情報等)も含まれる。例えば、カメラ姿勢(加速度、角速度、仰角・俯角等)の情報からビデオカメラ100が撮影時にパン、ティルト等のカメラワークを算出することが可能となる。また、焦点距離や、ズーム倍率の情報はそのままでも、属性情報として用いることが可能とである。属性情報生成部309は、撮影時の各種情報からシーン評価に有用な情報を抽出、算出等して属性情報を生成する。
シーン解析部310は、属性情報生成部309が生成した属性情報に基づいて、それぞれのシーンを評価し、その結果に基づいて再生すべきシーンを選択するものである。シーンの評価や選択方法等について後に詳細に説明する。
再生情報生成部311は、シーン解析部310が選択した再生すべきシーンを再生情報として生成するものである。この点についても後述する。
属性情報生成部309、シーン解析部310、再生情報生成部311は、図2のCPU204においてソフトウェアとして処理される。
多重化部314は、映像信号圧縮部304からの符号化映像データ、音声信号圧縮部313からの符号化音声データ、再生情報生成部311からの再生情報を多重化して出力するものである。多重化部314は、図2のCPU204で実行されるソフトウェアであってもよいし、圧縮伸張IC212で、処理されるものであってもよい。
記憶部315は、多重化部314から出力された符号化映像データ、符号化音声データ、再生情報が多重化されたデータを一時保持又は長期保持するものである。記憶部315は、図2のHDD215やRAM214等に該当する。
ダイジェスト再生部316は、記憶部315に記録された多重化されたデータを読み出し、そこから再生情報を抽出し、再生情報に従って映像データ、音声データを映像信号伸張部317、音声信号伸張部319でそれぞれ復号させ、映像表示部318、音声出力部320から出力する。ダイジェスト再生部316は、図2のCPU204で実行されるソフトウェア処理のアルゴリズムである。
上記の構成により、ビデオカメラ100で撮影された映像は、属性情報に基づいて抽出された好ましいシーンの選択を自動的に行い、その部分のみを再生等することが可能となる。
なお、図2及び図3のハードウェア構成図、機能図は本発明の実施するための一態様であり、これに限定されるものではない。例えば、図3において、シーン解析部310、再生情報生成部311は、記憶部315にデータを記録する前に処理されているが、記憶部315に圧縮された映像信号、圧縮された音声信号と、撮影時の属性情報を多重化して一度記録し、当該データを記憶部315から読み出した後にシーン解析、再生情報の生成等を行うものであっても良い。
また、図2のハードウェア構成と図3の機能構成の対応関係は、上記記載に限定するものではない。上記の説明は、本発明を実施するための一形態として示すものであって、機能構成とハードウェア構成が異なる関係であってもよい。
<2.撮影したシーンの解析、再生情報の生成>
図4は、ビデオカメラ100が撮影する映像の構成を示す図である。撮影者が撮影開始を指示し、撮影の終了又は撮影の一時停止を指示するまでに撮影された映像の単位を「クリップ」とする。撮影者が撮影の開始、撮影の終了又は一時停止を何度も繰り返すと、クリップが複数生成される。
図4は、ビデオカメラ100が撮影する映像の構成を示す図である。撮影者が撮影開始を指示し、撮影の終了又は撮影の一時停止を指示するまでに撮影された映像の単位を「クリップ」とする。撮影者が撮影の開始、撮影の終了又は一時停止を何度も繰り返すと、クリップが複数生成される。
一つのクリップは一つ又は複数の「シーン」から構成される。「シーン」は論理的につながりのある一続きの映像である。シーンは、任意に設定することが可能である。例えば、クリップを一つのシーンとして「1クリップ」=「1シーン」と設定してもよい。また、画面が大きく変わることを境として「シーン」を設定してもよい。この場合には、映像解析部306がフレーム間の動きベクトルを算出し、「動き」の大きさ(変化)が所定の値より大きい場合を、「シーン」の切り替え部分としてもよい。その他の撮影情報等に基づいて「シーン」を区切っても良い。例えば、撮影者からのボタン入力により「シーン」を区切っても良い。この場合に、撮影者の明確な意図で「クリップ」内の「シーン」を構成することが可能となる。
「シーン」は、一つ又は複数の「フレーム」から構成される。「フレーム」は映像を構成する個々の画像である。
図5は、シーン解析部310が、クリップ内を複数のシーンに分割した場合の例を示すものである。シーン解析部310は、上述の通り属性情報等に基づいてクリップを分割する。図5では、それぞれのシーンを「開始時間」と「終了時間」で定めているが、フレーム番号等でシーンの開始と終了を定めても良い。
図6は、シーン解析部310が、それぞれのシーンを評価する際に用いる属性情報と評価の関係例を示した図である。例えば、クリップイン(撮影の開始部分)やクリップアウト(撮影の終了前部分)部分については、映像の導入部分や重要部分と考えている場合は、撮影された映像が持つ論理的な意味が高いと推論される。この例では、クリップイン(A)及びクリップアウト(F)は、評価が100となっている。その他にも、撮影時のカメラワークとしてズームアップ(D)やズームダウン(G)についても、特定の被写体への注目度を高めるとの観点から評価が30として定められている。このように、シーン解析部310は予め属性情報それぞれに対する数値化された評価を持っている。図6の例では、評価点が高いほど高い評価(好ましい)として表現している。シーン解析部310は、このような図6の属性情報と評価との関係に基づいて各シーンを評価する。なお、一つのシーンに複数の属性情報が与えられている場合は、それぞれの属性情報に割り当てられている評価(評価点)を加算してもよい。また、一つのシーンに複数の属性情報が与えられている場合、その属性情報のなかから最も評価の高い属性が持つ評価(評価点)を当該シーンの評価点としてもよい。さらに、シーン内に含まれる種々の属性を考慮するのであれば、複数の属性の評価点の平均値等を評価としてもよい。さらに、より詳細に評価を行う場合には、シーンに含まれるフレーム毎に評価をしてもよい。なお、評価は好ましいシーンだけに行う必要はない。例えば、撮影時の手振れは、映像の視聴者に見づらい映像となる可能性があるので、こういった属性を持つシーンには減点(マイナス点)の評価をおこなうものであってもよい。
なお、図6の属性情報と評価の関係は、一つに限定するものではない。例えば、複数の属性情報・評価の組み合わせデータをビデオカメラ100の撮影者が撮影するモード(例えば、風景の撮影、人物(ポートレート)撮影、静物撮影等)によって切り換えるものであってもよい。また、予め複数の組み合わせデータを備えておき、撮影モードによって、複数のデータを合成(それぞれの評価の値を一定の比率で加算等)したものであってもよい。この場合には、合成の比率を変えることで、動的に属性情報・評価の組み合わせデータを変更することが可能となる。
図7はシーン解析部310が、各シーンに評価(優先度)を割り当てた結果を示した図である。図7は横軸に時間(シーン)を、縦軸に各シーンの評価(優先度)を示したものである。
図7の時間0付近のAは、撮影を開始した直後であるため「クリップイン」の属性を持つ。図6に従えば、「クリップイン」の属性は評価(優先度)100を持つ。
Bの符号が付けられているシーンは、「特定音声の抽出」の属性を持つ。特定音声の抽出は、上述の音声解析部312等により得られるものである。図6に従えば、「特定音声の抽出」の属性は評価(優先度)70を持つ。
Cの符号が付けられているシーンは、撮影者がカメラをパン、ティルト等のビデオカメラ100本体を動かして撮影した後に、静止して撮影することを意味する属性を示す。このようなシーンは、静止して撮影する際の被写体に映像としての価値が高いと判断できることが考えられる。図6に従えば、このような属性は評価(優先度)40を持つ。
Dの符号が付けられているシーンは、ビデオカメラをズームアップ又はズームダウン等して撮影しているシーンである。図6では、ズームアップ/ズームダウンでは評価(優先度)30を持つ。ただし、ズームアップとズームダウンで評価の値をかえることも可能である。例えばズームアップをズームダウンよりも評価を高く設定することで、ズームアップで撮影されるシーン、つまり映像の拡大倍率が大きくなるシーン(拡大されて撮影される被写体があるシーン)、について高い評価(優先度)を割り当てても良い。逆に、映像の拡大倍率が小さくなるシーンについては比較的低い評価(優先度)を割り当てることも可能である。
Eの符号が付けられているシーンは、ビデオカメラがパン、ティルト等の動きをともなった撮影(カメラワーク)を行ったシーンである。この場合は評価(優先度)25が割り当てられる。
以上よりシーン解析部310は、各シーンについて評価(優先度)を割り当てる。なお、図7の例では、シーンを単位として評価を割り当てたが、シーン解析部310はクリップ単位、又は、フレーム単位で上記の評価割り当てをおこなってもよい。
シーン解析部310は、さらに、各シーンに割り当てた評価に基づいて、好ましいシーンのみを抽出する。具体的には評価の高いシーンのみを抽出する。図7の例では、#1〜#3の部分のシーンのみを抽出することとなる。なお、抽出方法については、抽出されたシーンの合計再生時間が所定の時間以内であること、又は、シーンの評価が一定以上であること等、様々な観点で抽出をすることが可能である。
再生情報生成部311は、シーン解析部310が抽出したシーンに従って、映像再生の手順・方法を記した再生情報を生成するものである。この再生情報とは、例えば、図8に示すような、再生対象となるシーンの開始時刻と終了時刻で示されるものであってもよい。この場合、各シーンの中における代表的な映像画面(シーン中における最も評価の高い映像画面等)を別途記録しておくと、参照用画面の検索にも有効である。
なお、再生情報の管理は上記の内容に限られず、他の方法であってもよい。例えば、フレーム番号での指定などでも可能である。また、再生情報生成部311が生成した再生情報を、MPEG等のTS(Transport Stream)として多重化部314で多重化する場合等には、多重化時に用いられる時刻情報(例えばPTSやDTSの時刻情報)等を用いて再生情報を記録することも可能である。H264の場合にも同様に所定の多重化時の時刻情報を用いてもよい。
さらに、一部のビデオカメラのデータ記録方式として用いられているAVCHD(Advanced Video Codec High Definition)等の規格を用いて映像データを記録する場合には、PlayListファイル等に再生情報を記録する方法を用いても良い。
以上により、撮影した映像からダイジェスト映像(要約された映像)を自動的に生成することが可能となる。
<3.属性情報におけるズームアップの扱いについて>
シーン解析部310は、ズームアップについて属性情報として一定の評価(優先度)(図6の例では30)を割り当てている。しかし、ズームアップの機能は、一般的にレンズ部300のレンズを制御することで映像の拡大倍率を変更する「光学ズーム」と、撮像部301(撮像部301〜信号処理部303の場合もある)で受像した映像信号の一部を信号処理として画像を拡大する「電子ズーム」の2種類がある。
シーン解析部310は、ズームアップについて属性情報として一定の評価(優先度)(図6の例では30)を割り当てている。しかし、ズームアップの機能は、一般的にレンズ部300のレンズを制御することで映像の拡大倍率を変更する「光学ズーム」と、撮像部301(撮像部301〜信号処理部303の場合もある)で受像した映像信号の一部を信号処理として画像を拡大する「電子ズーム」の2種類がある。
図9は、光学ズームと電子ズームとの使用例を示すものである。低倍率(0から10倍)の範囲では、光学ズームのみを用い、10倍以上の領域では、光学ズームと電子ズームを併用することで対応する。電子ズームは、光学ズームと比較して撮像部301で受像した映像の一部分を信号処理により拡大したものであるため、映像コンテンツの実質的な解像度(電子ズームで拡大される映像コンテンツの一部分を、撮像部301で受像する際の解像度)は、映像コンテンツの拡大倍率が大きくなるほど低下する。
シーン解析部310は、光学ズームと電子ズームの特性を考慮してズームアップに対する属性情報及びその評価を設定する。光学ズームと電子ズームが図9に示すように、予め拡大倍率に応じて用いられるズーム方法が決められている場合について説明する。
属性情報生成部309は、撮影時に各種センサや制御情報を収集する。拡大倍率の情報は、レンズ制御部307からの制御情報、及び、撮像制御部306または信号処理部303の情報等に基づいて、光学ズーム、電子ズームの動作内容から属性情報生成部309がシーン毎に算出する。
シーン解析部310は、属性情報生成部309が生成した拡大倍率の情報に基づいて、シーンの評価(優先度)を決定する。図10は、拡大倍率と評価の関係を示したグラフである。この場合、光学ズームの範囲では、拡大率が大きくなるにしたがって評価も増加する。しかし、電子ズームが作用し始める10倍以上の拡大倍率の領域に入ると、評価は減少し、20倍で評価が0となる。これは、電子ズームでは、撮影される映像の実質的な解像度が低下するため、電子ズームが作用し始める倍率になると、拡大倍率に応じて評価を下げるものである。これにより、ズームアップによる撮影者の注目度と画質の低下との関係を考慮した属性情報の評価が可能となる。図10の例では、所定の拡大倍率(閾値)と比較し、閾値よりも大きい場合(電子ズームが適用される場合)は、評価を減少、あるいは行わない。閾値よりも小さい場合(工学ズームのみの場合)は、属性情報の評価を行うものである。
また、別の評価方法として、図11に示す例がある。図11の例では、シーン解析部310は、光学ズームと電子ズームが併用される拡大倍率30倍までは拡大倍率に応じて評価を増加させる。それ以降については、評価を0とするものである。これは、電子ズームによる映像の拡大は、拡大倍率に応じて画質が劣化するが、電子ズームの拡大倍率が小さい領域では画質レベルが著しく低下するわけではないので、所定の拡大倍率(閾値)まではシーンの評価を行うものである。所定の拡大倍率を超えた場合は、画質レベルが著しく低下するためシーンの評価を行わない。図11の場合は30倍を所定の拡大倍率の境とした場合の例である。
なお、拡大倍率10倍から30倍までの間は、電子ズームによる拡大が行われるが、この際、電子ズームで取得される映像の解像度を規定の解像度(例えば、表示画面の解像度、映像の記録の際に定められた解像度)に変換する技術を用いても良い。これにより、電子ズームを用いて撮影された映像を解像度補完により、より高い解像度で記録、表示等をすることが可能となり、電子ズームの欠点である実質的な解像度が低下する課題を解決することが可能となる。
解像度補完には、映像を形成する個々のフレーム、それぞれで処理を行うフレーム内処理と、複数のフレームを用いて処理を行うフレーム間処理がある。上記の解像度補完には、いずれの方法を用いても良い。
さらに別の評価方法として、図12に示す例がある。図12の例では、光学ズームのみの拡大領域の範囲と電子ズームが用いられる拡大領域の範囲とで、拡大倍率に応じて評価の増加率を変えるものである。この場合には、光学ズームによる拡大と電子ズームによる拡大の効果の大きさに関連させて、評価の方法を変えるものである。
以上より、光学ズームと電子ズームによる映像の拡大倍率によってズームアップ時のシーンの評価をかえることで、より、撮影された映像内容に従ったシーンの抽出が可能となる。
また属性情報生成部309が、レンズ制御部307や撮像制御部305から直接、光学ズーム、電子ズームの動作に関わる情報を取得できる場合は、シーン解析部は、これら映像倍率変更方法に基づいてシーンを評価することも可能である。例えば、光学ズームの場合は高評価とするが、電子ズームが動作している場合は、評価しない(評価0)としてもよい。
この場合も上記と同様に撮影された映像内容に従ったシーンの抽出が可能となる。
<4.新評価に基づく再生情報の生成について>
再生情報生成部311は、シーン解析部310がシーン毎に行った評価に基づいて再生すべきシーンを特定する。上記の映像の拡大倍率に応じたシーンの評価の例を図13に示す。図13は、シーンと拡大倍率(ズームレベル)と、再生される映像の関係を示した図である。図13(A)は、シーンとそのシーンの拡大倍率との関係を示した図である。シーン解析部はこの拡大倍率に応じてシーンを評価する。この例では、映像の拡大倍率(ズームレベル)が30倍を超えるシーンについては、評価しない(評価0とする)。図13(A)では、シーン1、2、4はいずれの拡大倍率が30倍以下であるが、シーン3が50倍であるため、シーン解析部310は、シーン3については評価していない。図13(B)
は、図13(A)のシーン1〜4に対応するシーンの位置を表す図である。図13(B)は、シーン解析部310の評価に基づいて、拡大倍率(ズームレベル)の属性情報を持つシーンに該当する部分、及びそのうち、評価されているシーンを示す図である。図13(C)は、シーン解析部310の評価に従って、再生情報生成部311が生成する再生情報により再生される映像を表す図である。
再生情報生成部311は、シーン解析部310がシーン毎に行った評価に基づいて再生すべきシーンを特定する。上記の映像の拡大倍率に応じたシーンの評価の例を図13に示す。図13は、シーンと拡大倍率(ズームレベル)と、再生される映像の関係を示した図である。図13(A)は、シーンとそのシーンの拡大倍率との関係を示した図である。シーン解析部はこの拡大倍率に応じてシーンを評価する。この例では、映像の拡大倍率(ズームレベル)が30倍を超えるシーンについては、評価しない(評価0とする)。図13(A)では、シーン1、2、4はいずれの拡大倍率が30倍以下であるが、シーン3が50倍であるため、シーン解析部310は、シーン3については評価していない。図13(B)
は、図13(A)のシーン1〜4に対応するシーンの位置を表す図である。図13(B)は、シーン解析部310の評価に基づいて、拡大倍率(ズームレベル)の属性情報を持つシーンに該当する部分、及びそのうち、評価されているシーンを示す図である。図13(C)は、シーン解析部310の評価に従って、再生情報生成部311が生成する再生情報により再生される映像を表す図である。
なお、再生情報生成部311が生成する再生情報は評価されたシーンのみを再生するものでなくてもよい。例えば、評価されたシーンについては、通常の速度で再生を行い、評価されなかったシーンについては高速再生を行うものであってもよい。つまり、評価されたシーン(評価の高いシーン)と評価されなかったシーン(評価の低いシーン)とで、再生方法をかえるものであってもよい。
以上、本実施の形態に示した構成により、ビデオカメラ100は撮影した映像から、好適なシーン抽出を行うことが可能となる。
(実施の形態2)
本実施の形態と実施の形態1との異なる点は、光学ズームと電子ズームの属性情報の評価についてである。その他の点については、実施の形態1と共通であるため、説明を省略する。
本実施の形態と実施の形態1との異なる点は、光学ズームと電子ズームの属性情報の評価についてである。その他の点については、実施の形態1と共通であるため、説明を省略する。
本実施の形態では、拡大倍率とズームアップ時に伴う映像の実質的な解像度に基づいてシーンの評価を行う方法を示す。
属性情報生成部309は、撮像制御部305又は映像解析部306からの情報に基づいて、映像の実質的な解像度を算出する。例えば、撮像部301で受像した映像信号を後段の映像AD変換部302、信号処理部303等で全く電子ズームの信号処理を行っていない場合、映像の実質的な解像度は撮像部301の解像度と等しくなる。電子ズームを使用している場合は、撮像部301で受像した画像の一部を信号処理により拡大しているため、映像の実質的な解像度を算出する必要がある。具体例を図14に示す。撮像部301の光を受像する撮像面1401は、撮像面全体でレンズ部300を透過した光を受像する。電子ズームの場合、撮像面1401が受像した光の内、一部の領域である部分領域1402で受像した光の信号のみを、信号処理により撮像面1401の大きさに拡大するものである。そのため、この場合の映像の実質的な解像度とは、この部分領域の解像度といえる。図14の例では、撮像面1401の解像度に(a/A)×(b/B)を乗じたものが実質的な解像度となる。
この場合の拡大倍率と実質的な解像度との関係を図15に示す。光学ズームのみにより映像を拡大している場合(10倍まで)、映像は撮像面1401全体の解像度を持つが、電子ズームによる拡大処理が行われると、拡大率に従って映像の実質的な解像度が低下する。
シーン解析部310は、属性情報として上記の映像の実質的な解像度を利用してシーンの評価を行う。図15は、映像の拡大倍率と実質的な解像度の関係の一例を示すグラフである。図15において、解像度が60以上ではシーンとして評価し、60未満では評価しない(評価0)とする。この場合、シーン解析部は、映像の拡大倍率が30倍以下であれば、シーンとして評価され、30倍を超えると評価されないこととなる。
以上より、本実施の形態では、映像の実質的な解像度に基づいてシーンを評価することにより、映像内容に従ったシーン抽出を自動的に行うことが可能となる。
なお、映像の実質的な解像度の算出には幾つかの方法がる。映像信号そのものを解析して拡大率を算出する場合は、映像信号を構成する一つの画素において、該画素とその隣接する画素又は該画素と一定の距離内にある他の画素との表示内容を比較し、表示内容の近似度を算出する。これを映像信号の画面全体でおこなうことで画面全体の近似度の傾向を計る。この結果により、映像の実質的な解像度を推定等することが可能となる。
また、他の方法として、撮像部301〜信号処理部303までの制御内容から映像信号の拡大処理が施されていることを検出し、撮像制御部307等から、属性情報取得部309が拡大率を取得することで映像の実施的な解像度を正確に取得することも可能である。
本実施の形態では、属性情報の内容に基づいて評価を行い、評価の高いシーンから抽出する方法について説明したが、これに限定するものではない。例えば、評価の低いシーンのみを抽出し、映像再生時にそれら評価の低いシーンのみを除外して再生するものであってもよい。このようにすることで、視聴者は撮影した映像を大きく変更することなく、視聴することが可能となる。
(実施の形態3)
本実施の形態と実施の形態1との異なる点は、属性情報の評価についてである。その他の点については、実施の形態1と共通であるため、説明を省略する。
本実施の形態と実施の形態1との異なる点は、属性情報の評価についてである。その他の点については、実施の形態1と共通であるため、説明を省略する。
本実施の形態では、ズームアップ時、ズームダウン時の映像拡大率の時間単位での変化量に基づいてシーンの評価を行う方法を示す。これは、ズームアップやズームダウンの動作が著しく速く行われて撮影された映像は、見にくい映像(評価として低い)という考えに基づくものである。
図16に拡大変更速度(ズーム速度)とシーン評価(優先度)の関係の一例を示す。図16の例では、2倍/秒で拡大倍率を変更する際に最も高い評価(優先度)を設定している。これ以上の速度で映像の拡大倍率を変更する場合は、倍率を変更する速度が高くなるにしたがって評価(優先度)をさげている。これは、視聴者が映像を視聴する際に、視聴者にとって適正な映像の拡大変更速度(ズーム速度)を想定し、その想定に近い場合ほど高評価を得るとする考え方である。これにより、撮影した映像からより視聴者に好ましいシーンの抽出を自動的に行うことが可能となる。
なお、この拡大変更速度は、シーン解析部310が、レンズ制御部307によるレンズ部300を光学ズーム制御する際の制御内容や、撮像部300等による電子ズームの制御内容に基づいて単位時間毎、又は、単位フレーム毎の拡大変更速度を算出することが可能である。
また、別の方法として撮影された映像信号から拡大速度を算出することも可能である。この場合は、映像解析部306が連続するフレーム間での動きベクトルを算出する。この場合、ズームアップ及びズームダウンによる撮影が行われていると、撮影画像の中心を起点または終点として連続するフレーム間で放射状の動きベクトルを算出する。また、この際の動きベクトルの大きさでズームアップ、ズームダウンの拡大変更速度を推定することも可能である。以上より、映像解析部306による映像信号の解析により、画像変更速度(ズーム速度)の算出も可能である。
以上により、シーン解析部310は、画像変更速度に応じてシーンの評価(優先度)をすることが可能となる。この評価に基づいて実施の形態1と同様に再生情報生成部311は、再生情報を生成することが可能となる。
(実施の形態4)
本実施の形態と実施の形態1との異なる点は、光学ズームと電子ズームの属性情報の評価についてである。その他の点については、実施の形態1と共通であるため、説明を省略する。
本実施の形態と実施の形態1との異なる点は、光学ズームと電子ズームの属性情報の評価についてである。その他の点については、実施の形態1と共通であるため、説明を省略する。
本実施の形態では、シーン解析部310が図2に示す三脚センサ218からの入力情報に基づいてシーン解析を行う例を説明する。
一般に撮影時の拡大倍率(ズームアップ)が大きくなると、撮影時の手振れが大きくなるという課題がある。シーン解析部310は、レンズ制御部307や姿勢検出部308からの各種制御情報により、撮影時の手振れを検出することが可能である。また、レンズ部300が手振れ補正機能を備えている場合には、そこからの制御情報を直接取得することでも、手振れを検出することができる。
これらの手振れは、レンズ制御部307等を通じてレンズ部300を制御することにより、補正をすることが可能である。しかし、これらの補正は限られたものが一般であるため、特に撮影の拡大倍率が大きくなると、完全には補正できない場合がある。撮影時の手振れ補正等を防ぐには、一般には三脚等を用いて安定した状態での固定撮影が望ましい。
そこで、シーン解析部310は、映像の拡大率と三脚センサ218との属性情報に基づいてシーン毎に評価を行う。具体的には、属性情報の一つである三脚センサが「無」を意味している場合は、図17(A)に示すシーンの評価を行う。属性情報の三脚使用が「有」を意味している場合は、図17(B)のように、シーン毎の評価を行う。
シーン解析部310は図17(A)と図17(B)の評価方法を三脚の有無で切り換える。この評価方法は、拡大倍率が大きい場合の撮影では、撮影者が三脚無しで手に持って撮影すると手振れによる撮影映像の乱れ、拡大倍率が大きくても、ビデオカメラを三脚に固定して撮影する場合は、映像の乱れが比較的小さくなる、という観点で評価を行っている。そこで、本実施の形態では、映像の拡大倍率と三脚使用状況に基づいて、シーン毎の評価を切り換えて行うものである。
これにより、撮影条件を考慮した撮影シーンの評価を行うことができ、視聴者によってより好ましいシーンの抽出を自動的に行うことが可能となる。
なお、本実施の形態では、三脚を例にあげて説明したが、これに限定するものではない。三脚以外の一脚であってもよい。つまり撮影時にビデオカメラが手振れ等の影響がない固定された状況(安定した状況)での撮影か、手振れ等の恐れのある状況(不安定な状況)での撮影かを識別できるものであればよい。これは、映像撮影装置がこれを識別する方法として、外部からの入力(三脚センサ218)を利用し、これによりシーン解析部310はシーン評価の評価方法を変えるというものである。
(実施の形態5)
本実施の形態と実施の形態4との異なる点は、電子ズームの評価についてである。その他の点については、実施の形態4と共通であるため説明を省略する。
本実施の形態と実施の形態4との異なる点は、電子ズームの評価についてである。その他の点については、実施の形態4と共通であるため説明を省略する。
本実施の形態では、信号処理部303が、電子ズームを行う際に、解像度補完処理を行う場合と行わない場合とで、シーン解析部310がシーン評価を異なるものとする場合について説明する。
信号処理部303が、電子ズームを用いて撮影された映像を、解像度補完技術を用いて、映像の解像度を高めると、電子ズームの拡大率が相対的に小さい場合、電子ズームによる解像度の低下を解像度補完技術によって擬似的に補うことが可能となる。そのため、この場合には、シーン解析部310は、図17(B)に示すように、所定の解像度までは、シーンの評価を拡大倍率の増加に伴って、高める。
反対に、解像度補完技術を用いない場合、電子ズームによる拡大倍率の増加にともなって、映像の実質的な解像度も低下するため、図17(A)のように評価する。この場合、たとえば、映像の実質的な解像度の変化は、図15に記した解像度補完処理を行わない場合(実線)と解像度補完処理を行う場合(点線)のようになる。
これにより、解像度補完技術を伴った電子ズームの撮影であるか否かによって、シーンの評価を行うことが可能となり、より好ましいシーンの抽出をシーン解析部310は自動的に行うことができる。
なお、上記すべての実施の形態で説明した評価の方法(特に評価の嗜好)は、すべて一例であり上記の評価方法に限定されるものではない。例えば、視聴者の好む映像の種類に応じて評価の方法をかえてもよい。
また、上記の実施の形態で示した複数の評価方法を組み合わせて評価することも当然可能である。
さらに、シーン解析部310が算出した属性情報に基づいて、別の属性情報(2次属性情報)を生成し、それらに基づいてシーンを評価するものであってもよい。属性情報生成部が収集する複数の属性情報から新たな属性情報を生成ることで、より高度なシーンの判別をすることも可能となる。
また、上記の実施の形態では、映像撮影装置を用いて説明したが、本発明はこれに限定されるものではない。例えば、映像撮影装置で撮影した映像を編集する映像編集装置でも同様に実施できる。この場合、映像編集装置は、映像撮影装置から撮影した映像、音声だけを受け取り、それぞれの映像、音声のみを解析することでシーン毎の属性情報を抽出する方法を採用することで実現できる。さらに、映像編集装置が、映像、音声だけでなく、属性情報等も取得できる場合は、上記の実施の形態と同様に取得した属性情報に基づいてシーンの評価を行うことができる。
本発明は、映像を撮影する映像撮影装置や、映像を編集する映像編集装置で実現することができる。特に、映像撮影時の拡大率変更(ズーム)動作に関する属性情報を利用することで、より映像としての価値が高いシーンを自動的に抽出することが可能となる。
100 ビデオカメラ
200 レンズ群
201 撮像素子
202 映像ADC
203 映像信号変換IC
204 CPU
205 クロック
206 レンズ制御モジュール
207 姿勢検出センサ
208 入力ボタン
209 ディスプレイ
210 スピーカー
211 出力I/F
212 圧縮伸張IC
213 ROM
214 RAM
215 HDD
216 音声ADC
217 マイクロフォン
218 三脚センサ
300 レンズ部
301 撮像部
302 映像AD変換部
303 信号処理部
304 映像信号圧縮部
305 撮像制御部
306 映像解析部
307 レンズ制御部
308 姿勢検出部
309 属性情報生成部
310 シーン解析部
311 再生情報生成部
312 音声解析部
313 音声信号圧縮部
314 多重化部
315 記憶部
316 ダイジェスト再生部
317 映像信号伸張部
318 映像表示部
319 音声信号伸張部
320 音声出力部
321 音声AD変換部
322 マイク部
323 外部入力部
200 レンズ群
201 撮像素子
202 映像ADC
203 映像信号変換IC
204 CPU
205 クロック
206 レンズ制御モジュール
207 姿勢検出センサ
208 入力ボタン
209 ディスプレイ
210 スピーカー
211 出力I/F
212 圧縮伸張IC
213 ROM
214 RAM
215 HDD
216 音声ADC
217 マイクロフォン
218 三脚センサ
300 レンズ部
301 撮像部
302 映像AD変換部
303 信号処理部
304 映像信号圧縮部
305 撮像制御部
306 映像解析部
307 レンズ制御部
308 姿勢検出部
309 属性情報生成部
310 シーン解析部
311 再生情報生成部
312 音声解析部
313 音声信号圧縮部
314 多重化部
315 記憶部
316 ダイジェスト再生部
317 映像信号伸張部
318 映像表示部
319 音声信号伸張部
320 音声出力部
321 音声AD変換部
322 マイク部
323 外部入力部
Claims (7)
- 映像を撮影する映像撮影装置であって、
前記映像撮影時の属性情報を生成する属性情報生成部と、
前記属性情報に含まれる前記映像の映像倍率変更方法に関する情報と、映像倍率に関する情報と、前記映像の実質的な解像度に関する情報と、映像倍率の時間変化率に関する情報と、の少なくとも一つに基づいて前記映像をシーン毎に評価するシーン解析部と、
前記評価に基づいて、前記映像の再生情報を生成する再生情報生成部と、
を備える映像撮影装置。 - 被写体からの入射した光を電気信号に変換する撮像部と、
前記撮像部へ入射する光を調整するレンズ部と、
をさらに備え、
前記映像倍率変更方法に関する情報とは、前記レンズ部での光学調整による倍率変更方法と、前記撮像部が出力する電気信号に基づいた信号処理による倍率変更方法と、の少なくとも一つを示す情報である、
請求項1に記載の映像撮影装置。 - 前記シーン解析部は、前記映像倍率に関する情報に基づくシーンの評価を、前記映像コンテンツの映像倍率と所定の倍率とを比較して評価する、
請求項1に記載の映像撮影装置。 - 前記シーン解析部は、前記映像コンテンツの実質的な解像度に関する情報に基づくシーンの評価を、前記映像コンテンツの実質的な解像度と所定の解像度とを比較して評価する、
請求項1に記載の映像撮影装置。 - 前記シーン解析部は、前記映像倍率の時間変化率に関する情報に基づくシーンの評価を、前記映像コンテンツの時間変化率と所定の時間変化率とを比較して評価する、
請求項1に記載の映像撮影装置。 - 前記シーン解析部は、該映像撮影装置の撮影状況に応じて、前記評価方法を変える、
請求項1に記載の映像撮影装置。 - 前記シーン解析部は、解像度補完処理の情報に基づいて、前記映像をシーン毎に評価する、
請求項1に記載の映像撮影装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010023878A JP2010263611A (ja) | 2009-04-07 | 2010-02-05 | 映像撮影装置 |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009092619 | 2009-04-07 | ||
| JP2010023878A JP2010263611A (ja) | 2009-04-07 | 2010-02-05 | 映像撮影装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2010263611A true JP2010263611A (ja) | 2010-11-18 |
Family
ID=43361276
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010023878A Pending JP2010263611A (ja) | 2009-04-07 | 2010-02-05 | 映像撮影装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2010263611A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015139162A (ja) * | 2014-01-23 | 2015-07-30 | キヤノン株式会社 | 音響信号処理装置、動画撮影装置およびそれらの制御方法 |
| JP2017192114A (ja) * | 2016-04-15 | 2017-10-19 | キヤノン株式会社 | 画像処理装置及び画像処理方法、プログラム、並びに記憶媒体 |
-
2010
- 2010-02-05 JP JP2010023878A patent/JP2010263611A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015139162A (ja) * | 2014-01-23 | 2015-07-30 | キヤノン株式会社 | 音響信号処理装置、動画撮影装置およびそれらの制御方法 |
| JP2017192114A (ja) * | 2016-04-15 | 2017-10-19 | キヤノン株式会社 | 画像処理装置及び画像処理方法、プログラム、並びに記憶媒体 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5685732B2 (ja) | 映像抽出装置、プログラム及び記録媒体 | |
| JP5456023B2 (ja) | 画像撮影装置、画像撮影方法、プログラム、及び集積回路 | |
| US8208792B2 (en) | Content shooting apparatus for generating scene representation metadata | |
| US8000558B2 (en) | Thumbnail generating apparatus and image shooting apparatus | |
| KR101000605B1 (ko) | 촬상 장치, 화상 기록 장치 및 화상 기록 방법 | |
| US7884860B2 (en) | Content shooting apparatus | |
| JP5106335B2 (ja) | 撮像装置及びその制御方法及びプログラム | |
| US7502560B2 (en) | Image capturing apparatus, method for recording captured image data, and captured image data processing apparatus and method | |
| JP4960121B2 (ja) | コンテンツ撮影装置 | |
| JP4992639B2 (ja) | コンテンツ撮影装置 | |
| JP2010245856A (ja) | 映像編集装置 | |
| JPWO2015098110A1 (ja) | 撮像装置、撮像システムおよび撮像方法 | |
| JP5655668B2 (ja) | 撮像装置、画像処理方法及びプログラム | |
| KR20150032165A (ko) | 결합하는 동영상의 동영상 선별 장치, 동영상 선별 방법 및 기억 매체 | |
| JP4637045B2 (ja) | 撮像装置 | |
| US20130063621A1 (en) | Imaging device | |
| JP2011119936A (ja) | 撮影装置及び再生方法 | |
| US8305467B2 (en) | Image pickup apparatus and image pickup method | |
| JP2010263611A (ja) | 映像撮影装置 | |
| US20160172004A1 (en) | Video capturing apparatus | |
| JP2011119934A (ja) | 画像撮影装置及び画像撮影方法 | |
| JP2007266659A (ja) | 撮像再生装置 | |
| JP2008205953A (ja) | 撮像装置、及び画像再生装置 | |
| JP2021002803A (ja) | 画像処理装置、その制御方法、プログラム | |
| JP2011101161A (ja) | 撮像装置、その制御方法、再生装置およびプログラム |