[go: up one dir, main page]

JP2016009039A - 撮像装置 - Google Patents

撮像装置 Download PDF

Info

Publication number
JP2016009039A
JP2016009039A JP2014128703A JP2014128703A JP2016009039A JP 2016009039 A JP2016009039 A JP 2016009039A JP 2014128703 A JP2014128703 A JP 2014128703A JP 2014128703 A JP2014128703 A JP 2014128703A JP 2016009039 A JP2016009039 A JP 2016009039A
Authority
JP
Japan
Prior art keywords
unit
level
correction
frequency spectrum
driving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014128703A
Other languages
English (en)
Inventor
啓太 園田
Keita Sonoda
啓太 園田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014128703A priority Critical patent/JP2016009039A/ja
Publication of JP2016009039A publication Critical patent/JP2016009039A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Studio Devices (AREA)

Abstract

【課題】適切にノイズ低減処理を行う。
【解決手段】入力される音声信号の周波数スペクトルの信号レベルとノイズプロファイルのレベルを周波数毎に比較してレベル抑圧をするノイズキャンセル部を有し、入力音声レベルが予め定められた閾値を下回る場合、駆動部が駆動前の周波数スペクトルと駆動中にノイズキャンセル部にてレベル抑圧された周波数スペクトルとの信号レベルを比較し、ノイズプロファイルのレベルを補正する。
【選択図】図2

Description

本発明は、撮像装置に関する。
従来、画像信号を記録すると共に音声信号を記録する撮像装置が知られている。これらの撮像装置には、装置に備えられたまたは装着されたレンズを移動する際に、レンズを移動するためのモータなどの駆動部が発生した音(駆動ノイズ、駆動雑音)を低減するものがあった(特許文献1:例えば図11)。
特開平06−349208号公報
ズームレンズ等を構成する鏡筒は、個体ばらつきや経年変化により駆動時の駆動音にレベル差が生じる。よって、レベル差に応じて鏡筒駆動時の減音処理のパラメータの補正が必要となる。
前記に記載された音声処理の技術は、鏡筒の駆動音のみを抽出してレベルを検知する構成となっていない。つまり、鏡筒の駆動音を除いた音と鏡筒駆動音の区別することができない。
よって環境音が限りなく小さい、例えば無響室や無響箱等の静音環境下でないと鏡筒の個体ばらつきによる音レベル差、経年変化による音レベル差を検知することができない。
そこで、本発明は、静音環境等の限定された環境下だけでなく、ある程度の音が存在する環境下においても、鏡筒の個体ばらつきに依る鏡筒駆動時の駆動音のレベル差や経年変化により生じる鏡筒駆動時の駆動音のレベル変化を補正する事ができ、また、限定された環境下においては鏡筒駆動時の駆動音の周波数ずれも補正できる音声信号処理装置を提供することを目的とする。
本発明の撮像装置は、撮像手段と、前記撮像手段の光学系を移動させる駆動手段と、時系列の音声データを周波数スペクトルに変換するFFT部と、入力される音声信号の周波数スペクトルの信号レベルとノイズプロファイルのレベルを周波数毎に比較してレベル抑圧をするノイズキャンセル部と、前記ノイズキャンセル部にてレベル抑圧された周波数スペクトルを時系列の音声データに戻すiFFT部と、前記周波数スペクトルの信号レベルと前記ノイズプロファイルのレベルを比較するレベル比較部と、前記ノイズプロファイルと対象とする駆動部の周波数スペクトルとの周波数ずれあるいはレベルずれを演算し、結果に応じて補正を実行するか否かを判定する補正判定部と、前記ノイズプロファイルの補正レベルを演算し補正する補正部と、前記駆動部を駆動させているか否かに応じて、前記調整手段を制御する制御手段を備え、入力音声レベルが予め定められた閾値を下回る場合、駆動部が駆動前の周波数スペクトルと駆動中にノイズキャンセル部にてレベル抑圧された周波数スペクトルとの信号レベルを比較し、ノイズプロファイルのレベルを補正する。
本発明によれば、静音環境等の限定された環境下だけでなく、ある程度の音が存在する環境下においても、鏡筒の個体ばらつきに依る鏡筒駆動時の駆動音のレベル差や経年変化により生じる鏡筒駆動時の駆動音のレベル変化を補正する事ができ、また、限定された環境化においては鏡筒駆動時の駆動音の周波数ずれも補正する事ができる。
撮像装置のブロック図である。 撮像部及び音声入力部の詳細な構成を示すブロック図である。 ノイズプロファイルの周波数スペクトルを示す図である。 ノイズキャンセル処理を表す図である。 デジタル音声信号の周波数スペクトルを表す図である。 音声信号の周波数スペクトルを表す図である。 音声信号の周波数スペクトルを表す図である。 補正パラメータを示した図である。 デジタル音声信号の周波数スペクトルを表す図である。 音声信号の周波数スペクトルを表す図である。 従来例の撮像部及び、音声入力部の構成を示すブロック図である。
以下、図面を参照して本発明の実施例を詳細に説明する。
本実施例では、撮像装置について図1から図10を用いて説明する。図1は、実施例1の撮像装置100の構成を示すブロック図である。
図1において、撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。撮影レンズは、内蔵型のレンズであっても、着脱式のレンズであっても良い。また、撮像素子は、CCD、CMOS等に代表される光電変換素子であればよい。
音声入力部102は、内蔵または音声端子を介して接続されたマイクにより、撮像装置100の周辺の音声を集音し、アナログデジタル変換、音声処理などを行い音声データを生成する。マイクは、指向性、無指向性を問わないが、本実施例では無指向性のマイクを使用するものとする。メモリ103は、撮像部101により得られた画像データや、音声入力部102により得られた音声データを一時的に記憶する。表示制御部104は、撮像部101により得られた画像データに係る映像や、撮像装置100の操作画面、メニュー画面等を表示部105や、不図示の映像端子を介して外部のディスプレイに表示させる。
符号化処理部106は、メモリ103に一時的に記憶された画像データや音声データを読み出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成する。また、音声データに関しては圧縮しないようにしてもよい。圧縮画像データは、例えば、MPEG2やH.264/MPEG4−AVCなど、どのような圧縮方式で圧縮されたものであってもよい。また、圧縮音声データも、AC3、AAC、ATRAC、ADPCMなどのような圧縮方式で圧縮されたものであってもよい。
記録再生部107は、記録媒体108に対して、符号化処理部106で生成された圧縮画像データ、圧縮音声データまたは音声データ、各種データを記録したり、記録媒体108から読出したりする。ここで、記録媒体108は、画像データ、音声データ、等を記録することができれば、磁気ディスク、光学式ディスク、半導体メモリなどのあらゆる方式の記録媒体を含む。
制御部109は、撮像装置100の各ブロックに制御信号を送信することで撮像装置100の各ブロックを制御することができ、各種制御を実行するためのCPUやメモリなどからなる。制御部109で使用するメモリは、各種制御プログラムを格納するROM、演算処理のためのRAM等であり、制御部109外付けのメモリも含む。操作部110は、ボタンやダイヤルなどからなり、ユーザの操作に応じて、指示信号を制御部109に送信する。
本実施例の撮像装置では、動画記録開始、終了を指示するための撮影ボタン、光学的、電子的に画像を拡大、縮小する指示するためのズームレバー、各種調整をするための十字キー、決定キーなどからなる。音声出力部111は、記録再生部107により再生された音声データや圧縮音声データ、または制御部109により出力される音声データをスピーカ112や音声端子などに出力する。外部出力部113は、記録再生部107により再生された圧縮映像データや圧縮音声データ、音声データなどを外部機器に出力する。データバス114は、音声データや画像データ等の各種データ、各種制御信号を撮像装置100の各ブロックに供給する。
ここで、本実施例の撮像装置100の通常の動作について説明する。本実施例の撮像装置100は、ユーザが操作部110を操作して電源を投入する指示が出されたことに応じて、不図示の電源供給部から、撮像装置の各ブロックに電源を供給する。
電源が供給されると、制御部109は、操作部110のモード切り換えスイッチが、例えば、撮影モード、再生モード等のどのモードであるかを操作部110からの指示信号により確認する。動画記録モードでは、撮像部101により得られた画像データと音声入力部102により得られた音声データとを1つのファイルとして保存する。再生モードでは、記録媒体108に記録された圧縮画像データを記録再生部107により再生して表示部105に表示させる。
動画記録モードでは、まず、制御部109は、撮影待機状態に移行させるように制御信号を撮像装置100の各ブロックに送信し、以下のような動作をさせる。
撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。そして、得られた画像データを表示処理部104に送信し、表示部105に表示させる。ユーザはこの様にして表示された画面を見ながら撮影の準備を行う。
音声入力部102は、複数のマイクにより得られたアナログ音声信号をデジタル変換し、得られた複数のデジタル音声信号を処理して、マルチチャンネルの音声データを生成する。そして、得られた音声データを音声出力部111に送信し、接続されたスピーカ112や不図示のイヤホンから音声として出力させる。ユーザは、この様にして出力された音声を聞きながら記録音量を決定するためのマニュアルボリュームの調整をすることもできる。
次に、ユーザが操作部110の記録ボタンを操作することにより撮影開始の指示信号が制御部109に送信されると、制御部109は、撮像装置100の各ブロックに撮影開始の指示信号を送信し、以下のような動作をさせる。
撮像部101は、撮影レンズにより取り込まれた被写体の光学像を撮像素子により画像信号に変換し、アナログデジタル変換、画像調整処理などを行い、画像データを生成する。そして、得られた画像データを表示処理部104に送信し、表示部105に表示させる。また、得られた画像データをメモリ103送信する。
音声入力部102は、複数のマイクにより得られたアナログ音声信号をデジタル変換し、得られた複数のデジタル音声信号を処理して、マルチチャンネルの音声データを生成する。そして、得られた音声データをメモリ103に送信する。また、マイクが一つの場合には、得られたアナログ音声信号をデジタル変換し音声データを生成し、音声データをメモリ103に送信する。
符号化処理部106は、メモリ103に一時的に記憶された画像データや音声データを読み出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成する。
そして、制御部109は、これらの圧縮画像データ、圧縮音声データを合成し、データストリームを形成し、記録再生部107に出力する。音声データを圧縮しない場合には、制御部109は、メモリ103に格納された音声データと圧縮画像データとを合成し、データストリームを形成して記録再生部107に出力する。
記録再生部107は、UDF、FAT等のファイルシステム管理のもとに、データストリームを一つの動画ファイルとして記録媒体108に書き込んでいく。
以上の動作を撮影中は継続する。そして、ユーザが操作部110の記録ボタンを操作することにより撮影終了の指示信号が制御部109に送信されると、制御部109は、撮像装置100の各ブロックに撮影終了の指示信号を送信し、以下のような動作をさせる。
撮像部101、音声入力部102は、それぞれ画像データ、音声データの生成を停止する。符号化処理部106は、メモリに記憶されている残りの画像データと音声データとを読出して所定の符号化を行い、圧縮画像データ、圧縮音声データ等を生成し終えたら動作を停止する。音声データを圧縮しない場合には、当然、圧縮画像データの生成が終わったら動作を停止する。
そして、制御部109は、これらの最後の圧縮画像データと、圧縮音声データまたは音声データとを合成し、データストリームを形成し、記録再生部107に出力する。
記録再生部107は、UDF、FAT等のファイルシステム管理のもとに、データストリームを一つの動画ファイルとして記録媒体108に書き込んでいく。そして、データストリームの供給が停止したら、動画ファイルを完成させて、記録動作を停止させる。
制御部109は、記録動作が停止すると、撮影待機状態に移行させるように制御信号を撮像装置100の各ブロックに送信して、撮影待機状態に戻る。
次に、再生モードでは、制御部109は、再生状態に移行させるように制御信号を撮像装置100の各ブロックに送信し、以下のような動作をさせる。
記録媒体108に記録された圧縮画像データと圧縮音声データとからなる動画ファイルを記録再生部107が読出して、読出された圧縮画像データ、圧縮音声データは、符号化処理部106に送る。
符号化処理部106は、圧縮画像データ、圧縮音声データを復号してそれぞれ、表示制御部104、音声出力部111に送信する。表示制御部104は、復号された画像データを表示部105に表示させる。音声出力部111は、復号された音声データを内蔵または、取付けられた外部スピーカから出力させる。本実施例の撮像装置100は以上のように、画像、音声の記録再生を行うことができる。
本実施例では、音声入力部102において、音声信号を得る際に、マイクにより得られた音声信号のレベル調整処理等の処理をしている。この処理は、装置が起動してから常に行われてもよいし、撮影モードが選択されてから行われてもよい、または、音声の記録に関連するモードが選択されてから行われても良い。また、音声の記録に関連するモードにおいて、音声の記録が開始したことに応じて上記の処理を行ってもよい。本実施例では、動画像撮影の開始されたタイミングで上記の処理を行うようにしたものとする。
図2は、本実施例の撮像装置100の撮像部101、音声入力部102の詳細な構成を示すブロック図である。
撮像部101は、被写体の光学像を取り込むレンズ201等の光学系、レンズ201により取り込まれた被写体の光学像を電気信号(画像信号)に変換させる撮像素子202を有している。さらに、撮像素子202により得られたアナログ画像信号をデジタル画像信号に変換し、画質調整処理をして画像データを形成し、メモリに送信する画像処理手段203を有している。さらに、レンズ201を移動させるための位置センサ、モータ等の公知の駆動メカニズムを有するレンズ制御部204を有している。本実施例では撮像部101にレンズ201、レンズ制御部204が内蔵されているように記載しているが、これらは着脱可能な交換レンズであっても良い。
例えば、ズーム動作、フォーカス調整などの指示を、ユーザが操作部110を操作して入力すると、制御部109は、レンズ制御部204にレンズを移動させる制御信号(駆動信号)を送信する。レンズ制御部204は、この制御信号に応じて、位置センサでレンズ201の位置を確認し、モータ等の駆動部でレンズ201の移動を行う。また、画像処理部203により得られた画像や被写体との距離を制御部109が確認し、自動的に調整する場合は、レンズを駆動させる制御信号を送信することになる。また、画像のブレを防止する、いわゆる防振機能を備えている場合には、制御部109は、不図示の振動センサにより検出された振動に基づいて、レンズ201を移動させるための制御信号をレンズ制御部204に送信することになる。
このときに、本実施例の撮像装置100は、レンズ201の移動による駆動ノイズやレンズ201を移動させるためのモータの駆動ノイズが発生することになる。本実施例では、制御部109からのレンズを駆動させる制御信号に応じて、レンズ制御部204は、レンズを駆動させる。すなわち、制御部109は、駆動ノイズが発生するタイミングを知る(検出するまたは、決定する)ことができる。
本実施例において、レンズ201は、例えば最大で6倍、最小で1倍の拡大、縮小を光学的に行うことができる。これを本実施例では光学ズームと言う。光学ズームは、制御部109からの指示で、レンズ制御部204が、レンズ201のレンズを移動させることで、被写体の光学像を拡大させるものである。また、画像処理部203は、撮像素子202により得られた画像信号の一部を拡大した画像信号を出力する電子ズーム(拡大)機能を備えている。また、撮像素子202により得る画像の範囲を広くし、画像処理部203で画像サイズを縮小した画像信号を出力する電子ズーム(縮小)機能を備えている。
また、音声入力部102の音声処理は、音声振動を電気信号に変換し、音声信号を出力するマイク205、マイク205により得られたアナログ音声信号をデジタル音声信号に変換するAD変換部206を有している。また、AD変換された時間領域のデジタル音声信号を高速フーリエ変換して周波数領域のデジタル音声信号に変換するFFT部207、FFT部207により変換された周波数領域のデジタル音声信号の或るサンプルタイミングにおける周波数スペクトルの信号レベルをメモリ208に記憶されている周波数スペクトルが持つ各周波数ごとの信号レベルと比較し、周波数毎に抑圧処理を施すノイズキャンセル部209を有している。さらに、抑圧処理された後の周波数領域のデジタル信号を時間軸に逆変換してデジタル音声信号を生成するiFFT部210、iFFT部210により生成された時間領域のデジタル音声信号の振幅を所定のレベルに抑えるためのオートレベルコントローラ(以後、ALC)211、音声信号に所定の処理を行い音声データを形成しメモリ103へ送信する音声処理部212を有している。
本実施例におけるメモリ208に記録された周波数スペクトルは、例えば、被写体の光学像を拡大するためにレンズ201を移動(以降、拡大駆動)するときに対応する「拡大時の周波数スペクトル」を有している。また、被写体の光学像を縮小するためにレンズ201を移動(以降、縮小駆動)するときに対応する「縮小時の周波数スペクトル」を有している。本実施例ではレンズ201を移動する場合について説明したが、これ以外の駆動部についてそれぞれに異なる周波数スペクトルを有し、同様の処理をしてもよい。
このメモリ208に記録された周波数スペクトルの例を示した図が図3である。図3において(A1)は、拡大駆動するときに対応する「拡大時の周波数スペクトル」を示す。また、(B1)は、縮小駆動するときに対応する「縮小時の周波数スペクトル」を示す。本実施例はこれらをノイズプロファイルと呼ぶ。
本実施例においてデジタル音声信号は、48KHz、16bitのサンプリングである。周波数スペクトルは、レンズ201を移動している期間のスペクトルの信号レベルを512ポイントFFT部207で求め、周波数スペクトルとして算出している。本実施例においては、「拡大時の周波数スペクトル」(以後ノイズプロファイルA1)と「縮小時の周波数スペクトル」(以後ノイズプロファイルB1)を例として図3に図示している。勿論、レンズ201以外の駆動部についてそれぞれに異なる周波数スペクトルを有し、同様の処理をしてもよい。
次にレンズ201がレンズ制御部204の駆動部により移動するときのノイズキャンセル処理について説明する。ユーザによる操作部110の操作により、被写体の光学像を拡大するためにレンズ201が移動する(拡大駆動)場合について説明する。ユーザにより操作部110が拡大操作されると、制御部109は、レンズ制御部204に、被写体の光学像を拡大する方向にレンズが移動するように制御信号を送信する。レンズ制御部204はこの制御信号に応じて、被写体の光学像を拡大する方向にレンズ201が移動するようにモータ等を駆動する。このとき、レンズ201が駆動部の駆動により移動する間、制御部109は、ノイズキャンセル部209に対して、レンズ201が拡大駆動することを示す制御信号を送信する。
そして、マイク205により得られたアナログ音声信号はAD変換部206によりデジタル音声信号に変換され、FFT部207により周波数領域に変換されたデジタル音声信号をノイズキャンセル部209に送信する。ノイズキャンセル部209は、レンズ201が拡大駆動することを示す制御信号を制御部109から受信しているので、メモリ208からノイズプロファイルA1を読み出す。ノイズプロファイルA1を用いたノイズキャンセル部209のノイズキャンセル処理を図4に示す。FFT部207により周波数領域にへ変換されたデジタル信号の周波数スペクトルをA2として示す。
本実施例においてデジタル音声信号は、48KHz、16bitのサンプリングである。周波数スペクトルは、レンズ201を移動している期間、ある一定の短期間においてスペクトルの信号レベルを512ポイントFFT部207で求め、周波数スペクトルA2として算出している。ノイズプロファイルA1と周波数スペクトルA2の512ポイントでのレベルを比較し、4段階に分類して抑圧量を決定している。図4に示すように例として、ノイズプロファイルA1と周波数スペクトルA2の一致度を比較して、(1)48dB抑圧、(2)36dB抑圧、(3)24dB抑圧、(4)抑圧なしとする。勿論、抑圧量は、変更しても構わないし、4段階も問わない。ノイズキャンセル部209により前記抑圧処理を施されたデジタル音声データは、iFFT部210により時間領域のデジタル音声信号に逆変換され、その後、ALC部211によりALC処理、音声処理部211によりデジタル音声データに所定の処理を行い音声データを形成してメモリ103へ送信する。
ユーザによる操作部110の操作により、被写体の光学像を縮小するためにレンズ201が移動する(縮小駆動)場合のノイズキャンセル処理についても、拡大駆動時と同様に、ノイズキャンセル部209が、レンズ201が縮小駆動することを示す制御信号を制御部109から受信して、メモリ208からノイズプロファイルB1を読み出して、FFT部207により周波数領域にへ変換されたデジタル信号の周波数スペクトルに対し信号レベルを比較して、4段階に分類して抑圧量を決定する。勿論、レンズ201以外の駆動部についても、それぞれに異なるノイズプロファイルをメモリ208に格納し、FFT部207は制御部109の制御信号により、読み出すプロファイルを変更してノイズキャンセル動作を実施する。
本実施例では図2において、マイクが一つの場合について説明したが、複数のマイクを使用するようにしてもよい。この場合、ノイズプロファイルをマイク共通にしてノイズキャンセル処理をするようにしてもよい。しかし、それぞれのマイクに対応するノイズプロファイルを個別に設けるようにすると、さらに雑音低減効果を高めることができる。これは、マイクによって、配置された位置などの影響により、それぞれのマイクに入力される駆動雑音のレベルが異なるため、個別に雑音を低減することが望ましいからである。
次に、図2を用いて、本実施例におけるノイズプロファイルの補正について説明する。図2において、レベル比較部213は、FFT部207により変換された周波数領域のデジタル音声信号の周波数スペクトルの信号レベルとメモリ208に格納されたノイズプロファイルのレベルを比較するものである。補正判定部214は、レベル比較部213の比較結果を受けて、補正判定の条件を満たした場合、メモリ208に格納されたノイズプロファイルを補正するか否かを判定する。(補正判定の条件についての説明は後述する)。補正部216は、補正判定部214からの補正判定結果を受けて、メモリ208に格納されたノイズプロファイルを補正する。
ここで、補正判定部214が補正判定をする条件について説明する。まず、第一の条件について説明する。補正判定部214は、レベル比較部の比較結果如何により、メモリ208に格納されたノイズプロファイルを補正するか否かを判定する。補正判定部214は、レベル比較部の比較結果を以って、補正判定手段を変更する。第一の補正判定手段として、メモリ208に格納されたノイズプロファイルとノイズキャンセル部208から出力されるノイズキャンセル後のデジタル音声信号の周波数スペクトルを比較することに依る。(詳細の処理については後述する。)また、/第二の補正判定手段として、レンズ201がレンズ制御部204の駆動部により移動する時のイズキャンセル部208から出力されるノイズキャンセル後のデジタル音声信号と、レンズ201が移動する直前のバッファ1に格納されたノイズキャンセル未処理のデジタル音声信号の夫々の所定の周波数帯のみの平均値とメモリ208に格納された補正パラメータを比較することに依る。(補正パラメータについての説明は後述する。)補正判定部214が補正判定をする第一の条件として、第一の補正判定手段もしくは、第二の補正判定手段による比較結果によりメモリ208に格納されたノイズプロファイルの補正が必要か否かである。
次に、補正判定部214が補正判定をする第二の条件について説明する。ユーザーが操作部110により補正処理を指示すると、制御部109は、補正判定部214と補正部216に対して、補正処理司令を示す制御信号を送信する。補正判定部214が補正判定をする第二の条件として、ユーザーにより補正処理の操作が為されたか否かである。
次に、補正判定部214が補正判定をする第三の条件について説明する。制御部109は、カウンターとメモリを内蔵しており、レンズ201の駆動回数をカウントして記録し、メモリに記録されている予め定められた規定の回数を超えたら、補正判定部214と補正部216に対して、補正処理司令を示す制御信号を送信する。また制御部109は、カウンターが規定の回数を超えたらリセットする。カウンターとメモリは外部に別で構成しても勿論良いものとする。補正判定部214が補正判定をする第三の条件としては、レンズ201等の駆動部の駆動回数が規定の回数を超えたか否かである。補正判定部214は、前記条件1においてノイズプロファイルの補正が必要と判定された場合、かつ前記条件2においてユーザーにより補正処理の操作が為された場合において、補正実行を判定をする。また、補正判定部214は、前記条件1においてノイズプロファイルの補正が必要と判定された場合、かつ前記条件3においてレンズ201等の駆動部の駆動回数が規定の回数を超えた場合において、補正実行を判定をする。
次に本実施例における音声入力部102の音声レベル補正処理について説明する。まずユーザによる操作部110の操作により、被写体の光学像を拡大するためにレンズ201が移動する(拡大駆動)場合について説明する。ユーザによる操作部110の操作により、被写体の光学像を拡大するためにレンズ201が移動する(拡大駆動)と、制御部109は、補正判定部214と補正部216に対して、レンズ201が駆動部の駆動により移動する間、レンズ201が拡大駆動することを示す制御信号を送信する。また、マイク205により得られたアナログ音声信号はAD変換部206によりデジタル音声信号に変換され、さらにFFT部207により変換された周波数領域のデジタル音声信号がレベル比較部213に送信される。ここでレベル比較部213は、FFT部207からのデジタル音声信号の周波数スペクトルの信号レベルとメモリ208に格納された拡大駆動時のノイズプロファイルA1のレベルを比較する。
実施例においてデジタル音声信号は、48KHz、16bitのサンプリングである。周波数スペクトルは、レンズ201を拡大駆動する直前の、ある一定の短期間においてスペクトルを512ポイントFFT部207で求め、周波数スペクトルXとして算出している。図5は、前述のノイズプロファイルA1、レンズ201を拡大駆動する直前のデジタル音声信号の周波数スペクトルXを表す。補正判定部214は、レベル比較部213の結果により、前述の補正判定手段を決定する。周波数全帯域において周波数スペクトルXがノイズプロファイルA1を下回る場合、例えば周波数スペクトルX1とノイズプロファイルA1の関係にある場合に補正判定部214は前述の第一の補正判定手段を選定する。周波数全帯域において周波数スペクトルXがノイズプロファイルA1を下回らなかった場合、補正判定部214は、周波数スペクトルXとノイズプロファイルA1夫々の予め定められた特定の周波数帯の平均値を比較する。予め定められた特定の周波数帯の平均値においては、周波数スペクトルXがノイズプロファイルA1を下回る場合、例えば周波数スペクトルX2とノイズプロファイルA1の関係の様に予め定められた特定周波数帯F1においては、周波数スペクトルXの平均値がノイズプロファイルA1の平均値を下回る場合に補正判定部214は前述の第二の補正判定手段を選定する。予め定められた特定の周波数帯の平均値においても、周波数スペクトルXがノイズプロファイルA1を上回る場合、例えば周波数スペクトルX3とノイズプロファイルA1の関係にある場合には、補正判定部214は補正判定を実施しない。
ここで第一の補正判定手段について説明する。補正判定部214は、バッファに格納されたレンズ201を拡大駆動する直前の音声信号の周波数スペクトルの信号レベルと、ノイズキャンセル部209によりノイズキャンセル処理の施されたレンズ201の拡大駆動中の周波数スペクトルの夫々512ポイントのレベルを比較する。バッファ215は、随時ある一定の短期間においてスペクトルの信号レベルを512ポイントFFT部207で求め、周波数スペクトルとして格納される。補正判定部214は、前述の2種類の周波数スペクトルの夫々512ポイント分のレベルを比較した(以後、このレベル比較の処理をプロファイルチェック1と記述)結果、予め定められた閾値よりも大きな差分が算出された場合、そのポイントをワーニングする。例えば図6の様に、拡大駆動する直前の音声信号の周波数スペクトルX1aに対し、拡大駆動中の音声信号の周波数スペクトルX1bがF3、F4の周波数帯でのポイントで閾値以上の差分が算出された場合、その周波数帯でのポイントをワーニングする。更に補正判定部214は、前述のプロファイルチェック1を所定回数実施し、ワーニングした回数が所定回数以上となるポイントを補正実行ポイントと判定する。例えば図6の様に、周波数スペクトルX1aと周波数スペクトルX1bのF3、F4の周波数帯でのポイントのレベル差が所定回数以上閾値を超え、ワーニングされた場合、F3、F4の周波数帯でのポイントが補正手段1実行ポイントと判定される。
次に、第二の補正判定手段について説明する。補正判定部214は、バッファに格納されたレンズ201を拡大駆動する直前の音声信号の周波数スペクトルの予め定められた特定の周波数帯の平均値と、ノイズキャンセル部209によりノイズキャンセル処理の施されたレンズ201の拡大駆動中の周波数スペクトルの予め定められた特定の周波数帯の平均値を比較する。例えば、図7の様に、予め定められた特定の周波数帯F1において、夫々拡大駆動する直前の音声信号の周波数スペクトルX2aとノイズキャンセル処理を施された拡大駆動中の周波数スペクトルX2bの平均値の差分αを算出する。ここで、補正判定部209は、メモリ208に格納された補正パラメータと前述の算出した夫々のある特定周波数帯F1での周波数スペクトルの平均値の差分αから、補正レベルを算出する。
ここで補正パラメータについて説明する。図8は補正パラメータを示した図である。横軸にレンズ201が拡大駆動していない一定期間の音声信号の周波数スペクトルの予め定められた特定の周波数帯域F1の平均レベルを示し、縦軸に拡大駆動している一定期間の一定期間の音声信号の周波数スペクトルの予め定められた特定の周波数帯域F1の平均レベルから拡大駆動していない一定期間の音声信号の周波数スペクトルの予め定められた特定の周波数帯域F1の平均レベルを引いたレベルを示す。前記の関係を求める場合、音圧レベル[dB]は相対尺度のため音圧[μPa]で算出 する。駆動部が駆動していないある一定期間の間入力される音声信号のレベル、つまり環境音の音圧レベルをS[dB]、音圧をs[μPa]と表し、駆動部が駆動しているある一定期間の間入力される音声信号のレベルから駆動部が駆動していないある一定期間の間入力される音声信号、つまり駆動部駆動音の音圧レベルをN[dB]、音圧をn[μPa]と表し、駆動部が駆動しているある一定期間の間入力される音声信号のレベル、つまり駆動部駆動音と環境音を足した音圧レベルをS+N[dB]、音圧をs+n[μPa]と表すとする。この時後述の計算式が成り立つ。
S=20log10(s/p0
N=20log10(n/p0
S+N=20log10(10^(S/10)+10^(N/10))
※p0は基準値(p0=20μPa)
前記式より、図8で前述の横軸に拡大駆動していない一定期間の音声信号の周波数スペクトルの予め定められた特定の周波数帯域F1の平均レベルを示し、縦軸に拡大駆動している一定期間の一定期間の音声信号の周波数スペクトルの予め定められた特定の周波数帯域F1の平均レベルから拡大駆動していない一定期間の音声信号の周波数スペクトルの予め定められた特定の周波数帯域F1の平均レベルを引いたレベルの関係を導いている。
補正判定部214は、前述の算出した夫々のある特定周波数帯F1での周波数スペクトルの平均値の差分αと横軸上のレベルが同レベルであり、補正パラメータ上にあるデフォルトレベルβとの差分を算出する(以後、この算出の処理をプロファイルチェック2と記述)。前述のプロファイルチェック2の結果、予め定められた閾値よりも大きな差分が算出された場合、補正判定部214はワーニングする。更に補正判定部214は、前述のプロファイルチェック2を所定回数実施し、ワーニングした回数が所定回数以上となる場合、補正手段2実行と判定する。
続いて、補正判定部214は、前述の補正判定の条件1かつ2を満たした場合、もしくは、条件1かつ3を満たした場合、補正実行を判定する。またこの場合、補正判定部214は、条件1において、補正判定手段1における判定か、補正判定手段2における判定か、又、補正判定手段1における判定の場合は補正手段1実行ポイントも判定に付与する。
次に、補正部216は、補正判定部214の判定結果を受けて、補正処理を実行する。ここで、補正判定部214が補正判定手段1により補正実行を判定した場合の補正処理1について説明する。
ユーザーによる操作部110の操作により、被写体の光学像を拡大するためにレンズ201が移動する(拡大駆動)と、制御部109は、補正判定部214と補正部216に対して、レンズ201が駆動部の駆動により移動する間、レンズ201が拡大駆動することを示す制御信号を送信する。また、マイク205により得られたアナログ音声信号はAD変換部206によりデジタル音声信号に変換され、さらにFFT部207により変換された周波数領域のデジタル音声信号がレベル比較部213に送信される。ここでレベル比較部213は、FFT部207からのデジタル音声信号の周波数スペクトルの信号レベルとメモリ208に格納された拡大駆動時のノイズプロファイルA1のレベルを比較する。
実施例においてデジタル音声信号は、48KHz、16bitのサンプリングである。周波数スペクトルは、レンズ201を拡大駆動する直前の、ある一定の短期間においてスペクトルの信号レベルを512ポイントFFT部207で求め、周波数スペクトルYとして算出している。図9は、前述のノイズプロファイルA1、レンズ201を拡大駆動する直前のデジタル音声信号の周波数スペクトルY1を表す。
補正部216は、レベル比較部213からの結果を受け、図9の様に補正手段1実行ポイントの周波数帯において、周波数スペクトルY1がノイズプロファイルA1を下回る場合、補正処理の実行を進める。逆に周波数スペクトルY1がノイズプロファイルA1を上回る場合、補正処理の実行を中止する。続いて、補正部216は、バッファ217に格納されたレンズ201を拡大駆動する直前の音声信号の周波数スペクトルの信号レベルと、ノイズキャンセル部209によりノイズキャンセル処理の施されたレンズ201の拡大駆動中の周波数スペクトルの夫々補正手段1実行ポイントのレベルを比較する。バッファ215は、随時ある一定の短期間においてスペクトルの信号レベルを512ポイントFFT部207で求め、周波数スペクトルとして格納される。補正部216は、前述の2種類の周波数スペクトルの夫々補正手段1実行ポイント分のレベルを比較した(以後、このレベル比較の処理をプロファイル補正1と記述)結果、予め定められた閾値よりも大きな差分が算出された場合、メモリ208に格納されたノイズプロファイルA1のレベルを補正する。例えば図10の様に、拡大駆動する直前の音声信号の周波数スペクトルY1aに対し、拡大駆動中の音声信号の周波数スペクトルY1bがF3、F4の周波数帯でのポイントで閾値以上の差分が算出された場合、メモリ208に格納されたノイズプロファイルA1のその周波数帯でのポイントのレベルに対し、算出結果分の補正を実施する。前述のプロファイル補正1の処理は、レンズ201の縮小駆動の場合においても、同様の処理を実施する。比較する対象が、縮小駆動時のノイズプロファイルとなるのみである。
次に、補正判定部214が補正判定手段2により補正実行を判定した場合の補正処理2を説明する。レベル比較部213の比較結果の処理までは、前述の補正処理1と同様である。前述しているが、図5は、前述のノイズプロファイルA1、レンズ201を拡大駆動する直前のデジタル音声信号の周波数スペクトルXを表す。レベル比較部213の比較結果を受けて、補正部216は、例えば周波数スペクトルX2とノイズプロファイルA1の関係の様に予め定められた特定周波数帯F1において、周波数スペクトルX2の平均値がノイズプロファイルA1の平均値を下回る場合に補正部216は補正処理の実行を進める。予め定められた特定の周波数帯の平均値においても、周波数スペクトルXがノイズプロファイルA1を上回る場合は、補正処理の実行を中止する。
続いて、補正部216は、バッファ217に格納されたレンズ201を拡大駆動する直前の音声信号の周波数スペクトルの予め定められた特定の周波数帯の平均値と、ノイズキャンセル部209によりノイズキャンセル処理の施されたレンズ201の拡大駆動中の周波数スペクトルの予め定められた特定の周波数帯の平均値を比較する。処理内容としては、補正判定手段2と同様の処理を実施する。例えば、前述の図7の様に、予め定められた特定の周波数帯F1において、夫々拡大駆動する直前の音声信号の周波数スペクトルX2aとノイズキャンセル処理を施された拡大駆動中の周波数スペクトルX2bの平均値の差分αを算出する。ここで、補正部216は、メモリ208に格納された補正パラメータと前述の算出した夫々のある特定周波数帯F1での周波数スペクトルの平均値の差分αから、補正レベルを算出する。図8の補正パラメータについては、前述の通りである。補正部216は、前述の算出した夫々のある特定周波数帯F1での周波数スペクトルの平均値の差分αと横軸上のレベルが同レベルであり、補正パラメータ上にあるデフォルトレベルβとの差分を算出する(以後、この算出の処理をプロファイル補正2と記述)。
前述のプロファイル補正2の結果、予め定められた閾値よりも大きな差分が算出された場合、補正部216は、メモリ208に格納されたノイズプロファイルA1のその周波数帯でのポイントのレベルに対し、算出結果分の補正を実施する。前述のプロファイル補正1の処理は、レンズ201の縮小駆動の場合においても、同様の処理を実施する。比較する対象が、縮小駆動時のノイズプロファイルとなるのみである。
本実施例においては、1系統の音声が入力される場合について説明したが、それ以上のチャンネル数であっても適用することができる。
また、本実施例においては、撮像装置について説明したが、本実施例の音声入力部102にの音声処理は、外部の音声を記録、または入力するような装置であればどのような装置であっても適用することができる。例えば、ICレコーダ、携帯電話等に適用しても良い。
100 撮像装置、101 撮像部、102 音声入力部、103 メモリ、
104 表示制御部、105 表示部、106 符号化処理部

Claims (4)

  1. 撮像手段と、
    前記撮像手段の光学系を移動させる駆動手段と、
    時系列の音声データを周波数スペクトルに変換するFFT部と、
    入力される音声信号の周波数スペクトルの信号レベルとノイズプロファイルのレベルを周波数毎に比較してレベル抑圧をするノイズキャンセル部と、
    前記ノイズキャンセル部にてレベル抑圧された周波数スペクトルを時系列の音声データに戻すiFFT部と、
    前記周波数スペクトルの信号レベルと前記ノイズプロファイルのレベルを比較するレベル比較部と、
    前記ノイズプロファイルと対象とする駆動部の周波数スペクトルとの周波数ずれあるいはレベルずれを演算し、結果に応じて補正を実行するか否かを判定する補正判定部と、
    前記ノイズプロファイルの補正レベルを演算し補正する補正部と、
    前記駆動部を駆動させているか否かに応じて、前記調整手段を制御する制御手段を備え、
    入力音声レベルが予め定められた閾値を下回る場合、駆動部が駆動前の周波数スペクトルと駆動中にノイズキャンセル部にてレベル抑圧された周波数スペクトルとの信号レベルを比較し、ノイズプロファイルのレベルを補正することを特徴とする撮像装置。
  2. 前記周波数スペクトルの信号レベルが予め定められた第一の閾値以下であれば、前記補正判定部は、前記駆動部が駆動前の周波数スペクトルの信号レベルと前記駆動部が駆動中のノイズキャンセル部によりレベル抑圧された周波数スペクトルの信号レベルを比較し、比較結果に応じて補正を実行するか否かを判定することを特徴とする請求項1に記載の撮像装置。
  3. 前記周波数スペクトルの信号レベルが予め定められた第二の閾値以下であれば、前記補正判定部は、所定の周波数帯域において、前記駆動部が駆動中のノイズキャンセル部によりレベル抑圧された周波数スペクトルの信号レベルと前記駆動部が駆動前の周波数スペクトルの信号レベルの平均値と補正パラメータを比較し、比較結果に応じて補正を実行するか否かを判定することを特徴とする請求項1に記載の撮像装置。
  4. 前記操作手段から補正が指示された場合か、もしくは駆動部の駆動回数が予め定められた回数を超えた場合の条件と前記補正判定部による補正実行の判定結果が出された場合の条件との和条件により、前記補正判定部は補正処理を実行するか否かを判定することを特徴とする請求項1に記載の撮像装置。
JP2014128703A 2014-06-24 2014-06-24 撮像装置 Pending JP2016009039A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014128703A JP2016009039A (ja) 2014-06-24 2014-06-24 撮像装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014128703A JP2016009039A (ja) 2014-06-24 2014-06-24 撮像装置

Publications (1)

Publication Number Publication Date
JP2016009039A true JP2016009039A (ja) 2016-01-18

Family

ID=55226635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014128703A Pending JP2016009039A (ja) 2014-06-24 2014-06-24 撮像装置

Country Status (1)

Country Link
JP (1) JP2016009039A (ja)

Similar Documents

Publication Publication Date Title
US10535363B2 (en) Audio processing apparatus and control method thereof
JP2008263498A (ja) 風雑音低減装置、音響信号録音装置及び撮像装置
KR101739942B1 (ko) 오디오 노이즈 제거 방법 및 이를 적용한 영상 촬영 장치
US8514300B2 (en) Imaging apparatus for reducing driving noise
JP6610725B2 (ja) 音処理装置および音処理プログラム
US9462174B2 (en) Electronic device and control method
JP2010166516A (ja) 音響処理装置及びそれを備えた電子機器並びに音響処理方法
JP2016009039A (ja) 撮像装置
JP5495753B2 (ja) 撮像装置
JP2018074220A (ja) 音声処理装置
JP6985821B2 (ja) 音声処理装置及びその制御方法
US10425731B2 (en) Audio processing apparatus, audio processing method, and program
JP6929137B2 (ja) 音声処理装置及びその制御方法
JP5645373B2 (ja) 音声処理装置、音声処理方法
JP2016111478A (ja) 音声処理装置
JP2016009965A (ja) 撮像装置
JP6886352B2 (ja) 音声処理装置及びその制御方法
JP6877246B2 (ja) 音声処理装置及びその制御方法
JP5340127B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法
JP2010134260A (ja) 電子機器及び音声処理方法
JP6931296B2 (ja) 音声処理装置及びその制御方法
JP2018066963A (ja) 音声処理装置
JP5506471B2 (ja) 撮像装置
JP2023026918A (ja) 音声処理装置、音声処理装置の制御方法、及びプログラム
JP2016009952A (ja) 音声信号処理装置