JP2018066963A - 音声処理装置 - Google Patents
音声処理装置 Download PDFInfo
- Publication number
- JP2018066963A JP2018066963A JP2016207316A JP2016207316A JP2018066963A JP 2018066963 A JP2018066963 A JP 2018066963A JP 2016207316 A JP2016207316 A JP 2016207316A JP 2016207316 A JP2016207316 A JP 2016207316A JP 2018066963 A JP2018066963 A JP 2018066963A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- audio signal
- correction amount
- frequency
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【課題】 風雑音と駆動雑音が音声に重畳している場合にそれぞれの雑音を低減する。【解決手段】 入力音声信号を音声信号スペクトルへ変換する変換手段と、駆動雑音の周波数毎の振幅に関するプロファイルを記憶する記憶手段と、変換手段からの出力に基づいて減算係数を算出する算出手段と、入力音声信号に含まれる風雑音の大きさに応じて補正量を決定する補正量決定手段と、減算係数を補正量で補正する補正手段と、補正された減算係数とプロファイルとから周波数毎の雑音の低減値を決定する決定手段と、変換手段から出力された音声信号のスペクトルから低減値を減算することにより駆動雑音の低減処理を行う雑音低減手段と、雑音低減手段からの音声信号スペクトルを時間領域の音声信号に変換する逆変換手段と、逆変換手段から出力された音声信号から風雑音を低減する低減手段とを有する。【選択図】 図5
Description
本発明は音声処理装置に関する。
従来、デジタルカメラなどの撮像装置では、撮影された動画と共に音声を記録している。デジタルカメラは屋外で使用されることが多い。そのため、マイクに対して風が当たり、この風による雑音が音声に含まれてしまう。また、デジタルカメラはビデオカメラに比べて本体のサイズが小さく、レンズなどの光学系とマイクの位置が近い。そのため、絞りやレンズを駆動させるモータによる駆動音がノイズとして音声に含まれてしまう。
従来、このように、マイクからの音声に含まれる風によるノイズ(風雑音)や光学系の駆動によるノイズ(駆動雑音)を低減させる技術が提案されている。ノイズ低減の方法として、スペクトルサブトラクション(Spectral Sutraction)法(以下、SS法)が知られている(特許文献1)。
しかしながら、駆動雑音の帯域と風雑音帯域が重複する様な音声が入力された場合に、SS法で駆動雑音や風雑音の低減処理を行ったとすると、次のような問題がある。
図12は、風切り音(風雑音)と駆動音が重畳した時において、Lch、Rchの音声信号の位相ベクトルを表した図である。ここでは、例えば駆動音をズームレンズの駆動により発生する雑音(ズーム音)とする。図12(a)では風切り音R1201と風切り音L1202は逆位相に入力され、ズーム音R1203とズーム音L1204は同位相で入力されたと仮定する。
その時、風雑音の低減処理と駆動雑音の低減処理は、図12(b)のように行われる。図12(b)において、駆動雑音の低減処理1207、1208はズーム音+風切り音1205、1206からスカラー量分を差し引く。また、風雑音の低減処理1209、1210は位相差分のスカラー量を差し引く。その為、ズーム音に同位相の雑音1211が残り、抑圧できないといった課題がある。
本発明は、風雑音と駆動雑音が音声に重畳している場合に、それぞれの雑音を低減することが可能な装置を提供することを目的とする。
入力手段と、駆動手段と、前記入力手段により得られた時間領域の音声信号を一定の時間毎に分割し、周波数領域の音声信号スペクトルへ変換する変換手段と、前記駆動手段による雑音である駆動雑音の周波数毎の振幅に関するプロファイルを記憶する記憶手段と、前記変換手段からの出力信号に基づいて減算係数を算出する算出手段と、前記入力手段より得られた音声信号に含まれる風雑音の大きさに応じて、前記減算係数の補正量を決定する補正量決定手段と、前記算出手段で求めた減算係数を前記補正量決定手段により得られた補正量で補正する補正手段と、前記補正手段により補正された減算係数と、前記記憶手段に記憶されている前記プロファイルとから、周波数毎の雑音の低減値を決定する決定手段と、前記変換手段から出力された前記周波数領域の音声信号のスペクトルから、前記決定手段により得られる前記低減値を減算することにより、前記駆動雑音の低減処理を行う雑音低減手段と、前記雑音低減手段からの前記周波数領域の音声信号スペクトルを時間領域の音声信号に変換する逆変換手段と、前記逆変換手段から出力された音声信号から風雑音を低減する風雑音の低減手段とを有する。
本発明によれば、風雑音と駆動雑音が音声に重畳している場合でも、それぞれの雑音を低減することが可能となる。
(実施例1)
以下、本発明の実施形態を説明する。
以下、本発明の実施形態を説明する。
図1は本発明の音声処理装置が適用される撮像装置の構成例を示すブロック図である。図1における撮像装置100は、主に、音声処理部107で雑音の低減処理を行う。以下に説明する多くの構成要素はメモリバス117に接続され、メモリ116に対してデータのやり取りを行なっている。
メモリ116は高速でランダムアクセス可能なダイナミックRAMである。メモリ内は音声データ領域、画像データ領域、制御信号領域がある。また、音声データ領域に記憶された音声データ、及び画像データ領域に記憶された画像データ、タイミング信号領域のタイミング信号はフレーム毎にどの時刻のデータであるかを識別するように管理されている。
図1において、レンズ101は、モータ駆動部103で制御されたモータ102によりズーム動作を行う。撮像部104はレンズ101を介して結像された被写体の光学像をCCDセンサやCMOSセンサ等の撮像素子により光電変換してアナログ画像信号を生成する。そして、生成されたアナログ画像信号をデジタル信号に変換して、画像処理部105に送信する。画像処理部105は、入力されたデジタル画像信号に、設定値に応じたホワイトバランスや色、明るさ等を調整する画質調整処理を施し、メモリ116に送信し、メモリ116内の画像データ領域に記憶する。
音声入力部106は内蔵されたマイクロホンまたは音声入力端子を介して接続された外部マイク等である。音声処理部107は、音声入力部106で装置周囲の音声を収音することにより得られたアナログ音声信号をデジタル信号に変換し、レベルの適正処理、特定周波数の低減処理等の音声に関する処理を行う。音声処理部107は、後述のように、駆動雑音の低減処理や風雑音の低減処理を行う。そして、音声処理部107は、デジタル音声信号をメモリ116に送信し、メモリ116内の音声データ領域に記憶する。また、音声処理部107は、通信部109からメモリ116の音声データ領域に記憶された音声データを読み出し、同様な処理を施し、再度メモリ116の音声データ領域に記憶する。
表示部108は、例えば、液晶ディスプレイ、有機ELディスプレイ、電子ペーパー等の表示デバイスで有れば何であっても良い。例えば、表示用の画像データは画像処理部105からメモリ116の画像データ領域に一時的に記憶される。表示部108は画像データ領域から画像データを読み出してディスプレイに表示させる。
通信部109はワイヤレスマイクから送信されたデジタル音声信号を受信し、一時的にメモリ116の制御信号領域に記憶する。通信部109は、外部装置との間で通信を行うもので、例えば、音声信号、画像信号、撮影開始、終了コマンド等の撮影動作の為の制御信号等を送受信する。通信部109は、例えば、赤外線通信モジュールやBluetooth(登録商標)通信モジュール、無線LANモジュール等の無線通信モジュールである。
記録再生部110は記録媒体111に記録された画像データを読み出し(再生し)、表示部108や画像出力部114に送信する。記録媒体111は、メモリカードやHDDなどのランダムアクセスの記録媒体である。
画像出力部114は、例えば画像出力端子からなり、撮像装置100に接続された外部ディスプレイ等に映像を表示させるために画像信号を送信する。音声出力部115は、例えば、音声出力端子からなり、メモリ116の音声データ領域に記憶されている音声データを読みだして、撮像装置100に接続されたイヤホンやスピーカ等から音声を出力する為に音声信号を送信する。また、音声出力部115は、撮像装置100に内蔵され、音声信号に応じた音声を出力するスピーカであっても良い。また、画像出力部114及び音声出力部115は、統合された1つの端子、例えば、HDMI(登録商標)(High Definition Multimedia Interface)のような端子であっても良い。
操作部113は、例えば、ボタンやダイヤル等であり、ユーザの操作に応じた指示信号を制御部112に送信する。制御部112は、操作部113から送信された指示信号に基づいて、撮像装置100の各ブロックに制御信号を送信することで、各ブロックを制御する。操作部113は、例えば、電源ボタン、記録開始ボタン、メニュー表示ボタン、決定ボタン、カーソールキー、タッチパネル等である。また、制御部112は、各種処理を実行する為の、例えばCPU、DRAM、SRAM等からなる。メモリバス117は、各種データや、制御信号を撮像装置100の各ブロックに送信する為にものである。
次に、音声処理部107の内部構成を説明する。図2は、従来の音声処理部107の音声処理のフローを表すフローチャートである。S201では、SS法で駆動雑音の低減処理を行う。SS法による駆動雑音の低減処理の詳細は後述する。S202では、S201でカメラ駆動雑音処理をした音声出力を用いて、風雑音低減処理を行う。風雑音低減処理の詳細は後述する。S203では、S202までに一通りの雑音低減処理を行った音声信号に対し、一定の音量になる様に調整する為の、オートレベルコントロール処理(ALC)を行う。例えば、マイクロホンで収音された音声が小さい時には、振幅を増幅し、適正な音量の場合には振幅の増幅率を元に戻す。また、一般的には、増幅率には上限が設けられている。
以下に風雑音低減処理とSS法によるカメラ駆動雑音の低減処理の方法を説明する。
<風雑音の低減方法>
マイクロホンなどを使って屋外の音声を収音する際には風がマイクロホンにあたり、風雑音が記録されてしまうことがある。そこで、本実施形態では、左右方向からの音声を独立して収音するマイクロホン(ステレオマイク)で取得された左右それぞれの音声信号に対して、風雑音の低減処理を行う。無指向で近接する2つマイクロホンで収音された音声は、一般的に以下の様な特徴を有する。
(1)風がない環境で収音した場合、左右のマイクに同位相の音声が収音される。特に低域周波数は同位相となる。
(2)風がある環境で収音した場合、風雑音が低域周波数(約50Hz〜数kHz)程度に集中し、左右のマイクの収音では音声信号に位相差が発生する。
マイクロホンなどを使って屋外の音声を収音する際には風がマイクロホンにあたり、風雑音が記録されてしまうことがある。そこで、本実施形態では、左右方向からの音声を独立して収音するマイクロホン(ステレオマイク)で取得された左右それぞれの音声信号に対して、風雑音の低減処理を行う。無指向で近接する2つマイクロホンで収音された音声は、一般的に以下の様な特徴を有する。
(1)風がない環境で収音した場合、左右のマイクに同位相の音声が収音される。特に低域周波数は同位相となる。
(2)風がある環境で収音した場合、風雑音が低域周波数(約50Hz〜数kHz)程度に集中し、左右のマイクの収音では音声信号に位相差が発生する。
以上の2点の特徴を考慮し、風雑音の低減処理が行われる。図3(a)は、音声処理部107における風雑音の低減処理を行う回路ブロック300を示す図である。また、図3(b)はハイパスフィルタ303の振幅特性の例を表すグラフである。なお、図3(a)の風雑音処理回路300は、後述のように、SS方による雑音の低減処理が行われた後のLch、Rchの音声信号が入力され、風雑音の低減処理を行う。
図3(a)において、風雑音の低減回路300に入力されたステレオ音声信号の左チャンネル(Lch)と右チャンネル(Rch)は、加算回路301で加算、減算回路302で減算される。ハイパスフィルタ回路303では、例えば図3(b)のような風雑音に多く含まれる周波数帯域である50kHz以下の成分を減衰させる。ハイパスフィルタ303は、減算回路302で求めたステレオ音声信号の差分値の低域周波数を除去して出力する。ここでは、例えば1kHzで3dB減衰するフィルタとする。
ハイパスフィルタ303の出力と加算回路301からの出力を加算回路304で加算し、コントローラ307で加算回路304の出力の音量を半分に調整してLch音声出力部に出力する。また、減算回路305により、加算回路301からの出力からハイパスフィルタ303の出力を減算し、コントローラ307で減算回路305の出力の音量を半分に調整してRch音声出力部に出力する。このように、風雑音低減回路300により、入力音声に含まれる風雑音が低減される。
<SS法による駆動雑音の低減処理方法>
SS法を用いた駆動雑音の低減処理の構成について、図4(a)を用いて説明する。図4(a)において、ノイズプロファイル401、402は、低減対象となる雑音の周波数成分をノイズプロファイルとして記憶する。具体的には、低減対象となる雑音のみから成る音声信号をフーリエ変換し、周波数成分を得る。このとき、低減対象となる雑音がある程度の時間(例えば4秒間)続く場合は、雑音が続く時間内における周波数成分の時間変化に対して、ピークホールドしたものがノイズプロファイルとなる。また、ノイズプロファイル401、402に記憶されるノイズプロファイルは、ある程度復元可能な形であれば圧縮されていてもよい。記憶されているノイズプロファイルの、圧縮、非圧縮は限定されない。また、ノイズプロファイル401、402は、記憶しているノイズプロファイルを、周波数成分比較部405、406と加減算器411、412へ送信する。
SS法を用いた駆動雑音の低減処理の構成について、図4(a)を用いて説明する。図4(a)において、ノイズプロファイル401、402は、低減対象となる雑音の周波数成分をノイズプロファイルとして記憶する。具体的には、低減対象となる雑音のみから成る音声信号をフーリエ変換し、周波数成分を得る。このとき、低減対象となる雑音がある程度の時間(例えば4秒間)続く場合は、雑音が続く時間内における周波数成分の時間変化に対して、ピークホールドしたものがノイズプロファイルとなる。また、ノイズプロファイル401、402に記憶されるノイズプロファイルは、ある程度復元可能な形であれば圧縮されていてもよい。記憶されているノイズプロファイルの、圧縮、非圧縮は限定されない。また、ノイズプロファイル401、402は、記憶しているノイズプロファイルを、周波数成分比較部405、406と加減算器411、412へ送信する。
フーリエ変換部403、404は、入力された音声信号を一定の時間毎(フレーム)毎に分割する。そして、分割した時間領域のデジタル音声信号に対してフーリエ変換を行い、周波数領域の音声信号スペクトルに変換する。その結果、音声信号の周波数毎の位相情報と、周波数毎の振幅の絶対値(周波数成分)、を算出する。また、フーリエ変換部403、404は、算出した周波数成分を周波数成分比較部45、406と雑音低減部413、414へ送信する。また、フーリエ変換部403、404は、算出した周波数毎の位相情報を逆フーリエ変換部415、416へ送信する。
周波数成分比較部405、406は除算器であり、フーリエ変換部403、404から送信された入力音声の周波数成分を、ノイズプロファイル記憶部401、402からのノイズプロファイルにより周波数毎に除算する。周波数成分比較部405、406は算出した周波数毎の演算結果を時間変化制御部407、408へ送信する。
時間変化制御部407、408は、周波数成分比較部405、406から送信された周波数毎の除算結果に対して、周波数毎に時間方向へローパスフィルタ(LPF)をかけることにより平滑化する。時間変化制御部407、408は、算出した周波数毎の判定結果を、減算係数算出部409、410へ送信する。
減算係数算出部409、410は、時間変化制御部407、408から送信された、周波数毎の演算結果を用いて、周波数毎の減算係数を算出する。時間変化制御部407、408の出力であるLPF出力レベル大きくなれば、徐々に減算係数γ[n]が小さくなるようなテーブルである。例えば、図4(b)の様なテーブルである。LPF出力レベルが十分に大きい場合は、低減対象とする騒音の周波数成分に対して、十分大きな所望音声の周波数成分が重畳されており、マスキング効果により、人間の聴覚では騒音をほぼ知覚できなくなる。そのため、減算係数γ[n]を小さくすることで、雑音低減部413、414により入力音声から減算されるプロファイルの大きさを小さくし、所望音声が劣化することを抑えることができる。減算係数算出部409、410は、算出した周波数毎の減算係数を乗算器411、412へ送信する。
乗算器411、412は、減算係数算出部409、410から送信された周波数毎の減算係数と、ノイズプロファイル記憶部401、402から送信されたノイズプロファイルとを、周波数毎に乗算する。乗算器411、412の周波数毎の演算結果を、減算係数スペクトルとする。乗算器411、412は、算出した減算係数スペクトルを雑音低減部413、414へ送信する。
雑音低減部413、414は減算器であり、フーリエ変換部403、404から送信される周波数成分から、乗算器411、412から送信される減算係数スペクトルを減算することで、騒音が低減された周波数毎のスペクトルを得る。雑音低減部413、414で得られたスペクトルを、雑音低減スペクトルとする。雑音騒音低減部413、414は、雑音低減スペクトルを逆フーリエ変換部415、416へ送信する。
逆フーリエ変換部415、416は、雑音低減部413、414から送信される雑音低減スペクトルに対して、フーリエ変換部403、404から送信される位相情報を用いて、逆フーリエ変換(フーリエ逆変換)を行う。即ち、周波数領域の音声信号スペクトルを時間領域の音声信号に変換する逆変換処理を行う。そして、雑音が低減されたデジタル音声信号を得る。逆フーリエ変換部415、416は、復元した雑音低減後のデジタル音声信号を信号出力制御部Lch、Rchへ送信する。
以上、風雑音の低減処理回路と、SS方式を用いた雑音低減処理回路について説明した。次に、本実施例における、音声処理部107による雑音の低減処理について説明する。
図5は、本実施例における、雑音の低減処理の回路を示す図である。雑音低減回路500は音声処理部107に含まれる。雑音低減回路500は、SS法による駆動雑音の低減処理を行う。駆動雑音は、図1におけるモータ102の駆動により発生する雑音である。なお、図4(a)と共通するブロックに関しては同一の番号を付加し、詳細な説明を省略する。
雑音低減回路500には、音声入力部106から入力された、LchとRchの音声信号をデジタル信号に変換した後のデジタル音声信号が入力される。また、雑音低減回路500からのLch、Rchの音声信号が、図3の風雑音処理回路300に出力される。
雑音低減回路500においては、入力音声に含まれる風雑音の成分の大きさに応じてノイズプロファイルの補正量を調整する。図5において、補正量決定部511では、高速フーリエ変換回路503、504で出力された周波数帯域毎の音声データを用いて、Lch、Rchの音声信号の位相の異なる低域周波数を検出し、減衰係数γ[n]を補正する為の補正値αを決定する。
図6(a)は、補正量決定部511による減衰係数γ[n]の補正量αを決定する処理を示すフローチャートである。雑音低減回路500では、入力音声に含まれる風雑音の成分の大きさに応じてノイズプロファイルの補正量を調整する。そのため、入力音声に含まれる風雑音の成分を検出する処理を行う。S601において、風検出の評価値を初期化する。S602では、フーリエ変換部401、402から送信した音声スペクトルの周波数帯域に、閾値thf以上の周波数帯域が含まれていないを判定する。閾値thf以上の周波数帯域が含まれていない場合、S603に移行する。また、閾値thf以上の周波数帯域が含まれている場合、フローを終了する。この時の音声スペクトルの周波数の閾値であるthfは、音声信号に風雑音が多く集中する帯域である1kHz程度に設定する。
S603では、フーリエ変換部401、402の出力であるステレオマイクの音声スペクトルの位相特性を比較する。前述のように、音声に風雑音が含まれている場合、音声の低域周波数帯域では、周波数の位相が無相関であるため、ある閾値thφ以上の位相差があればS604に移行する。また、位相差が閾値thφ以下であれば、風雑音が含まれていないとして、S602に移行する。この時、図1の撮像装置100としてのデジタルカメラは、LchとRchのマイクの間の距離が小さいと考えられる。通常、マイク間距離が小さい場合、ステレオマイクに入ってくる音声は、低域周波数帯域であるthf以下では、ほぼ同位相の音声が収音できる。
S604では、フーリエ変換部401、402の出力であるステレオマイクの音声スペクトルの振幅を比較する。風雑音が含まれる音声スペクトルでは、振幅が大きい。そのため、左右の音声スペクトルの振幅がある閾値thA以上あれば、風雑音が含まれていると判定し605に移行する。また、振幅がある閾値thA以下であれば、S602に移行する。
S605では、S602からS604までの条件に合っていた場合、その音声スペクトルには風雑音が含まれているとして、風検出の評価値を1加算する。S606では、風検出の評価値がある閾値thn以上であれば、S607に移行する。閾値thn以下であればS602に移行する。S607では、例えば図7(a)の様な風検出の評価値に対する減衰係数γの補正量αを決めておく。S606で求めた風検出の評価値を参照して補正量αを決定し、フローを終了する。補正量αは風検出の評価値が大きければ補正量αも大きくする。この時、図7(a)は風検出の評価値がある一定値以上になった場合、補正量αを一定に設定したが、状況に応じてどのように設定しても良い。
減衰係数補正部512、513では、このように補正量決定部511で求めた補正量αを用いて、減衰係数算出部509で算出した減衰係数γ[n]を補正する。乗算器411、412は、減算係数補正部512、513から出力された周波数毎の減算係数と、ノイズプロファイル記憶部401、402から送信されたノイズプロファイルとを、周波数毎に乗算する。これにより、ノイズプロファイルに基づく、周波数毎の雑音の低減値が決定される。
図7(b)は減衰係数γ[n]を補正量αにより補正したグラフを示す。図7(b)では、補正量決定部511で求めた補正量αを音声レベル毎の減衰係数γに加算する。ここでは、補正方法として、補正量αを加算したが、状況に応じて補正量αを変えても良い。
このように、本実施形態では、風雑音が含まれる場合、その大きさに応じてノイズプロファイルの減衰係数を補正する。具体的には、風雑音の大きさが大きいほど、プロファイルが大きくなるように減衰係数の補正量が決定される。そのため、風雑音が含まれていると判断される場合には、入力音声から減算されるノイズプロファイルの成分がより大きくなるように補正される。減衰係数γ[n]に補正量αを加算することで、SS法を用いた駆動雑音の低減処理時には、低域で駆動音が残留する課題を解決出来る。
(実施例2)
本実施例では、減衰係数γの補正方法に関する説明を行う。本実施例の雑音低減回路の構成は、実施例1の構成と同様の構成を持つ為、説明は省略する。ただし、補正量決定部511の構成が実施例1と異なる為、以下に詳細を述べる。
本実施例では、減衰係数γの補正方法に関する説明を行う。本実施例の雑音低減回路の構成は、実施例1の構成と同様の構成を持つ為、説明は省略する。ただし、補正量決定部511の構成が実施例1と異なる為、以下に詳細を述べる。
図8は、本実施例における補正量決定部511の処理を説明するフローチャートである。また、図9は、減衰係数γ[n]を補正量αにより補正したグラフを示す。S801では、補正量決定部511で、音声信号のレベルが閾値以上かどうかを判定する。S802では、音声信号のレベルが閾値以上であれば、レベルに応じた減衰係数γに対し補正量αを加算する。また、図9の様に補正後、減衰係数1.0以上の値は減衰係数1.0にする。
S803では、音声信号が閾値以下であれば、補正量αは設定せず、減衰係数補正部510、511では減衰係数γの補正を行わない。S804では、S802、S803で補正した、減衰係数γ[n]をプロファイル501、502にかけて、プロファイルを更新する。
本実施例では、ステレオマイクから得られた、音声信号のレベルが閾値より小さい場合は、風雑音が入ってきたとしても補正量αを加算しない。音声信号が閾値以上のレベルであれば、補正量α分を加算する。
このように、音声信号のレベルに応じて、補正量αを加算するかを決定することで、音声信号のレベルが小さい場合に補正しすぎないように駆動雑音及び風雑音を低減することができる。
(実施例3)
図10及び図11を用いて本実施例における雑音低減回路1000を説明する。本実施例の雑音低減回路1000の構成は、実施例1及び実施例2の構成における図5の騒音低減装置の構成と比較し、ノイズプロファイル生成部1001、1002が異なる。
図10及び図11を用いて本実施例における雑音低減回路1000を説明する。本実施例の雑音低減回路1000の構成は、実施例1及び実施例2の構成における図5の騒音低減装置の構成と比較し、ノイズプロファイル生成部1001、1002が異なる。
図10は、本実施例の雑音低減回路1000の構成を示す図である。また、図11はSS法による駆動雑音の低減処理を行う為のプロファイル生成を行うための概念図である。ノイズプロファイル生成部1001、1002は、低減対象となる雑音の周波数成分示すノイズプロファイルを記憶する。具体的には、図11において低減対象の雑音が発生する前の音声1101及び低減対象の雑音1102から成る音声信号をフーリエ変換し、音声信号1101の周波数成分Rt1[i]と音声信号1102の周波数成分Rt2[i]を得る。この時周波数成分Rt1[i]とRt2[i]は、振幅のスカラー量である。また、iは周波数のサンプル数で、サンプリング定理により音声データのサンプル数Nだとすると、iはN/2となる。つまり音声データのサンプル数N=1024の場合、周波数のサンプル数は、i=512となる。
時間t2の騒音周波数成分(Rt2)から時間t1の雑音を含まない音声の周波数成分(Rt1)を差し引く事で、雑音のみの周波数成分、つまりノイズプロファイルRpを算出する。
Rp[i]=Rt2[i]−Rt1[i] 式(1)
Rp[i]=Rt2[i]−Rt1[i] 式(1)
算出した低減対象の雑音のみの周波数成分Rpをノイズプロファイルとして記憶し、雑音低減部413、414において、騒音低減処理をする。
このように、騒音が発生する毎にノイズプロファイルを生成することで、それぞれの騒音に適した低減処理が行えるようになる。
Claims (7)
- 入力手段と、
駆動手段と、
前記入力手段により得られた時間領域の音声信号を一定の時間毎に分割し、周波数領域の音声信号スペクトルへ変換する変換手段と、
前記駆動手段による雑音である駆動雑音の周波数毎の振幅に関するプロファイルを記憶する記憶手段と、
前記変換手段から出力された信号に基づいて減算係数を算出する算出手段と、
前記入力手段より得られた音声信号に含まれる風雑音の大きさに応じて、前記減算係数の補正量を決定する補正量決定手段と、
前記算出手段で求めた減算係数を前記補正量決定手段により得られた補正量で補正する補正手段と、
前記補正手段により補正された減算係数と、前記記憶手段に記憶されている前記プロファイルとから、周波数毎の雑音の低減値を決定する決定手段と、
前記変換手段から出力された前記周波数領域の音声信号のスペクトルから、前記決定手段により得られる前記低減値を減算することにより、前記駆動雑音の低減処理を行う雑音低減手段と、
前記雑音低減手段からの前記周波数領域の音声信号スペクトルを時間領域の音声信号に変換する逆変換手段と、
前記逆変換手段から出力された音声信号から風雑音を低減する風雑音の低減手段と、
を有することを特徴とする音声処理装置。 - 前記補正量決定手段は、前記入力手段より得られた音声信号に風雑音が多く含まれているほど前記低減値が大きくなるように前記補正量を決定することを特徴とする請求項1に記載の音声処理装置。
- 前記補正量決定手段は、前記変換手段から出力された音声信号スペクトルの振幅特性及び位相特性から風雑音の評価値を求め、前記評価値に基づいて前記補正量を決定することを特徴とする請求項1に記載の音声処理装置。
- 前記入力手段はステレオ音声信号を入力し、
前記補正量決定手段は、前記変換手段から出力された、前記ステレオ音声信号の左チャンネルと右チャンネルの音声信号スペクトルにおける位相差、及び、振幅の大きさに応じて前記評価値を求めることを特徴とする請求項3に記載の音声処理装置。 - 前記補正手段は、前記補正量決定手段により決定された前記補正量を音声レベル毎の減算係数に加算して補正することを特徴とする請求項1に記載の音声処理装置。
- 前記算出手段は、前記プロファイルを前記変換手段から出力された音声信号スペクトルにより除算した結果の時間変化が大きいほど、前記減算係数を小さくすることを特徴とする請求項1に記載の音声処理装置。
- 前記算出手段は、前記変換手段から出力された音声信号スペクトルと、前記プロファイルとの比を周波数毎に求め、前記周波数毎の比を、一定の時間に対して周波数毎に平滑化した結果に基づいて、前記減算係数を算出することを特徴とする請求項6に記載の音声処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016207316A JP2018066963A (ja) | 2016-10-21 | 2016-10-21 | 音声処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016207316A JP2018066963A (ja) | 2016-10-21 | 2016-10-21 | 音声処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2018066963A true JP2018066963A (ja) | 2018-04-26 |
Family
ID=62086098
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016207316A Pending JP2018066963A (ja) | 2016-10-21 | 2016-10-21 | 音声処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2018066963A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2023509593A (ja) * | 2020-01-24 | 2023-03-09 | コンチネンタル オートモーティブ システムズ インコーポレイテッド | 風雑音減衰のための方法及び装置 |
-
2016
- 2016-10-21 JP JP2016207316A patent/JP2018066963A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2023509593A (ja) * | 2020-01-24 | 2023-03-09 | コンチネンタル オートモーティブ システムズ インコーポレイテッド | 風雑音減衰のための方法及び装置 |
| JP7352740B2 (ja) | 2020-01-24 | 2023-09-28 | コンチネンタル オートモーティブ システムズ インコーポレイテッド | 風雑音減衰のための方法及び装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2008263498A (ja) | 風雑音低減装置、音響信号録音装置及び撮像装置 | |
| CN102780948B (zh) | 风噪声抑制器、半导体集成电路和风噪声抑制方法 | |
| US20080317261A1 (en) | Wind Noise Reduction Device | |
| US9495950B2 (en) | Audio signal processing device, imaging device, audio signal processing method, program, and recording medium | |
| CN109285554B (zh) | 一种回声消除方法、服务器、终端及系统 | |
| JP5998483B2 (ja) | 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体 | |
| US10535363B2 (en) | Audio processing apparatus and control method thereof | |
| CN103078599B (zh) | 一种音视频播放设备及音量控制方法 | |
| JP2008263483A (ja) | 風雑音低減装置、音響信号録音装置及び撮像装置 | |
| US20150271439A1 (en) | Signal processing device, imaging device, and program | |
| JP6610725B2 (ja) | 音処理装置および音処理プログラム | |
| US9160460B2 (en) | Noise cancelling device | |
| JP5349062B2 (ja) | 音響処理装置及びそれを備えた電子機器並びに音響処理方法 | |
| JP7616785B2 (ja) | バイノーラル記録を処理するための方法及びデバイス | |
| JP2018066963A (ja) | 音声処理装置 | |
| JP7770883B2 (ja) | 撮影装置、制御方法、およびプログラム | |
| JP2015114444A (ja) | 音声処理装置、音声処理方法 | |
| JP2019192963A (ja) | ノイズ軽減装置、ノイズ軽減方法およびプログラム | |
| JP2018074220A (ja) | 音声処理装置 | |
| JP6985821B2 (ja) | 音声処理装置及びその制御方法 | |
| JP7781535B2 (ja) | 音声処理装置、制御方法、およびプログラム | |
| JP2019070688A (ja) | 撮像装置 | |
| JP5473786B2 (ja) | 音声信号処理装置、及びその制御方法 | |
| JP2018207313A (ja) | 音声処理装置及びその制御方法 | |
| JP2016111478A (ja) | 音声処理装置 |