JP2015050685A

JP2015050685A - オーディオ信号処理装置および方法、並びにプログラム

Info

Publication number: JP2015050685A
Application number: JP2013182022A
Authority: JP
Inventors: 明文河野; Akifumi Kono; 徹知念; Toru Chinen; 辻　実; Minoru Tsuji; 実辻
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2013-09-03
Filing date: 2013-09-03
Publication date: 2015-03-16
Also published as: CN104426495A; US9836272B2; US20150063600A1

Abstract

【課題】共振帯域信号だけでなく入力信号も考慮してゲイン調整量を算出することで、より適切なゲイン調整を行うことができ、より高品質な音声を得ることができるオーディオ信号処理装置を提供する。
【解決手段】帯域分割部２１は、入力信号を共振帯域信号と共振帯域外信号とに分割し、分析部２２は、共振帯域信号と入力信号から共振分析特徴量を抽出する。ゲイン調整量算出部２３は、共振帯域信号と入力信号の共振分析特徴量に基づいて、共振帯域のゲイン調整量を算出し、ゲイン調整部２４は、ゲイン調整量に基づいて入力信号の共振帯域のゲイン調整を行う。その結果、より高品質な音声を得ることができる。ノート型のパーソナルコンピュータに適用することができる。
【選択図】図１

Description

本技術はオーディオ信号処理装置および方法、並びにプログラムに関し、特に、より高品質な音声を得ることができるようにしたオーディオ信号処理装置および方法、並びにプログラムに関する。

近年、ノート型のパーソナルコンピュータ等のポータブル機器の小型化が進み、スピーカと、基盤やキーボード等の部品とが必然的に近い位置に配置されてしまう状況や、部品自体が小型化および薄型化している状況があり、音声を再生する際に共振が起こりやすい。

しかし、共振に対するハード的な対策はコストがかかるため、低コストでできる範囲の対策に止まるか、あるいは共振は仕方のないものとされ、その結果として音質が犠牲にされてしまう状況がある。

また、共振に対する対策として、共振が起こらないように音声全体の音量を下げるという方法があるが、音源によっては音量が小さくなりすぎて聞こえない、あるいは音質に満足できないといった場合がある。これに対して、ノッチフィルタ等で共振周波数帯域のゲインを抑圧することで共振を抑圧する技術が提案されている。

ところで、映画コンテンツや音楽コンテンツを、ノート型のパーソナルコンピュータ等の小型スピーカを内蔵したポータブル機器で再生する場合、全体的に音声の音量が小さくなってしまうことが知られている。

そこで、音声をより聞きやすくするために、音声のオーディオ信号の再生レベルを強調する技術がある（例えば、特許文献１および特許文献２参照）。この技術では、入力されたオーディオ信号の分析結果に応じて振幅変換関数の特性が動的に変化し、再生レベルが強調される。

特開２０１２−６０３７９号公報特開２０１２−２３５３１０号公報

しかしながら、上述した技術では、十分に高品質な音声を得ることができなかった。

例えば、共振現象においては共振帯域の信号レベルが同じでも共振帯域以外の信号レベルによって共振の大きさが変わる場合がある。そのため、ノッチフィルタ等の共振帯域のみで抑圧ゲイン量を決めてしまう技術では、抑圧する必要のない信号に対してもゲインを抑圧してしまい、音声の音量や音質に悪影響が出てしまう。

さらに、再生レベルを強調する技術では、ノート型のパーソナルコンピュータ等で再生レベルを強調すると、前述の共振がより大きくなり、音声の音質への悪影響も大きくなってしまう。また、共振を抑えるために再生レベルの強調量を十分に大きくすることもできなかった。そのため、十分に高品質な音声を得ることができなかった。

本技術は、このような状況に鑑みてなされたものであり、より高品質な音声を得ることができるようにするものである。

本技術の一側面のオーディオ信号処理装置は、音声の入力信号を帯域分割して共振帯域信号を生成する帯域分割部と、前記共振帯域信号および前記入力信号から各々の特徴量を抽出する分析部と、前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出するゲイン調整量算出部と、前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行うゲイン調整部とを備える。

前記ゲイン調整量算出部には、学習により生成された統計解析モデルを用いて、前記特徴量に基づき前記ゲイン調整量を算出させることができる。

前記ゲイン調整量算出部には、複数の前記共振帯域ごとに前記ゲイン調整量を算出させ、前記ゲイン調整部には、前記複数の前記共振帯域ごとにゲイン調整を行わせることができる。

オーディオ信号処理装置には、前記入力信号から抽出された再生レベル強調特徴量と、学習により生成された前記再生レベル強調特徴量からマッピング制御情報を得るための情報とに基づいて、前記マッピング制御情報を決定するマッピング制御情報決定部と、前記マッピング制御情報により定まる線形または非線形なマッピング関数に基づいて、ゲイン調整された前記入力信号を振幅変換するマッピング処理部とをさらに設け、前記ゲイン調整量算出部には、前記マッピング制御情報と前記分析部で抽出した前記特徴量に基づいて前記ゲイン調整量を算出させることができる。

前記ゲイン調整量を、前記入力信号に含まれる前記共振帯域信号の割合が大きくなるほど、大きくなるようにすることができる。

前記帯域分割部には、前記入力信号を前記共振帯域信号と共振帯域外信号とに分割させ、前記ゲイン調整部には、前記共振帯域信号のゲイン調整を行わせ、オーディオ信号処理装置には、ゲイン調整された前記共振帯域信号と、前記共振帯域外信号とを加算する加算部をさらに設けることができる。

本技術の一側面のオーディオ信号処理方法またはプログラムは、音声の入力信号を帯域分割して共振帯域信号を生成し、前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行うステップを含む。

本技術の一側面においては、音声の入力信号が帯域分割されて共振帯域信号が生成され、前記共振帯域信号および前記入力信号から各々の特徴量が抽出され、前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量が算出され、前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整が行われる。

本技術の一側面によれば、より高品質な音声を得ることができる。

なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載された何れかの効果であってもよい。

オーディオ信号処理装置の構成例を示す図である。共振帯域成分抑圧処理を説明するフローチャートである。共振の発生について説明する図である。ゲイン調整モデルの例を示す図である。オーディオ信号処理装置の構成例を示す図である。共振帯域成分抑圧処理を説明するフローチャートである。オーディオ信号処理装置の構成例を示す図である。共振帯域成分抑圧処理を説明するフローチャートである。オーディオ信号処理装置の構成例を示す図である。共振帯域成分抑圧処理を説明するフローチャートである。マッピング制御モデルについて説明する図である。マッピング関数について説明する図である。コンピュータの構成例を示す図である。

以下、図面を参照して、本技術を適用した実施の形態について説明する。

〈第１の実施の形態〉
〈オーディオ信号処理装置の構成例〉
図１は、本技術を適用したオーディオ信号処理装置の構成例を示す図である。例えば、オーディオ信号処理装置は、ノート型のパーソナルコンピュータなどからなる。

オーディオ信号処理装置１１は、帯域分割部２１、分析部２２、ゲイン調整量算出部２３、ゲイン調整部２４、および加算部２５を有している。オーディオ信号処理装置１１では、音声のオーディオ信号である入力信号が、帯域分割部２１および分析部２２に供給される。

帯域分割部２１は、例えば帯域通過フィルタからなり、入力信号に対する帯域分割を行って、供給された入力信号から共振帯域信号と共振帯域外信号を生成する。すなわち、入力信号に対する帯域分割により、入力信号が共振帯域信号と共振帯域外信号とに分割される。帯域分割部２１は、共振帯域信号を分析部２２およびゲイン調整部２４に供給するとともに、共振帯域外信号を加算部２５に供給する。

ここで共振帯域信号は、入力信号のうちの予め定められた共振が生じる周波数、すなわち共振周波数の帯域成分からなる信号である。したがって、共振帯域信号は入力信号のうちの抑圧したい共振帯域成分の信号である。

また、共振帯域外信号は、入力信号から共振帯域成分を除去して得られる成分の信号である。すなわち、共振帯域外信号は、入力信号のうちの共振周波数以外の周波数帯域成分の信号であり、抑圧する必要のない周波数帯域成分の信号である。

分析部２２は、供給された入力信号と、帯域分割部２１から供給された共振帯域信号とから共振分析特徴量を抽出し、ゲイン調整量算出部２３に供給する。ゲイン調整量算出部２３は、分析部２２から供給された共振分析特徴量に基づいて、入力信号の共振帯域成分を抑圧する最適なゲイン調整量を算出し、ゲイン調整部２４に供給する。

ゲイン調整部２４は、ゲイン調整量算出部２３から供給されたゲイン調整量に基づいて、帯域分割部２１から供給された共振帯域信号の振幅を変換することで、共振帯域信号のゲイン調整を行い、その結果得られた共振帯域信号を加算部２５に供給する。

加算部２５は、ゲイン調整部２４から供給された共振帯域信号と、帯域分割部２１から供給された共振帯域外信号とを加算することで、入力信号における共振帯域成分が抑圧された信号である出力信号を生成し、出力する。

〈共振帯域成分抑圧処理の説明〉
次に、オーディオ信号処理装置１１の動作について説明する。

オーディオ信号処理装置１１は、入力信号が供給されると、共振帯域成分を抑圧する共振帯域成分抑圧処理を開始して出力信号を生成する。以下、図２のフローチャートを参照して、オーディオ信号処理装置１１による共振帯域成分抑圧処理について説明する。

ステップＳ１１において、帯域分割部２１は、供給された入力信号を共振帯域信号と共振帯域外信号とに分割して、共振帯域信号を分析部２２およびゲイン調整部２４に供給するとともに、共振帯域外信号を加算部２５に供給する。例えば帯域通過フィルタにより入力信号に対するフィルタ処理が行われ、共振帯域信号と共振帯域外信号とが生成される。

ステップＳ１２において、分析部２２は、供給された入力信号と、帯域分割部２１から供給された共振帯域信号とから共振分析特徴量を抽出し、ゲイン調整量算出部２３に供給する。

具体的には、例えば分析部２２は入力信号における処理対象となっているｎ番目のサンプルを中心とするＮ個のサンプルからなる入力信号の区間について、次式（１）を計算することにより入力信号の二乗平均平方根RMS_ab(n)を算出し、共振分析特徴量とする。

なお、式（１）において、x(m)は入力信号のｍ番目のサンプルを示しており、入力信号は、各サンプルx(m)の値が-1.0≦x(m)≦1.0となるように正規化されているものとする。

また、分析部２２は共振帯域信号における処理対象となっているｎ番目のサンプルを中心とするＮ個のサンプルからなる共振帯域信号の区間について、次式（２）を計算することにより共振帯域信号の二乗平均平方根RMS_rb(n)を算出し、共振分析特徴量とする。

なお、式（２）において、x_rb(m)は共振帯域信号のｍ番目のサンプルを示しており、共振帯域信号は、各サンプルx_rb(m)の値が-1.0≦x_rb(m)≦1.0となるように正規化されているものとする。

このようにして得られた入力信号の二乗平均平方根RMS_ab(n)と、共振帯域信号の二乗平均平方根RMS_rb(n)とが共振分析特徴量としてゲイン調整量算出部２３に供給される。

なお、ここでは共振分析特徴量として二乗平均平方根を求める例について説明したが、共振分析特徴量は、その他、どのようなものであってもよい。例えば二乗平均平方根に加えて、二乗平均平方根のｔ乗値（但し、ｔ≧２）や、トーン性の強さ、共振帯域をさらに細かく分割して求めたトゥルーピークなどを共振分析特徴量として追加したり、それらの任意の組み合わせを共振分析特徴量としたりしてもよい。その他、二乗平均平方根や、二乗平均平方根のｔ乗値、トーン性の強さ、トゥルーピークなどの対数値を共振分析特徴量として用いてもよい。

また、入力信号および共振帯域信号の分析にあたり、帯域通過フィルタを用いる例について説明したが、他のフィルタを用いてもよいし、周波数領域での入力信号の分割や特徴量の抽出、分析を行うようにしてもよい。

ステップＳ１３において、ゲイン調整量算出部２３は、分析部２２から供給された共振分析特徴量に基づいて、入力信号の共振帯域成分を抑圧する最適なゲイン調整量を算出し、ゲイン調整部２４に供給する。

例えば、共振現象を詳しく解析すると共振帯域信号のレベル、すなわち共振帯域信号の二乗平均平方根RMS_rb(n)の値が同じ場合でも入力信号のレベル、すなわち二乗平均平方根RMS_ab(n)の値によって共振度合いが変わることが分かる。

ここで、簡単な信号の例を図３に示す。なお、図３において縦軸および横軸は振幅および周波数を示しており、周波数軸におけるＦは共振周波数を示している。

図３では、折れ線Ｃ１１および折れ線Ｃ１２は、それぞれ異なる信号の周波数特性を表している。例えば折れ線Ｃ１１は入力信号としての共振しやすい信号の周波数特性を表しており、折れ線Ｃ１２は入力信号としての共振し難い信号の周波数特性を表している。

折れ線Ｃ１１と折れ線Ｃ１２を比較すると、それぞれの信号における共振周波数帯域、すなわち共振周波数Ｆの信号レベル（振幅）はＬＶ１１となっており、同じである。しかし、折れ線Ｃ１１に示す信号は、共振周波数Ｆの成分が支配的であるため共振しやすい傾向がある。すなわち、折れ線Ｃ１１に示す信号の共振周波数Ｆの成分のレベルは、他の周波数成分のレベルと比較して、突出して大きな値となっている。

これに対して、折れ線Ｃ１２に示す信号は、共振周波数Ｆの成分が支配的ではないため共振し難い、あるいは共振が気にならないという傾向がある。

折れ線Ｃ１２に示す信号のように、入力信号の共振周波数Ｆの成分のレベルだけでなく、他の周波数成分のレベルも大きい場合には、共振帯域信号のゲイン調整量は折れ線Ｃ１１に示す信号についてのゲイン調整量と比べて小さくてもよいことが多い。そのため、折れ線Ｃ１１に示す信号と、折れ線Ｃ１２に示す信号とで共振帯域信号のゲイン調整量を同じ値としてしまうと、必要以上に折れ線Ｃ１２に示す信号のゲインを抑圧してしまい、音量や音圧に悪影響がでてしまう。

そこで、オーディオ信号処理装置１１は、共振帯域信号のゲイン調整量を算出する際には共振帯域信号のレベルだけでなく、入力信号のレベル、すなわち入力信号全体の帯域とのバランスも考慮することで、必要以上にゲインが抑圧されてしまうことを防止する。

具体的には、例えばゲイン調整量算出部２３は、事前に統計解析に基づいて学習されたゲイン調整モデルを用いてゲイン調整量を求める。

ゲイン調整モデルの学習では、ゲイン調整量F(X,Y)が被説明変数とされ、学習用のオーディオ信号から抽出された二乗平均平方根RMS_ab(n)および二乗平均平方根RMS_rb(n)、それらの二乗平均平方根の二乗値、並びに二乗平均平方根やその二乗値とは無関係なオフセット項が説明変数とされる。そして、ゲイン調整量算出部２３には、それらの被説明変数と説明変数とに基づいて事前に学習された、次式（３）に示す統計解析モデルがゲイン調整モデルとして記録されている。

なお、式（３）においてａ，ｂ，ｃ，ｄ，ｅは、それぞれモデルパラメータである。

ここで、式（３）におけるＸを二乗平均平方根RMS_ab(n)とし、Ｙを二乗平均平方根RMS_rb(n)としたときのゲイン調整モデルの学習結果例を図４に示す。

図４では、横軸であるＸ軸、および縦軸であるＹ軸は、それぞれ二乗平均平方根RMS_ab(n)、および二乗平均平方根RMS_rb(n)を示している。また、各領域の濃度はゲイン調整量F(X,Y)を示しており、濃度が濃いほどゲイン調整量の絶対値が大きい、すなわち共振帯域の抑圧量が大きくなる。

この例では、入力信号に含まれる共振帯域信号の割合が大きくなるほど、ゲイン調整量が大きくなり、共振帯域の成分がより大きく抑圧されるようになる。例えば、二乗平均平方根RMS_ab(n)の値が一定の値である場合には、共振帯域信号のパワー、つまり二乗平均平方根RMS_rb(n)が大きいほどゲイン調整量の絶対値は大きくなる。

このように、入力信号と共振帯域信号との関係に基づいて、適切なゲイン調整量を定めることで、共振帯域成分を必要以上に抑圧してしまうことを防止し、より適切なゲイン調整を行うことができるようになる。

なお、ゲイン調整モデルとしてのモデルパラメータの学習時には、共振が生じるオーディオ信号と、共振が生じないオーディオ信号とが学習データとして用いられ、複数の学習データごとに、学習データを再生したときの最適なゲイン調整量が人間によって予め定められる。また、学習データから抽出された共振分析特徴量が説明変数として用いられる。この場合、実際に人が最適であると感じるゲイン調整量、つまり実際の人の感覚を学習に反映させることができるので、最適なゲイン調整モデルを得ることができるようになる。

ゲイン調整量算出部２３は、このような学習により生成されたゲイン調整モデルを用いて、分析部２２から供給された共振分析特徴量としての二乗平均平方根RMS_ab(n)および二乗平均平方根RMS_rb(n)に基づいて、ゲイン調整量を算出する。具体的には、二乗平均平方根RMS_ab(n)と二乗平均平方根RMS_rb(n)が上述した式（３）に代入され、その結果得られたF(X,Y)の値がゲイン調整量とされる。

なお、ここではゲイン調整量の算出方法として統計解析モデルを用いた手法について説明したが、簡単な線形または非線形の関数やテーブルを用いてゲイン調整量を算出するようにしてもよい。

図２のフローチャートの説明に戻り、ステップＳ１３においてゲイン調整量が算出されると、処理はステップＳ１４に進む。

ステップＳ１４において、ゲイン調整部２４はゲイン調整量算出部２３からのゲイン調整量に基づいて、帯域分割部２１からの共振帯域信号の振幅を変換することで、共振帯域信号のゲイン調整を行い、加算部２５に供給する。これにより、入力信号における共振帯域のゲイン調整が行われたことになる。

ステップＳ１５において、加算部２５はゲイン調整部２４から供給された共振帯域信号と、帯域分割部２１から供給された共振帯域外信号とを加算して出力信号を生成し、出力する。出力信号が出力されると、共振帯域成分抑圧処理は終了する。

以上のようにして、オーディオ信号処理装置１１は、入力信号と共振帯域信号とから共振分析特徴量を抽出し、共振分析特徴量に基づいて求められたゲイン調整量で共振帯域信号のゲイン調整を行う。

このように入力信号と共振帯域信号とから抽出した共振分析特徴量を用いてゲイン調整量を求めることで、より適切に入力信号の共振帯域成分を抑圧し、より高品質な音声を得ることができるようになる。

具体的には、例えば共振帯域の信号レベルに対して共振帯域外の信号レベルが小さい、つまり共振が大きい信号に対してはゲインが大きく抑圧されることになる。逆に、共振帯域の信号レベルに対して共振帯域外の信号レベルが小さくない、つまり共振しない信号、または共振が気にならない信号に対してはゲインが抑圧されないことになる。

このように、オーディオ信号処理装置１１によれば、共振の大きさに応じた最適な共振抑圧が可能となる。これにより、共振帯域信号が必要以上にゲイン抑圧されてしまうことを防止し、大音量かつ良音質な音声を得ることが可能となる。

また、共振に対してハード的な対策を取らなくてよくなるため、デザイン上の制約がなくなる、その分だけ低コストになる、あるいは他の部分にコストをかけて高機能化や高品質化を図るといったことが可能になる。

〈第２の実施の形態〉
〈オーディオ信号処理装置の構成例〉
なお、第１の実施の形態では、入力信号から１つの共振帯域信号を分割抽出する例について説明したが、共振周波数の整数倍の周波数も共振周波数となることが一般的である。

そこで、複数の共振帯域信号に対してゲイン調整することで、より効果的に共振抑圧を行うようにしてもよい。そのような場合、オーディオ信号処理装置は、例えば図５に示すように構成される。なお、図５において図１における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

図５に示すオーディオ信号処理装置５１は、帯域分割部６１、分析部２２、ゲイン調整量算出部２３、ゲイン調整部６２−１乃至ゲイン調整部６２−Ｋ、および加算部２５を有している。

帯域分割部６１は、供給された入力信号をＫ個の共振帯域信号と、１つの共振帯域外信号とに分割する。ここで、Ｋ個の共振帯域信号は、入力信号の互いに異なる共振帯域成分からなる信号であり、それらの共振帯域はともに共振が生じる周波数帯域となっている。例えば、Ｋ個の共振帯域は、それぞれ所定の共振帯域の整数倍の帯域となっている。

帯域分割部６１は、Ｋ個の共振帯域信号を分析部２２およびゲイン調整部６２−１乃至ゲイン調整部６２−Ｋに供給するとともに、共振帯域外信号を加算部２５に供給する。

分析部２２は、供給された入力信号と、帯域分割部６１から供給されたＫ個の共振帯域信号のそれぞれとから共振分析特徴量を抽出し、ゲイン調整量算出部２３に供給する。ゲイン調整量算出部２３は、分析部２２から供給された共振分析特徴量に基づいて、Ｋ個の共振帯域ごとに、入力信号の共振帯域成分を抑圧する最適なゲイン調整量を算出し、ゲイン調整部６２−１乃至ゲイン調整部６２−Ｋに供給する。

ゲイン調整部６２−１乃至ゲイン調整部６２−Ｋは、ゲイン調整量算出部２３から供給されたゲイン調整量に基づいて、帯域分割部６１から供給された共振帯域信号の振幅を変換することで共振帯域信号のゲイン調整を行い、加算部２５に供給する。

なお、以下、ゲイン調整部６２−１乃至ゲイン調整部６２−Ｋを特に区別する必要のない場合、単にゲイン調整部６２とも称することとする。

加算部２５は、ゲイン調整部６２−１乃至ゲイン調整部６２−Ｋから供給された共振帯域信号と、帯域分割部６１から供給された共振帯域外信号とを加算して出力信号を生成し、出力する。

〈共振帯域成分抑圧処理の説明〉
次に、図６のフローチャートを参照して、オーディオ信号処理装置５１により行われる共振帯域成分抑圧処理について説明する。

ステップＳ４１において、帯域分割部６１は、供給された入力信号をＫ個の共振帯域の共振帯域信号と、１つの共振帯域外信号とに分割して、共振帯域信号を分析部２２およびゲイン調整部６２に供給するとともに、共振帯域外信号を加算部２５に供給する。

具体的には、Ｋ個の共振帯域信号が分析部２２に供給され、１番目乃至Ｋ番目の共振帯域の共振帯域信号のそれぞれが、ゲイン調整部６２−１乃至ゲイン調整部６２−Ｋのそれぞれに供給される。

ステップＳ４２において、分析部２２は、供給された入力信号と、帯域分割部６１から供給されたＫ個の共振帯域信号とから共振分析特徴量を抽出し、ゲイン調整量算出部２３に供給する。

具体的には、例えば分析部２２は、上述した式（１）の計算を行って入力信号の二乗平均平方根RMS_ab(n)を算出し、共振分析特徴量とする。

また、分析部２２は、Ｋ個の共振帯域ごとに上述した式（２）と同様の計算を行って、各共振帯域信号の二乗平均平方根RMS_rbi(n)を算出し、共振分析特徴量とする。ここで、１≦ｉ≦Ｋであり、二乗平均平方根RMS_rbi(n)はｉ番目の共振帯域の成分である共振帯域信号の二乗平均平方根を示している。

ステップＳ４３において、ゲイン調整量算出部２３は分析部２２から供給された共振分析特徴量に基づいて、Ｋ個の共振帯域ごとに入力信号の共振帯域成分を抑圧する最適なゲイン調整量を算出し、ゲイン調整部６２に供給する。

例えばゲイン調整量算出部２３は、Ｋ個の共振帯域ごとに上述した式（３）に示したゲイン調整モデル、より詳細にはモデルパラメータを記録している。このとき、ｉ番目（但し、１≦ｉ≦Ｋ）の共振帯域のゲイン調整モデルは、説明変数Ｙと被説明変数とに、それぞれ二乗平均平方根RMS_rbi(n)とｉ番目の共振帯域のゲイン調整量とが用いられて学習されたものである。

ゲイン調整量算出部２３は、二乗平均平方根RMS_ab(n)と、ｉ番目の共振帯域の二乗平均平方根RMS_rbi(n)とを、ｉ番目の共振帯域のモデルパラメータを用いて表される式（３）に代入し、その結果得られたF(X,Y)の値をｉ番目の共振帯域のゲイン調整量とする。そして、ゲイン調整量算出部２３は、得られたｉ番目の共振帯域のゲイン調整量を、ゲイン調整部６２−ｉ（但し、１≦ｉ≦Ｋ）に供給する。

なお、ｉ番目の共振帯域のゲイン調整量の算出に、他の共振帯域の二乗平均平方根が用いられるようにしてもよい。そのような場合、例えばｉ番目の共振帯域のゲイン調整モデルは、次式（４）に示す統計解析モデルとされる。

なお、式（４）においてＸは二乗平均平方根RMS_ab(n)とされ、Ｙ_１乃至Ｙ_Ｋは、それぞれ二乗平均平方根RMS_rb1(n)乃至二乗平均平方根RMS_rbK(n)とされる。したがって、この例では、二乗平均平方根RMS_ab(n)と、Ｋ個の共振帯域の二乗平均平方根RMS_rb1(n)乃至二乗平均平方根RMS_rbK(n)を説明変数とし、ｉ番目の共振帯域のゲイン調整量を被説明変数として学習が行われる。またａ，ｂ，ｃ_１乃至ｃ_Ｋ，ｄ_１乃至ｄ_Ｋ，ｅは、それぞれモデルパラメータである。

この場合、ゲイン調整量算出部２３は、二乗平均平方根RMS_ab(n)とＫ個の二乗平均平方根RMS_rbi(n)とを式（４）に代入し、その結果得られたF(X,Y₁,…,Y_K)の値をｉ番目の共振帯域のゲイン調整量とする。

さらに、例えば二乗平均平方根RMS_ab(n)とＫ個の二乗平均平方根RMS_rbi(n)とから１つのゲイン調整モデルが学習され、そのゲイン調整モデルがＫ個の各共振帯域で共通に用いられるようにしてもよい。

ステップＳ４４において、ゲイン調整部６２はゲイン調整量算出部２３からのゲイン調整量に基づいて、帯域分割部６１からの共振帯域信号の振幅を変換することで、共振帯域信号のゲイン調整を行い、加算部２５に供給する。具体的には、ゲイン調整部６２−ｉ（但し、１≦ｉ≦Ｋ）はｉ番目の共振帯域のゲイン調整量を用いて、ｉ番目の共振帯域の共振帯域信号のゲイン調整を行う。

ステップＳ４５において、加算部２５はＫ個のゲイン調整部６２から供給されたＫ個の共振帯域信号と、帯域分割部６１から供給された共振帯域外信号とを加算して出力信号を生成し、出力する。出力信号が出力されると、共振帯域成分抑圧処理は終了する。

以上のようにして、オーディオ信号処理装置５１は、入力信号と複数の共振帯域信号とから共振分析特徴量を抽出し、共振分析特徴量に基づいて求められたゲイン調整量で共振帯域ごとに共振帯域信号のゲイン調整を行う。これにより、共振帯域ごとに適切に入力信号の共振帯域成分を抑圧し、より高品質な音声を得ることができるようになる。

〈第３の実施の形態〉
〈オーディオ信号処理装置の構成例〉
また、以上においては共振帯域のゲインを抑圧するために、共振分析特徴量から直接ゲイン調整量を算出し、共振帯域信号の振幅を変換する例について説明したが、入力信号に対して例えばノッチフィルタ等を用いて共振帯域のゲインを抑圧してもよい。

そのような場合、オーディオ信号処理装置は、例えば図７に示すように構成される。なお、図７において図１における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

図７に示すオーディオ信号処理装置９１は、帯域分割部２１、分析部２２、共振制御情報算出部１０１、および共振制御部１０２を有している。

共振制御情報算出部１０１は、分析部２２から供給された共振分析特徴量に基づいて、共振帯域成分を抑圧するための情報として共振制御情報を算出し、共振制御部１０２に供給する。共振制御部１０２は、共振制御情報算出部１０１から供給された共振制御情報に基づいて、供給された入力信号の共振帯域成分を抑圧し、その結果得られた信号を出力信号として出力する。

例えば共振制御部１０２において、入力信号の共振帯域成分を抑圧する処理として、ノッチフィルタ係数を用いたフィルタ処理、すなわちノッチフィルタ処理が行われる場合、共振制御情報としてノッチフィルタ係数が算出される。なお、以下では、共振制御部１０２においてノッチフィルタ処理が行われるものとして、説明を続ける。

〈共振帯域成分抑圧処理の説明〉
次に、オーディオ信号処理装置９１の動作について説明する。以下、図８のフローチャートを参照して、オーディオ信号処理装置９１による共振帯域成分抑圧処理について説明する。

ステップＳ７１において、帯域分割部２１は、供給された入力信号を共振帯域信号と共振帯域外信号とに分割して、共振帯域信号を分析部２２に供給する。

ステップＳ７２において、分析部２２は、供給された入力信号と、帯域分割部２１から供給された共振帯域信号とから共振分析特徴量を抽出し、共振制御情報算出部１０１に供給する。例えば共振分析特徴量として、入力信号の二乗平均平方根RMS_ab(n)と、共振帯域信号の二乗平均平方根RMS_rb(n)とが算出される。

ステップＳ７３において、共振制御情報算出部１０１は、分析部２２から供給された共振分析特徴量に基づいて共振制御情報を算出し、共振制御部１０２に供給する。ここでは共振制御情報としてノッチフィルタ係数が算出される。

ステップＳ７４において、共振制御部１０２は、共振制御情報算出部１０１から供給された共振制御情報に基づいて、供給された入力信号の共振帯域成分を抑圧し、その結果得られた出力信号を出力する。具体的には、共振制御情報としてのノッチフィルタ係数が用いられて、入力信号に対してノッチフィルタ処理が施され、入力信号の共振帯域成分が抑圧される。つまり、入力信号に対して直接、共振帯域のゲイン調整が行われる。

出力信号が出力されると、共振帯域成分抑圧処理は終了する。

以上のようにして、オーディオ信号処理装置９１は、入力信号と共振帯域信号とから共振分析特徴量を抽出し、共振分析特徴量に基づいて求められた共振制御情報で適応的に入力信号の共振帯域成分のゲイン調整を行う。これにより、共振帯域だけでなく入力信号の全帯域についても考慮して、より適切に入力信号の共振帯域成分を抑圧することができる。その結果、より高品質な音声を得ることができるようになる。

〈第４の実施の形態〉
〈オーディオ信号処理装置の構成例〉
さらに、以上においては入力信号の共振帯域成分のゲイン調整を行う例について説明したが、共振帯域成分のゲイン調整に加えて入力信号の再生レベルの強調も行われるようにしてもよい。そのよう場合、オーディオ信号処理装置は、例えば図９に示すように構成される。なお、図９において図１における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

図９に示すオーディオ信号処理装置１３１は、帯域分割部２１、分析部２２、ゲイン調整部２４、加算部２５、再生レベル強調分析部１４１、マッピング制御情報決定部１４２、ゲイン調整量算出部１４３、およびマッピング処理部１４４を有している。

再生レベル強調分析部１４１は、供給された入力信号から再生レベル強調分析特徴量を抽出し、マッピング制御情報決定部１４２に供給する。

マッピング制御情報決定部１４２は、予め統計解析に基づいて学習されたマッピング制御モデルを用いて、再生レベル強調分析部１４１から供給された再生レベル強調分析特徴量からマッピング制御情報を求め、ゲイン調整量算出部１４３およびマッピング処理部１４４に供給する。ここで、マッピング制御情報は、入力信号の再生レベルを強調するときの強調度合いを示す情報である。

ゲイン調整量算出部１４３は、分析部２２から供給された共振分析特徴量と、マッピング制御情報決定部１４２から供給されたマッピング制御情報とに基づいて、ゲイン調整量を決定し、ゲイン調整部２４に供給する。

マッピング処理部１４４は、マッピング制御情報決定部１４２から供給されたマッピング制御情報に基づいて、加算部２５から供給された信号に対するマッピング処理を行い、入力信号の再生レベルを強調する。マッピング処理部１４４は、再生レベルが強調された入力信号を、最終的な出力信号として出力する。なお、マッピング処理では、マッピング制御情報により定まる線形または非線形のマッピング関数が用いられて、入力信号に対する線形または非線形の振幅変換が行われる。

〈共振帯域成分抑圧処理の説明〉
次に、オーディオ信号処理装置１３１の動作について説明する。以下、図１０のフローチャートを参照して、オーディオ信号処理装置１３１による共振帯域成分抑圧処理について説明する。なお、ステップＳ１０１およびステップＳ１０２の処理は、図２のステップＳ１１およびステップＳ１２の処理と同様であるので、その説明は省略する。

ステップＳ１０３において、再生レベル強調分析部１４１は、供給された入力信号から再生レベル強調分析特徴量を抽出し、マッピング制御情報決定部１４２に供給する。

具体的には、例えば再生レベル強調分析部１４１は式（１）と同様の計算を行って、入力信号の二乗平均平方根RMS(n)を再生レベル強調分析特徴量として算出する。

なお、ここでは入力信号は前処理なしで分析される。つまり前処理なしで入力信号から特徴量の抽出が行われる。そのため、再生レベル強調分析特徴量として求められる二乗平均平方根RMS(n)は、共振分析特徴量として求められる二乗平均平方根RMS_ab(n)と等価となるが、必要に応じてDCカットなどの前処理が行われてから再生レベル強調分析特徴量の算出が行われてもよい。

また、その他、二乗平均平方根RMS(n)のｔ乗値（但し、ｔ≧２）や、零交差率、周波数エンベロープの傾きなどを再生レベル強調分析特徴量として追加したり、それらの任意の組み合わせを再生レベル強調分析特徴量としたりしてもよい。

ステップＳ１０４において、マッピング制御情報決定部１４２はマッピング制御モデルを用いて、再生レベル強調分析部１４１から供給された再生レベル強調分析特徴量からマッピング制御情報を求め、ゲイン調整量算出部１４３およびマッピング処理部１４４に供給する。

例えば、マッピング制御情報決定部１４２には、学習用に用意された複数のマッピング制御情報を被説明変数とし、学習用に用意された再生レベル強調分析特徴量を説明変数として最小二乗法により線形回帰モデルの学習を行うことで生成されたマッピング制御モデルが予め記録されている。マッピング制御モデルは、例えば図１１の曲線Ｃ２１により表される２次関数の係数などとされる。

なお、図１１において縦軸はマッピング制御情報を示しており、横軸は再生レベル強調分析特徴量としての二乗平均平方根RMS(n)を示している。

図１１では、曲線Ｃ２１は各再生レベル強調分析特徴量の値に対して定まるマッピング制御情報の値を示している。この例では、入力信号の音声の音量が小さく、再生レベル強調分析特徴量が小さいほど、マッピング制御情報の値も小さくなる。

マッピング制御情報決定部１４２は、マッピング制御モデルとして記録しているモデルパラメータにより定まる関数に、再生レベル強調分析特徴量を代入することで、マッピング制御情報を得る。

図１０のフローチャートの説明に戻り、ステップＳ１０４においてマッピング制御情報が求められると、その後、ステップＳ１０５の処理が行われる。

ステップＳ１０５において、ゲイン調整量算出部１４３は、分析部２２からの共振分析特徴量と、マッピング制御情報決定部１４２からのマッピング制御情報とに基づいてゲイン調整量を算出し、ゲイン調整部２４に供給する。

ゲイン調整量算出部１４３は、ゲイン調整量F(X,Y)を被説明変数とし、共振分析特徴量としての二乗平均平方根RMS_ab(n)および二乗平均平方根RMS_rb(n)に加えて、さらにマッピング制御情報も説明変数として用いて学習されたゲイン調整モデルを記録している。

例えば学習により得られるゲイン調整モデルは、式（３）においてＸを二乗平均平方根RMS_ab(n)と、マッピング制御情報から得られる所定値βとの和とし、Ｙを二乗平均平方根RMS_rb(n)と所定値βの和としたものとされる。ここで、所定値βは、マッピング制御情報αを二乗平均平方根と同じ次元の値となるように変換する式β＝ｈ（α）から得られる値、つまり関数ｈ（α）にマッピング制御情報を代入して得られる値とされる。

このようなゲイン調整モデルにおいても、式（３）に示したゲイン調整モデルにおける場合と同様に、入力信号に含まれる共振帯域信号の割合が大きくなるほど、ゲイン調整量が大きくなり、共振帯域の成分がより大きく抑圧されるようになる。

また、後段のマッピング処理部１４４においては、マッピング制御情報が小さいほど、入力信号の再生レベルが強調されるようなマッピング処理が行われる。そのため、ゲイン調整モデルではマッピング制御情報が小さいほど、ゲイン調整量が大きくなる。つまり、マッピング処理での再生レベル強調量に応じて、予め共振帯域の成分が抑圧される。

なお、その他、例えば次式（５）に示すゲイン調整モデルが用いられるようにしてもよい。式（５）では、Ｘが二乗平均平方根RMS_ab(n)とされ、Ｙが二乗平均平方根RMS_rb(n)とされ、Ｚがマッピング制御情報とされる。また、式（５）においてａ，ｂ，ｃ，ｄ，ｅ，ｆ，ｇは、それぞれモデルパラメータである。

ゲイン調整量算出部１４３は、予め記録しているゲイン調整モデルにより示される関数（式）に共振分析特徴量としての二乗平均平方根RMS_ab(n)および二乗平均平方根RMS_rb(n)と、マッピング制御情報またはマッピング制御情報により定まる値βとを代入することで、ゲイン調整量を算出する。

ステップＳ１０６において、ゲイン調整部２４はゲイン調整量算出部１４３からのゲイン調整量に基づいて、帯域分割部２１からの共振帯域信号の振幅を変換することで、共振帯域信号のゲイン調整を行い、加算部２５に供給する。

ステップＳ１０７において、加算部２５はゲイン調整部２４から供給された共振帯域信号と、帯域分割部２１から供給された共振帯域外信号とを加算してマッピング処理部１４４に供給する。なお、以下、加算部２５から出力される信号、つまり共振帯域信号と共振帯域外信号とを加算して得られる信号を加算信号とも称することとする。

ステップＳ１０８において、マッピング処理部１４４は、マッピング制御情報決定部１４２から供給されたマッピング制御情報を用いて、加算部２５から供給された加算信号に対するマッピング処理を行う。

例えばマッピング処理部１４４は、加算信号における処理対象となっているｎ番目のサンプルのサンプル値ｘを、次式（６）に示す非線形のマッピング関数ｆ（ｘ）に代入して、加算信号の振幅変換を行なう。つまり、サンプル値ｘをマッピング関数ｆ（ｘ）に代入して得られた値が、最終的な出力信号のｎ番目のサンプルのサンプル値とされる。なお、この場合、加算信号のサンプル値ｘは、-1.0から1.0までの値となるように正規化されているものとする。また、式（６）において、αはマッピング制御情報の値を示している。

このようなマッピング関数ｆ（ｘ）は、図１２に示すようにマッピング制御情報が小さいほど、急峻に変化する関数となる。なお、図１２において、横軸は加算信号のサンプル値ｘを示しており、縦軸はマッピング関数ｆ（ｘ）の値を示している。また、曲線ｆ１１乃至曲線ｆ１３は、それぞれマッピング制御情報αが「３」、「５」、および「５０」であるときのマッピング関数ｆ（ｘ）を表している。

図１２から分かるように、マッピング制御情報が小さいほど、全体的にサンプル値ｘの変化に対するｆ（ｘ）の変化量が大きいマッピング関数ｆ（ｘ）が用いられて、加算信号の振幅変換が行なわれる。このようにマッピング制御情報を変化させると、加算信号（入力信号）に対する増幅量が変化する。

例えば再生レベル強調分析特徴量として二乗平均平方根RMS(n)が求められる場合、入力信号の音声の音量が小さいほど、再生レベル強調分析特徴量は小さくなるので、これによりマッピング制御情報の値も小さくなる。また、マッピング制御情報が小さいほど、マッピング関数ｆ（ｘ）の傾きは大きくなる。

したがって、入力信号の音声の音量が全体的に小さいほど、サンプル値ｘ＝０を含むサンプル値ｘの大部分の区間において、より急峻に変化する特性のマッピング関数ｆ（ｘ）が用いられて、加算信号（入力信号）の振幅変換が行なわれる。

その結果、入力信号における全体として音量の小さい区間では、音量の小さい音声はより音量が大きい音声に変換されるように入力信号が振幅変換され、入力信号の再生レベルが強調される。これにより、例えば音量のダイナミックレンジの大きなコンテンツを、小型スピーカを内蔵する機器で再生する場合等においても、従来は聞こえにくかった小さい音を、より聞こえ易くすることができる。

また、入力信号における全体として音量の大きな区間においても、その中のサンプル値ｘが小さな信号に対しては、適度に急峻な特性のマッピング関数ｆ（ｘ）が用いられ、入力信号（加算信号）の振幅変換が行なわれる。

その結果、入力信号における全体として音量の大きな区間においても、その中の音量の小さな音声は音量の大きい音声に変換されるように入力信号が振幅変換され、入力信号の再生レベルが強調される。これにより、従来から比較的大きく再生されていた音も、さらに大きく聞こえるようになる。

さらに、マッピング制御情報により非線形なマッピング関数ｆ（ｘ）を変化させることで、より自由度の高い振幅変換を実現することができる。つまり、入力信号の特定区間全体の特性に応じて、最も効果的な特性の非線形関数をマッピング関数とすることで、処理対象のサンプルが含まれる区間の特性だけでなく、そのサンプルのサンプル値の大きさも考慮した振幅変換を行なうことができる。

なお、マッピング処理で用いられるマッピング関数ｆ（ｘ）は、非線形関数に限らず、−１≦ｘ≦１であるサンプル値ｘに対して、−１≦ｆ（ｘ）≦１となる関数であれば、線形関数や指数関数など、どのような関数であってもよい。例えば、マッピング処理の効果の評価が高いものや聴感上適したものをマッピング関数として用いればよい。

マッピング処理部１４４は、マッピング処理により加算信号の振幅を変換して出力信号とすると、得られた出力信号を出力し、共振帯域成分抑圧処理は終了する。

以上のようにして、オーディオ信号処理装置１３１は、入力信号と共振帯域信号とから共振分析特徴量を抽出するとともに、入力信号から再生レベル強調分析特徴量を抽出してマッピング制御情報を得る。そして、オーディオ信号処理装置１３１は、共振分析特徴量とマッピング制御情報に基づいて求められたゲイン調整量で共振帯域信号のゲインを調整し、さらにマッピング制御情報に基づいて、共振帯域信号と共振帯域外信号を加算して得られた加算信号の振幅変換を行う。

このように共振分析特徴量とマッピング制御情報を用いてゲイン調整量を求めることで、より適切に入力信号の共振帯域成分を抑圧し、より高品質な音声を得ることができるようになる。特に、再生レベル強調技術と組み合わせた場合に、共振を効果的に抑圧したまま再生レベルを強調することができるため、より大音量で迫力のある音声再生を実現することが可能となる。

ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどが含まれる。

図１３は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

コンピュータにおいて、ＣＰＵ５０１，ＲＯＭ５０２，ＲＡＭ５０３は、バス５０４により相互に接続されている。

バス５０４には、さらに、入出力インターフェース５０５が接続されている。入出力インターフェース５０５には、入力部５０６、出力部５０７、記録部５０８、通信部５０９、及びドライブ５１０が接続されている。

入力部５０６は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部５０７は、ディスプレイ、スピーカなどよりなる。記録部５０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部５０９は、ネットワークインターフェースなどよりなる。ドライブ５１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア５１１を駆動する。

以上のように構成されるコンピュータでは、ＣＰＵ５０１が、例えば、記録部５０８に記録されているプログラムを、入出力インターフェース５０５及びバス５０４を介して、ＲＡＭ５０３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ（ＣＰＵ５０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア５１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータでは、プログラムは、リムーバブルメディア５１１をドライブ５１０に装着することにより、入出力インターフェース５０５を介して、記録部５０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部５０９で受信し、記録部５０８にインストールすることができる。その他、プログラムは、ＲＯＭ５０２や記録部５０８に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

また、本明細書中に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

さらに、本技術は、以下の構成とすることも可能である。

（１）
音声の入力信号を帯域分割して共振帯域信号を生成する帯域分割部と、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出する分析部と、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出するゲイン調整量算出部と、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行うゲイン調整部と
を備えるオーディオ信号処理装置。
（２）
前記ゲイン調整量算出部は、学習により生成された統計解析モデルを用いて、前記特徴量に基づき前記ゲイン調整量を算出する
（１）に記載のオーディオ信号処理装置。
（３）
前記ゲイン調整量算出部は、複数の前記共振帯域ごとに前記ゲイン調整量を算出し、
前記ゲイン調整部は、前記複数の前記共振帯域ごとにゲイン調整を行う
（１）または（２）に記載のオーディオ信号処理装置。
（４）
前記入力信号から抽出された再生レベル強調特徴量と、学習により生成された前記再生レベル強調特徴量からマッピング制御情報を得るための情報とに基づいて、前記マッピング制御情報を決定するマッピング制御情報決定部と、
前記マッピング制御情報により定まる線形または非線形なマッピング関数に基づいて、ゲイン調整された前記入力信号を振幅変換するマッピング処理部と
をさらに備え、
前記ゲイン調整量算出部は、前記マッピング制御情報と前記分析部で抽出した前記特徴量に基づいて前記ゲイン調整量を算出する
（１）乃至（３）の何れか一項に記載のオーディオ信号処理装置。
（５）
前記ゲイン調整量は、前記入力信号に含まれる前記共振帯域信号の割合が大きくなるほど、大きくなる
（１）乃至（４）の何れか一項に記載のオーディオ信号処理装置。
（６）
前記帯域分割部は、前記入力信号を前記共振帯域信号と共振帯域外信号とに分割し、
前記ゲイン調整部は、前記共振帯域信号のゲイン調整を行い、
ゲイン調整された前記共振帯域信号と、前記共振帯域外信号とを加算する加算部をさらに備える
（１）乃至（３）の何れか一項に記載のオーディオ信号処理装置。
（７）
音声の入力信号を帯域分割して共振帯域信号を生成し、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行う
ステップを含むオーディオ信号処理方法。
（８）
音声の入力信号を帯域分割して共振帯域信号を生成し、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行う
ステップを含む処理をコンピュータに実行させるプログラム。

１１オーディオ信号処理装置，２１帯域分割部，２２分析部，２３ゲイン調整量算出部，２４ゲイン調整部，２５加算部，６１帯域分割部，６２−１乃至６２−Ｋ，６２ゲイン調整部，１０１共振制御情報算出部，１０２共振制御部，１４１再生レベル強調分析部，１４２マッピング制御情報決定部，１４３ゲイン調整量算出部，１４４マッピング処理部

Claims

音声の入力信号を帯域分割して共振帯域信号を生成する帯域分割部と、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出する分析部と、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出するゲイン調整量算出部と、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行うゲイン調整部と
を備えるオーディオ信号処理装置。
前記ゲイン調整量算出部は、学習により生成された統計解析モデルを用いて、前記特徴量に基づき前記ゲイン調整量を算出する
請求項１に記載のオーディオ信号処理装置。
前記ゲイン調整量算出部は、複数の前記共振帯域ごとに前記ゲイン調整量を算出し、
前記ゲイン調整部は、前記複数の前記共振帯域ごとにゲイン調整を行う
請求項１に記載のオーディオ信号処理装置。
前記入力信号から抽出された再生レベル強調特徴量と、学習により生成された前記再生レベル強調特徴量からマッピング制御情報を得るための情報とに基づいて、前記マッピング制御情報を決定するマッピング制御情報決定部と、
前記マッピング制御情報により定まる線形または非線形なマッピング関数に基づいて、ゲイン調整された前記入力信号を振幅変換するマッピング処理部と
をさらに備え、
前記ゲイン調整量算出部は、前記マッピング制御情報と前記分析部で抽出した前記特徴量に基づいて前記ゲイン調整量を算出する
請求項１に記載のオーディオ信号処理装置。
前記ゲイン調整量は、前記入力信号に含まれる前記共振帯域信号の割合が大きくなるほど、大きくなる
請求項１に記載のオーディオ信号処理装置。
前記帯域分割部は、前記入力信号を前記共振帯域信号と共振帯域外信号とに分割し、
前記ゲイン調整部は、前記共振帯域信号のゲイン調整を行い、
ゲイン調整された前記共振帯域信号と、前記共振帯域外信号とを加算する加算部をさらに備える
請求項１に記載のオーディオ信号処理装置。
音声の入力信号を帯域分割して共振帯域信号を生成し、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行う
ステップを含むオーディオ信号処理方法。
音声の入力信号を帯域分割して共振帯域信号を生成し、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行う
ステップを含む処理をコンピュータに実行させるプログラム。