JP2015050685A - オーディオ信号処理装置および方法、並びにプログラム - Google Patents
オーディオ信号処理装置および方法、並びにプログラム Download PDFInfo
- Publication number
- JP2015050685A JP2015050685A JP2013182022A JP2013182022A JP2015050685A JP 2015050685 A JP2015050685 A JP 2015050685A JP 2013182022 A JP2013182022 A JP 2013182022A JP 2013182022 A JP2013182022 A JP 2013182022A JP 2015050685 A JP2015050685 A JP 2015050685A
- Authority
- JP
- Japan
- Prior art keywords
- gain adjustment
- signal
- resonance
- input signal
- resonance band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【課題】共振帯域信号だけでなく入力信号も考慮してゲイン調整量を算出することで、より適切なゲイン調整を行うことができ、より高品質な音声を得ることができるオーディオ信号処理装置を提供する。
【解決手段】帯域分割部21は、入力信号を共振帯域信号と共振帯域外信号とに分割し、分析部22は、共振帯域信号と入力信号から共振分析特徴量を抽出する。ゲイン調整量算出部23は、共振帯域信号と入力信号の共振分析特徴量に基づいて、共振帯域のゲイン調整量を算出し、ゲイン調整部24は、ゲイン調整量に基づいて入力信号の共振帯域のゲイン調整を行う。その結果、より高品質な音声を得ることができる。ノート型のパーソナルコンピュータに適用することができる。
【選択図】図1
【解決手段】帯域分割部21は、入力信号を共振帯域信号と共振帯域外信号とに分割し、分析部22は、共振帯域信号と入力信号から共振分析特徴量を抽出する。ゲイン調整量算出部23は、共振帯域信号と入力信号の共振分析特徴量に基づいて、共振帯域のゲイン調整量を算出し、ゲイン調整部24は、ゲイン調整量に基づいて入力信号の共振帯域のゲイン調整を行う。その結果、より高品質な音声を得ることができる。ノート型のパーソナルコンピュータに適用することができる。
【選択図】図1
Description
本技術はオーディオ信号処理装置および方法、並びにプログラムに関し、特に、より高品質な音声を得ることができるようにしたオーディオ信号処理装置および方法、並びにプログラムに関する。
近年、ノート型のパーソナルコンピュータ等のポータブル機器の小型化が進み、スピーカと、基盤やキーボード等の部品とが必然的に近い位置に配置されてしまう状況や、部品自体が小型化および薄型化している状況があり、音声を再生する際に共振が起こりやすい。
しかし、共振に対するハード的な対策はコストがかかるため、低コストでできる範囲の対策に止まるか、あるいは共振は仕方のないものとされ、その結果として音質が犠牲にされてしまう状況がある。
また、共振に対する対策として、共振が起こらないように音声全体の音量を下げるという方法があるが、音源によっては音量が小さくなりすぎて聞こえない、あるいは音質に満足できないといった場合がある。これに対して、ノッチフィルタ等で共振周波数帯域のゲインを抑圧することで共振を抑圧する技術が提案されている。
ところで、映画コンテンツや音楽コンテンツを、ノート型のパーソナルコンピュータ等の小型スピーカを内蔵したポータブル機器で再生する場合、全体的に音声の音量が小さくなってしまうことが知られている。
そこで、音声をより聞きやすくするために、音声のオーディオ信号の再生レベルを強調する技術がある(例えば、特許文献1および特許文献2参照)。この技術では、入力されたオーディオ信号の分析結果に応じて振幅変換関数の特性が動的に変化し、再生レベルが強調される。
しかしながら、上述した技術では、十分に高品質な音声を得ることができなかった。
例えば、共振現象においては共振帯域の信号レベルが同じでも共振帯域以外の信号レベルによって共振の大きさが変わる場合がある。そのため、ノッチフィルタ等の共振帯域のみで抑圧ゲイン量を決めてしまう技術では、抑圧する必要のない信号に対してもゲインを抑圧してしまい、音声の音量や音質に悪影響が出てしまう。
さらに、再生レベルを強調する技術では、ノート型のパーソナルコンピュータ等で再生レベルを強調すると、前述の共振がより大きくなり、音声の音質への悪影響も大きくなってしまう。また、共振を抑えるために再生レベルの強調量を十分に大きくすることもできなかった。そのため、十分に高品質な音声を得ることができなかった。
本技術は、このような状況に鑑みてなされたものであり、より高品質な音声を得ることができるようにするものである。
本技術の一側面のオーディオ信号処理装置は、音声の入力信号を帯域分割して共振帯域信号を生成する帯域分割部と、前記共振帯域信号および前記入力信号から各々の特徴量を抽出する分析部と、前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出するゲイン調整量算出部と、前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行うゲイン調整部とを備える。
前記ゲイン調整量算出部には、学習により生成された統計解析モデルを用いて、前記特徴量に基づき前記ゲイン調整量を算出させることができる。
前記ゲイン調整量算出部には、複数の前記共振帯域ごとに前記ゲイン調整量を算出させ、前記ゲイン調整部には、前記複数の前記共振帯域ごとにゲイン調整を行わせることができる。
オーディオ信号処理装置には、前記入力信号から抽出された再生レベル強調特徴量と、学習により生成された前記再生レベル強調特徴量からマッピング制御情報を得るための情報とに基づいて、前記マッピング制御情報を決定するマッピング制御情報決定部と、前記マッピング制御情報により定まる線形または非線形なマッピング関数に基づいて、ゲイン調整された前記入力信号を振幅変換するマッピング処理部とをさらに設け、前記ゲイン調整量算出部には、前記マッピング制御情報と前記分析部で抽出した前記特徴量に基づいて前記ゲイン調整量を算出させることができる。
前記ゲイン調整量を、前記入力信号に含まれる前記共振帯域信号の割合が大きくなるほど、大きくなるようにすることができる。
前記帯域分割部には、前記入力信号を前記共振帯域信号と共振帯域外信号とに分割させ、前記ゲイン調整部には、前記共振帯域信号のゲイン調整を行わせ、オーディオ信号処理装置には、ゲイン調整された前記共振帯域信号と、前記共振帯域外信号とを加算する加算部をさらに設けることができる。
本技術の一側面のオーディオ信号処理方法またはプログラムは、音声の入力信号を帯域分割して共振帯域信号を生成し、前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行うステップを含む。
本技術の一側面においては、音声の入力信号が帯域分割されて共振帯域信号が生成され、前記共振帯域信号および前記入力信号から各々の特徴量が抽出され、前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量が算出され、前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整が行われる。
本技術の一側面によれば、より高品質な音声を得ることができる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載された何れかの効果であってもよい。
以下、図面を参照して、本技術を適用した実施の形態について説明する。
〈第1の実施の形態〉
〈オーディオ信号処理装置の構成例〉
図1は、本技術を適用したオーディオ信号処理装置の構成例を示す図である。例えば、オーディオ信号処理装置は、ノート型のパーソナルコンピュータなどからなる。
〈オーディオ信号処理装置の構成例〉
図1は、本技術を適用したオーディオ信号処理装置の構成例を示す図である。例えば、オーディオ信号処理装置は、ノート型のパーソナルコンピュータなどからなる。
オーディオ信号処理装置11は、帯域分割部21、分析部22、ゲイン調整量算出部23、ゲイン調整部24、および加算部25を有している。オーディオ信号処理装置11では、音声のオーディオ信号である入力信号が、帯域分割部21および分析部22に供給される。
帯域分割部21は、例えば帯域通過フィルタからなり、入力信号に対する帯域分割を行って、供給された入力信号から共振帯域信号と共振帯域外信号を生成する。すなわち、入力信号に対する帯域分割により、入力信号が共振帯域信号と共振帯域外信号とに分割される。帯域分割部21は、共振帯域信号を分析部22およびゲイン調整部24に供給するとともに、共振帯域外信号を加算部25に供給する。
ここで共振帯域信号は、入力信号のうちの予め定められた共振が生じる周波数、すなわち共振周波数の帯域成分からなる信号である。したがって、共振帯域信号は入力信号のうちの抑圧したい共振帯域成分の信号である。
また、共振帯域外信号は、入力信号から共振帯域成分を除去して得られる成分の信号である。すなわち、共振帯域外信号は、入力信号のうちの共振周波数以外の周波数帯域成分の信号であり、抑圧する必要のない周波数帯域成分の信号である。
分析部22は、供給された入力信号と、帯域分割部21から供給された共振帯域信号とから共振分析特徴量を抽出し、ゲイン調整量算出部23に供給する。ゲイン調整量算出部23は、分析部22から供給された共振分析特徴量に基づいて、入力信号の共振帯域成分を抑圧する最適なゲイン調整量を算出し、ゲイン調整部24に供給する。
ゲイン調整部24は、ゲイン調整量算出部23から供給されたゲイン調整量に基づいて、帯域分割部21から供給された共振帯域信号の振幅を変換することで、共振帯域信号のゲイン調整を行い、その結果得られた共振帯域信号を加算部25に供給する。
加算部25は、ゲイン調整部24から供給された共振帯域信号と、帯域分割部21から供給された共振帯域外信号とを加算することで、入力信号における共振帯域成分が抑圧された信号である出力信号を生成し、出力する。
〈共振帯域成分抑圧処理の説明〉
次に、オーディオ信号処理装置11の動作について説明する。
次に、オーディオ信号処理装置11の動作について説明する。
オーディオ信号処理装置11は、入力信号が供給されると、共振帯域成分を抑圧する共振帯域成分抑圧処理を開始して出力信号を生成する。以下、図2のフローチャートを参照して、オーディオ信号処理装置11による共振帯域成分抑圧処理について説明する。
ステップS11において、帯域分割部21は、供給された入力信号を共振帯域信号と共振帯域外信号とに分割して、共振帯域信号を分析部22およびゲイン調整部24に供給するとともに、共振帯域外信号を加算部25に供給する。例えば帯域通過フィルタにより入力信号に対するフィルタ処理が行われ、共振帯域信号と共振帯域外信号とが生成される。
ステップS12において、分析部22は、供給された入力信号と、帯域分割部21から供給された共振帯域信号とから共振分析特徴量を抽出し、ゲイン調整量算出部23に供給する。
具体的には、例えば分析部22は入力信号における処理対象となっているn番目のサンプルを中心とするN個のサンプルからなる入力信号の区間について、次式(1)を計算することにより入力信号の二乗平均平方根RMS_ab(n)を算出し、共振分析特徴量とする。
なお、式(1)において、x(m)は入力信号のm番目のサンプルを示しており、入力信号は、各サンプルx(m)の値が-1.0≦x(m)≦1.0となるように正規化されているものとする。
また、分析部22は共振帯域信号における処理対象となっているn番目のサンプルを中心とするN個のサンプルからなる共振帯域信号の区間について、次式(2)を計算することにより共振帯域信号の二乗平均平方根RMS_rb(n)を算出し、共振分析特徴量とする。
なお、式(2)において、x_rb(m)は共振帯域信号のm番目のサンプルを示しており、共振帯域信号は、各サンプルx_rb(m)の値が-1.0≦x_rb(m)≦1.0となるように正規化されているものとする。
このようにして得られた入力信号の二乗平均平方根RMS_ab(n)と、共振帯域信号の二乗平均平方根RMS_rb(n)とが共振分析特徴量としてゲイン調整量算出部23に供給される。
なお、ここでは共振分析特徴量として二乗平均平方根を求める例について説明したが、共振分析特徴量は、その他、どのようなものであってもよい。例えば二乗平均平方根に加えて、二乗平均平方根のt乗値(但し、t≧2)や、トーン性の強さ、共振帯域をさらに細かく分割して求めたトゥルーピークなどを共振分析特徴量として追加したり、それらの任意の組み合わせを共振分析特徴量としたりしてもよい。その他、二乗平均平方根や、二乗平均平方根のt乗値、トーン性の強さ、トゥルーピークなどの対数値を共振分析特徴量として用いてもよい。
また、入力信号および共振帯域信号の分析にあたり、帯域通過フィルタを用いる例について説明したが、他のフィルタを用いてもよいし、周波数領域での入力信号の分割や特徴量の抽出、分析を行うようにしてもよい。
ステップS13において、ゲイン調整量算出部23は、分析部22から供給された共振分析特徴量に基づいて、入力信号の共振帯域成分を抑圧する最適なゲイン調整量を算出し、ゲイン調整部24に供給する。
例えば、共振現象を詳しく解析すると共振帯域信号のレベル、すなわち共振帯域信号の二乗平均平方根RMS_rb(n)の値が同じ場合でも入力信号のレベル、すなわち二乗平均平方根RMS_ab(n)の値によって共振度合いが変わることが分かる。
ここで、簡単な信号の例を図3に示す。なお、図3において縦軸および横軸は振幅および周波数を示しており、周波数軸におけるFは共振周波数を示している。
図3では、折れ線C11および折れ線C12は、それぞれ異なる信号の周波数特性を表している。例えば折れ線C11は入力信号としての共振しやすい信号の周波数特性を表しており、折れ線C12は入力信号としての共振し難い信号の周波数特性を表している。
折れ線C11と折れ線C12を比較すると、それぞれの信号における共振周波数帯域、すなわち共振周波数Fの信号レベル(振幅)はLV11となっており、同じである。しかし、折れ線C11に示す信号は、共振周波数Fの成分が支配的であるため共振しやすい傾向がある。すなわち、折れ線C11に示す信号の共振周波数Fの成分のレベルは、他の周波数成分のレベルと比較して、突出して大きな値となっている。
これに対して、折れ線C12に示す信号は、共振周波数Fの成分が支配的ではないため共振し難い、あるいは共振が気にならないという傾向がある。
折れ線C12に示す信号のように、入力信号の共振周波数Fの成分のレベルだけでなく、他の周波数成分のレベルも大きい場合には、共振帯域信号のゲイン調整量は折れ線C11に示す信号についてのゲイン調整量と比べて小さくてもよいことが多い。そのため、折れ線C11に示す信号と、折れ線C12に示す信号とで共振帯域信号のゲイン調整量を同じ値としてしまうと、必要以上に折れ線C12に示す信号のゲインを抑圧してしまい、音量や音圧に悪影響がでてしまう。
そこで、オーディオ信号処理装置11は、共振帯域信号のゲイン調整量を算出する際には共振帯域信号のレベルだけでなく、入力信号のレベル、すなわち入力信号全体の帯域とのバランスも考慮することで、必要以上にゲインが抑圧されてしまうことを防止する。
具体的には、例えばゲイン調整量算出部23は、事前に統計解析に基づいて学習されたゲイン調整モデルを用いてゲイン調整量を求める。
ゲイン調整モデルの学習では、ゲイン調整量F(X,Y)が被説明変数とされ、学習用のオーディオ信号から抽出された二乗平均平方根RMS_ab(n)および二乗平均平方根RMS_rb(n)、それらの二乗平均平方根の二乗値、並びに二乗平均平方根やその二乗値とは無関係なオフセット項が説明変数とされる。そして、ゲイン調整量算出部23には、それらの被説明変数と説明変数とに基づいて事前に学習された、次式(3)に示す統計解析モデルがゲイン調整モデルとして記録されている。
なお、式(3)においてa,b,c,d,eは、それぞれモデルパラメータである。
ここで、式(3)におけるXを二乗平均平方根RMS_ab(n)とし、Yを二乗平均平方根RMS_rb(n)としたときのゲイン調整モデルの学習結果例を図4に示す。
図4では、横軸であるX軸、および縦軸であるY軸は、それぞれ二乗平均平方根RMS_ab(n)、および二乗平均平方根RMS_rb(n)を示している。また、各領域の濃度はゲイン調整量F(X,Y)を示しており、濃度が濃いほどゲイン調整量の絶対値が大きい、すなわち共振帯域の抑圧量が大きくなる。
この例では、入力信号に含まれる共振帯域信号の割合が大きくなるほど、ゲイン調整量が大きくなり、共振帯域の成分がより大きく抑圧されるようになる。例えば、二乗平均平方根RMS_ab(n)の値が一定の値である場合には、共振帯域信号のパワー、つまり二乗平均平方根RMS_rb(n)が大きいほどゲイン調整量の絶対値は大きくなる。
このように、入力信号と共振帯域信号との関係に基づいて、適切なゲイン調整量を定めることで、共振帯域成分を必要以上に抑圧してしまうことを防止し、より適切なゲイン調整を行うことができるようになる。
なお、ゲイン調整モデルとしてのモデルパラメータの学習時には、共振が生じるオーディオ信号と、共振が生じないオーディオ信号とが学習データとして用いられ、複数の学習データごとに、学習データを再生したときの最適なゲイン調整量が人間によって予め定められる。また、学習データから抽出された共振分析特徴量が説明変数として用いられる。この場合、実際に人が最適であると感じるゲイン調整量、つまり実際の人の感覚を学習に反映させることができるので、最適なゲイン調整モデルを得ることができるようになる。
ゲイン調整量算出部23は、このような学習により生成されたゲイン調整モデルを用いて、分析部22から供給された共振分析特徴量としての二乗平均平方根RMS_ab(n)および二乗平均平方根RMS_rb(n)に基づいて、ゲイン調整量を算出する。具体的には、二乗平均平方根RMS_ab(n)と二乗平均平方根RMS_rb(n)が上述した式(3)に代入され、その結果得られたF(X,Y)の値がゲイン調整量とされる。
なお、ここではゲイン調整量の算出方法として統計解析モデルを用いた手法について説明したが、簡単な線形または非線形の関数やテーブルを用いてゲイン調整量を算出するようにしてもよい。
図2のフローチャートの説明に戻り、ステップS13においてゲイン調整量が算出されると、処理はステップS14に進む。
ステップS14において、ゲイン調整部24はゲイン調整量算出部23からのゲイン調整量に基づいて、帯域分割部21からの共振帯域信号の振幅を変換することで、共振帯域信号のゲイン調整を行い、加算部25に供給する。これにより、入力信号における共振帯域のゲイン調整が行われたことになる。
ステップS15において、加算部25はゲイン調整部24から供給された共振帯域信号と、帯域分割部21から供給された共振帯域外信号とを加算して出力信号を生成し、出力する。出力信号が出力されると、共振帯域成分抑圧処理は終了する。
以上のようにして、オーディオ信号処理装置11は、入力信号と共振帯域信号とから共振分析特徴量を抽出し、共振分析特徴量に基づいて求められたゲイン調整量で共振帯域信号のゲイン調整を行う。
このように入力信号と共振帯域信号とから抽出した共振分析特徴量を用いてゲイン調整量を求めることで、より適切に入力信号の共振帯域成分を抑圧し、より高品質な音声を得ることができるようになる。
具体的には、例えば共振帯域の信号レベルに対して共振帯域外の信号レベルが小さい、つまり共振が大きい信号に対してはゲインが大きく抑圧されることになる。逆に、共振帯域の信号レベルに対して共振帯域外の信号レベルが小さくない、つまり共振しない信号、または共振が気にならない信号に対してはゲインが抑圧されないことになる。
このように、オーディオ信号処理装置11によれば、共振の大きさに応じた最適な共振抑圧が可能となる。これにより、共振帯域信号が必要以上にゲイン抑圧されてしまうことを防止し、大音量かつ良音質な音声を得ることが可能となる。
また、共振に対してハード的な対策を取らなくてよくなるため、デザイン上の制約がなくなる、その分だけ低コストになる、あるいは他の部分にコストをかけて高機能化や高品質化を図るといったことが可能になる。
〈第2の実施の形態〉
〈オーディオ信号処理装置の構成例〉
なお、第1の実施の形態では、入力信号から1つの共振帯域信号を分割抽出する例について説明したが、共振周波数の整数倍の周波数も共振周波数となることが一般的である。
〈オーディオ信号処理装置の構成例〉
なお、第1の実施の形態では、入力信号から1つの共振帯域信号を分割抽出する例について説明したが、共振周波数の整数倍の周波数も共振周波数となることが一般的である。
そこで、複数の共振帯域信号に対してゲイン調整することで、より効果的に共振抑圧を行うようにしてもよい。そのような場合、オーディオ信号処理装置は、例えば図5に示すように構成される。なお、図5において図1における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
図5に示すオーディオ信号処理装置51は、帯域分割部61、分析部22、ゲイン調整量算出部23、ゲイン調整部62−1乃至ゲイン調整部62−K、および加算部25を有している。
帯域分割部61は、供給された入力信号をK個の共振帯域信号と、1つの共振帯域外信号とに分割する。ここで、K個の共振帯域信号は、入力信号の互いに異なる共振帯域成分からなる信号であり、それらの共振帯域はともに共振が生じる周波数帯域となっている。例えば、K個の共振帯域は、それぞれ所定の共振帯域の整数倍の帯域となっている。
帯域分割部61は、K個の共振帯域信号を分析部22およびゲイン調整部62−1乃至ゲイン調整部62−Kに供給するとともに、共振帯域外信号を加算部25に供給する。
分析部22は、供給された入力信号と、帯域分割部61から供給されたK個の共振帯域信号のそれぞれとから共振分析特徴量を抽出し、ゲイン調整量算出部23に供給する。ゲイン調整量算出部23は、分析部22から供給された共振分析特徴量に基づいて、K個の共振帯域ごとに、入力信号の共振帯域成分を抑圧する最適なゲイン調整量を算出し、ゲイン調整部62−1乃至ゲイン調整部62−Kに供給する。
ゲイン調整部62−1乃至ゲイン調整部62−Kは、ゲイン調整量算出部23から供給されたゲイン調整量に基づいて、帯域分割部61から供給された共振帯域信号の振幅を変換することで共振帯域信号のゲイン調整を行い、加算部25に供給する。
なお、以下、ゲイン調整部62−1乃至ゲイン調整部62−Kを特に区別する必要のない場合、単にゲイン調整部62とも称することとする。
加算部25は、ゲイン調整部62−1乃至ゲイン調整部62−Kから供給された共振帯域信号と、帯域分割部61から供給された共振帯域外信号とを加算して出力信号を生成し、出力する。
〈共振帯域成分抑圧処理の説明〉
次に、図6のフローチャートを参照して、オーディオ信号処理装置51により行われる共振帯域成分抑圧処理について説明する。
次に、図6のフローチャートを参照して、オーディオ信号処理装置51により行われる共振帯域成分抑圧処理について説明する。
ステップS41において、帯域分割部61は、供給された入力信号をK個の共振帯域の共振帯域信号と、1つの共振帯域外信号とに分割して、共振帯域信号を分析部22およびゲイン調整部62に供給するとともに、共振帯域外信号を加算部25に供給する。
具体的には、K個の共振帯域信号が分析部22に供給され、1番目乃至K番目の共振帯域の共振帯域信号のそれぞれが、ゲイン調整部62−1乃至ゲイン調整部62−Kのそれぞれに供給される。
ステップS42において、分析部22は、供給された入力信号と、帯域分割部61から供給されたK個の共振帯域信号とから共振分析特徴量を抽出し、ゲイン調整量算出部23に供給する。
具体的には、例えば分析部22は、上述した式(1)の計算を行って入力信号の二乗平均平方根RMS_ab(n)を算出し、共振分析特徴量とする。
また、分析部22は、K個の共振帯域ごとに上述した式(2)と同様の計算を行って、各共振帯域信号の二乗平均平方根RMS_rbi(n)を算出し、共振分析特徴量とする。ここで、1≦i≦Kであり、二乗平均平方根RMS_rbi(n)はi番目の共振帯域の成分である共振帯域信号の二乗平均平方根を示している。
ステップS43において、ゲイン調整量算出部23は分析部22から供給された共振分析特徴量に基づいて、K個の共振帯域ごとに入力信号の共振帯域成分を抑圧する最適なゲイン調整量を算出し、ゲイン調整部62に供給する。
例えばゲイン調整量算出部23は、K個の共振帯域ごとに上述した式(3)に示したゲイン調整モデル、より詳細にはモデルパラメータを記録している。このとき、i番目(但し、1≦i≦K)の共振帯域のゲイン調整モデルは、説明変数Yと被説明変数とに、それぞれ二乗平均平方根RMS_rbi(n)とi番目の共振帯域のゲイン調整量とが用いられて学習されたものである。
ゲイン調整量算出部23は、二乗平均平方根RMS_ab(n)と、i番目の共振帯域の二乗平均平方根RMS_rbi(n)とを、i番目の共振帯域のモデルパラメータを用いて表される式(3)に代入し、その結果得られたF(X,Y)の値をi番目の共振帯域のゲイン調整量とする。そして、ゲイン調整量算出部23は、得られたi番目の共振帯域のゲイン調整量を、ゲイン調整部62−i(但し、1≦i≦K)に供給する。
なお、i番目の共振帯域のゲイン調整量の算出に、他の共振帯域の二乗平均平方根が用いられるようにしてもよい。そのような場合、例えばi番目の共振帯域のゲイン調整モデルは、次式(4)に示す統計解析モデルとされる。
なお、式(4)においてXは二乗平均平方根RMS_ab(n)とされ、Y1乃至YKは、それぞれ二乗平均平方根RMS_rb1(n)乃至二乗平均平方根RMS_rbK(n)とされる。したがって、この例では、二乗平均平方根RMS_ab(n)と、K個の共振帯域の二乗平均平方根RMS_rb1(n)乃至二乗平均平方根RMS_rbK(n)を説明変数とし、i番目の共振帯域のゲイン調整量を被説明変数として学習が行われる。またa,b,c1乃至cK,d1乃至dK,eは、それぞれモデルパラメータである。
この場合、ゲイン調整量算出部23は、二乗平均平方根RMS_ab(n)とK個の二乗平均平方根RMS_rbi(n)とを式(4)に代入し、その結果得られたF(X,Y1,…,YK)の値をi番目の共振帯域のゲイン調整量とする。
さらに、例えば二乗平均平方根RMS_ab(n)とK個の二乗平均平方根RMS_rbi(n)とから1つのゲイン調整モデルが学習され、そのゲイン調整モデルがK個の各共振帯域で共通に用いられるようにしてもよい。
ステップS44において、ゲイン調整部62はゲイン調整量算出部23からのゲイン調整量に基づいて、帯域分割部61からの共振帯域信号の振幅を変換することで、共振帯域信号のゲイン調整を行い、加算部25に供給する。具体的には、ゲイン調整部62−i(但し、1≦i≦K)はi番目の共振帯域のゲイン調整量を用いて、i番目の共振帯域の共振帯域信号のゲイン調整を行う。
ステップS45において、加算部25はK個のゲイン調整部62から供給されたK個の共振帯域信号と、帯域分割部61から供給された共振帯域外信号とを加算して出力信号を生成し、出力する。出力信号が出力されると、共振帯域成分抑圧処理は終了する。
以上のようにして、オーディオ信号処理装置51は、入力信号と複数の共振帯域信号とから共振分析特徴量を抽出し、共振分析特徴量に基づいて求められたゲイン調整量で共振帯域ごとに共振帯域信号のゲイン調整を行う。これにより、共振帯域ごとに適切に入力信号の共振帯域成分を抑圧し、より高品質な音声を得ることができるようになる。
〈第3の実施の形態〉
〈オーディオ信号処理装置の構成例〉
また、以上においては共振帯域のゲインを抑圧するために、共振分析特徴量から直接ゲイン調整量を算出し、共振帯域信号の振幅を変換する例について説明したが、入力信号に対して例えばノッチフィルタ等を用いて共振帯域のゲインを抑圧してもよい。
〈オーディオ信号処理装置の構成例〉
また、以上においては共振帯域のゲインを抑圧するために、共振分析特徴量から直接ゲイン調整量を算出し、共振帯域信号の振幅を変換する例について説明したが、入力信号に対して例えばノッチフィルタ等を用いて共振帯域のゲインを抑圧してもよい。
そのような場合、オーディオ信号処理装置は、例えば図7に示すように構成される。なお、図7において図1における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
図7に示すオーディオ信号処理装置91は、帯域分割部21、分析部22、共振制御情報算出部101、および共振制御部102を有している。
共振制御情報算出部101は、分析部22から供給された共振分析特徴量に基づいて、共振帯域成分を抑圧するための情報として共振制御情報を算出し、共振制御部102に供給する。共振制御部102は、共振制御情報算出部101から供給された共振制御情報に基づいて、供給された入力信号の共振帯域成分を抑圧し、その結果得られた信号を出力信号として出力する。
例えば共振制御部102において、入力信号の共振帯域成分を抑圧する処理として、ノッチフィルタ係数を用いたフィルタ処理、すなわちノッチフィルタ処理が行われる場合、共振制御情報としてノッチフィルタ係数が算出される。なお、以下では、共振制御部102においてノッチフィルタ処理が行われるものとして、説明を続ける。
〈共振帯域成分抑圧処理の説明〉
次に、オーディオ信号処理装置91の動作について説明する。以下、図8のフローチャートを参照して、オーディオ信号処理装置91による共振帯域成分抑圧処理について説明する。
次に、オーディオ信号処理装置91の動作について説明する。以下、図8のフローチャートを参照して、オーディオ信号処理装置91による共振帯域成分抑圧処理について説明する。
ステップS71において、帯域分割部21は、供給された入力信号を共振帯域信号と共振帯域外信号とに分割して、共振帯域信号を分析部22に供給する。
ステップS72において、分析部22は、供給された入力信号と、帯域分割部21から供給された共振帯域信号とから共振分析特徴量を抽出し、共振制御情報算出部101に供給する。例えば共振分析特徴量として、入力信号の二乗平均平方根RMS_ab(n)と、共振帯域信号の二乗平均平方根RMS_rb(n)とが算出される。
ステップS73において、共振制御情報算出部101は、分析部22から供給された共振分析特徴量に基づいて共振制御情報を算出し、共振制御部102に供給する。ここでは共振制御情報としてノッチフィルタ係数が算出される。
ステップS74において、共振制御部102は、共振制御情報算出部101から供給された共振制御情報に基づいて、供給された入力信号の共振帯域成分を抑圧し、その結果得られた出力信号を出力する。具体的には、共振制御情報としてのノッチフィルタ係数が用いられて、入力信号に対してノッチフィルタ処理が施され、入力信号の共振帯域成分が抑圧される。つまり、入力信号に対して直接、共振帯域のゲイン調整が行われる。
出力信号が出力されると、共振帯域成分抑圧処理は終了する。
以上のようにして、オーディオ信号処理装置91は、入力信号と共振帯域信号とから共振分析特徴量を抽出し、共振分析特徴量に基づいて求められた共振制御情報で適応的に入力信号の共振帯域成分のゲイン調整を行う。これにより、共振帯域だけでなく入力信号の全帯域についても考慮して、より適切に入力信号の共振帯域成分を抑圧することができる。その結果、より高品質な音声を得ることができるようになる。
〈第4の実施の形態〉
〈オーディオ信号処理装置の構成例〉
さらに、以上においては入力信号の共振帯域成分のゲイン調整を行う例について説明したが、共振帯域成分のゲイン調整に加えて入力信号の再生レベルの強調も行われるようにしてもよい。そのよう場合、オーディオ信号処理装置は、例えば図9に示すように構成される。なお、図9において図1における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
〈オーディオ信号処理装置の構成例〉
さらに、以上においては入力信号の共振帯域成分のゲイン調整を行う例について説明したが、共振帯域成分のゲイン調整に加えて入力信号の再生レベルの強調も行われるようにしてもよい。そのよう場合、オーディオ信号処理装置は、例えば図9に示すように構成される。なお、図9において図1における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
図9に示すオーディオ信号処理装置131は、帯域分割部21、分析部22、ゲイン調整部24、加算部25、再生レベル強調分析部141、マッピング制御情報決定部142、ゲイン調整量算出部143、およびマッピング処理部144を有している。
再生レベル強調分析部141は、供給された入力信号から再生レベル強調分析特徴量を抽出し、マッピング制御情報決定部142に供給する。
マッピング制御情報決定部142は、予め統計解析に基づいて学習されたマッピング制御モデルを用いて、再生レベル強調分析部141から供給された再生レベル強調分析特徴量からマッピング制御情報を求め、ゲイン調整量算出部143およびマッピング処理部144に供給する。ここで、マッピング制御情報は、入力信号の再生レベルを強調するときの強調度合いを示す情報である。
ゲイン調整量算出部143は、分析部22から供給された共振分析特徴量と、マッピング制御情報決定部142から供給されたマッピング制御情報とに基づいて、ゲイン調整量を決定し、ゲイン調整部24に供給する。
マッピング処理部144は、マッピング制御情報決定部142から供給されたマッピング制御情報に基づいて、加算部25から供給された信号に対するマッピング処理を行い、入力信号の再生レベルを強調する。マッピング処理部144は、再生レベルが強調された入力信号を、最終的な出力信号として出力する。なお、マッピング処理では、マッピング制御情報により定まる線形または非線形のマッピング関数が用いられて、入力信号に対する線形または非線形の振幅変換が行われる。
〈共振帯域成分抑圧処理の説明〉
次に、オーディオ信号処理装置131の動作について説明する。以下、図10のフローチャートを参照して、オーディオ信号処理装置131による共振帯域成分抑圧処理について説明する。なお、ステップS101およびステップS102の処理は、図2のステップS11およびステップS12の処理と同様であるので、その説明は省略する。
次に、オーディオ信号処理装置131の動作について説明する。以下、図10のフローチャートを参照して、オーディオ信号処理装置131による共振帯域成分抑圧処理について説明する。なお、ステップS101およびステップS102の処理は、図2のステップS11およびステップS12の処理と同様であるので、その説明は省略する。
ステップS103において、再生レベル強調分析部141は、供給された入力信号から再生レベル強調分析特徴量を抽出し、マッピング制御情報決定部142に供給する。
具体的には、例えば再生レベル強調分析部141は式(1)と同様の計算を行って、入力信号の二乗平均平方根RMS(n)を再生レベル強調分析特徴量として算出する。
なお、ここでは入力信号は前処理なしで分析される。つまり前処理なしで入力信号から特徴量の抽出が行われる。そのため、再生レベル強調分析特徴量として求められる二乗平均平方根RMS(n)は、共振分析特徴量として求められる二乗平均平方根RMS_ab(n)と等価となるが、必要に応じてDCカットなどの前処理が行われてから再生レベル強調分析特徴量の算出が行われてもよい。
また、その他、二乗平均平方根RMS(n)のt乗値(但し、t≧2)や、零交差率、周波数エンベロープの傾きなどを再生レベル強調分析特徴量として追加したり、それらの任意の組み合わせを再生レベル強調分析特徴量としたりしてもよい。
ステップS104において、マッピング制御情報決定部142はマッピング制御モデルを用いて、再生レベル強調分析部141から供給された再生レベル強調分析特徴量からマッピング制御情報を求め、ゲイン調整量算出部143およびマッピング処理部144に供給する。
例えば、マッピング制御情報決定部142には、学習用に用意された複数のマッピング制御情報を被説明変数とし、学習用に用意された再生レベル強調分析特徴量を説明変数として最小二乗法により線形回帰モデルの学習を行うことで生成されたマッピング制御モデルが予め記録されている。マッピング制御モデルは、例えば図11の曲線C21により表される2次関数の係数などとされる。
なお、図11において縦軸はマッピング制御情報を示しており、横軸は再生レベル強調分析特徴量としての二乗平均平方根RMS(n)を示している。
図11では、曲線C21は各再生レベル強調分析特徴量の値に対して定まるマッピング制御情報の値を示している。この例では、入力信号の音声の音量が小さく、再生レベル強調分析特徴量が小さいほど、マッピング制御情報の値も小さくなる。
マッピング制御情報決定部142は、マッピング制御モデルとして記録しているモデルパラメータにより定まる関数に、再生レベル強調分析特徴量を代入することで、マッピング制御情報を得る。
図10のフローチャートの説明に戻り、ステップS104においてマッピング制御情報が求められると、その後、ステップS105の処理が行われる。
ステップS105において、ゲイン調整量算出部143は、分析部22からの共振分析特徴量と、マッピング制御情報決定部142からのマッピング制御情報とに基づいてゲイン調整量を算出し、ゲイン調整部24に供給する。
ゲイン調整量算出部143は、ゲイン調整量F(X,Y)を被説明変数とし、共振分析特徴量としての二乗平均平方根RMS_ab(n)および二乗平均平方根RMS_rb(n)に加えて、さらにマッピング制御情報も説明変数として用いて学習されたゲイン調整モデルを記録している。
例えば学習により得られるゲイン調整モデルは、式(3)においてXを二乗平均平方根RMS_ab(n)と、マッピング制御情報から得られる所定値βとの和とし、Yを二乗平均平方根RMS_rb(n)と所定値βの和としたものとされる。ここで、所定値βは、マッピング制御情報αを二乗平均平方根と同じ次元の値となるように変換する式β=h(α)から得られる値、つまり関数h(α)にマッピング制御情報を代入して得られる値とされる。
このようなゲイン調整モデルにおいても、式(3)に示したゲイン調整モデルにおける場合と同様に、入力信号に含まれる共振帯域信号の割合が大きくなるほど、ゲイン調整量が大きくなり、共振帯域の成分がより大きく抑圧されるようになる。
また、後段のマッピング処理部144においては、マッピング制御情報が小さいほど、入力信号の再生レベルが強調されるようなマッピング処理が行われる。そのため、ゲイン調整モデルではマッピング制御情報が小さいほど、ゲイン調整量が大きくなる。つまり、マッピング処理での再生レベル強調量に応じて、予め共振帯域の成分が抑圧される。
なお、その他、例えば次式(5)に示すゲイン調整モデルが用いられるようにしてもよい。式(5)では、Xが二乗平均平方根RMS_ab(n)とされ、Yが二乗平均平方根RMS_rb(n)とされ、Zがマッピング制御情報とされる。また、式(5)においてa,b,c,d,e,f,gは、それぞれモデルパラメータである。
ゲイン調整量算出部143は、予め記録しているゲイン調整モデルにより示される関数(式)に共振分析特徴量としての二乗平均平方根RMS_ab(n)および二乗平均平方根RMS_rb(n)と、マッピング制御情報またはマッピング制御情報により定まる値βとを代入することで、ゲイン調整量を算出する。
ステップS106において、ゲイン調整部24はゲイン調整量算出部143からのゲイン調整量に基づいて、帯域分割部21からの共振帯域信号の振幅を変換することで、共振帯域信号のゲイン調整を行い、加算部25に供給する。
ステップS107において、加算部25はゲイン調整部24から供給された共振帯域信号と、帯域分割部21から供給された共振帯域外信号とを加算してマッピング処理部144に供給する。なお、以下、加算部25から出力される信号、つまり共振帯域信号と共振帯域外信号とを加算して得られる信号を加算信号とも称することとする。
ステップS108において、マッピング処理部144は、マッピング制御情報決定部142から供給されたマッピング制御情報を用いて、加算部25から供給された加算信号に対するマッピング処理を行う。
例えばマッピング処理部144は、加算信号における処理対象となっているn番目のサンプルのサンプル値xを、次式(6)に示す非線形のマッピング関数f(x)に代入して、加算信号の振幅変換を行なう。つまり、サンプル値xをマッピング関数f(x)に代入して得られた値が、最終的な出力信号のn番目のサンプルのサンプル値とされる。なお、この場合、加算信号のサンプル値xは、-1.0から1.0までの値となるように正規化されているものとする。また、式(6)において、αはマッピング制御情報の値を示している。
このようなマッピング関数f(x)は、図12に示すようにマッピング制御情報が小さいほど、急峻に変化する関数となる。なお、図12において、横軸は加算信号のサンプル値xを示しており、縦軸はマッピング関数f(x)の値を示している。また、曲線f11乃至曲線f13は、それぞれマッピング制御情報αが「3」、「5」、および「50」であるときのマッピング関数f(x)を表している。
図12から分かるように、マッピング制御情報が小さいほど、全体的にサンプル値xの変化に対するf(x)の変化量が大きいマッピング関数f(x)が用いられて、加算信号の振幅変換が行なわれる。このようにマッピング制御情報を変化させると、加算信号(入力信号)に対する増幅量が変化する。
例えば再生レベル強調分析特徴量として二乗平均平方根RMS(n)が求められる場合、入力信号の音声の音量が小さいほど、再生レベル強調分析特徴量は小さくなるので、これによりマッピング制御情報の値も小さくなる。また、マッピング制御情報が小さいほど、マッピング関数f(x)の傾きは大きくなる。
したがって、入力信号の音声の音量が全体的に小さいほど、サンプル値x=0を含むサンプル値xの大部分の区間において、より急峻に変化する特性のマッピング関数f(x)が用いられて、加算信号(入力信号)の振幅変換が行なわれる。
その結果、入力信号における全体として音量の小さい区間では、音量の小さい音声はより音量が大きい音声に変換されるように入力信号が振幅変換され、入力信号の再生レベルが強調される。これにより、例えば音量のダイナミックレンジの大きなコンテンツを、小型スピーカを内蔵する機器で再生する場合等においても、従来は聞こえにくかった小さい音を、より聞こえ易くすることができる。
また、入力信号における全体として音量の大きな区間においても、その中のサンプル値xが小さな信号に対しては、適度に急峻な特性のマッピング関数f(x)が用いられ、入力信号(加算信号)の振幅変換が行なわれる。
その結果、入力信号における全体として音量の大きな区間においても、その中の音量の小さな音声は音量の大きい音声に変換されるように入力信号が振幅変換され、入力信号の再生レベルが強調される。これにより、従来から比較的大きく再生されていた音も、さらに大きく聞こえるようになる。
さらに、マッピング制御情報により非線形なマッピング関数f(x)を変化させることで、より自由度の高い振幅変換を実現することができる。つまり、入力信号の特定区間全体の特性に応じて、最も効果的な特性の非線形関数をマッピング関数とすることで、処理対象のサンプルが含まれる区間の特性だけでなく、そのサンプルのサンプル値の大きさも考慮した振幅変換を行なうことができる。
なお、マッピング処理で用いられるマッピング関数f(x)は、非線形関数に限らず、−1≦x≦1であるサンプル値xに対して、−1≦f(x)≦1となる関数であれば、線形関数や指数関数など、どのような関数であってもよい。例えば、マッピング処理の効果の評価が高いものや聴感上適したものをマッピング関数として用いればよい。
マッピング処理部144は、マッピング処理により加算信号の振幅を変換して出力信号とすると、得られた出力信号を出力し、共振帯域成分抑圧処理は終了する。
以上のようにして、オーディオ信号処理装置131は、入力信号と共振帯域信号とから共振分析特徴量を抽出するとともに、入力信号から再生レベル強調分析特徴量を抽出してマッピング制御情報を得る。そして、オーディオ信号処理装置131は、共振分析特徴量とマッピング制御情報に基づいて求められたゲイン調整量で共振帯域信号のゲインを調整し、さらにマッピング制御情報に基づいて、共振帯域信号と共振帯域外信号を加算して得られた加算信号の振幅変換を行う。
このように共振分析特徴量とマッピング制御情報を用いてゲイン調整量を求めることで、より適切に入力信号の共振帯域成分を抑圧し、より高品質な音声を得ることができるようになる。特に、再生レベル強調技術と組み合わせた場合に、共振を効果的に抑圧したまま再生レベルを強調することができるため、より大音量で迫力のある音声再生を実現することが可能となる。
ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどが含まれる。
図13は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU501,ROM502,RAM503は、バス504により相互に接続されている。
バス504には、さらに、入出力インターフェース505が接続されている。入出力インターフェース505には、入力部506、出力部507、記録部508、通信部509、及びドライブ510が接続されている。
入力部506は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部507は、ディスプレイ、スピーカなどよりなる。記録部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインターフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア511を駆動する。
以上のように構成されるコンピュータでは、CPU501が、例えば、記録部508に記録されているプログラムを、入出力インターフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア511をドライブ510に装着することにより、入出力インターフェース505を介して、記録部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記録部508にインストールすることができる。その他、プログラムは、ROM502や記録部508に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
また、本明細書中に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
さらに、本技術は、以下の構成とすることも可能である。
(1)
音声の入力信号を帯域分割して共振帯域信号を生成する帯域分割部と、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出する分析部と、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出するゲイン調整量算出部と、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行うゲイン調整部と
を備えるオーディオ信号処理装置。
(2)
前記ゲイン調整量算出部は、学習により生成された統計解析モデルを用いて、前記特徴量に基づき前記ゲイン調整量を算出する
(1)に記載のオーディオ信号処理装置。
(3)
前記ゲイン調整量算出部は、複数の前記共振帯域ごとに前記ゲイン調整量を算出し、
前記ゲイン調整部は、前記複数の前記共振帯域ごとにゲイン調整を行う
(1)または(2)に記載のオーディオ信号処理装置。
(4)
前記入力信号から抽出された再生レベル強調特徴量と、学習により生成された前記再生レベル強調特徴量からマッピング制御情報を得るための情報とに基づいて、前記マッピング制御情報を決定するマッピング制御情報決定部と、
前記マッピング制御情報により定まる線形または非線形なマッピング関数に基づいて、ゲイン調整された前記入力信号を振幅変換するマッピング処理部と
をさらに備え、
前記ゲイン調整量算出部は、前記マッピング制御情報と前記分析部で抽出した前記特徴量に基づいて前記ゲイン調整量を算出する
(1)乃至(3)の何れか一項に記載のオーディオ信号処理装置。
(5)
前記ゲイン調整量は、前記入力信号に含まれる前記共振帯域信号の割合が大きくなるほど、大きくなる
(1)乃至(4)の何れか一項に記載のオーディオ信号処理装置。
(6)
前記帯域分割部は、前記入力信号を前記共振帯域信号と共振帯域外信号とに分割し、
前記ゲイン調整部は、前記共振帯域信号のゲイン調整を行い、
ゲイン調整された前記共振帯域信号と、前記共振帯域外信号とを加算する加算部をさらに備える
(1)乃至(3)の何れか一項に記載のオーディオ信号処理装置。
(7)
音声の入力信号を帯域分割して共振帯域信号を生成し、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行う
ステップを含むオーディオ信号処理方法。
(8)
音声の入力信号を帯域分割して共振帯域信号を生成し、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行う
ステップを含む処理をコンピュータに実行させるプログラム。
音声の入力信号を帯域分割して共振帯域信号を生成する帯域分割部と、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出する分析部と、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出するゲイン調整量算出部と、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行うゲイン調整部と
を備えるオーディオ信号処理装置。
(2)
前記ゲイン調整量算出部は、学習により生成された統計解析モデルを用いて、前記特徴量に基づき前記ゲイン調整量を算出する
(1)に記載のオーディオ信号処理装置。
(3)
前記ゲイン調整量算出部は、複数の前記共振帯域ごとに前記ゲイン調整量を算出し、
前記ゲイン調整部は、前記複数の前記共振帯域ごとにゲイン調整を行う
(1)または(2)に記載のオーディオ信号処理装置。
(4)
前記入力信号から抽出された再生レベル強調特徴量と、学習により生成された前記再生レベル強調特徴量からマッピング制御情報を得るための情報とに基づいて、前記マッピング制御情報を決定するマッピング制御情報決定部と、
前記マッピング制御情報により定まる線形または非線形なマッピング関数に基づいて、ゲイン調整された前記入力信号を振幅変換するマッピング処理部と
をさらに備え、
前記ゲイン調整量算出部は、前記マッピング制御情報と前記分析部で抽出した前記特徴量に基づいて前記ゲイン調整量を算出する
(1)乃至(3)の何れか一項に記載のオーディオ信号処理装置。
(5)
前記ゲイン調整量は、前記入力信号に含まれる前記共振帯域信号の割合が大きくなるほど、大きくなる
(1)乃至(4)の何れか一項に記載のオーディオ信号処理装置。
(6)
前記帯域分割部は、前記入力信号を前記共振帯域信号と共振帯域外信号とに分割し、
前記ゲイン調整部は、前記共振帯域信号のゲイン調整を行い、
ゲイン調整された前記共振帯域信号と、前記共振帯域外信号とを加算する加算部をさらに備える
(1)乃至(3)の何れか一項に記載のオーディオ信号処理装置。
(7)
音声の入力信号を帯域分割して共振帯域信号を生成し、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行う
ステップを含むオーディオ信号処理方法。
(8)
音声の入力信号を帯域分割して共振帯域信号を生成し、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行う
ステップを含む処理をコンピュータに実行させるプログラム。
11 オーディオ信号処理装置, 21 帯域分割部, 22 分析部, 23 ゲイン調整量算出部, 24 ゲイン調整部, 25 加算部, 61 帯域分割部, 62−1乃至62−K,62 ゲイン調整部, 101 共振制御情報算出部, 102 共振制御部, 141 再生レベル強調分析部, 142 マッピング制御情報決定部, 143 ゲイン調整量算出部, 144 マッピング処理部
Claims (8)
- 音声の入力信号を帯域分割して共振帯域信号を生成する帯域分割部と、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出する分析部と、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出するゲイン調整量算出部と、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行うゲイン調整部と
を備えるオーディオ信号処理装置。 - 前記ゲイン調整量算出部は、学習により生成された統計解析モデルを用いて、前記特徴量に基づき前記ゲイン調整量を算出する
請求項1に記載のオーディオ信号処理装置。 - 前記ゲイン調整量算出部は、複数の前記共振帯域ごとに前記ゲイン調整量を算出し、
前記ゲイン調整部は、前記複数の前記共振帯域ごとにゲイン調整を行う
請求項1に記載のオーディオ信号処理装置。 - 前記入力信号から抽出された再生レベル強調特徴量と、学習により生成された前記再生レベル強調特徴量からマッピング制御情報を得るための情報とに基づいて、前記マッピング制御情報を決定するマッピング制御情報決定部と、
前記マッピング制御情報により定まる線形または非線形なマッピング関数に基づいて、ゲイン調整された前記入力信号を振幅変換するマッピング処理部と
をさらに備え、
前記ゲイン調整量算出部は、前記マッピング制御情報と前記分析部で抽出した前記特徴量に基づいて前記ゲイン調整量を算出する
請求項1に記載のオーディオ信号処理装置。 - 前記ゲイン調整量は、前記入力信号に含まれる前記共振帯域信号の割合が大きくなるほど、大きくなる
請求項1に記載のオーディオ信号処理装置。 - 前記帯域分割部は、前記入力信号を前記共振帯域信号と共振帯域外信号とに分割し、
前記ゲイン調整部は、前記共振帯域信号のゲイン調整を行い、
ゲイン調整された前記共振帯域信号と、前記共振帯域外信号とを加算する加算部をさらに備える
請求項1に記載のオーディオ信号処理装置。 - 音声の入力信号を帯域分割して共振帯域信号を生成し、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行う
ステップを含むオーディオ信号処理方法。 - 音声の入力信号を帯域分割して共振帯域信号を生成し、
前記共振帯域信号および前記入力信号から各々の特徴量を抽出し、
前記共振帯域信号の前記特徴量、および前記入力信号の前記特徴量に基づいて、前記入力信号の共振帯域のゲイン調整量を算出し、
前記ゲイン調整量に基づいて、前記入力信号における前記共振帯域のゲイン調整を行う
ステップを含む処理をコンピュータに実行させるプログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013182022A JP2015050685A (ja) | 2013-09-03 | 2013-09-03 | オーディオ信号処理装置および方法、並びにプログラム |
| US14/466,737 US9836272B2 (en) | 2013-09-03 | 2014-08-22 | Audio signal processing apparatus, method, and program |
| CN201410429238.6A CN104426495A (zh) | 2013-09-03 | 2014-08-27 | 音频信号处理装置、方法和程序 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013182022A JP2015050685A (ja) | 2013-09-03 | 2013-09-03 | オーディオ信号処理装置および方法、並びにプログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2015050685A true JP2015050685A (ja) | 2015-03-16 |
Family
ID=52583315
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013182022A Pending JP2015050685A (ja) | 2013-09-03 | 2013-09-03 | オーディオ信号処理装置および方法、並びにプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US9836272B2 (ja) |
| JP (1) | JP2015050685A (ja) |
| CN (1) | CN104426495A (ja) |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP2262108B1 (en) | 2004-10-26 | 2017-03-01 | Dolby Laboratories Licensing Corporation | Adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
| TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
| CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
| US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
| CN119495308A (zh) | 2012-05-18 | 2025-02-21 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
| UA129991C2 (uk) | 2013-01-21 | 2025-10-08 | Долбі Лабораторіс Лайсензін Корпорейшн | Блок та спосіб обробки звукового сигналу, носій інформації |
| KR20240055146A (ko) | 2013-01-21 | 2024-04-26 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
| CN116665683A (zh) | 2013-02-21 | 2023-08-29 | 杜比国际公司 | 用于参数化多声道编码的方法 |
| CN107093991B (zh) | 2013-03-26 | 2020-10-09 | 杜比实验室特许公司 | 基于目标响度的响度归一化方法和设备 |
| US9635417B2 (en) | 2013-04-05 | 2017-04-25 | Dolby Laboratories Licensing Corporation | Acquisition, recovery, and matching of unique information from file-based media for automated file detection |
| TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
| CN116741189A (zh) | 2013-09-12 | 2023-09-12 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
| JP6476192B2 (ja) | 2013-09-12 | 2019-02-27 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 多様な再生環境のためのダイナミックレンジ制御 |
| CN110808723B (zh) | 2014-05-26 | 2024-09-17 | 杜比实验室特许公司 | 音频信号响度控制 |
| EP4372746B1 (en) | 2014-10-10 | 2025-06-25 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
| CN107071634B (zh) * | 2017-03-03 | 2023-11-10 | Gn听力公司 | 信号处理装置、方法和扬声器 |
| US11689169B1 (en) * | 2021-02-26 | 2023-06-27 | Apple Inc. | Linking audio amplification gain reduction per channel and across frequency ranges |
| JP2024048957A (ja) * | 2022-09-28 | 2024-04-09 | パナソニックオートモーティブシステムズ株式会社 | 信号処理装置、信号処理方法及びプログラム |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH09270723A (ja) * | 1996-03-29 | 1997-10-14 | Alps Electric Co Ltd | 携帯電話機の受信回路用ic |
| JP3972267B2 (ja) * | 1997-02-25 | 2007-09-05 | 日本ビクター株式会社 | デジタルオーディオ信号処理用記録媒体、プログラム用の通信方法及び受信方法、デジタルオーディオ信号用の通信方法及び受信方法、並びにデジタルオーディオ記録媒体 |
| NZ539237A (en) * | 2002-10-09 | 2006-11-30 | Univ East Carolina | Frequency altered feedback for treating non-stuttering pathologies |
| US20050117754A1 (en) * | 2003-12-02 | 2005-06-02 | Atsushi Sakawaki | Active noise cancellation helmet, motor vehicle system including the active noise cancellation helmet, and method of canceling noise in helmet |
| JP2005175674A (ja) * | 2003-12-09 | 2005-06-30 | Nec Corp | 信号圧縮伸張装置および携帯通信端末装置 |
| JP2008278476A (ja) * | 2007-04-05 | 2008-11-13 | Yamaha Corp | コンデンサマイク装置のsn比改善方法およびコンデンサマイク装置並びにコンデンサマイク装置搭載機器 |
| JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
| JP5903758B2 (ja) * | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
| JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
-
2013
- 2013-09-03 JP JP2013182022A patent/JP2015050685A/ja active Pending
-
2014
- 2014-08-22 US US14/466,737 patent/US9836272B2/en not_active Expired - Fee Related
- 2014-08-27 CN CN201410429238.6A patent/CN104426495A/zh active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| CN104426495A (zh) | 2015-03-18 |
| US9836272B2 (en) | 2017-12-05 |
| US20150063600A1 (en) | 2015-03-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2015050685A (ja) | オーディオ信号処理装置および方法、並びにプログラム | |
| JP5903758B2 (ja) | 信号処理装置および方法、プログラム、並びにデータ記録媒体 | |
| CN102149034B (zh) | 声音增强设备及方法 | |
| JP6290429B2 (ja) | 音声処理システム | |
| US20120275625A1 (en) | Signal processing device, method thereof, program, and data recording medium | |
| US9413316B2 (en) | Asymmetric polynomial psychoacoustic bass enhancement | |
| US8355908B2 (en) | Audio signal processing device for noise reduction and audio enhancement, and method for the same | |
| CN102549659A (zh) | 抑制音频信号中的噪声 | |
| JP2016518788A (ja) | 動的閾値を用いた周波数帯域圧縮 | |
| CN103886865A (zh) | 声音处理装置、声音处理方法和程序 | |
| EP3896998B1 (en) | Systems and methods for providing content-specific, personalized audio replay on customer devices | |
| JP2016134706A (ja) | ミキシング装置、信号ミキシング方法、及びミキシングプログラム | |
| EP2828853B1 (en) | Method and system for bias corrected speech level determination | |
| JP2009296298A (ja) | 音声信号処理装置および方法 | |
| US9697848B2 (en) | Noise suppression device and method of noise suppression | |
| JP4922427B2 (ja) | 信号補正装置 | |
| US9398387B2 (en) | Sound processing device, sound processing method, and program | |
| US9871497B2 (en) | Processing audio signal to produce enhanced audio signal | |
| CN115866482A (zh) | 一种音频处理方法及装置 | |
| WO2025006266A1 (en) | Enhancing audio content | |
| EP3896999A1 (en) | Systems and methods for a hearing assistive device | |
| CN120148544A (zh) | 一种音频信号的处理方法以及处理装置 | |
| JP6314803B2 (ja) | 信号処理装置、信号処理方法及びプログラム | |
| JP2018010207A (ja) | 音声信号処理装置及び音声信号処理プログラム |