JP2004061617A

JP2004061617A - 受話音声処理装置

Info

Publication number: JP2004061617A
Application number: JP2002216602A
Authority: JP
Inventors: Mutsumi Saito; 斎藤　睦巳
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2002-07-25
Filing date: 2002-07-25
Publication date: 2004-02-26
Also published as: US20040019481A1; US7428488B2

Abstract

【課題】本発明は、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる受話音声処理装置を提供することを目的とする。
【解決手段】各周波数帯域毎に設定された音声スペクトルに対する圧縮率に基づいて目標スペクトルを算出し、音声スペクトルを目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出し、このゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出して、フィルタ係数を設定されて受話音声信号に対するフィルタ処理を行うことにより、子音など受話音声の信号レベルの小さな部分が聞き取れるレベルにまで増幅され、音声の明瞭度を改善することができる。
【選択図】　　　図２

Description

【０００１】
【発明の属する技術分野】
本発明は、受話音声処理装置に関し、携帯電話における受話音声を明瞭にする受話音声処理装置に関する。
【０００２】
【従来の技術】
近年、携帯電話が広く普及している。図１は、従来の携帯電話の受話装置部の一例のブロック図を示す。アンテナ１０で受信された信号はＲＦ送受信部１２で同調された後、ベースバンド信号処理部１４でベースバンド信号に変換される。その後、音声復号化器１６で受話音声信号に復号化され、アンプ１８で増幅されスピーカ２０から音声として再生される。
【０００３】
ここで、音声復号化器１６としては、ディジタル信号処理により音声信号を高能率で圧縮・解凍する方式、例えば共役代数符号励起線形予測（ＣＳ−ＡＣＥＬＰ：Ｃｏｎｊｕｇａｔｅ　Ｓｔｒｕｃｔｕｒｅ−Ａｌｇｅｂｒａｉｃ　ＣＥＬＰ）のデコーダを用いることができる。あるいは、ベクトル和励起線形予測（ＶＳＥＬＰ：Ｖｅｃｔｏｒ　Ｓｕｍ　Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ　Ｐｒｅｄｉｃｔｉｏｎ）のデコーダや、ＡＤＰＣＭデコーダ、ＰＣＭデコーダ等であってもよい。
【０００４】
携帯電話は屋外で使用することが多く、交通騒音など周囲雑音がうるさい場所では通話が聞きづらくなることがしばしば起こる。これは、周囲雑音によるマスキング効果によって、音声の音量の小さな部分を聞き取りにくくなり、明瞭度が低下することによって起こる現象である。
【０００５】
ここで、送話側の音声については、混入した周囲雑音を取り除く、いわゆるノイズキャンセラが実装されており、通話相手に送信する音声については改善がなされている。しかし、受話音声については特に対策が取られておらず、雑音下で会話を行っている携帯電話使用者本人は相手の音声が聞き取りにくい。これに対する対策としては、使用者自身が音量を調節する方法が取られているのが現状である。
【０００６】
使用者が受話音量を変えるのではなく、周囲雑音に応じて受話音量を自動的に調整する方法がいくつか提案されている。例えば、特開平９−１３０４５３号公報に記載のものは、周囲雑音に応じて受話音量を調節する方法に関して、音量の増減速度について工夫を行っている。
【０００７】
また、特開平８−１６３２２７号公報に記載のものは、マイクロホンに入力される使用者自身の音声によって誤ったレベルが測定されてしまう点に着目し、音声／非音声の判別手段を設けて、レベル測定の確度を上げるようにしている。しかし、これらは単に受話音声の音量調整しかしておらず、音声の周波数特性についての考慮は全く行われていない。
【０００８】
一方、特開平５−２８４２００号及び特開平８−２６５０７５号公報に記載のものは、周囲雑音に応じて受話音声の音程を変換したり、再生する音域を調整したり行っている。
【０００９】
また、比較的精細な処理を行っているものとして、特開２０００−３４９８９３号公報に記載のものがある。これは、周囲雑音から音声へのマスキング量を算出した上で音声強調処理を行っている。
【００１０】
【発明が解決しようとする課題】
しかしながら上記従来例については、次のような問題がある。
【００１１】
特開平９−１３０４５３号、特開平８−１６３２２７号のような受話音量の自動調整のみでは、大きく増幅した際に歪が発生し、聴感上不快となることが予想され、また明瞭度の改善効果も限定的である。
【００１２】
また、特開平５−２８４２００号及び特開平８−２６５０７５号のような音程を変えたり再生する音域を制限してしまうものでは、音質つまり聞こえ方が変わってしまい、使用者が違和感を覚えるおそれがあり、明瞭度の改善は限定的である。
【００１３】
また、特開２０００−３４９８９３号のものは、一旦記録メディアに記録された音声を対象にしており、通話中リアルタイムに使用することは想定していない。また、使用されている音声強調処理自体が、従来型の帯域分割型ダイナミックレンジ圧縮処理であるため帯域分割に伴う問題がある。すなわち、帯域毎に異なる圧縮処理を施した信号を伸長して合成しする際に、帯域間の不連続性によって音声の違和感が発生するおそれがある。
【００１４】
本発明は、上記の点に鑑みなされたものであり、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる受話音声処理装置を提供することを目的とする。
【００１５】
【課題を解決するための手段】
請求項１に記載の発明は、受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
各周波数帯域毎に設定された前記音声スペクトルに対する圧縮率に基づいて目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を有することにより、
子音など受話音声の信号レベルの小さな部分が聞き取れるレベルにまで増幅され、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【００１６】
請求項２に記載の発明は、受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルに応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を有することにより、
雑音が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【００１７】
請求項３に記載の発明は、受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記音声スペクトルと前記雑音スペクトルの差分から前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を有することにより、
雑音が受話音声に対して非常に大きいときには、よりゲインを大きくし、逆に受話音声の方が雑音よりも十分に大きい場合には全く増幅しないようにする適応的な処理が可能となり、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【００１８】
請求項４に記載の発明は、受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
前記マスキング量に応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を有することにより、
マスキング量が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【００１９】
請求項５に記載の発明は、受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
前記マスキング量に応じて前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を有することにより、
マスキング量が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【００２０】
付記６に記載の発明は、前記ゲイン算出部で算出した各周波数帯域毎のゲイン値の時定数制御を行って前記フィルタ係数算出部に供給する時定数制御部を有することにより、
各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させることができる。
【００２１】
付記７に記載の発明は、送話マイクからの入力信号が使用者の発した音声であるか非音声であるかを判定する音声／非音声判定部と、
前記送話マイクからの入力信号が非音声であるときに、前記フィルタ部に前記フィルタ係数算出部からのフィルタ係数を設定するフィルタ係数調整部を有することにより、
使用者の発声中は極端な増幅をしないようにすることができる。
【００２２】
付記８に記載の発明は、送話マイクからの入力信号に対し使用者の頭部による回折効果を補償して前記周囲雑音周波数分析部に供給する補償フィルタを有することにより、
実際に耳元位置で聞こえる雑音の周波数特性が推定されるため、より現実に即した処理となり、明瞭な受話音声を得ることができる。
【００２３】
【発明の実施の形態】
図２は、本発明の受話音声処理装置の第１実施例のブロック図を示す。同図中、図１と同一部分には同一符号を付し、その説明を省略する。この実施例では、周囲雑音を参照する必要がなく、前もって各周波数毎の圧縮増幅率を設定した上で周波数毎に異なる比率で音声の圧縮増幅を行う。
【００２４】
図２において、音声復号化器１６で復号化された受話音声信号はフィルタ型圧縮増幅処理部３０内の周波数分析部３１及びフィルタ部３２に供給される。
【００２５】
周波数分析部３１は、受話音声信号の各周波数成分の大きさ（パワスペクトル）を算出する。以下、パワスペクトルを単に「スペクトル」という。周波数分析部３１としては、ＦＦＴ（Ｆａｓｔ　Ｆｏｕｒｉｅｒ　Ｔｒａｎｓｆｏｒｍ：高速フーリエ変換）を使用するのが演算量的に見て最も適しているが、その他の方法、すなわち、ＤＦＴ（Ｄｉｓｃｒｅｔｅ　Ｆｏｕｒｉｅｒ　Ｔｒａｎｓｆｏｒｍ：離散フーリエ変換）やフィルタバンク、あるいはウェーブレット変換等を用いてもよい。分析結果の音声スペクトルは目標スペクトル算出部３３及びゲイン算出部３４に供給される。
【００２６】
目標スペクトル算出部３３は、予め内部テーブル３５から供給される固定の圧縮率に従って音声スペクトルを圧縮増幅して目標スペクトルを算出してゲイン算出部３４に供給する。
【００２７】
雑音下では音声の小さな部分が雑音に隠されて聞こえないことが多いが、圧縮増幅を行えば小さい信号ほどより増幅されるため、雑音に埋もれやすい音も聞き取りやすくなる。このような圧縮増幅を周波数毎に行って得られるスペクトルを目標スペクトルとする。
【００２８】
この処理に用いられる圧縮率は、周波数帯域毎に異なる値が設定されており、周波数帯域毎に異なる比率で圧縮増幅が行われる。これは、受話音声は一般に低い周波数ではレベルが大きく、高い周波数はレベルが低くなるため、低い周波数についてはレベル圧縮をあまり行わなくてもよく、逆に高い周波数は周囲雑音に埋もれてしまうため、より大きなレベル圧縮を行う必要があるからである。
【００２９】
目標スペクトル算出部３３は、音声の帯域をＮ分割し、ｎ＝１〜Ｎとして、受話音声のスペクトルをＳｐｉ（ｎ）とし、目標スペクトルをＳｐｅ（ｎ）とすると、ｎ＝１〜Ｎのそれぞれについて、Ｓｐｉ（ｎ）をＳｐｅ（ｎ）とする変換を行う。この変換には図３（Ａ）または図３（Ｂ）で示すような関数を用いる。なお、ここでのＳｐｉ（ｎ）は、周波数分析部３１の出力をそのまま用いてもよいし、隣接する複数の周波数帯域を１つにまとめて分割数Ｎを少なくするようにしてもよい。
【００３０】
図３（Ａ），（Ｂ）において、横軸が入力信号のレベルであり、縦軸が目標とする出力信号のレベルであり、最大振幅値を０ｄＢとして表現する。図中の実線が圧縮無しの場合の入力信号のレベルと出力信号のレベルとの関係を示し、実線が圧縮された入力信号のレベルと出力信号のレベルとの関係を示している。これによって、入力信号のレベルに応じて目標とする出力信号のレベルが一意に決まる。図３（Ａ）は、出力ダイナミックレンジ／入力ダイナミックレンジで表される圧縮率Ｃ（ｎ）＝１／２の場合であり、図３（Ｂ）は、圧縮率Ｃ（ｎ）＝３／４の場合であるが、この圧縮率は正であればどんな値でもよい。ただし、Ｃ（ｎ）＞１．０の場合は伸長となり振幅の小さい音ほどより小さくなる。現実的には、Ｃ（ｎ）の値は、１／１０≦Ｃ（ｎ）＜１．０程度であり、事前の調査で最適な値が決定されて、内部テーブル３５に格納されている。
【００３１】
ゲイン算出部３４は周波数分析部３１からの音声スペクトルと目標スペクトルとを比較し、音声スペクトルを目標スペクトルまで増幅するために必要な各周波数帯域毎のゲイン値（音声スペクトルと目標スペクトルの差分）を算出する。ここで、ｎ＝１〜Ｎとして、ゲインの対数値をＧｄｂ（ｎ）とすると、
Ｇｄｂ（ｎ）＝Ｓｐｅ（ｎ）−Ｓｐｉ（ｎ）
と表わすことができる。そして、後にフィルタ係数の設計をすることを考慮し、対数（ｄＢ）で表わされたゲインについてリニアの値に変換しておく。リニアのゲイン値Ｇｌｉｎ（ｎ）を得るには、次式を用いる。
【００３２】
Ｇｌｉｎ（ｎ）＝ｐｏｗ（１０，Ｇｄｂ（ｎ）／２０）
ここで、ｐｏｗ（ａ，ｂ）はａのｂ乗を表わす。なお、図４（Ａ）〜（Ｄ）に、Ｓｐｉ，Ｓｐｅ，Ｇｄｂ，Ｇｌｉｎの一実施例を示す。
【００３３】
時定数制御部３６では内部テーブル３５から供給される固定の時定数を用いて、ゲイン算出部３４から供給される各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させるために時定数制御処理を行う。
【００３４】
その時点のゲインが直前のゲインよりも小さい時は、ゲインを下げようとしており、つまり、音声波形の振幅が増大しており、これは音声の立ち上がりであるので、次式でゲイン調整を行う。
【００３５】
ゲイン出力＝その時点でのゲイン値×ａ０＋直前のゲイン値×ａ１
その時点のゲインが直前のゲインよりも大きい時は、ゲインを上げようとしており、つまり、音声波形の振幅が減少しており、これは音声の立ち下がりであるので、次式でゲイン調整を行う。
【００３６】
ゲイン出力＝その時点でのゲイン値×ｂ０＋直前のゲイン値×ｂ１
例えば、音声の立ち上がりを急峻にしたい場合、係数ａ０を大きく、係数ａ１を小さくすればよい。逆に滑らかにしたい場合、係数ａ０を小さく、係数ａ１を大きくすれば、直前のゲイン値から大きく変化することはなく、ゲインの変化が滑らかになる。音声の立ち下がりの場合についても同様である。
【００３７】
ここで、例えば立ち上がりの時間をＸ（ｓｅｃ）とするならば、サンプリング周波数をｓｆとして、次式により係数ａ０，ａ１を決定する。
【００３８】
ａ０＝ｅｘｐ（−１．０／（ｓｆ×Ｘ＋１．０））
ａ１＝１．０−ａ０
例えば、音声の立ち上がりでは数ｍｓで目標とするゲインに到達するようにし、音声の立ち下がりでは数１０〜１００ｍｓ程度に設定すると、音声の歪み感が少なくなる。
【００３９】
図５に時定数制御の様子を示す。図５（Ａ）に平滑化される前のゲイン値を示す。これはゲイン算出部３４で算出された、ある周波数でのゲイン値について時間を追って観察したものである。そして、平滑化された後のゲイン値を図５（Ｂ）に示す。急峻な変化が無くなり、滑らかに変化していることが分かる。
【００４０】
フィルタ設計部３７は、ＦＦＴあるいはＤＦＴを用いた周波数サンプリング法により、各周波数帯域でのゲイン値を周波数軸上のサンプルデータとし、それを逆フーリエ変換することで、その周波数特性を持つディジタルフィルタを設計し、得られたフィルタ係数をフィルタ部３２に設定する。このフィルタ係数は時間とともに変化する。
【００４１】
あるいは、アナログフィルタの設計アルゴリズムを用いて、所定の周波数特性を持つアナログフィルタを設計したのち、双一次変換等を用いてアナログの伝達関数からディジタルフィルタ係数への変換を行ってもよい。
【００４２】
フィルタ部３２は、上記フィルタ係数を設定されて、音声復号化器１６から供給される受話音声信号のフィルタ処理を行う。フィルタ部３２は、一般的にはディジタルフィルタを用いるが、フィルタの形式は、ＦＩＲ（Ｆｉｎｉｔｅ　Ｉｍｐｕｌｓｅ　Ｒｅｓｐｏｎｓｅ：有限インパルス応答）フィルタでも良いし、ＩＩＲ（Ｉｎｆｉｎｉｔｅ　Ｉｍｐｕｌｓｅ　Ｒｅｓｐｏｎｓｅ：無限インパルス応答）フィルタでも良い。これにより、受話音声信号のスペクトルが目標スペクトルに整形されて出力され、アンプ１８及びスピーカ２０を通し音声として再生される。
【００４３】
図６（Ａ）はフィルタ型圧縮増幅処理部３０の入力受話音声信号の波形を示し、図６（Ｂ）はフィルタ型圧縮増幅処理部３０の出力受話音声信号の波形を示す。圧縮増幅処理によって、もともと振幅の低かった部分が増幅されていることがわかる。また、図７（Ａ）はフィルタ型圧縮増幅処理部３０の入力受話音声信号のスペクトルを示し、図７（Ｂ）はフィルタ型圧縮増幅処理部３０の出力受話音声信号のスペクトルを示す。これにより、周囲雑音によって聞き取りにくくなる高い周波数の部分がより強調されていることがわかる。
【００４４】
本実施例では、子音など受話音声の信号レベルの小さな部分が聞き取れるレベルにまで増幅され、明瞭に音声を聞き取ることができる。
【００４５】
図８は、本発明の受話音声処理装置の第２実施例のブロック図を示す。同図中、図２と同一部分には同一符号を付す。この実施例は、周囲雑音の周波数特性に応じて各周波数での圧縮率を調整できるようにしたものである。
【００４６】
図８において、音声復号化器１６で復号化された受話音声信号はフィルタ型圧縮増幅処理部４０内の周波数分析部３１及びフィルタ部３２に供給される。
【００４７】
周波数分析部３１は、受話音声信号の各周波数成分である音声スペクトルを算出する。周波数分析部３１としては、ＦＦＴを使用するのが演算量的に見て最も適しているが、その他の方法、すなわち、ＤＦＴやフィルタバンク、あるいはウェーブレット変換等を用いてもよい。分析結果の音声スペクトルは目標スペクトル算出部３３及びゲイン算出部３４に供給される。
【００４８】
一方、送話マイク４１から入力された信号は周波数分析部４２で周囲雑音として周波数分析され、雑音スペクトルが算出される。
【００４９】
圧縮率算出部４３は、雑音スペクトルから各周波数での圧縮率を求める。これは、雑音スペクトルとそれに対応する圧縮率を前もって決めておき、内部テーブル３５から雑音スペクトルに対応する圧縮率を読み込む。これにより、雑音が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、明瞭度を維持することができる。
【００５０】
ここで、雑音スペクトルをＳｐｎ（ｎ）とすると、各周波数帯域での圧縮率Ｃ（ｎ）は、Ｓｐｎ（ｎ）に応じた値を内部テーブル３５から読み出す。なお、計算によって算出してもよい。計算する場合には、次式を用いる。
【００５１】
Ｃ（ｎ）＝ｆ１（Ｓｐｎ（ｎ））
但し、ｆ１は雑音スペクトルから圧縮率を算出するための関数であり、例えば、以下のような式を用いる。
【００５２】

目標スペクトル算出部３３は、圧縮率算出部４３から供給される圧縮率に従って音声スペクトルを圧縮増幅して目標スペクトルを算出しゲイン算出部３４に供給する。
【００５３】
雑音下では音声の小さな部分が雑音に隠されて聞こえないことが多いが、圧縮増幅を行えば小さい信号ほどより増幅されるため、雑音に埋もれやすい音も聞き取りやすくなる。このような圧縮増幅を周波数毎に行って得られるスペクトルを目標スペクトルとする。この処理に用いられる圧縮率は、周波数帯域毎に異なる値が設定されており、周波数帯域毎に異なる比率で圧縮増幅が行われる。これは、受話音声は一般に低い周波数ではレベルが大きく、高い周波数はレベルが低くなるため、低い周波数についてはレベル圧縮をあまり行わなくてもよく、逆に高い周波数は周囲雑音に埋もれてしまうため、より大きなレベル圧縮を行う必要があるからである。
【００５４】
目標スペクトル算出部３３は、音声の帯域をＮ分割し、ｎ＝１〜Ｎとして、受話音声のスペクトルをＳｐｉ（ｎ）とし、目標スペクトルをＳｐｅ（ｎ）とすると、ｎ＝１〜Ｎのそれぞれについて、Ｓｐｉ（ｎ）をＳｐｅ（ｎ）とする変換を行う。この変換には図３（Ａ）または図３（Ｂ）で示すような関数を用いる。なお、ここでのＳｐｉ（ｎ）は、周波数分析部３１の出力をそのまま用いてもよいし、隣接する複数の周波数帯域を１つにまとめて分割数Ｎを少なくするようにしてもよい。
【００５５】
ゲイン算出部３４は周波数分析部３１からの音声スペクトルと目標スペクトルとを比較し、音声スペクトルを目標スペクトルまで増幅するために必要な各周波数帯域毎のゲイン値（音声スペクトルと目標スペクトルの差分）を算出する。
【００５６】
時定数制御部３６では内部テーブル３５から供給される固定の時定数を用いて、ゲイン算出部３４から供給される各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させるために時定数制御処理を行う。
【００５７】
その時点のゲインが直前のゲインよりも小さい時は、ゲインを下げようとしており、つまり、音声波形の振幅が増大しており、これは音声の立ち上がりであるので、次式でゲイン調整を行う。
【００５８】
ゲイン出力＝その時点でのゲイン値×ａ０＋直前のゲイン値×ａ１
その時点のゲインが直前のゲインよりも大きい時は、ゲインを上げようとしており、つまり、音声波形の振幅が減少しており、これは音声の立ち下がりであるので、次式でゲイン調整を行う。
【００５９】
ゲイン出力＝その時点でのゲイン値×ｂ０＋直前のゲイン値×ｂ１
ここで、例えば立ち上がりの時間をＸ（ｓｅｃ）とするならば、サンプリング周波数をｓｆとして、次式により係数ａ０，ａ１を決定する。
【００６０】
ａ０＝ｅｘｐ（−１．０／（ｓｆ×Ｘ＋１．０））
ａ１＝１．０−ａ０
例えば、音声の立ち上がりでは数ｍｓで目標とするゲインに到達するようにし、音声の立ち下がりでは数１０〜１００ｍｓ程度に設定すると、音声の歪み感が少なくなる。
【００６１】
フィルタ設計部３７は、ＦＦＴあるいはＤＦＴを用いた周波数サンプリング法により、各周波数帯域でのゲイン値を周波数軸上のサンプルデータとし、それを逆フーリエ変換することで、その周波数特性を持つディジタルフィルタを設計し、得られたフィルタ係数をフィルタ部３２に設定する。
【００６２】
フィルタ部３２は、上記フィルタ係数を設定されて、音声復号化器１６から供給される受話音声信号のフィルタ処理を行う。これにより、受話音声信号のスペクトルが目標スペクトルに整形されて出力され、アンプ１８及びスピーカ２０を通し音声として再生される。
【００６３】
図９は、本発明の受話音声処理装置の第３実施例のブロック図を示す。同図中、図８と同一部分には同一符号を付す。この実施例は、第２実施例の構成に対し、圧縮率算出部４３を、受話音声の周波数特性と周囲雑音の周波数特性との差分を算出する回路で置き換えたものである。
【００６４】
図９において、音声復号化器１６で復号化された受話音声信号はフィルタ型圧縮増幅処理部５０内の周波数分析部３１及びフィルタ部３２に供給される。
【００６５】
周波数分析部３１は、受話音声信号の各周波数成分である音声スペクトルを算出する。周波数分析部３１としては、ＦＦＴを使用するのが演算量的に見て最も適しているが、その他の方法、すなわち、ＤＦＴやフィルタバンク、あるいはウェーブレット変換等を用いてもよい。分析結果の音声スペクトルは周波数特性の差分計算部５１に供給される。
【００６６】
一方、送話マイク４１から入力された信号は周波数分析部４２で周囲雑音として周波数分析され、雑音スペクトルが算出されて周波数特性の差分計算部５１に供給される。
【００６７】
周波数特性の差分計算部５１では、音声スペクトルと雑音スペクトルの差分を計算する。差分をＳｐｄ（ｎ）とすると、Ｓｐｄ（ｎ）は次式で表される。
【００６８】
Ｓｐｄ（ｎ）＝Ｓｐｉ（ｎ）−Ｓｐｎ（ｎ）
ゲイン算出部５２は、スペクトルの差分Ｓｐｄ（ｎ）から直接、各周波数でのゲイン値を算出する。なお、ゲイン値は、Ｓｐｄ（ｎ）に応じた値を内部テーブル３５から読み出してもよいし、計算によって算出してもよい。
【００６９】
Ｓｐｄ（ｎ）の対数表現をＧｄｂ（ｎ）とすると、各周波数での圧縮率Ｃ（ｎ）は、
Ｃ（ｎ）＝ｆ２（Ｇｄｂ（ｎ））
によって計算される。ここでｆ２はスペクトルの差分からゲイン値を算出するための関数であり、例えば、以下のような式を用いてもよい。
【００７０】

時定数制御部３６では内部テーブル３５から供給される固定の時定数を用いて、ゲイン算出部３４から供給される各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させるために時定数制御処理を行う。
【００７１】
フィルタ設計部３７は、ＦＦＴあるいはＤＦＴを用いた周波数サンプリング法により、各周波数帯域でのゲイン値を周波数軸上のサンプルデータとし、それを逆フーリエ変換することで、その周波数特性を持つディジタルフィルタを設計し、得られたフィルタ係数をフィルタ部３２に設定する。
【００７２】
フィルタ部３２は、上記フィルタ係数を設定されて、音声復号化器１６から供給される受話音声信号のフィルタ処理を行う。これにより、受話音声信号のスペクトルが目標スペクトルに整形されて出力され、アンプ１８及びスピーカ２０を通し音声として再生される。
【００７３】
この実施例では、例えば雑音が受話音声に対して非常に大きいときには、よりゲインを大きくし、逆に受話音声の方が雑音よりも十分に大きい場合には全く増幅しないようにするといった、適応的な処理が可能となる。また、この処理は各周波数毎に行われる。
【００７４】
図１０は、本発明の受話音声処理装置の第４実施例のブロック図を示す。同図中、図８と同一部分には同一符号を付す。この実施例は、周囲雑音の周波数特性から圧縮率を算出する際に、聴覚のマスキング効果を考慮し、周囲雑音によるマスキング量を算出した上で圧縮率の算出を行う構成にしたものである。
【００７５】
図１０において、音声復号化器１６で復号化された受話音声信号はフィルタ型圧縮増幅処理部６０内の周波数分析部３１及びフィルタ部３２に供給される。
【００７６】
周波数分析部３１は、受話音声信号の各周波数成分である音声スペクトルを算出する。周波数分析部３１としては、ＦＦＴを使用するのが演算量的に見て最も適しているが、その他の方法、すなわち、ＤＦＴやフィルタバンク、あるいはウェーブレット変換等を用いてもよい。分析結果の音声スペクトルは目標スペクトル算出部３３及びゲイン算出部３４及びマスキング量算出部６１に供給される。
【００７７】
一方、送話マイク４１から入力された信号は周波数分析部４２で周囲雑音として周波数分析され、雑音スペクトルが算出されてマスキング量算出部６１に供給される。
【００７８】
マスキング量算出部６１では、雑音スペクトル及び音声スペクトルからマスキング量の算出を周波数毎に行う。一般にマスキングは、レベルの大きな信号がレベルの小さい信号をマスクする。そのため、まず雑音スペクトルと音声スペクトルとの大きさの差を算出し、差が一定以上の場合のみ、マスキング計算の対象とする。
【００７９】
まず、周波数間のマスキングについて考える。図１１を用いて周波数マスキングの算出方法を説明する。音声スペクトルと雑音スペクトルの差分Ｓｐｄ（ｎ）は次式で表される。
【００８０】
Ｓｐｄ（ｎ）＝Ｓｐｎ（ｎ）−Ｓｐｉ（ｎ）
そして、Ｓｐｄ（ｎ）＞Ｔｈｒｅｆの場合のみ、周波数マスキング計算を行う。Ｔｈｒｅｆは閾値であり、定数である。
【００８１】
マスキング効果は、マスクされる信号の周波数がマスクする信号の周波数に近い程強く、周波数が離れる程弱くなるということが知られている。そこで、以下の式のような関数を用いて、雑音信号が受話音声に与えるマスキング量Ｍａｓｋ（ｎ）（ｄＢ）を算出する。雑音信号によってマスクされる周波数をｎ’とすると、ｎ’≧ｎの場合は次式となり、
Ｍａｓｋ（ｎ’）＝Ｓｐｄ（ｎ）−Ｃ１×（ｎ’−ｎ）
ｎ’＜ｎの場合は次式となる。
【００８２】
Ｍａｓｋ（ｎ’）＝Ｓｐｄ（ｎ）−Ｃ２×（ｎ−ｎ’）
但し、Ｃ１，Ｃ２は正の定数である。
【００８３】
次に、時間軸でのマスキングを考える。図１２を用いて時間マスキングの算出方法を説明する。マスキングは時間がずれた２つの信号間でも起こることが分かっている。一般に時間的に前の信号が後の信号をマスクする。
【００８４】
ある時刻ｔにおける、ある周波数ｎの音声スペクトルと雑音スペクトルの差分Ｓｐｄ（ｔ，ｎ）は次式で表される。
【００８５】
Ｓｐｄ（ｔ，ｎ）＝Ｓｐｎ（ｔ，ｎ）−Ｓｐｉ（ｔ，ｎ）
そして、Ｓｐｄ（ｔ，ｎ）＞Ｔｈｒｅｔだった場合のみ、時間マスキングの計算を行う。Ｔｈｒｅｔは閾値であり、定数である。
【００８６】
周波数ｎについて、ある時刻ｔ’の信号が時刻ｔの信号によってマスクされる時間マスキング量をＭａｓｋ（ｔ’，ｎ）とすると、
Ｍａｓｋ（ｔ’，ｎ）＝Ｓｐｄ（ｔ，ｎ）−Ｃ３×（ｔ’−ｔ）
但し、Ｃ３は正の定数であり、時刻ｔ’は必ず時刻ｔより後であるとする。すなわち、（ｔ’−ｔ）＞０である。
【００８７】
なお、マスキング量の算出は、周波数マスキングと時間マスキングの両方について行ってもいいし、どちらか一方のみを用いてもよい。
【００８８】
圧縮率算出部６２は、マスキング量から各周波数での圧縮率を求める。これは、マスキング量とそれに対応する圧縮率を前もって決めておき、内部テーブル３５からマスキング量に対応する圧縮率を読み込む。これにより、マスキング量が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、明瞭度を維持することができる。
【００８９】
目標スペクトル算出部３３は、圧縮率算出部６２から供給される圧縮率に従って音声スペクトルを圧縮増幅して目標スペクトルを算出しゲイン算出部３４に供給する。
【００９０】
ゲイン算出部３４は周波数分析部３１からの音声スペクトルと目標スペクトルとを比較し、音声スペクトルを目標スペクトルまで増幅するために必要な各周波数帯域毎のゲイン値（音声スペクトルと目標スペクトルの差分）を算出する。
【００９１】
時定数制御部３６では内部テーブル３５から供給される固定の時定数を用いて、ゲイン算出部３４から供給される各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させるために時定数制御処理を行う。
【００９２】
フィルタ設計部３７は、ＦＦＴあるいはＤＦＴを用いた周波数サンプリング法により、各周波数帯域でのゲイン値を周波数軸上のサンプルデータとし、それを逆フーリエ変換することで、その周波数特性を持つディジタルフィルタを設計し、得られたフィルタ係数をフィルタ部３２に設定する。
【００９３】
フィルタ部３２は、上記フィルタ係数を設定されて、音声復号化器１６から供給される受話音声信号のフィルタ処理を行う。これにより、受話音声信号のスペクトルが目標スペクトルに整形されて出力され、アンプ１８及びスピーカ２０を通し音声として再生される。
【００９４】
図１３は、本発明の受話音声処理装置の第５実施例のブロック図を示す。同図中、図１０と同一部分には同一符号を付す。この実施例は、マスキング量から直接ゲイン値を求める構成にしたものである。
【００９５】
図１３において、音声復号化器１６で復号化された受話音声信号はフィルタ型圧縮増幅処理部７０内の周波数分析部３１及びフィルタ部３２に供給される。
【００９６】
周波数分析部３１は、受話音声信号の各周波数成分である音声スペクトルを算出する。周波数分析部３１としては、ＦＦＴを使用するのが演算量的に見て最も適しているが、その他の方法、すなわち、ＤＦＴやフィルタバンク、あるいはウェーブレット変換等を用いてもよい。分析結果の音声スペクトルは目標スペクトル算出部３３及びゲイン算出部３４及びマスキング量算出部６１に供給される。
【００９７】
一方、送話マイク４１から入力された信号は周波数分析部４２で周囲雑音として周波数分析され、雑音スペクトルが算出されてマスキング量算出部６１に供給される。
【００９８】
マスキング量算出部６１では、雑音スペクトル及び音声スペクトルから周波数マスキングと時間マスキングの両方についてマスキング量の算出を行う。ゲイン算出部７１は、算出されたマスキング量を各周波数毎に読み取り、そのマスキング量に合ったゲイン値を内部テーブル３５から読み出す。この場合、マスキング量が大きい程、ゲインは大きな値となる。
【００９９】
時定数制御部３６では内部テーブル３５から供給される固定の時定数を用いて、ゲイン算出部３４から供給される各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させるために時定数制御処理を行う。
【０１００】
フィルタ設計部３７は、ＦＦＴあるいはＤＦＴを用いた周波数サンプリング法により、各周波数帯域でのゲイン値を周波数軸上のサンプルデータとし、それを逆フーリエ変換することで、その周波数特性を持つディジタルフィルタを設計し、得られたフィルタ係数をフィルタ部３２に設定する。
【０１０１】
フィルタ部３２は、上記フィルタ係数を設定されて、音声復号化器１６から供給される受話音声信号のフィルタ処理を行う。これにより、受話音声信号のスペクトルが目標スペクトルに整形されて出力され、アンプ１８及びスピーカ２０を通し音声として再生される。
【０１０２】
図１４は、周囲雑音の特性に応じて圧縮増幅の程度を調整する際に、送話マイク入力信号の音声／非音声判定を行ってフィルタ係数を調整する実施例の要部のブロック図を示す。同図中、図８と同一部分には同一符号を付す。
【０１０３】
図１４において、送話マイク４１から入力された信号は周波数分析部４２で周囲雑音として周波数分析されると共に、音声／非音声判定部７２に供給される。音声／非音声判定部７２では送話マイク４１の入力が音声であるか否かの判定を行う。非音声と判定された場合は、図８〜図１０，図１３で述べた処理を行う。
【０１０４】
音声／非音声判定部７２で音声と判定された場合には、使用者本人が発声している可能性が高いため、送話マイク４１の入力をそのまま周囲雑音として判定すると、受話音声が極端に増幅されてしまうため、フィルタ係数調整部７３において、以下のような処理を行う。
【０１０５】
（１）フィルタ設計部３７から供給されるフィルタ係数を初期値（例えば全く増幅を行わない値など）に置き換えてフィルタ部３２に設定する。
【０１０６】
（２）フィルタ係数の最大値を決め、フィルタ設計部３７から供給されるフィルタ係数が最大値を越える場合には、最大値に置き換えてフィルタ部３２に設定する。
【０１０７】
（３）フィルタ部３２のフィルタ係数の更新を止める。つまり、非音声状態から音声状態に切り替わる直前のフィルタ係数をそのまま保持する。
【０１０８】
図８〜図１０，図１３それぞれの構成では、使用者が発声している間に、それを過大な周囲雑音と判断して受話音声を極端に増幅してしまい、使用者に不快感を与える恐れがあるが、図１４の構成とすることにより、使用者の発声中は極端な増幅をしないようにすることができる。
【０１０９】
図１５は、雑音信号の頭部による回折効果を補償する実施例のブロック図を示す。同図中、送話マイク４１の出力信号を頭部の回折効果を補償する補償フィルタ７４に通したのち周波数分析部４２に供給する。この補償フィルタ７４は、使用者の頭部の回折効果による、送話マイク４１の入力と現実に耳に入力する周囲雑音との差分を補償するものであり、前もってフィルタ係数を設計しておく。これにより、実際に耳元位置で聞こえる雑音の周波数特性が推定されるため、より現実に即した処理となり、明瞭な受話音声を得ることができる。
【０１１０】
補償フィルタ７４のフィルタ係数を求める方法を図１６に示す。図１６において、スピーカ７５からテスト信号を再生し、マイク７６及びマイク７７にて収録する。マイク７６は耳元位置に置き、マイク７７は携帯電話７８のマイク位置に置く。マイク７６で得られる周波数特性と、マイク７７で得られる周波数特性の差を測定し、その差を補償するフィルタ係数を前もって算出する。あるいは、マイク７６、マイク７７におけるインパルス応答を計測し、そのインパルス応答の差分からフィルタを設計するようにしてもよい。
【０１１１】
（付記１）　受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
各周波数帯域毎に設定された前記音声スペクトルに対する圧縮率に基づいて目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
【０１１２】
（付記２）　受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルに応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
【０１１３】
（付記３）　受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記音声スペクトルと前記雑音スペクトルの差分から前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
【０１１４】
（付記４）　受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
前記マスキング量に応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
【０１１５】
（付記５）　受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
前記マスキング量に応じて前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
【０１１６】
（付記６）　付記１乃至５の何れか記載の受話音声処理装置において、
前記ゲイン算出部で算出した各周波数帯域毎のゲイン値の時定数制御を行って前記フィルタ係数算出部に供給する時定数制御部を
有することを特徴とする受話音声処理装置。
【０１１７】
（付記７）　付記２乃至６の何れか記載の受話音声処理装置において、
前記送話マイクからの入力信号が使用者の発した音声であるか非音声であるかを判定する音声／非音声判定部と、
前記送話マイクからの入力信号が非音声であるときに、前記フィルタ部に前記フィルタ係数算出部からのフィルタ係数を設定するフィルタ係数調整部を
有することを特徴とする受話音声処理装置。
【０１１８】
（付記８）　付記２乃至７の何れか記載の受話音声処理装置において、
前記送話マイクからの入力信号に対し使用者の頭部による回折効果を補償して前記周囲雑音周波数分析部に供給する補償フィルタを
有することを特徴とする受話音声処理装置。
【０１１９】
【発明の効果】
上述の如く、請求項１に記載の発明によれば、子音など受話音声の信号レベルの小さな部分が聞き取れるレベルにまで増幅され、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【０１２０】
また、請求項２に記載の発明によれば、雑音が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【０１２１】
また、請求項３に記載の発明によれば、雑音が受話音声に対して非常に大きいときには、よりゲインを大きくし、逆に受話音声の方が雑音よりも十分に大きい場合には全く増幅しないようにする適応的な処理が可能となり、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【０１２２】
また、請求項４に記載の発明によれば、マスキング量が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【０１２３】
また、請求項５に記載の発明によれば、マスキング量が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【０１２４】
また、付記６に記載の発明によれば、各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させることができる。
【０１２５】
また、付記７に記載の発明によれば、使用者の発声中は極端な増幅をしないようにすることができる。
【０１２６】
また、付記８に記載の発明によれば、実際に耳元位置で聞こえる雑音の周波数特性が推定されるため、より現実に即した処理となり、明瞭な受話音声を得ることができる。
【図面の簡単な説明】
【図１】従来の携帯電話の受話装置部の一例のブロック図である。
【図２】本発明の受話音声処理装置の第１実施例のブロック図である。
【図３】圧縮増幅の変換関数を示す図である。
【図４】スペクトル及びゲインの一例を示す図である。
【図５】時定数制御の様子を示す図である。
【図６】フィルタ型圧縮増幅処理部の入出力受話音声信号の波形図である。
【図７】フィルタ型圧縮増幅処理部の入出力受話音声信号のスペクトルを示す図である。
【図８】本発明の受話音声処理装置の第２実施例のブロック図である。
【図９】本発明の受話音声処理装置の第３実施例のブロック図である。
【図１０】本発明の受話音声処理装置の第４実施例のブロック図である。
【図１１】周波数マスキングの算出方法を説明するための図である。
【図１２】時間マスキングの算出方法を説明するための図である。
【図１３】本発明の受話音声処理装置の第５実施例のブロック図である。
【図１４】フィルタ係数を調整する実施例の要部のブロック図である。
【図１５】雑音信号の頭部による回折効果を補償する実施例のブロック図である。
【図１６】フィルタ係数を求める方法を説明するための図である。
【符号の説明】
１０　アンテナ
１２　ＲＦ送受信部
１４　ベースバンド信号処理部
１６　音声復号化器
１８　アンプ
２０　スピーカ
３０，４０，５０，６０，７０　フィルタ型圧縮増幅処理部
３１　周波数分析部３１
３２　フィルタ部
３３　目標スペクトル算出部
３４，５２，７１　ゲイン算出部
３５　内部テーブル
３６　時定数制御部
３７　フィルタ設計部
４１　送話マイク
４２　周波数分析部
４３，６２　圧縮率算出部
５１　差分計算部
６１　マスキング量算出部
７２　音声／非音声判定部
７３　フィルタ係数調整部
７４　補償フィルタ
７５　スピーカ
７６，７７　マイク

Claims

受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
各周波数帯域毎に設定された前記音声スペクトルに対する圧縮率に基づいて目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルに応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記音声スペクトルと前記雑音スペクトルの差分から前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
前記マスキング量に応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
前記マスキング量に応じて前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。