[go: up one dir, main page]

JP2004061617A - 受話音声処理装置 - Google Patents

受話音声処理装置 Download PDF

Info

Publication number
JP2004061617A
JP2004061617A JP2002216602A JP2002216602A JP2004061617A JP 2004061617 A JP2004061617 A JP 2004061617A JP 2002216602 A JP2002216602 A JP 2002216602A JP 2002216602 A JP2002216602 A JP 2002216602A JP 2004061617 A JP2004061617 A JP 2004061617A
Authority
JP
Japan
Prior art keywords
spectrum
filter
frequency
calculates
received voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002216602A
Other languages
English (en)
Inventor
Mutsumi Saito
斎藤 睦巳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002216602A priority Critical patent/JP2004061617A/ja
Priority to US10/345,917 priority patent/US7428488B2/en
Publication of JP2004061617A publication Critical patent/JP2004061617A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

【課題】本発明は、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる受話音声処理装置を提供することを目的とする。
【解決手段】各周波数帯域毎に設定された音声スペクトルに対する圧縮率に基づいて目標スペクトルを算出し、音声スペクトルを目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出し、このゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出して、フィルタ係数を設定されて受話音声信号に対するフィルタ処理を行うことにより、子音など受話音声の信号レベルの小さな部分が聞き取れるレベルにまで増幅され、音声の明瞭度を改善することができる。
【選択図】   図2

Description

【0001】
【発明の属する技術分野】
本発明は、受話音声処理装置に関し、携帯電話における受話音声を明瞭にする受話音声処理装置に関する。
【0002】
【従来の技術】
近年、携帯電話が広く普及している。図1は、従来の携帯電話の受話装置部の一例のブロック図を示す。アンテナ10で受信された信号はRF送受信部12で同調された後、ベースバンド信号処理部14でベースバンド信号に変換される。その後、音声復号化器16で受話音声信号に復号化され、アンプ18で増幅されスピーカ20から音声として再生される。
【0003】
ここで、音声復号化器16としては、ディジタル信号処理により音声信号を高能率で圧縮・解凍する方式、例えば共役代数符号励起線形予測(CS−ACELP:Conjugate Structure−Algebraic CELP)のデコーダを用いることができる。あるいは、ベクトル和励起線形予測(VSELP:Vector Sum Excited Linear Prediction)のデコーダや、ADPCMデコーダ、PCMデコーダ等であってもよい。
【0004】
携帯電話は屋外で使用することが多く、交通騒音など周囲雑音がうるさい場所では通話が聞きづらくなることがしばしば起こる。これは、周囲雑音によるマスキング効果によって、音声の音量の小さな部分を聞き取りにくくなり、明瞭度が低下することによって起こる現象である。
【0005】
ここで、送話側の音声については、混入した周囲雑音を取り除く、いわゆるノイズキャンセラが実装されており、通話相手に送信する音声については改善がなされている。しかし、受話音声については特に対策が取られておらず、雑音下で会話を行っている携帯電話使用者本人は相手の音声が聞き取りにくい。これに対する対策としては、使用者自身が音量を調節する方法が取られているのが現状である。
【0006】
使用者が受話音量を変えるのではなく、周囲雑音に応じて受話音量を自動的に調整する方法がいくつか提案されている。例えば、特開平9−130453号公報に記載のものは、周囲雑音に応じて受話音量を調節する方法に関して、音量の増減速度について工夫を行っている。
【0007】
また、特開平8−163227号公報に記載のものは、マイクロホンに入力される使用者自身の音声によって誤ったレベルが測定されてしまう点に着目し、音声/非音声の判別手段を設けて、レベル測定の確度を上げるようにしている。しかし、これらは単に受話音声の音量調整しかしておらず、音声の周波数特性についての考慮は全く行われていない。
【0008】
一方、特開平5−284200号及び特開平8−265075号公報に記載のものは、周囲雑音に応じて受話音声の音程を変換したり、再生する音域を調整したり行っている。
【0009】
また、比較的精細な処理を行っているものとして、特開2000−349893号公報に記載のものがある。これは、周囲雑音から音声へのマスキング量を算出した上で音声強調処理を行っている。
【0010】
【発明が解決しようとする課題】
しかしながら上記従来例については、次のような問題がある。
【0011】
特開平9−130453号、特開平8−163227号のような受話音量の自動調整のみでは、大きく増幅した際に歪が発生し、聴感上不快となることが予想され、また明瞭度の改善効果も限定的である。
【0012】
また、特開平5−284200号及び特開平8−265075号のような音程を変えたり再生する音域を制限してしまうものでは、音質つまり聞こえ方が変わってしまい、使用者が違和感を覚えるおそれがあり、明瞭度の改善は限定的である。
【0013】
また、特開2000−349893号のものは、一旦記録メディアに記録された音声を対象にしており、通話中リアルタイムに使用することは想定していない。また、使用されている音声強調処理自体が、従来型の帯域分割型ダイナミックレンジ圧縮処理であるため帯域分割に伴う問題がある。すなわち、帯域毎に異なる圧縮処理を施した信号を伸長して合成しする際に、帯域間の不連続性によって音声の違和感が発生するおそれがある。
【0014】
本発明は、上記の点に鑑みなされたものであり、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる受話音声処理装置を提供することを目的とする。
【0015】
【課題を解決するための手段】
請求項1に記載の発明は、受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
各周波数帯域毎に設定された前記音声スペクトルに対する圧縮率に基づいて目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を有することにより、
子音など受話音声の信号レベルの小さな部分が聞き取れるレベルにまで増幅され、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【0016】
請求項2に記載の発明は、受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルに応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を有することにより、
雑音が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【0017】
請求項3に記載の発明は、受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記音声スペクトルと前記雑音スペクトルの差分から前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を有することにより、
雑音が受話音声に対して非常に大きいときには、よりゲインを大きくし、逆に受話音声の方が雑音よりも十分に大きい場合には全く増幅しないようにする適応的な処理が可能となり、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【0018】
請求項4に記載の発明は、受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
前記マスキング量に応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を有することにより、
マスキング量が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【0019】
請求項5に記載の発明は、受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
前記マスキング量に応じて前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を有することにより、
マスキング量が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【0020】
付記6に記載の発明は、前記ゲイン算出部で算出した各周波数帯域毎のゲイン値の時定数制御を行って前記フィルタ係数算出部に供給する時定数制御部を有することにより、
各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させることができる。
【0021】
付記7に記載の発明は、送話マイクからの入力信号が使用者の発した音声であるか非音声であるかを判定する音声/非音声判定部と、
前記送話マイクからの入力信号が非音声であるときに、前記フィルタ部に前記フィルタ係数算出部からのフィルタ係数を設定するフィルタ係数調整部を有することにより、
使用者の発声中は極端な増幅をしないようにすることができる。
【0022】
付記8に記載の発明は、送話マイクからの入力信号に対し使用者の頭部による回折効果を補償して前記周囲雑音周波数分析部に供給する補償フィルタを有することにより、
実際に耳元位置で聞こえる雑音の周波数特性が推定されるため、より現実に即した処理となり、明瞭な受話音声を得ることができる。
【0023】
【発明の実施の形態】
図2は、本発明の受話音声処理装置の第1実施例のブロック図を示す。同図中、図1と同一部分には同一符号を付し、その説明を省略する。この実施例では、周囲雑音を参照する必要がなく、前もって各周波数毎の圧縮増幅率を設定した上で周波数毎に異なる比率で音声の圧縮増幅を行う。
【0024】
図2において、音声復号化器16で復号化された受話音声信号はフィルタ型圧縮増幅処理部30内の周波数分析部31及びフィルタ部32に供給される。
【0025】
周波数分析部31は、受話音声信号の各周波数成分の大きさ(パワスペクトル)を算出する。以下、パワスペクトルを単に「スペクトル」という。周波数分析部31としては、FFT(Fast Fourier Transform:高速フーリエ変換)を使用するのが演算量的に見て最も適しているが、その他の方法、すなわち、DFT(Discrete Fourier Transform:離散フーリエ変換)やフィルタバンク、あるいはウェーブレット変換等を用いてもよい。分析結果の音声スペクトルは目標スペクトル算出部33及びゲイン算出部34に供給される。
【0026】
目標スペクトル算出部33は、予め内部テーブル35から供給される固定の圧縮率に従って音声スペクトルを圧縮増幅して目標スペクトルを算出してゲイン算出部34に供給する。
【0027】
雑音下では音声の小さな部分が雑音に隠されて聞こえないことが多いが、圧縮増幅を行えば小さい信号ほどより増幅されるため、雑音に埋もれやすい音も聞き取りやすくなる。このような圧縮増幅を周波数毎に行って得られるスペクトルを目標スペクトルとする。
【0028】
この処理に用いられる圧縮率は、周波数帯域毎に異なる値が設定されており、周波数帯域毎に異なる比率で圧縮増幅が行われる。これは、受話音声は一般に低い周波数ではレベルが大きく、高い周波数はレベルが低くなるため、低い周波数についてはレベル圧縮をあまり行わなくてもよく、逆に高い周波数は周囲雑音に埋もれてしまうため、より大きなレベル圧縮を行う必要があるからである。
【0029】
目標スペクトル算出部33は、音声の帯域をN分割し、n=1〜Nとして、受話音声のスペクトルをSpi(n)とし、目標スペクトルをSpe(n)とすると、n=1〜Nのそれぞれについて、Spi(n)をSpe(n)とする変換を行う。この変換には図3(A)または図3(B)で示すような関数を用いる。なお、ここでのSpi(n)は、周波数分析部31の出力をそのまま用いてもよいし、隣接する複数の周波数帯域を1つにまとめて分割数Nを少なくするようにしてもよい。
【0030】
図3(A),(B)において、横軸が入力信号のレベルであり、縦軸が目標とする出力信号のレベルであり、最大振幅値を0dBとして表現する。図中の実線が圧縮無しの場合の入力信号のレベルと出力信号のレベルとの関係を示し、実線が圧縮された入力信号のレベルと出力信号のレベルとの関係を示している。これによって、入力信号のレベルに応じて目標とする出力信号のレベルが一意に決まる。図3(A)は、出力ダイナミックレンジ/入力ダイナミックレンジで表される圧縮率C(n)=1/2の場合であり、図3(B)は、圧縮率C(n)=3/4の場合であるが、この圧縮率は正であればどんな値でもよい。ただし、C(n)>1.0の場合は伸長となり振幅の小さい音ほどより小さくなる。現実的には、C(n)の値は、1/10≦C(n)<1.0程度であり、事前の調査で最適な値が決定されて、内部テーブル35に格納されている。
【0031】
ゲイン算出部34は周波数分析部31からの音声スペクトルと目標スペクトルとを比較し、音声スペクトルを目標スペクトルまで増幅するために必要な各周波数帯域毎のゲイン値(音声スペクトルと目標スペクトルの差分)を算出する。ここで、n=1〜Nとして、ゲインの対数値をGdb(n)とすると、
Gdb(n)=Spe(n)−Spi(n)
と表わすことができる。そして、後にフィルタ係数の設計をすることを考慮し、対数(dB)で表わされたゲインについてリニアの値に変換しておく。リニアのゲイン値Glin(n)を得るには、次式を用いる。
【0032】
Glin(n)=pow(10,Gdb(n)/20)
ここで、pow(a,b)はaのb乗を表わす。なお、図4(A)〜(D)に、Spi,Spe,Gdb,Glinの一実施例を示す。
【0033】
時定数制御部36では内部テーブル35から供給される固定の時定数を用いて、ゲイン算出部34から供給される各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させるために時定数制御処理を行う。
【0034】
その時点のゲインが直前のゲインよりも小さい時は、ゲインを下げようとしており、つまり、音声波形の振幅が増大しており、これは音声の立ち上がりであるので、次式でゲイン調整を行う。
【0035】
ゲイン出力=その時点でのゲイン値×a0+直前のゲイン値×a1
その時点のゲインが直前のゲインよりも大きい時は、ゲインを上げようとしており、つまり、音声波形の振幅が減少しており、これは音声の立ち下がりであるので、次式でゲイン調整を行う。
【0036】
ゲイン出力=その時点でのゲイン値×b0+直前のゲイン値×b1
例えば、音声の立ち上がりを急峻にしたい場合、係数a0を大きく、係数a1を小さくすればよい。逆に滑らかにしたい場合、係数a0を小さく、係数a1を大きくすれば、直前のゲイン値から大きく変化することはなく、ゲインの変化が滑らかになる。音声の立ち下がりの場合についても同様である。
【0037】
ここで、例えば立ち上がりの時間をX(sec)とするならば、サンプリング周波数をsfとして、次式により係数a0,a1を決定する。
【0038】
a0=exp(−1.0/(sf×X+1.0))
a1=1.0−a0
例えば、音声の立ち上がりでは数msで目標とするゲインに到達するようにし、音声の立ち下がりでは数10〜100ms程度に設定すると、音声の歪み感が少なくなる。
【0039】
図5に時定数制御の様子を示す。図5(A)に平滑化される前のゲイン値を示す。これはゲイン算出部34で算出された、ある周波数でのゲイン値について時間を追って観察したものである。そして、平滑化された後のゲイン値を図5(B)に示す。急峻な変化が無くなり、滑らかに変化していることが分かる。
【0040】
フィルタ設計部37は、FFTあるいはDFTを用いた周波数サンプリング法により、各周波数帯域でのゲイン値を周波数軸上のサンプルデータとし、それを逆フーリエ変換することで、その周波数特性を持つディジタルフィルタを設計し、得られたフィルタ係数をフィルタ部32に設定する。このフィルタ係数は時間とともに変化する。
【0041】
あるいは、アナログフィルタの設計アルゴリズムを用いて、所定の周波数特性を持つアナログフィルタを設計したのち、双一次変換等を用いてアナログの伝達関数からディジタルフィルタ係数への変換を行ってもよい。
【0042】
フィルタ部32は、上記フィルタ係数を設定されて、音声復号化器16から供給される受話音声信号のフィルタ処理を行う。フィルタ部32は、一般的にはディジタルフィルタを用いるが、フィルタの形式は、FIR(Finite Impulse Response:有限インパルス応答)フィルタでも良いし、IIR(Infinite Impulse Response:無限インパルス応答)フィルタでも良い。これにより、受話音声信号のスペクトルが目標スペクトルに整形されて出力され、アンプ18及びスピーカ20を通し音声として再生される。
【0043】
図6(A)はフィルタ型圧縮増幅処理部30の入力受話音声信号の波形を示し、図6(B)はフィルタ型圧縮増幅処理部30の出力受話音声信号の波形を示す。圧縮増幅処理によって、もともと振幅の低かった部分が増幅されていることがわかる。また、図7(A)はフィルタ型圧縮増幅処理部30の入力受話音声信号のスペクトルを示し、図7(B)はフィルタ型圧縮増幅処理部30の出力受話音声信号のスペクトルを示す。これにより、周囲雑音によって聞き取りにくくなる高い周波数の部分がより強調されていることがわかる。
【0044】
本実施例では、子音など受話音声の信号レベルの小さな部分が聞き取れるレベルにまで増幅され、明瞭に音声を聞き取ることができる。
【0045】
図8は、本発明の受話音声処理装置の第2実施例のブロック図を示す。同図中、図2と同一部分には同一符号を付す。この実施例は、周囲雑音の周波数特性に応じて各周波数での圧縮率を調整できるようにしたものである。
【0046】
図8において、音声復号化器16で復号化された受話音声信号はフィルタ型圧縮増幅処理部40内の周波数分析部31及びフィルタ部32に供給される。
【0047】
周波数分析部31は、受話音声信号の各周波数成分である音声スペクトルを算出する。周波数分析部31としては、FFTを使用するのが演算量的に見て最も適しているが、その他の方法、すなわち、DFTやフィルタバンク、あるいはウェーブレット変換等を用いてもよい。分析結果の音声スペクトルは目標スペクトル算出部33及びゲイン算出部34に供給される。
【0048】
一方、送話マイク41から入力された信号は周波数分析部42で周囲雑音として周波数分析され、雑音スペクトルが算出される。
【0049】
圧縮率算出部43は、雑音スペクトルから各周波数での圧縮率を求める。これは、雑音スペクトルとそれに対応する圧縮率を前もって決めておき、内部テーブル35から雑音スペクトルに対応する圧縮率を読み込む。これにより、雑音が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、明瞭度を維持することができる。
【0050】
ここで、雑音スペクトルをSpn(n)とすると、各周波数帯域での圧縮率C(n)は、Spn(n)に応じた値を内部テーブル35から読み出す。なお、計算によって算出してもよい。計算する場合には、次式を用いる。
【0051】
C(n)=f1(Spn(n))
但し、f1は雑音スペクトルから圧縮率を算出するための関数であり、例えば、以下のような式を用いる。
【0052】
Figure 2004061617
目標スペクトル算出部33は、圧縮率算出部43から供給される圧縮率に従って音声スペクトルを圧縮増幅して目標スペクトルを算出しゲイン算出部34に供給する。
【0053】
雑音下では音声の小さな部分が雑音に隠されて聞こえないことが多いが、圧縮増幅を行えば小さい信号ほどより増幅されるため、雑音に埋もれやすい音も聞き取りやすくなる。このような圧縮増幅を周波数毎に行って得られるスペクトルを目標スペクトルとする。この処理に用いられる圧縮率は、周波数帯域毎に異なる値が設定されており、周波数帯域毎に異なる比率で圧縮増幅が行われる。これは、受話音声は一般に低い周波数ではレベルが大きく、高い周波数はレベルが低くなるため、低い周波数についてはレベル圧縮をあまり行わなくてもよく、逆に高い周波数は周囲雑音に埋もれてしまうため、より大きなレベル圧縮を行う必要があるからである。
【0054】
目標スペクトル算出部33は、音声の帯域をN分割し、n=1〜Nとして、受話音声のスペクトルをSpi(n)とし、目標スペクトルをSpe(n)とすると、n=1〜Nのそれぞれについて、Spi(n)をSpe(n)とする変換を行う。この変換には図3(A)または図3(B)で示すような関数を用いる。なお、ここでのSpi(n)は、周波数分析部31の出力をそのまま用いてもよいし、隣接する複数の周波数帯域を1つにまとめて分割数Nを少なくするようにしてもよい。
【0055】
ゲイン算出部34は周波数分析部31からの音声スペクトルと目標スペクトルとを比較し、音声スペクトルを目標スペクトルまで増幅するために必要な各周波数帯域毎のゲイン値(音声スペクトルと目標スペクトルの差分)を算出する。
【0056】
時定数制御部36では内部テーブル35から供給される固定の時定数を用いて、ゲイン算出部34から供給される各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させるために時定数制御処理を行う。
【0057】
その時点のゲインが直前のゲインよりも小さい時は、ゲインを下げようとしており、つまり、音声波形の振幅が増大しており、これは音声の立ち上がりであるので、次式でゲイン調整を行う。
【0058】
ゲイン出力=その時点でのゲイン値×a0+直前のゲイン値×a1
その時点のゲインが直前のゲインよりも大きい時は、ゲインを上げようとしており、つまり、音声波形の振幅が減少しており、これは音声の立ち下がりであるので、次式でゲイン調整を行う。
【0059】
ゲイン出力=その時点でのゲイン値×b0+直前のゲイン値×b1
ここで、例えば立ち上がりの時間をX(sec)とするならば、サンプリング周波数をsfとして、次式により係数a0,a1を決定する。
【0060】
a0=exp(−1.0/(sf×X+1.0))
a1=1.0−a0
例えば、音声の立ち上がりでは数msで目標とするゲインに到達するようにし、音声の立ち下がりでは数10〜100ms程度に設定すると、音声の歪み感が少なくなる。
【0061】
フィルタ設計部37は、FFTあるいはDFTを用いた周波数サンプリング法により、各周波数帯域でのゲイン値を周波数軸上のサンプルデータとし、それを逆フーリエ変換することで、その周波数特性を持つディジタルフィルタを設計し、得られたフィルタ係数をフィルタ部32に設定する。
【0062】
フィルタ部32は、上記フィルタ係数を設定されて、音声復号化器16から供給される受話音声信号のフィルタ処理を行う。これにより、受話音声信号のスペクトルが目標スペクトルに整形されて出力され、アンプ18及びスピーカ20を通し音声として再生される。
【0063】
図9は、本発明の受話音声処理装置の第3実施例のブロック図を示す。同図中、図8と同一部分には同一符号を付す。この実施例は、第2実施例の構成に対し、圧縮率算出部43を、受話音声の周波数特性と周囲雑音の周波数特性との差分を算出する回路で置き換えたものである。
【0064】
図9において、音声復号化器16で復号化された受話音声信号はフィルタ型圧縮増幅処理部50内の周波数分析部31及びフィルタ部32に供給される。
【0065】
周波数分析部31は、受話音声信号の各周波数成分である音声スペクトルを算出する。周波数分析部31としては、FFTを使用するのが演算量的に見て最も適しているが、その他の方法、すなわち、DFTやフィルタバンク、あるいはウェーブレット変換等を用いてもよい。分析結果の音声スペクトルは周波数特性の差分計算部51に供給される。
【0066】
一方、送話マイク41から入力された信号は周波数分析部42で周囲雑音として周波数分析され、雑音スペクトルが算出されて周波数特性の差分計算部51に供給される。
【0067】
周波数特性の差分計算部51では、音声スペクトルと雑音スペクトルの差分を計算する。差分をSpd(n)とすると、Spd(n)は次式で表される。
【0068】
Spd(n)=Spi(n)−Spn(n)
ゲイン算出部52は、スペクトルの差分Spd(n)から直接、各周波数でのゲイン値を算出する。なお、ゲイン値は、Spd(n)に応じた値を内部テーブル35から読み出してもよいし、計算によって算出してもよい。
【0069】
Spd(n)の対数表現をGdb(n)とすると、各周波数での圧縮率C(n)は、
C(n)=f2(Gdb(n))
によって計算される。ここでf2はスペクトルの差分からゲイン値を算出するための関数であり、例えば、以下のような式を用いてもよい。
【0070】
Figure 2004061617
時定数制御部36では内部テーブル35から供給される固定の時定数を用いて、ゲイン算出部34から供給される各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させるために時定数制御処理を行う。
【0071】
フィルタ設計部37は、FFTあるいはDFTを用いた周波数サンプリング法により、各周波数帯域でのゲイン値を周波数軸上のサンプルデータとし、それを逆フーリエ変換することで、その周波数特性を持つディジタルフィルタを設計し、得られたフィルタ係数をフィルタ部32に設定する。
【0072】
フィルタ部32は、上記フィルタ係数を設定されて、音声復号化器16から供給される受話音声信号のフィルタ処理を行う。これにより、受話音声信号のスペクトルが目標スペクトルに整形されて出力され、アンプ18及びスピーカ20を通し音声として再生される。
【0073】
この実施例では、例えば雑音が受話音声に対して非常に大きいときには、よりゲインを大きくし、逆に受話音声の方が雑音よりも十分に大きい場合には全く増幅しないようにするといった、適応的な処理が可能となる。また、この処理は各周波数毎に行われる。
【0074】
図10は、本発明の受話音声処理装置の第4実施例のブロック図を示す。同図中、図8と同一部分には同一符号を付す。この実施例は、周囲雑音の周波数特性から圧縮率を算出する際に、聴覚のマスキング効果を考慮し、周囲雑音によるマスキング量を算出した上で圧縮率の算出を行う構成にしたものである。
【0075】
図10において、音声復号化器16で復号化された受話音声信号はフィルタ型圧縮増幅処理部60内の周波数分析部31及びフィルタ部32に供給される。
【0076】
周波数分析部31は、受話音声信号の各周波数成分である音声スペクトルを算出する。周波数分析部31としては、FFTを使用するのが演算量的に見て最も適しているが、その他の方法、すなわち、DFTやフィルタバンク、あるいはウェーブレット変換等を用いてもよい。分析結果の音声スペクトルは目標スペクトル算出部33及びゲイン算出部34及びマスキング量算出部61に供給される。
【0077】
一方、送話マイク41から入力された信号は周波数分析部42で周囲雑音として周波数分析され、雑音スペクトルが算出されてマスキング量算出部61に供給される。
【0078】
マスキング量算出部61では、雑音スペクトル及び音声スペクトルからマスキング量の算出を周波数毎に行う。一般にマスキングは、レベルの大きな信号がレベルの小さい信号をマスクする。そのため、まず雑音スペクトルと音声スペクトルとの大きさの差を算出し、差が一定以上の場合のみ、マスキング計算の対象とする。
【0079】
まず、周波数間のマスキングについて考える。図11を用いて周波数マスキングの算出方法を説明する。音声スペクトルと雑音スペクトルの差分Spd(n)は次式で表される。
【0080】
Spd(n)=Spn(n)−Spi(n)
そして、Spd(n)>Threfの場合のみ、周波数マスキング計算を行う。Threfは閾値であり、定数である。
【0081】
マスキング効果は、マスクされる信号の周波数がマスクする信号の周波数に近い程強く、周波数が離れる程弱くなるということが知られている。そこで、以下の式のような関数を用いて、雑音信号が受話音声に与えるマスキング量Mask(n)(dB)を算出する。雑音信号によってマスクされる周波数をn’とすると、n’≧nの場合は次式となり、
Mask(n’)=Spd(n)−C1×(n’−n)
n’<nの場合は次式となる。
【0082】
Mask(n’)=Spd(n)−C2×(n−n’)
但し、C1,C2は正の定数である。
【0083】
次に、時間軸でのマスキングを考える。図12を用いて時間マスキングの算出方法を説明する。マスキングは時間がずれた2つの信号間でも起こることが分かっている。一般に時間的に前の信号が後の信号をマスクする。
【0084】
ある時刻tにおける、ある周波数nの音声スペクトルと雑音スペクトルの差分Spd(t,n)は次式で表される。
【0085】
Spd(t,n)=Spn(t,n)−Spi(t,n)
そして、Spd(t,n)>Thretだった場合のみ、時間マスキングの計算を行う。Thretは閾値であり、定数である。
【0086】
周波数nについて、ある時刻t’の信号が時刻tの信号によってマスクされる時間マスキング量をMask(t’,n)とすると、
Mask(t’,n)=Spd(t,n)−C3×(t’−t)
但し、C3は正の定数であり、時刻t’は必ず時刻tより後であるとする。すなわち、(t’−t)>0である。
【0087】
なお、マスキング量の算出は、周波数マスキングと時間マスキングの両方について行ってもいいし、どちらか一方のみを用いてもよい。
【0088】
圧縮率算出部62は、マスキング量から各周波数での圧縮率を求める。これは、マスキング量とそれに対応する圧縮率を前もって決めておき、内部テーブル35からマスキング量に対応する圧縮率を読み込む。これにより、マスキング量が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、明瞭度を維持することができる。
【0089】
目標スペクトル算出部33は、圧縮率算出部62から供給される圧縮率に従って音声スペクトルを圧縮増幅して目標スペクトルを算出しゲイン算出部34に供給する。
【0090】
ゲイン算出部34は周波数分析部31からの音声スペクトルと目標スペクトルとを比較し、音声スペクトルを目標スペクトルまで増幅するために必要な各周波数帯域毎のゲイン値(音声スペクトルと目標スペクトルの差分)を算出する。
【0091】
時定数制御部36では内部テーブル35から供給される固定の時定数を用いて、ゲイン算出部34から供給される各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させるために時定数制御処理を行う。
【0092】
フィルタ設計部37は、FFTあるいはDFTを用いた周波数サンプリング法により、各周波数帯域でのゲイン値を周波数軸上のサンプルデータとし、それを逆フーリエ変換することで、その周波数特性を持つディジタルフィルタを設計し、得られたフィルタ係数をフィルタ部32に設定する。
【0093】
フィルタ部32は、上記フィルタ係数を設定されて、音声復号化器16から供給される受話音声信号のフィルタ処理を行う。これにより、受話音声信号のスペクトルが目標スペクトルに整形されて出力され、アンプ18及びスピーカ20を通し音声として再生される。
【0094】
図13は、本発明の受話音声処理装置の第5実施例のブロック図を示す。同図中、図10と同一部分には同一符号を付す。この実施例は、マスキング量から直接ゲイン値を求める構成にしたものである。
【0095】
図13において、音声復号化器16で復号化された受話音声信号はフィルタ型圧縮増幅処理部70内の周波数分析部31及びフィルタ部32に供給される。
【0096】
周波数分析部31は、受話音声信号の各周波数成分である音声スペクトルを算出する。周波数分析部31としては、FFTを使用するのが演算量的に見て最も適しているが、その他の方法、すなわち、DFTやフィルタバンク、あるいはウェーブレット変換等を用いてもよい。分析結果の音声スペクトルは目標スペクトル算出部33及びゲイン算出部34及びマスキング量算出部61に供給される。
【0097】
一方、送話マイク41から入力された信号は周波数分析部42で周囲雑音として周波数分析され、雑音スペクトルが算出されてマスキング量算出部61に供給される。
【0098】
マスキング量算出部61では、雑音スペクトル及び音声スペクトルから周波数マスキングと時間マスキングの両方についてマスキング量の算出を行う。ゲイン算出部71は、算出されたマスキング量を各周波数毎に読み取り、そのマスキング量に合ったゲイン値を内部テーブル35から読み出す。この場合、マスキング量が大きい程、ゲインは大きな値となる。
【0099】
時定数制御部36では内部テーブル35から供給される固定の時定数を用いて、ゲイン算出部34から供給される各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させるために時定数制御処理を行う。
【0100】
フィルタ設計部37は、FFTあるいはDFTを用いた周波数サンプリング法により、各周波数帯域でのゲイン値を周波数軸上のサンプルデータとし、それを逆フーリエ変換することで、その周波数特性を持つディジタルフィルタを設計し、得られたフィルタ係数をフィルタ部32に設定する。
【0101】
フィルタ部32は、上記フィルタ係数を設定されて、音声復号化器16から供給される受話音声信号のフィルタ処理を行う。これにより、受話音声信号のスペクトルが目標スペクトルに整形されて出力され、アンプ18及びスピーカ20を通し音声として再生される。
【0102】
図14は、周囲雑音の特性に応じて圧縮増幅の程度を調整する際に、送話マイク入力信号の音声/非音声判定を行ってフィルタ係数を調整する実施例の要部のブロック図を示す。同図中、図8と同一部分には同一符号を付す。
【0103】
図14において、送話マイク41から入力された信号は周波数分析部42で周囲雑音として周波数分析されると共に、音声/非音声判定部72に供給される。音声/非音声判定部72では送話マイク41の入力が音声であるか否かの判定を行う。非音声と判定された場合は、図8〜図10,図13で述べた処理を行う。
【0104】
音声/非音声判定部72で音声と判定された場合には、使用者本人が発声している可能性が高いため、送話マイク41の入力をそのまま周囲雑音として判定すると、受話音声が極端に増幅されてしまうため、フィルタ係数調整部73において、以下のような処理を行う。
【0105】
(1)フィルタ設計部37から供給されるフィルタ係数を初期値(例えば全く増幅を行わない値など)に置き換えてフィルタ部32に設定する。
【0106】
(2)フィルタ係数の最大値を決め、フィルタ設計部37から供給されるフィルタ係数が最大値を越える場合には、最大値に置き換えてフィルタ部32に設定する。
【0107】
(3)フィルタ部32のフィルタ係数の更新を止める。つまり、非音声状態から音声状態に切り替わる直前のフィルタ係数をそのまま保持する。
【0108】
図8〜図10,図13それぞれの構成では、使用者が発声している間に、それを過大な周囲雑音と判断して受話音声を極端に増幅してしまい、使用者に不快感を与える恐れがあるが、図14の構成とすることにより、使用者の発声中は極端な増幅をしないようにすることができる。
【0109】
図15は、雑音信号の頭部による回折効果を補償する実施例のブロック図を示す。同図中、送話マイク41の出力信号を頭部の回折効果を補償する補償フィルタ74に通したのち周波数分析部42に供給する。この補償フィルタ74は、使用者の頭部の回折効果による、送話マイク41の入力と現実に耳に入力する周囲雑音との差分を補償するものであり、前もってフィルタ係数を設計しておく。これにより、実際に耳元位置で聞こえる雑音の周波数特性が推定されるため、より現実に即した処理となり、明瞭な受話音声を得ることができる。
【0110】
補償フィルタ74のフィルタ係数を求める方法を図16に示す。図16において、スピーカ75からテスト信号を再生し、マイク76及びマイク77にて収録する。マイク76は耳元位置に置き、マイク77は携帯電話78のマイク位置に置く。マイク76で得られる周波数特性と、マイク77で得られる周波数特性の差を測定し、その差を補償するフィルタ係数を前もって算出する。あるいは、マイク76、マイク77におけるインパルス応答を計測し、そのインパルス応答の差分からフィルタを設計するようにしてもよい。
【0111】
(付記1) 受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
各周波数帯域毎に設定された前記音声スペクトルに対する圧縮率に基づいて目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
【0112】
(付記2) 受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルに応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
【0113】
(付記3) 受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記音声スペクトルと前記雑音スペクトルの差分から前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
【0114】
(付記4) 受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
前記マスキング量に応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
【0115】
(付記5) 受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
前記マスキング量に応じて前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
有することを特徴とする受話音声処理装置。
【0116】
(付記6) 付記1乃至5の何れか記載の受話音声処理装置において、
前記ゲイン算出部で算出した各周波数帯域毎のゲイン値の時定数制御を行って前記フィルタ係数算出部に供給する時定数制御部を
有することを特徴とする受話音声処理装置。
【0117】
(付記7) 付記2乃至6の何れか記載の受話音声処理装置において、
前記送話マイクからの入力信号が使用者の発した音声であるか非音声であるかを判定する音声/非音声判定部と、
前記送話マイクからの入力信号が非音声であるときに、前記フィルタ部に前記フィルタ係数算出部からのフィルタ係数を設定するフィルタ係数調整部を
有することを特徴とする受話音声処理装置。
【0118】
(付記8) 付記2乃至7の何れか記載の受話音声処理装置において、
前記送話マイクからの入力信号に対し使用者の頭部による回折効果を補償して前記周囲雑音周波数分析部に供給する補償フィルタを
有することを特徴とする受話音声処理装置。
【0119】
【発明の効果】
上述の如く、請求項1に記載の発明によれば、子音など受話音声の信号レベルの小さな部分が聞き取れるレベルにまで増幅され、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【0120】
また、請求項2に記載の発明によれば、雑音が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【0121】
また、請求項3に記載の発明によれば、雑音が受話音声に対して非常に大きいときには、よりゲインを大きくし、逆に受話音声の方が雑音よりも十分に大きい場合には全く増幅しないようにする適応的な処理が可能となり、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【0122】
また、請求項4に記載の発明によれば、マスキング量が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【0123】
また、請求項5に記載の発明によれば、マスキング量が大きい周波数帯域では圧縮率を高めることで、音声を聞こえるレベルまで圧縮増幅することができ、音声の音量を大きく変化させることなく、音質の劣化及び変化を最小とした上で音声の明瞭度を改善することができる。
【0124】
また、付記6に記載の発明によれば、各周波数帯域毎に異なるゲイン値の時間的な変化が急峻にならず滑らかに変化させることができる。
【0125】
また、付記7に記載の発明によれば、使用者の発声中は極端な増幅をしないようにすることができる。
【0126】
また、付記8に記載の発明によれば、実際に耳元位置で聞こえる雑音の周波数特性が推定されるため、より現実に即した処理となり、明瞭な受話音声を得ることができる。
【図面の簡単な説明】
【図1】従来の携帯電話の受話装置部の一例のブロック図である。
【図2】本発明の受話音声処理装置の第1実施例のブロック図である。
【図3】圧縮増幅の変換関数を示す図である。
【図4】スペクトル及びゲインの一例を示す図である。
【図5】時定数制御の様子を示す図である。
【図6】フィルタ型圧縮増幅処理部の入出力受話音声信号の波形図である。
【図7】フィルタ型圧縮増幅処理部の入出力受話音声信号のスペクトルを示す図である。
【図8】本発明の受話音声処理装置の第2実施例のブロック図である。
【図9】本発明の受話音声処理装置の第3実施例のブロック図である。
【図10】本発明の受話音声処理装置の第4実施例のブロック図である。
【図11】周波数マスキングの算出方法を説明するための図である。
【図12】時間マスキングの算出方法を説明するための図である。
【図13】本発明の受話音声処理装置の第5実施例のブロック図である。
【図14】フィルタ係数を調整する実施例の要部のブロック図である。
【図15】雑音信号の頭部による回折効果を補償する実施例のブロック図である。
【図16】フィルタ係数を求める方法を説明するための図である。
【符号の説明】
10 アンテナ
12 RF送受信部
14 ベースバンド信号処理部
16 音声復号化器
18 アンプ
20 スピーカ
30,40,50,60,70 フィルタ型圧縮増幅処理部
31 周波数分析部31
32 フィルタ部
33 目標スペクトル算出部
34,52,71 ゲイン算出部
35 内部テーブル
36 時定数制御部
37 フィルタ設計部
41 送話マイク
42 周波数分析部
43,62 圧縮率算出部
51 差分計算部
61 マスキング量算出部
72 音声/非音声判定部
73 フィルタ係数調整部
74 補償フィルタ
75 スピーカ
76,77 マイク

Claims (5)

  1. 受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
    各周波数帯域毎に設定された前記音声スペクトルに対する圧縮率に基づいて目標スペクトルを算出する目標スペクトル算出部と、
    前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
    前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
    前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
    有することを特徴とする受話音声処理装置。
  2. 受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
    送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
    前記雑音スペクトルに応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
    前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
    前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
    前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
    前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
    有することを特徴とする受話音声処理装置。
  3. 受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
    送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
    前記音声スペクトルと前記雑音スペクトルの差分から前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
    前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
    前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
    有することを特徴とする受話音声処理装置。
  4. 受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
    送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
    前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
    前記マスキング量に応じた各周波数帯域毎の圧縮率を算出する圧縮率算出部と、
    前記各周波数帯域毎の圧縮率から目標スペクトルを算出する目標スペクトル算出部と、
    前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
    前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
    前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
    有することを特徴とする受話音声処理装置。
  5. 受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、
    送話マイクからの入力信号を周囲雑音として周波数分析し雑音スペクトルを算出する周囲雑音周波数分析部と、
    前記雑音スペクトルと前記音声スペクトルからマスキング量を算出するマスキング量算出部と、
    前記マスキング量に応じて前記音声スペクトルを増幅するためのゲイン値を各周波数帯域毎に算出するゲイン算出部と、
    前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、
    前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部を
    有することを特徴とする受話音声処理装置。
JP2002216602A 2002-07-25 2002-07-25 受話音声処理装置 Pending JP2004061617A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002216602A JP2004061617A (ja) 2002-07-25 2002-07-25 受話音声処理装置
US10/345,917 US7428488B2 (en) 2002-07-25 2003-01-16 Received voice processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002216602A JP2004061617A (ja) 2002-07-25 2002-07-25 受話音声処理装置

Publications (1)

Publication Number Publication Date
JP2004061617A true JP2004061617A (ja) 2004-02-26

Family

ID=30767959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002216602A Pending JP2004061617A (ja) 2002-07-25 2002-07-25 受話音声処理装置

Country Status (2)

Country Link
US (1) US7428488B2 (ja)
JP (1) JP2004061617A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006010908A (ja) * 2004-06-24 2006-01-12 Yamaha Corp 音声効果付与装置及び音声効果付与プログラム
JP2006017946A (ja) * 2004-06-30 2006-01-19 Yamaha Corp 音声処理装置およびプログラム
JP2007295347A (ja) * 2006-04-26 2007-11-08 Mitsubishi Electric Corp 音声処理装置
JP2009530685A (ja) * 2006-03-20 2009-08-27 マインドスピード・テクノロジーズ・インコーポレイテッド Mdct係数を使用する音声後処理
JP2010210815A (ja) * 2009-03-09 2010-09-24 Yawata Electric Industrial Co Ltd 音声信号調整装置及びその調整方法
WO2011077509A1 (ja) * 2009-12-21 2011-06-30 富士通株式会社 音声制御装置、及び音声制御方法
US8094829B2 (en) 2008-01-24 2012-01-10 Kabushiki Kaisha Toshiba Method for processing sound data
JP4954069B2 (ja) * 2005-06-17 2012-06-13 パナソニック株式会社 ポストフィルタ、復号化装置及びポストフィルタ処理方法
US8532309B2 (en) 2010-04-19 2013-09-10 Kabushiki Kaisha Toshiba Signal correction apparatus and signal correction method
JP2013182169A (ja) * 2012-03-02 2013-09-12 Yamaha Corp 音響処理装置
JP2016195439A (ja) * 2013-04-29 2016-11-17 ドルビー ラボラトリーズ ライセンシング コーポレイション 動的閾値を用いた周波数帯域圧縮
JP2025507662A (ja) * 2022-02-22 2025-03-21 ボーズ・コーポレーション オーディオ出力の明瞭度を調整するためのシステム及び方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7774396B2 (en) * 2005-11-18 2010-08-10 Dynamic Hearing Pty Ltd Method and device for low delay processing
JP2007274176A (ja) * 2006-03-30 2007-10-18 Pioneer Electronic Corp 音声会議装置、音声会議システムにおける音声確認方法及びそのプログラム
CN101303858B (zh) * 2007-05-11 2011-06-01 华为技术有限公司 实现基音增强后处理的方法及装置
JP5136378B2 (ja) * 2008-12-09 2013-02-06 富士通株式会社 音響処理方法
GB2465047B (en) 2009-09-03 2010-09-22 Peter Graham Craven Prediction of signals
JP4982617B1 (ja) * 2011-06-24 2012-07-25 株式会社東芝 音響制御装置、音響補正装置、及び音響補正方法
JP5085769B1 (ja) * 2011-06-24 2012-11-28 株式会社東芝 音響制御装置、音響補正装置、及び音響補正方法
US8965774B2 (en) * 2011-08-23 2015-02-24 Apple Inc. Automatic detection of audio compression parameters
US9423944B2 (en) 2011-09-06 2016-08-23 Apple Inc. Optimized volume adjustment
EP2675063B1 (en) 2012-06-13 2016-04-06 Dialog Semiconductor GmbH Agc circuit with optimized reference signal energy levels for an echo cancelling circuit
US9712348B1 (en) * 2016-01-15 2017-07-18 Avago Technologies General Ip (Singapore) Pte. Ltd. System, device, and method for shaping transmit noise
CN106328159B (zh) * 2016-09-12 2021-07-09 优酷网络技术(北京)有限公司 一种音频流的处理方法及装置
EP3840222A1 (en) * 2019-12-18 2021-06-23 Mimi Hearing Technologies GmbH Method to process an audio signal with a dynamic compressive system

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03284000A (ja) * 1990-03-30 1991-12-13 Ono Sokki Co Ltd 補聴器システム
JPH1117778A (ja) * 1997-06-23 1999-01-22 Sony Corp 音声信号の処理回路
JPH11202896A (ja) * 1998-01-14 1999-07-30 Kokusai Electric Co Ltd 音声高域強調方法及び音声高域強調装置
JP2000349893A (ja) * 1999-06-08 2000-12-15 Matsushita Electric Ind Co Ltd 音声再生方法および音声再生装置
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
JP2003264892A (ja) * 2002-03-07 2003-09-19 Matsushita Electric Ind Co Ltd 音響処理装置、音響処理方法およびプログラム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4609878A (en) * 1983-01-24 1986-09-02 Circuit Research Labs, Inc. Noise reduction system
US4817158A (en) * 1984-10-19 1989-03-28 International Business Machines Corporation Normalization of speech signals
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4696878A (en) * 1985-08-02 1987-09-29 Micronix Corporation Additive process for manufacturing a mask for use in X-ray photolithography and the resulting mask
US4658426A (en) * 1985-10-10 1987-04-14 Harold Antin Adaptive noise suppressor
US4939685A (en) * 1986-06-05 1990-07-03 Hughes Aircraft Company Normalized frequency domain LMS adaptive filter
US4893342A (en) * 1987-10-15 1990-01-09 Cooper Duane H Head diffraction compensated stereo system
JP2563719B2 (ja) 1992-03-11 1996-12-18 技術研究組合医療福祉機器研究所 音声加工装置と補聴器
US5479522A (en) * 1993-09-17 1995-12-26 Audiologic, Inc. Binaural hearing aid
JPH07123027A (ja) * 1993-10-26 1995-05-12 Fujitsu Ltd ディジタル加入者線伝送装置
FR2726392B1 (fr) * 1994-10-28 1997-01-10 Alcatel Mobile Comm France Procede et dispositif de suppression de bruit dans un signal de parole, et systeme avec annulation d'echo correspondant
EP0855129A1 (en) * 1995-10-10 1998-07-29 AudioLogic, Incorporated Digital signal processing hearing aid with processing strategy selection
US5724416A (en) * 1996-06-28 1998-03-03 At&T Corp Normalization of calling party sound levels on a conference bridge
US5937377A (en) * 1997-02-19 1999-08-10 Sony Corporation Method and apparatus for utilizing noise reducer to implement voice gain control and equalization
US6178400B1 (en) * 1998-07-22 2001-01-23 At&T Corp. Method and apparatus for normalizing speech to facilitate a telephone call
JP2000041300A (ja) 1998-07-23 2000-02-08 Nec Corp 聴覚補償処理方法及びディジタル補聴器
US6314396B1 (en) * 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
WO2001030049A1 (en) * 1999-10-19 2001-04-26 Fujitsu Limited Received speech processing unit and received speech reproducing unit
US6675125B2 (en) * 1999-11-29 2004-01-06 Syfx Statistics generator system and method
US20020116187A1 (en) * 2000-10-04 2002-08-22 Gamze Erten Speech detection
JP2002287782A (ja) * 2001-03-28 2002-10-04 Ntt Docomo Inc イコライザ装置
US7630507B2 (en) * 2002-01-28 2009-12-08 Gn Resound A/S Binaural compression system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03284000A (ja) * 1990-03-30 1991-12-13 Ono Sokki Co Ltd 補聴器システム
JPH1117778A (ja) * 1997-06-23 1999-01-22 Sony Corp 音声信号の処理回路
JPH11202896A (ja) * 1998-01-14 1999-07-30 Kokusai Electric Co Ltd 音声高域強調方法及び音声高域強調装置
JP2000349893A (ja) * 1999-06-08 2000-12-15 Matsushita Electric Ind Co Ltd 音声再生方法および音声再生装置
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
JP2003264892A (ja) * 2002-03-07 2003-09-19 Matsushita Electric Ind Co Ltd 音響処理装置、音響処理方法およびプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
鈴木 他: "「継時マスキングの補償に基づく音声強調方法の提案と評価」", 電子情報通信学会技術研究報告 音声SP91-131〜139, vol. 91, no. 513, CSNG199900189005, 13 March 1992 (1992-03-13), pages 31 - 37, ISSN: 0000902657 *
鈴木 他: "「継時マスキングの補償に基づく音声強調方法の提案と評価」", 電子情報通信学会技術研究報告 音声SP91-131〜139, vol. 91, no. 513, JPN7008008025, 13 March 1992 (1992-03-13), pages 31 - 37, ISSN: 0001174157 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006010908A (ja) * 2004-06-24 2006-01-12 Yamaha Corp 音声効果付与装置及び音声効果付与プログラム
JP2006017946A (ja) * 2004-06-30 2006-01-19 Yamaha Corp 音声処理装置およびプログラム
US8315863B2 (en) 2005-06-17 2012-11-20 Panasonic Corporation Post filter, decoder, and post filtering method
JP4954069B2 (ja) * 2005-06-17 2012-06-13 パナソニック株式会社 ポストフィルタ、復号化装置及びポストフィルタ処理方法
JP2009530685A (ja) * 2006-03-20 2009-08-27 マインドスピード・テクノロジーズ・インコーポレイテッド Mdct係数を使用する音声後処理
JP2007295347A (ja) * 2006-04-26 2007-11-08 Mitsubishi Electric Corp 音声処理装置
US8094829B2 (en) 2008-01-24 2012-01-10 Kabushiki Kaisha Toshiba Method for processing sound data
JP2010210815A (ja) * 2009-03-09 2010-09-24 Yawata Electric Industrial Co Ltd 音声信号調整装置及びその調整方法
WO2011077509A1 (ja) * 2009-12-21 2011-06-30 富士通株式会社 音声制御装置、及び音声制御方法
US8532309B2 (en) 2010-04-19 2013-09-10 Kabushiki Kaisha Toshiba Signal correction apparatus and signal correction method
JP2013182169A (ja) * 2012-03-02 2013-09-12 Yamaha Corp 音響処理装置
JP2016195439A (ja) * 2013-04-29 2016-11-17 ドルビー ラボラトリーズ ライセンシング コーポレイション 動的閾値を用いた周波数帯域圧縮
JP2025507662A (ja) * 2022-02-22 2025-03-21 ボーズ・コーポレーション オーディオ出力の明瞭度を調整するためのシステム及び方法
US12340818B2 (en) 2022-02-22 2025-06-24 Bose Corporation Systems and methods for adjusting clarity of an audio output

Also Published As

Publication number Publication date
US20040019481A1 (en) 2004-01-29
US7428488B2 (en) 2008-09-23

Similar Documents

Publication Publication Date Title
JP2004061617A (ja) 受話音声処理装置
US9197181B2 (en) Loudness enhancement system and method
EP1709734B1 (en) System for audio signal processing
US8085941B2 (en) System and method for dynamic sound delivery
CN100369111C (zh) 话音增强装置
CN102804260B (zh) 声音信号处理装置以及声音信号处理方法
KR100860805B1 (ko) 음성 강화 시스템
EP1680781B1 (en) System and method for audio signal processing
JP4649546B2 (ja) 補聴器
KR100800725B1 (ko) 이동통신 단말의 오디오 재생시 주변 잡음에 적응하는 자동음량 조절 방법 및 장치
US8200499B2 (en) High-frequency bandwidth extension in the time domain
US8645129B2 (en) Integrated speech intelligibility enhancement system and acoustic echo canceller
US20060126865A1 (en) Method and apparatus for adaptive sound processing parameters
US20030216907A1 (en) Enhancing the aural perception of speech
US8756055B2 (en) Systems and methods for improving the intelligibility of speech in a noisy environment
US7130794B2 (en) Received speech signal processing apparatus and received speech signal reproducing apparatus
JP2008522511A (ja) 適応可能な音声処理パラメータ用の方法及び装置
Chanda et al. Speech intelligibility enhancement using tunable equalization filter
JPH09311696A (ja) 自動利得調整装置
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
KR101789781B1 (ko) 낮은 임피던스의 단일 마이크에 의한 음성 신호로부터 잡음을 감쇄시키는 장치 및 방법
JPH0956000A (ja) 補聴器
JP2010092057A (ja) 受話音声処理装置及び受話音声再生装置
KR100746680B1 (ko) 음성 강조 장치
KR20070022206A (ko) 오디오 신호 처리를 위한 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050512

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071121

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081111