JPH0854897A - 音信号立ち上がり検出方法 - Google Patents
音信号立ち上がり検出方法Info
- Publication number
- JPH0854897A JPH0854897A JP6188377A JP18837794A JPH0854897A JP H0854897 A JPH0854897 A JP H0854897A JP 6188377 A JP6188377 A JP 6188377A JP 18837794 A JP18837794 A JP 18837794A JP H0854897 A JPH0854897 A JP H0854897A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- long
- rising edge
- time
- smoothed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Filters That Use Time-Delay Elements (AREA)
Abstract
号に対して、その最初のみを確実に検出可能とする。 【構成】 音入力信号を5msごとに過去20ms程度の時
間窓をかけて窓内を平均して短時間平滑化信号を得(1
2),その信号に対し、急に立ち上がり、徐々に立ち下
がるインパルス応答を畳み込み50〜100msの長時間
平滑化を行い(13),その出力を、過去の出力から予
測合成し(15),その予測合成値と現在の長時間平滑
化出力とを比較し(16),前者が著しく大の時、立ち
上がりとする。
Description
符号化、音声認識、音声通信などに利用され、音響信号
や音声信号の立ち上がりを検出する方法に関する。
立ち上がり検出方法として、例えばオーディオ符号化方
式であるエムペグ・オーディオ(MPEG-Audio)方式にお
いて聴覚的エントロピーを用いた検出方法が提案されて
いる。これは、複数の周波数小帯域ごとに、聴覚モデル
を用いて計算した入力信号に対する最小可聴ノイズの信
号対雑音比(SNR)(すなわちその小帯域において符
号化時に確保する必要があるSNR…必要SNR)を求
め、その必要SNRから聴覚的エントロピーと呼ばれる
値を計算し、この値があるしきい値を越えた時を立ち上
がりとして検出する。なお、エムペグ・オーディオ符号
化方式における立ち上がり検出方法についての詳細はI
SO/IEC標準IS−11172−3に述べられてい
る。
は、必要SNRを計算する際に、入力信号の周波数特性
を求める必要があり、全帯域で1024次もの次元の大
きいFFTを行うなど大きな演算量を要する処理が多く
あり、この方法により立ち上がり検出装置単体として構
成すると規模が大きすぎる。
ず、入力信号が接近したパルス列のような場合は、その
最初のパルスのみに応答して、これだけを音信号立ち上
がりとして検出すべきであるが、従来においてはその各
パルスを音信号立ち上がりとして検出してしまう。つま
り小さい立ち上がりの連続は聴覚的には立ち上がりとし
て感じないが、従来方法ではこの場合、小さい各立ち上
がりを音信号の立ち上がりと検出する問題があった。
の段階で入力音響信号に対応する強度を求め、第2の段
階でその強度に対して短時間、つまり5〜40ミリ秒程
度の平滑化を行って短時間平滑化信号を得、第3の段階
でその短時間平滑化信号に対して長時間、つまり20〜
150ミリ秒程度の平滑化を行って長時間平滑化信号を
得、第4の段階でその長時間平滑化信号の不連続性を計
算し、その得られた不連続点を立ち上がりとする。
は、入力音響信号を線形予測分析し、その結果の線形予
測係数と対応したフィルタ係数をもつ逆フィルタへこの
入力音響信号を通してその残差信号を得、その残差信号
の強度を用いてもよい。上記第3の段階の平滑化は、短
時間平滑化信号にインパルス応答を畳み込むことで行
う、あるいは短時間平滑化信号をディジタルの検波回路
に通すことにより行う。
時間平滑化信号から現在の長時間平滑化信号を予測合成
し、その予測合成された長時間平滑化信号を第6の段階
で実際の現在における長時間平滑化信号と比較し、後者
が前者より著しく大きい場合に前記不連続点、つまり立
ち上がりと判断する。前記予測合成は過去の長時間平滑
化信号を線形和することによるか、過去の長時間平滑化
信号を近似表現する関数によって補外することにより行
う。
全体の構造を認識する機能がある。このため、例えば単
一のインパルスは音の立ち上がりとして認識されるが、
このインパルスが速い周期で繰り返されると立ち上がり
としては認識されない。このような聴覚特性をもつ神経
の興奮パタンをこの発明では、短時間平滑化と、長時間
平滑化を持つ聴覚モデルによって模擬し、パタンの不連
続性を判定することによって立ち上がりを検出する。し
たがって、この発明では、聴覚特性に即した立ち上がり
の検出が行われる。
通すと、音の立ち上がりのような過去の信号から予測で
きない不連続点が強調された残差信号が得られる。した
がって、この残差信号の強さを入力音響信号と対応する
強さとして用いるとより、いっそう検出感度が高くな
る。
を示す。第1の段階11では、入力音響信号は32KHz
または48KHzなどの標本化ディジタル信号として入力
され、その入力音響信号の音強度として、例えば入力音
響信号の絶対値、二乗値を用いることができる。あるい
は、入力音響信号を線形予測分析し、その線形予測係数
と対応したフィルタ係数をもつフィルタ、いわゆる逆フ
ィルタに入力音響信号を通して残差信号を得、この残差
信号の絶対値、二乗値、またはこれを入力信号の振幅の
平均値で正規化した信号を用いてもよい。
の強度信号を例えば約5ms程度の頻度で、過去20ms程
度の時間窓をかけ、窓内の平均を計算して短時間平滑化
して短時間平滑化信号を得る。前記時間窓の窓形状は、
例えば、矩形窓、ハミング窓、ハニング窓、指数関数窓
などを用い、時間窓は5〜40ms程度とされる。第3の
段階13では、第2の段階12からの短時間平滑化信号
に、立ち上がりが速く立ち下りが遅いインパルス応答を
畳み込むことによって長時間の平滑化を行う。この平滑
化は20〜150msにわたって連続的に行われる。この
インパルス応答の波形としては図2Aに示すように何れ
も急に立ち上がり、徐々に立ち下がり、その立ち上が
り、立ち下がりはそれぞれ直線的、指数関数的、三角関
数的などである。あるいは図2Bに等価回路で示される
ような立ち上がりの時定数が小さく、立ち下がりの時定
数が大きい(立ち上がりの時定数は0でも良い)ディジ
タルの検波回路に短時間平滑化信号を通して長時間の平
滑化を行っても良い。このディジタル検波回路の処理は
例えば図2Cに示すように入力された短時間平滑化信号
系列x0 ,x1 ,…,xn-1 ,xn ,xn+1 ,…のそれ
ぞれを、その直前に得られた出力の長時間平滑化信号系
列y0 ,y1 ,…,yn-1 ,yn ,yn+ 1 …と比較し
(21),xn >yn-1 ならばxn をyn として出力し
(22),xn >yn-1 でなければyn-1 にR(0<R
<1)を乗算した値をyn として出力する(23)。
段階13からの長時間平滑化信号より現在における長時
間平滑化信号を予測する予測合成段階15と、その予測
合成出力と現在における第3の段階13の出力とを比較
する比較段階16とにわかれる。予測合成段階15で
は、例えば過去の信号の線形和による予測合成、最小二
乗法や最尤推定法による関数の当てはめなどの手法を用
いて過去の信号から現在の信号の予測値を合成する。つ
まり、長時間平滑化信号yn の系列を、各信号時間だけ
の単位遅延回路25の直列接続に入力し、その各遅延回
路25の出力に乗算器26で定数を掛算し、その掛算結
果を加算器27で加算して予測値yn+1 として出力す
る。あるいは図3Bに示すように長時間平滑化信号yn
の系列を時間に対する関数28として近似し、その関数
で補外して予測値yn+1 を得る。
滑化信号yn+1 とその予測合成信号yn+1 ′との比をy
n+1 /yn+1 ′を計算し、この値があるしきい値を越え
ていたら立ち上がりとする、あるいは、現在における信
号yn+1 と予測合成信号yn+ 1 ′との差(yn+1 −y
n+1 ′)=Δyを計算し、この値Δyがあるしきい値を
超えていたら立ち上がりとする。あるいは、現在におけ
る信号yn+1 と予測合成信号を定数倍したものA
yn+1 ′との差を計算し、この値があるしきい値を超え
ていたら立ち上がりとする方法を用いる。
間平滑化と、長時間平滑化とにより神経の興奮パタンを
模擬し、この信号を立ち上がりを判定に用いるので、よ
り聴覚特性に即した立ち上がりの検出が可能である。
に用いるインパルス応答の形状の例を示す図、Bは長時
間平滑化に用いるディジタル検波回路の等価回路を示す
図、Cはこの処理を離散信号に施す手順を示す流れ図で
ある。
間平滑化信号の線形和により求める場合の構成例を示す
図、Bは過去の長時間平滑化信号を近似表現する関数の
例を示す図である。
Claims (9)
- 【請求項1】 入力音響信号に対応する強度を求める第
1の段階と、 その第1の段階で得られた強度に対して短時間の平滑化
を行い、短時間平滑化信号を得る第2の段階と、 その第2の段階で得られた短時間平滑化信号に対して長
時間の平滑化を行い、長時間平滑化信号を得る第3の段
階と、 その第3の段階で得られた長時間平滑化信号の不連続性
を計算し、得られた不連続点を立ち上がりとする第4の
段階とを有する音信号立ち上がり検出方法。 - 【請求項2】 上記入力音響信号を線形予測分析し、そ
の結果の線形予測係数と対応したフィルタ係数をもつフ
ィルタに上記入力音響信号を通して残差信号を得、その
残差信号の強度を、上記第1の段階における上記入力音
響信号に対応する強度として用いることを特徴とする請
求項1記載の音信号立ち上がり検出方法。 - 【請求項3】 上記第3の段階は、上記第2の段階で得
られた短時間平滑化信号にインパルス応答を畳み込んで
平滑化を行うことであることを特徴とする請求項1また
は2記載の音信号立ち上がり検出方法。 - 【請求項4】 上記第3の段階は、上記第2の段階で得
られた短時間平滑化信号を、ディジタルの検波回路に通
すことによって平滑化することであることを特徴とする
請求項1または2記載の音信号立ち上がり検出方法。 - 【請求項5】 上記第4の段階は、上記第3の段階で得
られた過去の長時間平滑化信号から現在の長時間平滑化
信号を予測合成する第5の段階と、その第5の段階で得
られた予測合成された長時間平滑化信号と、実際の現在
における長時間平滑化信号とを比較し、後者が前者より
著しく大きい場合に立ち上がりと判断する第6の段階と
からなることを特徴とする請求項1ないし4の何れかに
記載の音信号立ち上がり検出方法。 - 【請求項6】 上記第5の段階は、過去の長時間平滑化
信号を線形和することにより予測合成を行うことを特徴
とする請求項5記載の音信号立ち上がり検出方法。 - 【請求項7】 上記第5の段階は、過去の長時間平滑化
信号を近似表現する関数によって補外することによって
予測合成を行うことを特徴とする請求項5記載の音信号
立ち上がり検出方法。 - 【請求項8】 上記第6の段階は、上記第3の段階で得
られた現在の長時間平滑化信号と、上記第5の段階で得
られた予測合成された長時間平滑化信号との比を計算
し、この比があるしきい値を越えた場合立ち上がりと判
断することを特徴とする請求項5ないし7記載の音信号
立ち上がり検出方法。 - 【請求項9】 上記第6の段階は、上記第3の段階で得
られた現在の長時間平滑化信号と、上記第5の段階で得
られた予測合成された長時間平滑化信号を定数倍したも
のとの差を計算し、この差があるしきい値を越えた場合
立ち上がりと判断することを特徴とする請求項5ないし
7記載の音信号立ち上がり検出方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP18837794A JP3285178B2 (ja) | 1994-08-10 | 1994-08-10 | 音信号立ち上がり検出方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP18837794A JP3285178B2 (ja) | 1994-08-10 | 1994-08-10 | 音信号立ち上がり検出方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0854897A true JPH0854897A (ja) | 1996-02-27 |
| JP3285178B2 JP3285178B2 (ja) | 2002-05-27 |
Family
ID=16222559
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP18837794A Expired - Lifetime JP3285178B2 (ja) | 1994-08-10 | 1994-08-10 | 音信号立ち上がり検出方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3285178B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2014136629A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
-
1994
- 1994-08-10 JP JP18837794A patent/JP3285178B2/ja not_active Expired - Lifetime
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2014136629A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
| JPWO2014136629A1 (ja) * | 2013-03-05 | 2017-02-09 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
| TWI581256B (zh) * | 2013-03-05 | 2017-05-01 | Nec Corp | A signal processing device, a signal processing method, and a signal processing program |
| US9715885B2 (en) | 2013-03-05 | 2017-07-25 | Nec Corporation | Signal processing apparatus, signal processing method, and signal processing program |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3285178B2 (ja) | 2002-05-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20050288923A1 (en) | Speech enhancement by noise masking | |
| RU2596592C2 (ru) | Пространственный аудио процессор и способ обеспечения пространственных параметров на основе акустического входного сигнала | |
| US20070232257A1 (en) | Noise suppressor | |
| US7508948B2 (en) | Reverberation removal | |
| US6175602B1 (en) | Signal noise reduction by spectral subtraction using linear convolution and casual filtering | |
| US5687285A (en) | Noise reducing method, noise reducing apparatus and telephone set | |
| US8015002B2 (en) | Dynamic noise reduction using linear model fitting | |
| US6895095B1 (en) | Method of eliminating interference in a microphone | |
| US6023674A (en) | Non-parametric voice activity detection | |
| US6459914B1 (en) | Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging | |
| US20040037439A1 (en) | Acoustic signal processing apparatus and method, and audio device | |
| JPS63500543A (ja) | 雑音抑圧システム | |
| JP2000148172A (ja) | 音声の動作特性検出装置および検出方法 | |
| US3786188A (en) | Synthesis of pure speech from a reverberant signal | |
| CN113593599A (zh) | 一种去除语音信号中噪声信号的方法 | |
| US20150071463A1 (en) | Method and apparatus for filtering an audio signal | |
| EP2230664B1 (en) | Method and apparatus for attenuating noise in an input signal | |
| JP2919685B2 (ja) | 信号識別回路 | |
| US5732141A (en) | Detecting voice activity | |
| JP3510458B2 (ja) | 音声認識システムおよび音声認識制御プログラムを記録した記録媒体 | |
| JP3418005B2 (ja) | 音声ピッチ検出装置 | |
| JP3285178B2 (ja) | 音信号立ち上がり検出方法 | |
| Lin et al. | Speech enhancement for nonstationary noise environment | |
| US6633847B1 (en) | Voice activated circuit and radio using same | |
| JPH0783752A (ja) | オーディオ歪曲測定装置およびその方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090308 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090308 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100308 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110308 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110308 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120308 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130308 Year of fee payment: 11 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| EXPY | Cancellation because of completion of term |