[go: up one dir, main page]

JPH0854897A - 音信号立ち上がり検出方法 - Google Patents

音信号立ち上がり検出方法

Info

Publication number
JPH0854897A
JPH0854897A JP6188377A JP18837794A JPH0854897A JP H0854897 A JPH0854897 A JP H0854897A JP 6188377 A JP6188377 A JP 6188377A JP 18837794 A JP18837794 A JP 18837794A JP H0854897 A JPH0854897 A JP H0854897A
Authority
JP
Japan
Prior art keywords
signal
long
rising edge
time
smoothed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6188377A
Other languages
English (en)
Other versions
JP3285178B2 (ja
Inventor
Naoki Iwagami
直樹 岩上
Takehiro Moriya
健弘 守谷
Satoshi Miki
聡 三樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP18837794A priority Critical patent/JP3285178B2/ja
Publication of JPH0854897A publication Critical patent/JPH0854897A/ja
Application granted granted Critical
Publication of JP3285178B2 publication Critical patent/JP3285178B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

(57)【要約】 【目的】 インパルスが速い周期で繰り返される入力信
号に対して、その最初のみを確実に検出可能とする。 【構成】 音入力信号を5msごとに過去20ms程度の時
間窓をかけて窓内を平均して短時間平滑化信号を得(1
2),その信号に対し、急に立ち上がり、徐々に立ち下
がるインパルス応答を畳み込み50〜100msの長時間
平滑化を行い(13),その出力を、過去の出力から予
測合成し(15),その予測合成値と現在の長時間平滑
化出力とを比較し(16),前者が著しく大の時、立ち
上がりとする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は楽音信号や音声信号の
符号化、音声認識、音声通信などに利用され、音響信号
や音声信号の立ち上がりを検出する方法に関する。
【0002】
【従来の技術】現在、聴覚特性を考慮に入れた音信号の
立ち上がり検出方法として、例えばオーディオ符号化方
式であるエムペグ・オーディオ(MPEG-Audio)方式にお
いて聴覚的エントロピーを用いた検出方法が提案されて
いる。これは、複数の周波数小帯域ごとに、聴覚モデル
を用いて計算した入力信号に対する最小可聴ノイズの信
号対雑音比(SNR)(すなわちその小帯域において符
号化時に確保する必要があるSNR…必要SNR)を求
め、その必要SNRから聴覚的エントロピーと呼ばれる
値を計算し、この値があるしきい値を越えた時を立ち上
がりとして検出する。なお、エムペグ・オーディオ符号
化方式における立ち上がり検出方法についての詳細はI
SO/IEC標準IS−11172−3に述べられてい
る。
【0003】
【発明が解決しようとする課題】しかし、この方法で
は、必要SNRを計算する際に、入力信号の周波数特性
を求める必要があり、全帯域で1024次もの次元の大
きいFFTを行うなど大きな演算量を要する処理が多く
あり、この方法により立ち上がり検出装置単体として構
成すると規模が大きすぎる。
【0004】従来においては平滑化処理は行われておら
ず、入力信号が接近したパルス列のような場合は、その
最初のパルスのみに応答して、これだけを音信号立ち上
がりとして検出すべきであるが、従来においてはその各
パルスを音信号立ち上がりとして検出してしまう。つま
り小さい立ち上がりの連続は聴覚的には立ち上がりとし
て感じないが、従来方法ではこの場合、小さい各立ち上
がりを音信号の立ち上がりと検出する問題があった。
【0005】
【課題を解決するための手段】この発明によれば、第1
の段階で入力音響信号に対応する強度を求め、第2の段
階でその強度に対して短時間、つまり5〜40ミリ秒程
度の平滑化を行って短時間平滑化信号を得、第3の段階
でその短時間平滑化信号に対して長時間、つまり20〜
150ミリ秒程度の平滑化を行って長時間平滑化信号を
得、第4の段階でその長時間平滑化信号の不連続性を計
算し、その得られた不連続点を立ち上がりとする。
【0006】上記入力音響信号に対応する強度として
は、入力音響信号を線形予測分析し、その結果の線形予
測係数と対応したフィルタ係数をもつ逆フィルタへこの
入力音響信号を通してその残差信号を得、その残差信号
の強度を用いてもよい。上記第3の段階の平滑化は、短
時間平滑化信号にインパルス応答を畳み込むことで行
う、あるいは短時間平滑化信号をディジタルの検波回路
に通すことにより行う。
【0007】上記第4の段階は、第5の段階で過去の長
時間平滑化信号から現在の長時間平滑化信号を予測合成
し、その予測合成された長時間平滑化信号を第6の段階
で実際の現在における長時間平滑化信号と比較し、後者
が前者より著しく大きい場合に前記不連続点、つまり立
ち上がりと判断する。前記予測合成は過去の長時間平滑
化信号を線形和することによるか、過去の長時間平滑化
信号を近似表現する関数によって補外することにより行
う。
【0008】
【作 用】人の聴覚では、音信号のパタンの微細構造と
全体の構造を認識する機能がある。このため、例えば単
一のインパルスは音の立ち上がりとして認識されるが、
このインパルスが速い周期で繰り返されると立ち上がり
としては認識されない。このような聴覚特性をもつ神経
の興奮パタンをこの発明では、短時間平滑化と、長時間
平滑化を持つ聴覚モデルによって模擬し、パタンの不連
続性を判定することによって立ち上がりを検出する。し
たがって、この発明では、聴覚特性に即した立ち上がり
の検出が行われる。
【0009】また、線形予測分析フィルタを入力信号に
通すと、音の立ち上がりのような過去の信号から予測で
きない不連続点が強調された残差信号が得られる。した
がって、この残差信号の強さを入力音響信号と対応する
強さとして用いるとより、いっそう検出感度が高くな
る。
【0010】
【実施例】図1に、この発明の実施例における処理手順
を示す。第1の段階11では、入力音響信号は32KHz
または48KHzなどの標本化ディジタル信号として入力
され、その入力音響信号の音強度として、例えば入力音
響信号の絶対値、二乗値を用いることができる。あるい
は、入力音響信号を線形予測分析し、その線形予測係数
と対応したフィルタ係数をもつフィルタ、いわゆる逆フ
ィルタに入力音響信号を通して残差信号を得、この残差
信号の絶対値、二乗値、またはこれを入力信号の振幅の
平均値で正規化した信号を用いてもよい。
【0011】第2の段階12では、第1の段階11から
の強度信号を例えば約5ms程度の頻度で、過去20ms程
度の時間窓をかけ、窓内の平均を計算して短時間平滑化
して短時間平滑化信号を得る。前記時間窓の窓形状は、
例えば、矩形窓、ハミング窓、ハニング窓、指数関数窓
などを用い、時間窓は5〜40ms程度とされる。第3の
段階13では、第2の段階12からの短時間平滑化信号
に、立ち上がりが速く立ち下りが遅いインパルス応答を
畳み込むことによって長時間の平滑化を行う。この平滑
化は20〜150msにわたって連続的に行われる。この
インパルス応答の波形としては図2Aに示すように何れ
も急に立ち上がり、徐々に立ち下がり、その立ち上が
り、立ち下がりはそれぞれ直線的、指数関数的、三角関
数的などである。あるいは図2Bに等価回路で示される
ような立ち上がりの時定数が小さく、立ち下がりの時定
数が大きい(立ち上がりの時定数は0でも良い)ディジ
タルの検波回路に短時間平滑化信号を通して長時間の平
滑化を行っても良い。このディジタル検波回路の処理は
例えば図2Cに示すように入力された短時間平滑化信号
系列x0 ,x1 ,…,xn-1 ,xn ,xn+1 ,…のそれ
ぞれを、その直前に得られた出力の長時間平滑化信号系
列y0 ,y1 ,…,yn-1 ,yn ,yn+ 1 …と比較し
(21),xn >yn-1 ならばxn をyn として出力し
(22),xn >yn-1 でなければyn-1 にR(0<R
<1)を乗算した値をyn として出力する(23)。
【0012】第4の段階14では、過去における第3の
段階13からの長時間平滑化信号より現在における長時
間平滑化信号を予測する予測合成段階15と、その予測
合成出力と現在における第3の段階13の出力とを比較
する比較段階16とにわかれる。予測合成段階15で
は、例えば過去の信号の線形和による予測合成、最小二
乗法や最尤推定法による関数の当てはめなどの手法を用
いて過去の信号から現在の信号の予測値を合成する。つ
まり、長時間平滑化信号yn の系列を、各信号時間だけ
の単位遅延回路25の直列接続に入力し、その各遅延回
路25の出力に乗算器26で定数を掛算し、その掛算結
果を加算器27で加算して予測値yn+1 として出力す
る。あるいは図3Bに示すように長時間平滑化信号yn
の系列を時間に対する関数28として近似し、その関数
で補外して予測値yn+1 を得る。
【0013】比較段階16では、現在における長時間平
滑化信号yn+1 とその予測合成信号yn+1 ′との比をy
n+1 /yn+1 ′を計算し、この値があるしきい値を越え
ていたら立ち上がりとする、あるいは、現在における信
号yn+1 と予測合成信号yn+ 1 ′との差(yn+1 −y
n+1 ′)=Δyを計算し、この値Δyがあるしきい値を
超えていたら立ち上がりとする。あるいは、現在におけ
る信号yn+1 と予測合成信号を定数倍したものA
n+1 ′との差を計算し、この値があるしきい値を超え
ていたら立ち上がりとする方法を用いる。
【0014】
【発明の効果】以上述べたように、この発明では、短時
間平滑化と、長時間平滑化とにより神経の興奮パタンを
模擬し、この信号を立ち上がりを判定に用いるので、よ
り聴覚特性に即した立ち上がりの検出が可能である。
【図面の簡単な説明】
【図1】この発明の実施例の手順を示す流れ図。
【図2】Aは長時間平滑化において畳み込みを行う場合
に用いるインパルス応答の形状の例を示す図、Bは長時
間平滑化に用いるディジタル検波回路の等価回路を示す
図、Cはこの処理を離散信号に施す手順を示す流れ図で
ある。
【図3】Aは連続性検出における予測合成を過去の長時
間平滑化信号の線形和により求める場合の構成例を示す
図、Bは過去の長時間平滑化信号を近似表現する関数の
例を示す図である。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力音響信号に対応する強度を求める第
    1の段階と、 その第1の段階で得られた強度に対して短時間の平滑化
    を行い、短時間平滑化信号を得る第2の段階と、 その第2の段階で得られた短時間平滑化信号に対して長
    時間の平滑化を行い、長時間平滑化信号を得る第3の段
    階と、 その第3の段階で得られた長時間平滑化信号の不連続性
    を計算し、得られた不連続点を立ち上がりとする第4の
    段階とを有する音信号立ち上がり検出方法。
  2. 【請求項2】 上記入力音響信号を線形予測分析し、そ
    の結果の線形予測係数と対応したフィルタ係数をもつフ
    ィルタに上記入力音響信号を通して残差信号を得、その
    残差信号の強度を、上記第1の段階における上記入力音
    響信号に対応する強度として用いることを特徴とする請
    求項1記載の音信号立ち上がり検出方法。
  3. 【請求項3】 上記第3の段階は、上記第2の段階で得
    られた短時間平滑化信号にインパルス応答を畳み込んで
    平滑化を行うことであることを特徴とする請求項1また
    は2記載の音信号立ち上がり検出方法。
  4. 【請求項4】 上記第3の段階は、上記第2の段階で得
    られた短時間平滑化信号を、ディジタルの検波回路に通
    すことによって平滑化することであることを特徴とする
    請求項1または2記載の音信号立ち上がり検出方法。
  5. 【請求項5】 上記第4の段階は、上記第3の段階で得
    られた過去の長時間平滑化信号から現在の長時間平滑化
    信号を予測合成する第5の段階と、その第5の段階で得
    られた予測合成された長時間平滑化信号と、実際の現在
    における長時間平滑化信号とを比較し、後者が前者より
    著しく大きい場合に立ち上がりと判断する第6の段階と
    からなることを特徴とする請求項1ないし4の何れかに
    記載の音信号立ち上がり検出方法。
  6. 【請求項6】 上記第5の段階は、過去の長時間平滑化
    信号を線形和することにより予測合成を行うことを特徴
    とする請求項5記載の音信号立ち上がり検出方法。
  7. 【請求項7】 上記第5の段階は、過去の長時間平滑化
    信号を近似表現する関数によって補外することによって
    予測合成を行うことを特徴とする請求項5記載の音信号
    立ち上がり検出方法。
  8. 【請求項8】 上記第6の段階は、上記第3の段階で得
    られた現在の長時間平滑化信号と、上記第5の段階で得
    られた予測合成された長時間平滑化信号との比を計算
    し、この比があるしきい値を越えた場合立ち上がりと判
    断することを特徴とする請求項5ないし7記載の音信号
    立ち上がり検出方法。
  9. 【請求項9】 上記第6の段階は、上記第3の段階で得
    られた現在の長時間平滑化信号と、上記第5の段階で得
    られた予測合成された長時間平滑化信号を定数倍したも
    のとの差を計算し、この差があるしきい値を越えた場合
    立ち上がりと判断することを特徴とする請求項5ないし
    7記載の音信号立ち上がり検出方法。
JP18837794A 1994-08-10 1994-08-10 音信号立ち上がり検出方法 Expired - Lifetime JP3285178B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18837794A JP3285178B2 (ja) 1994-08-10 1994-08-10 音信号立ち上がり検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18837794A JP3285178B2 (ja) 1994-08-10 1994-08-10 音信号立ち上がり検出方法

Publications (2)

Publication Number Publication Date
JPH0854897A true JPH0854897A (ja) 1996-02-27
JP3285178B2 JP3285178B2 (ja) 2002-05-27

Family

ID=16222559

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18837794A Expired - Lifetime JP3285178B2 (ja) 1994-08-10 1994-08-10 音信号立ち上がり検出方法

Country Status (1)

Country Link
JP (1) JP3285178B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014136629A1 (ja) * 2013-03-05 2014-09-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014136629A1 (ja) * 2013-03-05 2014-09-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
JPWO2014136629A1 (ja) * 2013-03-05 2017-02-09 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
TWI581256B (zh) * 2013-03-05 2017-05-01 Nec Corp A signal processing device, a signal processing method, and a signal processing program
US9715885B2 (en) 2013-03-05 2017-07-25 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program

Also Published As

Publication number Publication date
JP3285178B2 (ja) 2002-05-27

Similar Documents

Publication Publication Date Title
US20050288923A1 (en) Speech enhancement by noise masking
RU2596592C2 (ru) Пространственный аудио процессор и способ обеспечения пространственных параметров на основе акустического входного сигнала
US20070232257A1 (en) Noise suppressor
US7508948B2 (en) Reverberation removal
US6175602B1 (en) Signal noise reduction by spectral subtraction using linear convolution and casual filtering
US5687285A (en) Noise reducing method, noise reducing apparatus and telephone set
US8015002B2 (en) Dynamic noise reduction using linear model fitting
US6895095B1 (en) Method of eliminating interference in a microphone
US6023674A (en) Non-parametric voice activity detection
US6459914B1 (en) Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging
US20040037439A1 (en) Acoustic signal processing apparatus and method, and audio device
JPS63500543A (ja) 雑音抑圧システム
JP2000148172A (ja) 音声の動作特性検出装置および検出方法
US3786188A (en) Synthesis of pure speech from a reverberant signal
CN113593599A (zh) 一种去除语音信号中噪声信号的方法
US20150071463A1 (en) Method and apparatus for filtering an audio signal
EP2230664B1 (en) Method and apparatus for attenuating noise in an input signal
JP2919685B2 (ja) 信号識別回路
US5732141A (en) Detecting voice activity
JP3510458B2 (ja) 音声認識システムおよび音声認識制御プログラムを記録した記録媒体
JP3418005B2 (ja) 音声ピッチ検出装置
JP3285178B2 (ja) 音信号立ち上がり検出方法
Lin et al. Speech enhancement for nonstationary noise environment
US6633847B1 (en) Voice activated circuit and radio using same
JPH0783752A (ja) オーディオ歪曲測定装置およびその方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090308

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090308

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100308

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110308

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110308

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120308

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130308

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term