JP2011160429A - Echo elimination device - Google Patents
Echo elimination device Download PDFInfo
- Publication number
- JP2011160429A JP2011160429A JP2011029507A JP2011029507A JP2011160429A JP 2011160429 A JP2011160429 A JP 2011160429A JP 2011029507 A JP2011029507 A JP 2011029507A JP 2011029507 A JP2011029507 A JP 2011029507A JP 2011160429 A JP2011160429 A JP 2011160429A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- echo
- speaker
- sound
- received
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
【課題】非線形性が強い再生手段を用いた場合でもエコー信号の除去能力を高める。
【解決手段】受話信号を再生手段により、再生信号に変換・放声し、メインマイクロホン61よりの話者受音信号とスピーカ4よりのエコー信号からなる受音信号からエコー信号を除去して、送話信号を出力するエコー消去装置において、メインマイクロホン61から、エコー信号より、話者受音信号を大きく含む受音信号を収音し、サブマイクロホン62から、話者受音信号より、エコー信号を大きく含む受音信号を収音し、上記メインマイクロホンは近端話者方向に感度が高く再生手段方向に感度が低くなるように配置され、上記サブマイクロホンは近端話者方向に感度が低く再生手段方向に感度が高くなるように配置される。
【選択図】図7Even if a reproducing means having strong nonlinearity is used, the ability to remove an echo signal is enhanced.
The reception signal is converted into a reproduction signal by the reproduction means and is output, and the echo signal is removed from the reception signal composed of the speaker reception signal from the main microphone 61 and the echo signal from the speaker 4 to be transmitted. In the echo canceller that outputs a speech signal, the main microphone 61 picks up a sound reception signal including a speaker reception signal larger than the echo signal, and the sub microphone 62 receives an echo signal from the speaker reception signal. The main microphone is arranged so that the sensitivity is high in the near-end speaker direction and the sensitivity is low in the playback means direction, and the sub-microphone is played back with low sensitivity in the near-end speaker direction. It arrange | positions so that a sensitivity may become high in a means direction.
[Selection] Figure 7
Description
この発明は、例えば、TV会議や音声会議などハンズフリー通信のエコー消去装置に関する。 This invention is, for example, about the echo cancellation equipment of hands-free communication, such as TV conferencing and audio conferencing.
従来技術のエコー消去装置の機能構成例を図1に示し、スピーカを線形特性と非線形特性の並列接続したモデルで表したときのブロック図を図2に示す。 FIG. 1 shows an example of a functional configuration of a conventional echo canceling apparatus, and FIG. 2 shows a block diagram when a speaker is represented by a model in which linear characteristics and nonlinear characteristics are connected in parallel.
以下の説明において、再生手段はスピーカとして、収音手段はマイクロホンとして説明する。また、図示しない遠端話者よりの通信網2を経由した音声信号を受話信号x(t)と表し、近端話者7が発した音声を話者音声s(t)と表し、マイクロホンで収音された話者音声s(t)を話者受音信号a(t)と表し、スピーカから放声された再生音がマイクロホンにまわり込み、収音された音声信号をエコー信号d(t)と表し、マイクロホンで収音した音声信号を受音信号y(t)と表し、遠端話者への送話信号または誤差信号をe(t)と表す。ただしtは離散的時刻を表す。
In the following description, the reproducing means is described as a speaker, and the sound collecting means is described as a microphone. In addition, a voice signal from a far-end speaker (not shown) via the
従来のエコー消去装置14は可変フィルタ8、減算部10、フィルタ係数更新部12、とで構成されている。従来のエコー消去装置14はスピーカ4とマイクロホン6を用いた拡声通話において、受音信号y(t)に混入されたエコー信号d(t)を消去する。エコー消去装置14の入力信号、(マイクロホン6で収音される音声信号)つまり受音信号y(t)はエコー信号d(t)と話者受音信号a(t)とからなる。従来のエコー消去装置14は、受音信号y(t)に含まれるエコー信号d(t)を推定して、受音信号y(t)から差し引くことにより、受音信号y(t)に含まれるエコー信号d(t)を消去する。
The conventional echo canceling device 14 includes a
まず、図示しない遠端話者からの音声信号が通信網2を経由して、受話信号x(t)として、スピーカ4に入力される。また、スピーカ特性が線形であるとした場合、その特性をg(t)とし、スピーカ4からマイクロホン6までのインパルス応答をr1(t)とすると、スピーカ4からマイクロホン6に回り込み、収音されたエコー信号d(t)は以下の式(1)で表すことが出来る。
d(t)=g(t)*r1(t)*x(t) (1)
ただし*は畳み込み演算を表す。次に、近端話者7からマイクロホン6までのインパルス応答をc1(t)と表し、上述したように、近端話者7からの音声はs(t)であるので、受音信号y(t)は以下の式(2)で表すことができる。
y(t)=g(t)*r1(t)*x(t)+c1(t)*s(t) (2)
ここで、エコー消去装置14に求められるのは、受音信号y(t)に含まれるエコー信号d(t)を消去することである。つまり、式(2)の右辺の第1項g(t)*r1(t)*x(t)の成分を消去することである。
First, a voice signal from a far-end speaker (not shown) is input to the
d (t) = g (t) * r 1 (t) * x (t) (1)
However, * represents a convolution operation. Next, the impulse response from the near-
y (t) = g (t) * r 1 (t) * x (t) + c 1 (t) * s (t) (2)
Here, what is required of the echo canceller 14 is to cancel the echo signal d (t) included in the received sound signal y (t). That is, the component of the first term g (t) * r 1 (t) * x (t) on the right side of Expression (2) is eliminated.
可変フィルタ8で、推定したインパルス応答(以下、擬似インパルス応答h(t)という)を受話信号x(t)に畳み込み、可変フィルタ8よりの出力信号である擬似エコー信号h(t)*x(t)を出力する。減算部10で受音信号y(t)から擬似エコー信号h(t)*x(t)を減算して、減算部10はエコー信号d(t)を消去した送話信号e(t)を出力する。送話信号e(t)を式で表せば以下の式(3)になる。
e(t)={g(t)*r1(t)−h(t)}*x(t)+c1(t)*s(t) (3)
The
e (t) = {g (t) * r 1 (t) −h (t)} * x (t) + c 1 (t) * s (t) (3)
可変フィルタのフィルタ係数(擬似インパルス応答h(t))は、フィルタ係数更新部12で受話信号x(t)と送話信号e(t)等を用いて更新される。この更新には、学習同定(NLMS:NormalizedLeast−Mean−Squares)アルゴリズム、もしくは射影アルゴリズム、もしくは逐次最小二乗(RecursiveLeastSquare)アルゴリズム、もしくはLMS(LeastMeanSquare)アルゴリズム等を用いられる。例えば、学習同定アルゴリズムを用いると、更新式は以下の式(4)になる。
H(t+1)=H(t)+a・X(t)・e(t)/X(t)TX(t) (4)
The filter coefficient (pseudo impulse response h (t)) of the variable filter is updated by the filter
H (t + 1) = H (t) + a.X (t) .e (t) / X (t) TX (t) (4)
ここで、aは事前に設定されたステップサイズであり、0<a<2の値をとり、ATはベクトルAの転置行列を表し、H(t)は時刻tにおけるフィルタ係数H(t)=(h(0),h(1),…,h(L−1))Tで表され、Lは可変フィルタ8のフィルタのタップ長であり、X(t)は時刻tにおける受話信号x(t)のLサンプル分のベクトルであり、X(t)=(x(t−0),x(t−1),…,x(t−L+1))Tで表す。
Here, a is a preset step size, takes a value of 0 <a <2, AT represents a transposed matrix of vector A, and H (t) is a filter coefficient H (t) at time t. = (H (0), h (1),..., H (L-1)) T , L is the tap length of the filter of the
上述したように、フィルタ係数更新部12は受話信号x(t)と送話信号e(t)から、上記式(4)等で表す更新式を用いて、可変フィルタ8のフィルタ係数を更新する。可変フィルタ8は更新されたフィルタ係数で逐次、受話信号x(t)をフィルタリングする。以上の処理により、受音信号y(t)に含まれるエコー信号d(t)が消去される。エコー信号d(t)が消去された送話信号e(t)が通信網2を通じて、図示しない遠端話者に出力される。なお、従来のエコー消去装置の詳細は特許文献1に記載されている。
As described above, the filter
従来のエコー消去装置14においては、エコー信号d(t)を十分に消去できない場合があった。この理由は、次の点にあると考えられるに至った。 In the conventional echo canceller 14, the echo signal d (t) may not be sufficiently cancelled. The reason for this is thought to be as follows.
即ち、一般的に、スピーカ特性は、振幅の大きな入力信号(受話信号x(t))に対して、出力が頭打ちになるような非線形の特性をもっているので、スピーカ特性は線形と非線形の特性に分けて考えられる。即ちスピーカ特性は、図2に示すように、線形特性の部分のスピーカ4のインパルス応答をg(t)、非線形の部分の特性を関数f(・)との並列特性で表すことが出来る。このスピーカ特性を考慮するとエコー信号d(t)は以下の式(5)で表すことができる。
d(t)=g(t)*r1(t)*x(t)+r1(t)*f(x(t)) (5)
また受音信号y(t)は以下の式(6)で表すことができる。
y(t)=d(t)+c1(t)*s(t)
=g(t)*r1(t)*x(t)+r1(t)*f(x(t))+c1(t)*s(t) (6)
従って、送話信号e(t)は以下の式(7)になる。
e(t)={g(t)*r1(t)−h(t)}*x(t)+r1(t)*f(x(t))+c1(t)*s(t) (7)
That is, in general, the speaker characteristic has a nonlinear characteristic such that the output reaches a peak with respect to an input signal (received signal x (t)) having a large amplitude. It can be considered separately. That is, as shown in FIG. 2, the speaker characteristics can be expressed by the parallel characteristics of the linear response portion with the impulse response of the
d (t) = g (t) * r 1 (t) * x (t) + r 1 (t) * f (x (t)) (5)
The sound reception signal y (t) can be expressed by the following equation (6).
y (t) = d (t) + c 1 (t) * s (t)
= G (t) * r 1 (t) * x (t) + r 1 (t) * f (x (t)) + c 1 (t) * s (t) (6)
Accordingly, the transmission signal e (t) is expressed by the following equation (7).
e (t) = {g (t) * r 1 (t) −h (t)} * x (t) + r 1 (t) * f (x (t)) + c 1 (t) * s (t) (7)
しかし、従来のエコー消去装置14においては、消去可能なエコーは、線形のエコー経路を通って、マイクロホン6に到達したエコーのみで、非線形のエコーは消去できない。つまり、上記式(6)の右辺の第1項であるg(t)*r1(t)*x(t)のみが消去され、第2項であるr1(t)*f(x(t))の成分を消去することができず、送話信号e(t)に非線形のエコー信号が混入してしまう。従って、非線形が強いスピーカ等を用いた場合、十分にエコー信号を消去できないという問題があった。
However, in the conventional echo canceller 14, the only echo that can be canceled is the echo that reaches the
この発明によれば、受話信号を再生手段により、再生音に変換して、放声し、話者用収音手段よりの話者受音信号と上記再生音が回り込んだ信号(以下、エコー信号という)からなる受音信号から上記エコー信号を除去して、送話信号として出力するエコー消去装置において、上記受話信号から、第1の擬似エコー信号を生成し、上記複数の収音手段中よりの受音信号から、第2の擬似エコー信号を生成し、上記話者用収音手段よりの受音信号から上記第1の擬似エコー信号及び上記第2の擬似エコー信号を減算して、上記送話信号を出力し、少なくとも、上記受話信号と上記送話信号とが入力され、上記第1の可変フィルタのフィルタ係数を更新し、少なくとも、上記複数の収音手段中よりの受音信号と上記送話信号とから、上記第2の可変フィルタのフィルタ係数を更新し、上記話者用収音手段は、近端話者方向に感度が高く、且つ上記再生手段方向に感度が低くなるように配置されたマイクロホンであり、上記エコー用収音手段は、上記近端話者方向に感度が低く、且つ上記再生手段方向に感度が高くなるように配置されたマイクロホンである。 According to the present invention, the received signal is converted into a reproduced sound by the reproducing means, and is emitted, and a signal (hereinafter referred to as an echo signal) in which the speaker received signal from the sound collecting means for the speaker and the reproduced sound are circulated. In the echo canceling apparatus that removes the echo signal from the received sound signal and outputs it as a transmitted signal, a first pseudo echo signal is generated from the received signal, and the plurality of sound collecting means A second pseudo echo signal is generated from the received sound signal, and the first pseudo echo signal and the second pseudo echo signal are subtracted from the received sound signal from the speaker sound collecting means, A transmission signal is output; at least the reception signal and the transmission signal are input; a filter coefficient of the first variable filter is updated; and at least a reception signal from the plurality of sound collection units; From the transmission signal, the second possible Update the filter coefficients of the filter, the speaker for sound pickup means, high sensitivity in the near-end speaker direction and a disposed microphone as sensitive to the reproducing means the direction is low, the echo YoOsamu sound means, the near-end talker direction insensitive, Ru arranged microphone der so and sensitivity is high in the reproduction unit direction.
上記の構成により、非線形性が強いスピーカ等を用いた場合でも、エコー信号の除去能力を高めることが出来、送話信号の品質を高めることができる。 With the above configuration, even when a loudspeaker or the like with strong nonlinearity is used, the ability to remove echo signals can be enhanced, and the quality of the transmitted signal can be enhanced.
以下に、この発明を実施するための最良の形態を示す。 The best mode for carrying out the present invention will be described below.
この発明の機能構成例を図3に示し、この発明の主要な処理の流れを図4に示す。図1と同一機能構成部分には同一参照番号を付け、重複説明を省略する。以下も同様とする。また、メインマイクロホン61は話者用収音手段を話者の音声を収音するためのものであり、収音手段とはメインマイクロホンを含む全てのマイクロホンを表すこととする。
An example of the functional configuration of the present invention is shown in FIG. 3, and the main processing flow of the present invention is shown in FIG. The same functional components as those in FIG. 1 are denoted by the same reference numerals, and redundant description is omitted. The same applies to the following. The
エコー消去装置40は、第1の可変フィルタ24、第2の可変フィルタ26m(m=2、...、M)、加算部36、減算部38、第1のフィルタ係数更新部34、第2のフィルタ係数更新部32、とで構成されている。また、マイクロホンの数は、複数個であるM個(M≧2)になり、マイクロホンを6m(m=1、...、M)と表す。
The
この発明のエコー消去装置40の入力信号は、スピーカ4よりの再生信号がまわり込んだエコー信号と近端話者7よりの音声信号であり、つまりマイクロホン6mで収音された受音信号ym(t)である。出力信号は図示しない遠端話者への送話信号e(t)である。エコー消去装置40は、エコー信号d(t)を消去し、会話をしやすくする。また、エコー消去装置40の各入力信号は図示しないAD変換部で、アナログ信号から離散時間の信号(ディジタル信号)に変換され、エコー消去装置40の各出力信号は、図示しないDA変換部で離散時間の信号(ディジタル信号)からアナログ信号に変換される。
The input signal of the
受話信号x(t)はスピーカ4により再生音として再生される。スピーカ4内の信号の流れの詳細は上述と同様、図2に示す。上述の通り、スピーカ特性は、振幅の大きな信号の入力に対して、出力が頭打ちになるような非線形の特性をもっているので、スピーカ特性は線形と非線形の特性に分けて考える。線形特性の部分のインパルス応答g(t)、非線形の部分の特性を関数f(・)として表す。またスピーカから各マイクロホン6m(m=1、...、M)までのインパルス応答をrm(t)と表し、近端話者7から各マイクロホン6mまでのインパルス応答をcm(t)と表すと、各マイクロホン6mでの受音信号ym(t)は以下の式(8)で表すことができる。
ym(t)=g(t)*rm(t)*x(t)+rm(t)*f(x(t))+cm(t)*s(t) (8)
The received signal x (t) is reproduced as reproduced sound by the
y m (t) = g (t) * r m (t) * x (t) + r m (t) * f (x (t)) + c m (t) * s (t) (8)
この実施例1では、図示しない話者受音信号選出手段は、複数のマイクロホン6mから、エコー信号レベル対話者受音信号レベルの比の時間平均値が、他のマイクロホン6mに比べて小さいマイクロホン6mをメインマイクロホン61として選出した場合である。(ステップS2)。
In the first embodiment, the speaker received signal selection means (not shown) has a
また図示しないエコー受音信号選出手段は、複数のマイクロホン6mから、エコー信号レベル対話者受音信号レベルの比の時間平均値が大きいマイクロホンを1つ以上選出した場合である。ただし、この場合、メインマイクロホン61は選択しない(ステップS2)。
The echo sound signal selection means (not shown) is a case where one or more microphones having a large time average value of ratios of echo signal level dialogue person sound signal levels are selected from the plurality of
話者受音信号選出手段の選出の仕方の一例として、図3に記載のように、1つのマイクロホンをメインマイクロホン61とし、メインマイクロホン61の感度の高い方向を近端話者7方向に向け、その他のマイクロホンを全てサブマイクロホン6m(m=2、...、M)として、サブマイクロホン6mの感度の高い方向をスピーカ4方向に向けることが考えられる。メインマイクロホン61、サブマイクロホン6mの感度の方向については後ほど詳細に述べる。この場合、メインマイクロホン61に向かって近端話者7は音声を発することになる。
As an example of the selection method of the speaker reception signal selection means, as shown in FIG. 3, one microphone is set as the
メインマイクロホン61および、サブマイクロホン6mで収音された受音信号ym(t)(m=1、...、M)は上記式(8)と同様に表すことができる。サブマイクロホン6mの受音信号ym(t)がそれぞれ対応する第2の可変フィルタ26m(m=2、...、M)に入力される。第2の可変フィルタ26mが受音信号ym(t)に第2のフィルタ係数hm(t)を畳み込んで、つまり以下の式(9)を計算して第2の擬似エコー信号βm(t)(m=2、...、M)が生成される(ステップS4)。
βm(t)=ym(t)*hm(t) (9)
第2の擬似エコー信号βm(t)はそれぞれ加算部36へ入力される。
The received sound signal y m (t) (m = 1,..., M) collected by the
β m (t) = y m (t) * h m (t) (9)
The second pseudo echo signals β m (t) are each input to the
一方、受話信号x(t)は第1の可変フィルタ24に入力される。第1の可変フィルタ24が受話信号x(t)に第1のフィルタ係数h1(t)を畳み込んで、つまり以下の式(10)を計算して、第1の擬似エコー信号α(t)が生成される(ステップS4)。
α(t)=x(t)*h1(t) (10)
第1の擬似エコー信号α(t)および第2の擬似エコー信号βm(t)は加算部36へ入力され、α(t)+Σi=2 Mβi(t)が計算される。加算された信号α(t)+Σi=2 Mβi(t)は、減算部38に入力される。
On the other hand, the received signal x (t) is input to the first
α (t) = x (t) * h 1 (t) (10)
The first pseudo echo signal α (t) and the second pseudo echo signal β m (t) are input to the
一方、メインマイクロホン61で収音された受音信号y1(t)は減算部38に入力される。減算部38で、受音信号y1(t)から加算部36よりの音声信号α(t)+Σm=2 Mβm(t)を減算し、つまり、以下の式(11)が計算され、送話信号e(t)が出力される(ステップS6)。
e(t)=y1(t)−α(t)−Σi=2 Mβi(t)
=y1(t)−h1(t)*x(t)−Σi=2 Myi(t)*hi(t)
(11)
On the other hand, the received sound signal y 1 (t) collected by the
e (t) = y 1 (t) −α (t) −Σ i = 2 M β i (t)
= Y 1 (t) -h 1 (t) * x (t) -Σ i = 2 M y i (t) * h i (t)
(11)
上記式(8)より
y1(t)=g(t)*r1(t)*x(t)+r1(t)*f(x(t))+c1(t)*s(t) (12)
yi(t)=g(t)*ri(t)*x(t)+ri(t)*f(x(t))+ci(t)*s(t) (13)
となるので、式(12)(13)を上記式(11)へ代入すると、以下の式(14)になる。
e(t)=g(t)*r1(t)*x(t)+r1(t)*f(x(t))+c1(t)*s(t)
−h1(t)*x(t)−Σi=2 Mhi(t)*{g(t)*ri(t)*x(t)
+ri(t)*f(x(t))+ci(t)*s(t)}
={g(t)*r1(t)−h1(t)−Σi=2 Mhi(t)*g(t)*ri(t)}*x(t)
+{r1(t)−Σi=2 Mhi(t)*ri(t)}*f(x(t))
+{c1(t)−Σi=2 Mhi(t)*ci(t)}*s(t) (14)
From the above equation (8), y 1 (t) = g (t) * r 1 (t) * x (t) + r 1 (t) * f (x (t)) + c 1 (t) * s (t) (12)
y i (t) = g (t) * r i (t) * x (t) + r i (t) * f (x (t)) + c i (t) * s (t) (13)
Therefore, when Expressions (12) and (13) are substituted into Expression (11), the following Expression (14) is obtained.
e (t) = g (t) * r 1 (t) * x (t) + r 1 (t) * f (x (t)) + c 1 (t) * s (t)
-H 1 (t) * x ( t) -Σ i = 2 M h i (t) * {g (t) * r i (t) * x (t)
+ R i (t) * f (x (t)) + c i (t) * s (t)}
= {G (t) * r 1 (t) -h 1 (t) -Σ i = 2 M h i (t) * g (t) * r i (t)} * x (t)
+ {R 1 (t) −Σ i = 2 M h i (t) * r i (t)} * f (x (t))
+ {C 1 (t) −Σ i = 2 M h i (t) * c i (t)} * s (t) (14)
ここで、式(14)の第1項{g(t)*r1(t)−h1(t)−Σi=2 Mhi(t)*g(t)*ri(t)}*x(t)は線形の音響エコー成分であり、{g(t)*r1(t)−h1(t)−Σi=2 Mhi(t)*g(t)*ri(t)}=0となるh1(t)とhm(t)を設定すれば、線形の音響エコーを消去することが出来る。 Here, the first term of the expression (14) {g (t) * r 1 (t) −h 1 (t) −Σ i = 2 M h i (t) * g (t) * r i (t) } * X (t) is a linear acoustic echo component, and {g (t) * r 1 (t) −h 1 (t) −Σ i = 2 M h i (t) * g (t) * r By setting h 1 (t) and h m (t) where i (t)} = 0, linear acoustic echo can be eliminated.
式(14)の第2項{r1(t)−Σi=2 Mhi(t)*ri(t)}*f(x(t))は、非線形の音響エコー成分であり、r1(t)−Σi=2 Mhi(t)*ri(t)=0となるhm(t)を設定すれば、非線形の音響エコーを消去することが出来る。 The second term {r 1 (t) −Σ i = 2 M h i (t) * r i (t)} * f (x (t)) in Equation (14) is a nonlinear acoustic echo component, By setting h m (t) where r 1 (t) −Σ i = 2 M h i (t) * r i (t) = 0, nonlinear acoustic echo can be eliminated.
上記話者受音信号選出手段および、エコー受音信号選出手段は必ずしも設けなくても良い。この場合は話者受音信号選出手段が設けられないメインマイクロホン61からの話者音声を収音した受音信号が減算部38へ入力され、エコー受音信号選出手段が設けられないサブマイクロホン6mよりの受音信号が第2の可変フィルタ26mへ入力される。
The speaker received signal selecting means and the echo received signal selecting means are not necessarily provided. In this case, a received sound signal obtained by picking up the speaker voice from the
式(14)の第3項{c1(t)−Σi=2 Mhi(t)*ci(t)}*s(t)は近端話者7の音声成分であり、メインマイクロホン61で収音された近端話者7の音声成分c1(t)*s(t)に加え、劣化成分であるΣi=2 Mhi(t)*ci(t)*s(t)が存在している。
The third term {c 1 (t) −Σ i = 2 M h i (t) * c i (t)} * s (t) in the equation (14) is a speech component of the near-
また、上記式(14)の第3項に含まれる近端話者7の音声の劣化成分であるΣi=2 Mhi(t)*ci(t)*s(t)が大きくなってしまうと、送話音声の品質が悪くなってしまう。これを防ぐためには前述したエコー受音信号選択手段を用いる。以下に一例を説明する。簡略化のために、メインマイクロホン61、サブマイクロホン62、共に1個の場合を説明する。
Also, Σ i = 2 M h i (t) * c i (t) * s (t), which is a degradation component of the speech of the near-
上記{c1(t)−Σi=2 Mhi(t)*ci(t)}*s(t)に基づく近端話者7の音声の劣化を防ぐためには、h2(t)とc2(t)を小さくする必要がある。このためには、上記話者受音信号選出手段およびエコー受音信号選出手段を設ければよい。例えば、メインマイクロホン61およびサブマイクロホン62の配置を変えることが考えられる。図5に示すように、メインマイクロホン61およびサブマイクロホン62として単一指向性マイクロホンを使用する。メインマイクロホン61の感度の高い部分61aを近端話者7に向け、感度の低い部分61bをスピーカ4に向ける。また、サブマイクロホン62の感度の高い部分62aをスピーカ4に向けて、感度の低い部分62bを近端話者7に向ける。このような配置をすることで、メインマイクロホン61において、c2(t)の振幅が、c1(t)の振幅より小さくなる。さらに、r1(t)の振幅がr2(t)の振幅よりも小さくなることで、エコーを消去するためのフィルタh2(t)の振幅も小さくなる。何故なら、上記式(14)の第2項において、r1(t)−h2(t)*r2(t)=0となるh2(t)を設定しているからである。この配置により、近端話者7の音声の劣化成分h2(t)*c2(t)*s(t)を小さくすることが出来る。
In order to prevent the deterioration of the voice of the near-
この実施例1において、図6に示すように、メインマイクロホン61の感度の高い部分61aを近端話者7に向け、マイクロホン6mの感度の高い部分6maをスピーカ4に向けることで、近端話者7の音声の劣化成分を小さくすることが出来る。
In the first embodiment, as shown in FIG. 6, the high-
次に、エコー信号d(t)を抑圧するための可変フィルタの係数h1(t)、hm(t)(m=2、...、M)を求める方法を説明する。フィルタ係数h1(t)は第1のフィルタ係数更新部34で、hm(t)は、第2のフィルタ係数更新部32で更新される(ステップS8)。送話信号e(t)に含まれるエコー成分の2乗平均が小さくなるようにフィルタ係数h1(t)、hm(t)(m=2、...、M)を逐次更新することにより得られる。ただしフィルタ係数の初期値は任意の値で事前に与えられる。
Next, a method for obtaining the coefficients h 1 (t) and h m (t) (m = 2,..., M) of the variable filter for suppressing the echo signal d (t) will be described. The filter coefficient h 1 (t) is updated by the first filter
このフィルタ係数を逐次更新するアルゴリズムの代表的なものには、学習同定(NLMS:NormalizedLeast−Mean−Squares)アルゴリズム、もしくは射影アルゴリズム、もしくは逐次最小二乗(RecursiveLeastSquare)アルゴリズム、もしくはLMS(LeastMeanSquare)アルゴリズム等がある。以下、それぞれのアルゴリズムを簡単に説明する。 Typical algorithms for sequentially updating the filter coefficients include a learning identification (NLMS: Normalized-Lean-Squares) algorithm, a projection algorithm, a sequential least-squares (RecursiveLeastSquare) algorithm, or an LMS (LeastMeanSquare) algorithm. is there. Each algorithm will be briefly described below.
NLMSアルゴリズム
NLMSアルゴリズムは観測された最新の1サンプルの送話信号e(t)のみを用いてフィルタ係数を更新するアルゴリズムであり、演算量が少ない特徴をもつ。第1のフィルタ係数更新部34による更新式は以下の式(15)で表され、第2のフィルタ係数更新部32による更新式は以下の式(16)で表される。
H1(t+1)=H1(t)+a1・X(t)・e(t)/{X(t)TX(t)+Σi=2 MYi(t)TYi(t)} (15)
Hm(t+1)=Hm(t)+am・Ym(t)・e(t)/{X(t)TX(t)+Σi=2 MYi(t)TYi(t)} (16)
ただし、H1(t)、Hm(t)(m=2、...、M)は、時刻tにおける受話信号x(t)に対するフィルタ係数のベクトルであり、Hm(t)=(hm(0),hm(1),…,hm(L−1))T(m=1、...、M)で表され、Lはタップ数である。a1とamは事前に設定されたNLMSアルゴリズムのステップサイズであり、
0<a1、am<2を満たす。また、Y(t)は時刻tにおける送話信号y(t)のLサンプル分のベクトルであり、Ym(t)=(ym(t−0),ym(t−1),…,ym(t−L+1))Tで表す。
NLMS algorithm The NLMS algorithm is an algorithm for updating the filter coefficient using only the latest observed transmission signal e (t) of one sample, and has a feature that the amount of calculation is small. The update formula by the first filter
H 1 (t + 1) = H 1 (t) + a 1 · X (t) · e (t) / {X (t) T X (t) + Σ i = 2 M Y i (t) T Y i (t) } (15)
H m (t + 1) = H m (t) + a m · Y m (t) · e (t) / {X (t) T X (t) + Σ i = 2 M Y i (t) T Y i (t )} (16)
Here, H 1 (t), H m (t) (m = 2,..., M) are filter coefficient vectors for the received signal x (t) at time t, and H m (t) = ( h m (0), h m (1),..., h m (L−1)) T (m = 1,..., M), where L is the number of taps. a 1 and a m are pre-set NLMS algorithm step sizes,
0 <a 1 and a m <2 are satisfied. Y (t) is a vector of L samples of the transmission signal y (t) at time t, and Y m (t) = (y m (t−0), y m (t−1),. , Y m (t−L + 1)) T.
また、上記式(4)の右辺の分母と、上記式(15)(16)の右辺の分母を比較すると、上記式(15)(16)の右辺の分母で、余分にΣi=2 MYi(t)TYi(t)が足されている。Σi=2 MYi(t)TYi(t)は、各マイクロホン6mで収音された受音信号ym(t)のパワーの和である。分母に受音信号ym(t)のパワーの和を足しておくことで、フィルタ係数の発散を防ぐことが出来る。
Further, when the denominator of the right side of the above formula (4) is compared with the denominator of the right side of the above formulas (15) and (16), the Σ i = 2 M is extra in the denominator of the right side of the above formulas (15) and (16). Y i (t) T Y i (t) is added. Σ i = 2 M Y i (t) T Y i (t) is the sum of the powers of the received sound signals y m (t) collected by the
LMSアルゴリズム
LMSアルゴリズムもNLMSアルゴリズム同様、観測された最新の1サンプルの送話信号e(t)のみを用いてフィルタ係数を更新するアルゴリズムであり、演算量が少ない特徴をもつ。LMSアルゴリズムの更新式は、以下の式(17)、(18)で表すことができる。
H1(t+1)=H1(t)+b・X(t)・e(t) (17)
Hm(t+1)=Hm(t)+bm・Ym(t)・e(t) (18)
Similar to the NLMS algorithm, the LMS algorithm is an algorithm for updating the filter coefficient using only the latest observed transmission signal e (t) of one sample, and has a feature that the amount of calculation is small. The update formula of the LMS algorithm can be expressed by the following formulas (17) and (18).
H 1 (t + 1) = H 1 (t) + b · X (t) · e (t) (17)
H m (t + 1) = H m (t) + b m · Y m (t) · e (t) (18)
射影アルゴリズム
射影アルゴリズムは、過去uサンプル分の送話信号e(t)を用いて、フィルタ係数を更新するアルゴリズムである。射影アルゴリズムは隣り合う入力信号ベクトルの間の相関を取り除くことを基本的な考え方とするアルゴリズムである。射影アルゴリズムは上述したNLMSアルゴリズムに比べ、演算量が多くなるが送話信号e(t)の収束速度が速いという特徴がある。第1のフィルタ係数h1(t)および第2のフィルタ係数hm(t)(m=2、...、M)は以下の式(19)で更新される。なお、以下の式(19)は2次のフィルタ係数の更新式である。
Projection algorithm The projection algorithm is an algorithm for updating the filter coefficient using the transmission signal e (t) for the past u samples. The projection algorithm is an algorithm whose basic idea is to remove the correlation between adjacent input signal vectors. The projection algorithm has a feature that the amount of calculation is larger than the above-described NLMS algorithm, but the convergence speed of the transmission signal e (t) is high. The first filter coefficient h 1 (t) and the second filter coefficient h m (t) (m = 2,..., M) are updated by the following equation (19). In addition, the following formula | equation (19) is an update formula of a secondary filter coefficient.
ただし、ベクトルu(t)は、以下の式(20)で表すことができる。 However, the vector u (t) can be expressed by the following equation (20).
RLSアルゴリズム
RLSアルゴリズムは、過去全ての送話信号e(t)を利用して、フィルタ係数を更新するアルゴリズムであり、上述した射影アルゴリズムよりも送話信号e(t)の収束速度が速いが、演算量は多い。RLSアルゴリズムは過去の全入出力の関係を最小2乗誤差で近似させるフィルタ係数ベクトルH^(t)を求めることにある。第1のフィルタ係数h1(t)および第2のフィルタ係数hm(t)(m=2、...、M)は以下の式(21)で更新される。
RLS algorithm RLS algorithm is an algorithm for updating filter coefficients using all past transmission signals e (t), and the convergence speed of the transmission signal e (t) is faster than the projection algorithm described above. The amount of calculation is large. The RLS algorithm is to obtain a filter coefficient vector H ^ (t) that approximates all past input / output relationships with a least square error. The first filter coefficient h 1 (t) and the second filter coefficient h m (t) (m = 2,..., M) are updated by the following expression (21).
ただし、ベクトルK(t)は以下の式(22)で表すことができる。 However, the vector K (t) can be expressed by the following equation (22).
ただし、ベクトルP(t)は入力信号の共分散行列E[x(t)x(t)T]の逆行列として定義され、タップ数Lを用いて、L×Lの正方行列である。またベクトルP(t)は以下の式(23)を満たす。 However, the vector P (t) is defined as an inverse matrix of the covariance matrix E [x (t) x (t) T ] of the input signal, and is an L × L square matrix using the tap number L. The vector P (t) satisfies the following expression (23).
ただし、λは忘却係数であり、0≦λ≦1を満たす係数である。
これらのアルゴリズムの詳細については、「音響エコーキャンセラのための適応信号処理の研究 牧野昭二 博士論文 1993 東北大学」に記載されている。
また第1のフィルタ係数更新部34および、第2のフィルタ係数更新部32の更新アルゴリズムは各々違うアルゴリズムを用いても良い。
However, λ is a forgetting factor, which is a factor satisfying 0 ≦ λ ≦ 1.
Details of these algorithms are described in "Research on Adaptive Signal Processing for Acoustic Echo Canceller, Dr. Shoji Makino Doctoral Dissertation 1993 Tohoku University".
Also, different algorithms may be used for the update algorithms of the first filter
これらの更新アルゴリズムを適用して第1のフィルタ係数更新部34および、第2のフィルタ係数更新部32で、送話信号e(t)が収束するまで、第1のフィルタ係数h1(t)および第2のフィルタ係数hm(t)(m=2、...、M)は更新される(ステップS8)。またこれらのアルゴリズムを用いて、フィルタ係数を更新できることは、以下で説明する実施例2〜4においても同様である。
実施例1の機能構成により、スピーカ4に非線形性などがある場合に発生する非線形な音響エコーと、線形の音響エコーとの両方のエコーを消去することが出来、高い消去性能を実現することが出来る。
By applying these update algorithms, the first filter
With the functional configuration of the first embodiment, it is possible to cancel both the nonlinear acoustic echo generated when the
[実験結果]
従来のエコー消去装置14と実施例2のエコー消去装置40を実際のハンズフリー装置に適用して、効果を比較するための実験結果を説明する。この実験で使用した実施例1で説明したエコー消去装置40、スピーカ4、近端話者7などの配置を図7に示す。また、メインマイクロホン、サブマイクロホンをそれぞれ1つとした。メインマイクロホン61とサブマイクロホン62とを結ぶ直線と、スピーカ4と近端話者7とを結ぶ直線と、が直交するように、メインマイクロホン61、サブマイクロホン62、スピーカ4、近端話者7を配置させる。メインマイクロホン61とサブマイクロホン62との距離を2cm、スピーカ4と近端話者7との距離を50cm、スピーカ4とメインマイクロホン61との距離を5cmとし、スピーカ4の直径は4cmである。スピーカ特性は過大入力に対してクリップする特性を模擬したシグモイド関数とし、空間応答c1(t)、c2(t)、r1(t)、r2(t)は図7の配置で計測したインパルス応答とした。
[Experimental result]
An experimental result for comparing the effect by applying the conventional echo canceling device 14 and the
メインマイクロホン61の感度の高い部分41aを近端話者の方向へ向け、サブマイクロホン62の感度の高い部分62aをスピーカ4の方向へ向ける。また、サンプリング周波数は16kHz、残響時間を200ms、第1の可変フィルタ24および第2の可変フィルタ26のタップ数は512タップ、適応アルゴリズムはNLMSアルゴリズムを用いた。
The high sensitivity portion 41 a of the
図8、図9に実験結果を示す。図8は受話信号x(t)に白色雑音を入力したときのエコー消去量を示しているグラフであり、値が大きいほどより多くのエコーを消去できていることを示す。横軸が時刻(s)であり、縦軸がその時刻のエコー消去量を示す。細線が従来技術のエコー消去装置14によるエコー消去量を示し、太線が実施例1で説明したエコー消去装置40によるエコー消去量を示す。
8 and 9 show the experimental results. FIG. 8 is a graph showing the amount of echo cancellation when white noise is input to the received signal x (t). The larger the value, the more echoes can be canceled. The horizontal axis represents time (s), and the vertical axis represents the amount of echo cancellation at that time. A thin line indicates the amount of echo erasure by the conventional echo erasing device 14, and a thick line indicates the amount of echo erasure by the
従来技術のエコー消去装置14を用いた場合のエコー消去量は20dB程度が最大であることが理解できる。これは、スピーカ4に非線形性があるために生じる非線形な音響エコーを従来技術で説明したエコー消去装置14では消去できないためである。
It can be understood that the maximum amount of echo cancellation when using the conventional echo cancellation apparatus 14 is about 20 dB. This is because the non-linear acoustic echo generated due to the non-linearity of the
これに対し、実施例1で説明したエコー消去装置40を使用した場合のエコー消去量は40dB程度であることが理解できる。これは、実施例2で説明したエコー消去装置40においての非線形な音響エコーも消去できているからである。
On the other hand, it can be understood that the amount of echo cancellation when the
図9は、近端話者7に対するインパルス応答を示したグラフである。横軸が周波数(Hz)を示し、縦軸が、近端話者7からメインマイクロホン61までのインパルス応答c1(t)である。細線がエコー消去装置40の処理前を示し、太線がエコー消去装置40の処理後を示す。図8のグラフより、処理前と処理後のインパルス応答c1(t)を比較しても、殆ど差が無いことが理解できる。以上のことから、実施例1では、近端話者7の音声の劣化成分が小さいことがわかる。
FIG. 9 is a graph showing an impulse response to the near-
以上の説明から、実施例1によれば、線形の音響エコーと、スピーカ4の非線形性により発生する非線形な音響エコーの両方を消去し、高いエコー消去方法を実現出来る。さらに、近端話者7の音声の劣化を小さく高品質な収音が実現できる。
From the above description, according to the first embodiment, both the linear acoustic echo and the nonlinear acoustic echo generated due to the nonlinearity of the
実施例1では、メインマイクロホン61は感度の高い部分61aを近端話者7に向けて、感度の低い部分をスピーカ4に向け、サブマイクロホン62は感度の高い部分62aをスピーカ4に向け、感度の低い部分を近端話者7に向けることで、近端話者7の音声の劣化成分を小さくすることが出来ることを説明した。実施例2では、話者受音信号選出手段をメインビームフォーマとし、エコー受音信号選出手段をサブビームフォーマとする機能構成例である。実施例2ではこれらメインビームフォーマとサブビームフォーマを使って近端話者7の音声の劣化成分を小さくする。
In the first embodiment, the
図10に実施例2の機能構成例を示す。実施例2のエコー消去装置40は実施例2で説明したエコー消去装置40と比較して、上記サブビームフォーマ50とメインビームフォーマ52とが加えられる。また、この実施例では、マイクロホン6mにおいては、メインマイクロホン(話者用収音手段)、サブマイクロホンとに分けられることなく、全てのマイクロホン6mが並列的に作動する。
FIG. 10 shows a functional configuration example of the second embodiment. The
また、サブビームフォーマ50はサブ固定フィルタ50m(m=1、...、M)とサブ加算部500とで構成され、メインビームフォーマ52はメイン固定フィルタ52m(m=1、...、M)とメイン加算部520とで構成される。
The sub beamformer 50 includes a sub fixed
メインビームフォーマ52は近端話者7方向に感度を高くし、スピーカ4に対する感度を低くする。また、サブビームフォーマ50は、スピーカ4に対する感度を高くして、近端話者7に対する感度を低くする。メインビームフォーマ52とサブビームフォーマ50を使用することで、任意の方向に対して指向性が高い部分と低い部分を作ることができ、様々なスピーカとマイクロホンの配置に適用することができる。
The main beamformer 52 increases sensitivity toward the near-
また、この実施例2の説明では、簡略化のため、周波数領域ωで説明する。近端話者からマイクロホン6mまでの伝達関数をCm(ω)とし、スピーカ4からマイクロホン6mまでの伝達関数をRm(ω)とし、メインビームフォーマ52中のmチャネルのメイン固定フィルタ52mの各固定フィルタ係数をPm(ω)とし、サブビームフォーマ50のサブ固定フィルタ50mの固定フィルタ係数をQm(ω)とする。
In the description of the second embodiment, the description will be made in the frequency domain ω for simplification. The transfer function from the near-end speaker to the
サブ固定フィルタ50mおよびメイン固定フィルタ52mの各固定フィルタ係数は予め与えられた値から固定されたものである。以下に、固定フィルタ係数の設計を説明する。
メインビームフォーマ52に要求されるのは、近端話者7の音声s(ω)を収音し、スピーカ4からの再生音を抑圧することである。これらの条件を式で表せば、以下の式(24)(25)になる。
Σi=1 MCi’(ω)・Pi(ω)=D(ω) (24)
Σi=1 MRi’(ω)・Pi(ω)=0 (25)
Each fixed filter coefficient of the sub fixed
What is required of the main beamformer 52 is to pick up the voice s (ω) of the near-
Σ i = 1 M C i ′ (ω) · P i (ω) = D (ω) (24)
Σ i = 1 M R i ′ (ω) · P i (ω) = 0 (25)
ここで、D(ω)は目標とするインパルス応答である。目標とするインパルス応答とは、例えば、振幅値が固定値であり、位相が直線位相(時間領域における固定遅延)となっているようなインパルス応答である。Cm’(ω)、Rm’(ω)はマイク6m、スピーカ4、近端話者7の配置から計算される直接波の理論的な応答を事前に設定する。以下の式(26)(27)でも同様である。上記式(24)(25)を満たす固定フィルタ係数Pm(ω)を設定すれば良い。次に、サブビームフォーマ50に要求されるのは、近端話者7の音声s(ω)を抑圧し、スピーカ4からの再生音を収音することである。これらの条件を式で表すと、以下の式(26)(27)になる。
Σi=1 MCi’(ω)・Qi(ω)=0 (26)
Σi=1 MRi’(ω)・Qi(ω)=K(ω) (27)
Here, D (ω) is a target impulse response. The target impulse response is, for example, an impulse response in which the amplitude value is a fixed value and the phase is a linear phase (fixed delay in the time domain). C m ′ (ω) and R m ′ (ω) set in advance the theoretical response of the direct wave calculated from the arrangement of the
Σ i = 1 M C i ′ (ω) · Q i (ω) = 0 (26)
Σ i = 1 M R i ′ (ω) · Q i (ω) = K (ω) (27)
ただし、K(ω)は目標とするインパルス応答である。目標とするインパルス応答とは、例えば、振幅値が固定値であり、位相が直線位相(時間領域における固定遅延)となっているようなインパルス応答である。
その他の処理は実施例1と同様である。
However, K (ω) is a target impulse response. The target impulse response is, for example, an impulse response in which the amplitude value is a fixed value and the phase is a linear phase (fixed delay in the time domain).
Other processes are the same as those in the first embodiment.
以上のように、メインビームフォーマ52、サブビームフォーマ50を設定すれば、任意のマイクロホン6mとスピーカ4の配置において、メインビームフォーマ52では近端話者7の方向に感度を高くして、スピーカ4に対する感度を低くして、サブビームフォーマ50ではスピーカ4に対する感度を高くして、近端話者7に対する感度を低くすることが実現し、近端話者音声の劣化を防止することが出来る。
As described above, if the main beamformer 52 and the sub-beamformer 50 are set, the sensitivity of the main beamformer 52 in the direction of the near-
この実施例の機能構成例は、実施例1で説明したエコー消去装置40に受話検出部60とスイッチ62m(m=2、...M)を加えたものである。スイッチ62mのそれぞれは第2の可変フィルタ26mのそれぞれと対応して接続されている。
The functional configuration example of this embodiment is obtained by adding the
図11に実施例3の機能構成例を示す。通信網2よりの音声信号j(t)は第1の可変フィルタ24のほかに、受話検出部60にも入力される。受話検出部60は、音声信号j(t)のレベルを観測し、受話信号x(t)のある区間を検出する。検出は例えば、予め、与えられた閾値と音声信号j(t)のレベル(パワー)とを比較し、音声信号j(t)の方が大きい場合はその区間に受話信号x(t)が含まれていると判断する。
FIG. 11 shows a functional configuration example of the third embodiment. The audio signal j (t) from the
受話信号x(t)が含まれている区間では、受話検出部60がスイッチ62mのオン接続とし、第2の可変フィルタ26mをそれぞれ、加算部36へ接続させる。また、受話信号x(t)が含まれていない区間では、受話検出部60が、スイッチ62mの接続をオフとし、第2の可変フィルタ26mをそれぞれ加算部36から切り離す。
In a section in which the reception signal x (t) is included, the
これらの処理により、近端話者7の発話があり、音声信号j(t)中に受話信号x(t)が含まれていない区間ではスイッチ62mの接続がオフになっているので、第2の可変フィルタ26よりの第2の擬似エコー信号q(t)が加算部36に出力されず、つまりサブマイクロホン6mを経由する近端話者の音声が遮断され、送話信号e(t)での近端話者音声の劣化がなくなる。
By these processes, the connection of the
また音声信号j(t)中に受話信号x(t)が含まれている区間ではスイッチ62mがオン接続になっているので、実施例2で説明したとおり、エコー信号d(t)を消去する。
Further, since the
また受話信号x(t)が含まれている区間で、かつ近端話者7が発話しているいわゆるダブルトークの区間では、スイッチ62mがオン接続となり、エコー信号d(t)を消去する。このダブルトーク区間では、近端話者7の音声の劣化が生じるが、ダブルトーク時は、近端話者7から音声信号s(t)と受話信号x(t)の両方が聴こえるため、聴覚のマスキング効果により、音声の劣化が聞こえにくくなっているので、劣化の知覚が少なくなる。
Further, in a section in which the received signal x (t) is included and a so-called double talk section in which the near-
図12に示すこの実施例4の機能構成例は、実施例2で説明したエコー消去装置40に実施例3で説明した受話検出部60を加えたものである。実施例3同様、受話信号x(ω)が受話検出部60に入力され、通信網2よりの音声信号j(ω)中に受話信号x(ω)が含まれている区間では、スイッチ62がオン接続となり、エコー信号d(ω)が消去される。また、通信網2よりの音声信号j(ω)中に受話信号x(ω)が含まれていない区間では、スイッチ62の接続がオフとなり、近端話者7の音声の劣化は生じない。
The functional configuration example of the fourth embodiment shown in FIG. 12 is obtained by adding the
以上の各実施形態の他、本発明であるエコー消去装置は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、エコー消去装置において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。 In addition to the above embodiments, the echo canceller according to the present invention is not limited to the above-described embodiments, and can be appropriately changed without departing from the spirit of the present invention. In addition, the processing described in the echo canceling device is not only executed in time series according to the order of description, but may be executed in parallel or individually as required by the processing capability of the device that executes the processing. .
また、この発明のエコー消去装置における処理をコンピュータによって実現する場合、エコー消去装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、エコー消去装置における処理機能がコンピュータ上で実現される。 Further, when the processing in the echo canceller of the present invention is realized by a computer, the processing contents of the functions that the echo canceller should have are described by a program. Then, by executing this program on a computer, the processing function in the echo canceller is realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(DigitalVersatileDisc)、DVD−RAM(RandomAccessMemory)、CD−ROM(CompactDiscReadOnlyMemory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto−Opticaldisc)等を、半導体メモリとしてEEP−ROM(ElectronicallyErasableandProgrammable−ReadOnlyMemory)等を用いることができる。 The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape or the like is used as an optical disc, and a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only Memory), a CD-R (Recordable). ) / RW (ReWritable), etc., magneto-optical recording medium, MO (Magneto-Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable Programmable-Read Only Memory), etc. can be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(ApplicationServiceProvider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。 A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, this computer reads the program stored in its own recording medium and executes the process according to the read program. As another execution form of the program, the computer may directly read the program from a portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Further, the above-described processing may be executed by a so-called ASP (Application Service Provider) type service that realizes a processing function only by an execution instruction and result acquisition without transferring a program from the server computer to the computer. Good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、エコー消去装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In this embodiment, the echo canceling apparatus is configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.
Claims (3)
上記受話信号が入力され、第1の擬似エコー信号を生成する第1の可変フィルタと、
1以上のエコー用収音手段により、受音された受話信号が入力され、第2の擬似エコー信号を生成する第2の可変フィルタと、
上記話者用収音手段での受音信号から、上記第1の擬似エコー信号及び上記第2の擬似エコー信号を減算して、上記送話信号を出力する減算部と、
少なくとも、上記受話信号と上記送話信号とが入力され、上記第1の可変フィルタのフィルタ係数を更新する第1のフィルタ係数更新部と、
少なくとも、上記エコー用収音手段での受音信号と上記送話信号とが入力され、上記第2の可変フィルタのフィルタ係数を更新する第2のフィルタ係数更新部とを備え、
上記話者用収音手段は、近端話者方向に感度が高く、且つ上記再生手段方向に感度が低くなるように配置されたマイクロホンであり、
上記エコー用収音手段は、上記近端話者方向に感度が低く、且つ上記再生手段方向に感度が高くなるように配置されたマイクロホンであることを特徴とするエコー消去装置。 The reception means converts the received signal into a reproduced sound, utters, and a signal (hereinafter referred to as a speaker received signal) in which the near-end speaker sound is received by the speaker sound collecting means and the reproduced sound are In an echo canceller that removes the echo signal from a received signal consisting of a signal received by the speaker sound pickup means (hereinafter referred to as an echo signal) and outputs the signal as a transmitted signal.
A first variable filter that receives the received signal and generates a first pseudo echo signal;
By one or more echo YoOsamu sound hand stage, received sound has been received signals are input, a second variable filter for generating a second pseudo echo signal,
A subtracting unit that subtracts the first pseudo echo signal and the second pseudo echo signal from the received sound signal at the sound collecting means for the speaker and outputs the transmission signal;
A first filter coefficient updating unit that receives at least the reception signal and the transmission signal and updates a filter coefficient of the first variable filter;
A second filter coefficient update unit that receives at least a sound reception signal from the echo sound pickup means and the transmission signal and updates a filter coefficient of the second variable filter ;
The speaker sound collection means is a microphone arranged so that sensitivity is high in the near-end speaker direction and sensitivity is low in the reproduction means direction,
The echo picked-up sound means, echo canceller according to the near-end talker direction sensitivity is low, and wherein arranged microphone der Rukoto as sensitive to the reproducing means the direction is increased.
上記話者用収音手段と上記エコー用収音手段は、当該話者用収音手段と当該エコー用収音手段とを結ぶ直線と、上記再生手段と近端話者を結ぶ直線とが直交するように配置されることを特徴とするエコー消去装置。 The echo canceller according to claim 1,
In the speaker sound collecting means and the echo sound collecting means, a straight line connecting the speaker sound collecting means and the echo sound collecting means is orthogonal to a straight line connecting the reproducing means and the near-end speaker. echo canceller that is arranged to be characterized Rukoto.
上記第1のフィルタ係数更新部および、上記第2のフィルタ係数更新部のフィルタ係数の更新は、学習同定(NLMS:NormalizedLeast−Mean−Squares)アルゴリズム、もしくは射影アルゴリズム、もしくは逐次最小二乗(RecursiveLeastSquare)アルゴリズム、もしくはLMS(LeastMeanSquare)アルゴリズムを用いて、逐次更新するものであることを特徴とするエコー消去装置。 The echo canceller according to claim 1 or 2 ,
The update of the filter coefficients of the first filter coefficient update unit and the second filter coefficient update unit is performed by a learning identification (NLMS: Normalized Last-Mean-Squares) algorithm, a projection algorithm, or a sequential least-square (RecursiveLeastSquare) algorithm. Alternatively , an echo canceller that updates sequentially using a LMS (Least Mean Square) algorithm .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011029507A JP2011160429A (en) | 2011-02-15 | 2011-02-15 | Echo elimination device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011029507A JP2011160429A (en) | 2011-02-15 | 2011-02-15 | Echo elimination device |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006232519A Division JP4709714B2 (en) | 2006-08-29 | 2006-08-29 | Echo canceling apparatus, method thereof, program thereof, and recording medium thereof |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2011160429A true JP2011160429A (en) | 2011-08-18 |
Family
ID=44591935
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011029507A Pending JP2011160429A (en) | 2011-02-15 | 2011-02-15 | Echo elimination device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2011160429A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017191987A (en) * | 2016-04-12 | 2017-10-19 | 日本電信電話株式会社 | Echo canceling apparatus, method thereof, program, and recording medium |
| KR101877022B1 (en) * | 2017-05-29 | 2018-07-10 | 에스케이 텔레콤주식회사 | Apparatus for Cancellation of Acoustic Echo and Computer Program Therefore |
| WO2019098178A1 (en) | 2017-11-14 | 2019-05-23 | 日本電信電話株式会社 | Voice communication device, voice communication method, and program |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61502581A (en) * | 1984-12-14 | 1986-11-06 | モトロ−ラ・インコ−ポレ−テッド | Full duplex speaker horn for radio and landline telephones |
| JPH04290320A (en) * | 1991-03-19 | 1992-10-14 | Fujitsu Ltd | Echo canceller |
| JP2000515345A (en) * | 1996-07-24 | 2000-11-14 | エリクソン インコーポレイテッド | Echo canceller for nonlinear circuits |
| JP2003060530A (en) * | 2001-08-13 | 2003-02-28 | Fujitsu Ltd | Echo suppression processing system |
| JP2003273782A (en) * | 2002-03-14 | 2003-09-26 | Osaka Industrial Promotion Organization | Audio processing device, computer program, and recording medium |
| US7003099B1 (en) * | 2002-11-15 | 2006-02-21 | Fortmedia, Inc. | Small array microphone for acoustic echo cancellation and noise suppression |
-
2011
- 2011-02-15 JP JP2011029507A patent/JP2011160429A/en active Pending
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61502581A (en) * | 1984-12-14 | 1986-11-06 | モトロ−ラ・インコ−ポレ−テッド | Full duplex speaker horn for radio and landline telephones |
| JPH04290320A (en) * | 1991-03-19 | 1992-10-14 | Fujitsu Ltd | Echo canceller |
| JP2000515345A (en) * | 1996-07-24 | 2000-11-14 | エリクソン インコーポレイテッド | Echo canceller for nonlinear circuits |
| JP2003060530A (en) * | 2001-08-13 | 2003-02-28 | Fujitsu Ltd | Echo suppression processing system |
| JP2003273782A (en) * | 2002-03-14 | 2003-09-26 | Osaka Industrial Promotion Organization | Audio processing device, computer program, and recording medium |
| US7003099B1 (en) * | 2002-11-15 | 2006-02-21 | Fortmedia, Inc. | Small array microphone for acoustic echo cancellation and noise suppression |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017191987A (en) * | 2016-04-12 | 2017-10-19 | 日本電信電話株式会社 | Echo canceling apparatus, method thereof, program, and recording medium |
| KR101877022B1 (en) * | 2017-05-29 | 2018-07-10 | 에스케이 텔레콤주식회사 | Apparatus for Cancellation of Acoustic Echo and Computer Program Therefore |
| WO2019098178A1 (en) | 2017-11-14 | 2019-05-23 | 日本電信電話株式会社 | Voice communication device, voice communication method, and program |
| CN111345048A (en) * | 2017-11-14 | 2020-06-26 | 日本电信电话株式会社 | Voice communication device, voice communication method, and program |
| US11232806B2 (en) | 2017-11-14 | 2022-01-25 | Nippon Telegraph And Telephone Corporation | Voice communication device, voice communication method, and program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11297178B2 (en) | Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters | |
| JP5075042B2 (en) | Echo canceling apparatus, echo canceling method, program thereof, and recording medium | |
| US8842851B2 (en) | Audio source localization system and method | |
| CN107636758B (en) | Acoustic echo cancellation system and method | |
| CN104158990B (en) | Method and audio receiving circuit for processing audio signal | |
| JP5391103B2 (en) | Multi-channel echo canceling method, multi-channel echo canceling apparatus, multi-channel echo canceling program and recording medium therefor | |
| RU2744518C1 (en) | Voice communication device, voice communication method and program | |
| CN112863532B (en) | Echo suppression device, echo suppression method and storage medium | |
| US9667803B2 (en) | Nonlinear acoustic echo cancellation based on transducer impedance | |
| JP5469564B2 (en) | Multi-channel echo cancellation method, multi-channel echo cancellation apparatus and program thereof | |
| JP5662232B2 (en) | Echo canceling apparatus, method and program | |
| JP2011160429A (en) | Echo elimination device | |
| JP4709714B2 (en) | Echo canceling apparatus, method thereof, program thereof, and recording medium thereof | |
| Mahbub et al. | A single-channel acoustic echo cancellation scheme using gradient-based adaptive filtering | |
| JP5937451B2 (en) | Echo canceling apparatus, echo canceling method and program | |
| JP3403655B2 (en) | Method and apparatus for identifying unknown system using subband adaptive filter | |
| JP6356087B2 (en) | Echo canceling apparatus, method and program | |
| JP6143702B2 (en) | Echo canceling apparatus, method and program | |
| JP2017191992A (en) | Echo suppressor, method therefor, program, and recording medium | |
| JP2017191987A (en) | Echo canceling apparatus, method thereof, program, and recording medium | |
| JP3583998B2 (en) | Multi-channel echo canceling method, apparatus therefor, and program recording medium | |
| JP5925149B2 (en) | Acoustic coupling amount estimating apparatus, echo canceling apparatus, method and program thereof | |
| JP6180689B1 (en) | Echo canceller apparatus, echo cancellation method, and echo cancellation program | |
| JP4425114B2 (en) | Echo canceling method, echo canceling apparatus, echo canceling program, and recording medium recording the same | |
| JP6075783B2 (en) | Echo canceling apparatus, echo canceling method and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110617 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120807 |
|
| A02 | Decision of refusal |
Effective date: 20121204 Free format text: JAPANESE INTERMEDIATE CODE: A02 |