JP2002528778A - Method and apparatus for determining parameters of a technical system - Google Patents
Method and apparatus for determining parameters of a technical systemInfo
- Publication number
- JP2002528778A JP2002528778A JP2000578968A JP2000578968A JP2002528778A JP 2002528778 A JP2002528778 A JP 2002528778A JP 2000578968 A JP2000578968 A JP 2000578968A JP 2000578968 A JP2000578968 A JP 2000578968A JP 2002528778 A JP2002528778 A JP 2002528778A
- Authority
- JP
- Japan
- Prior art keywords
- separation matrix
- parameters
- processor
- cumulant
- minimization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H21/00—Adaptive networks
- H03H21/0012—Digital adaptive filters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L25/00—Baseband systems
- H04L25/02—Details ; arrangements for supplying electrical power along data transmission lines
- H04L25/03—Shaping networks in transmitter or receiver, e.g. adaptive shaping networks
- H04L25/03006—Arrangements for removing intersymbol interference
- H04L25/03178—Arrangements involving sequence estimation techniques
- H04L25/03331—Arrangements for the joint estimation of multiple sequences
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Power Engineering (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Complex Calculations (AREA)
- Dc Digital Transmission (AREA)
Abstract
(57)【要約】 技術システムのパラメータをもとめるための方法が決定される。この方法によって出力信号が重畳された統計的に互いに独立した入力信号の集合からもとめられる。出力信号の統計的独立性が最大化されるようにパラメータがもとめられる。 (57) [Summary] A method for determining parameters of a technical system is determined. In this way, the output signals are determined from a superimposed set of statistically independent input signals. The parameters are determined so that the statistical independence of the output signal is maximized.
Description
【0001】 本発明は、技術システムのパラメータをもとめるための方法ならびに装置に関
する。The present invention relates to a method and a device for determining the parameters of a technical system.
【0002】 信号のマルチチャネル伝送及びマルチチャネル受信において、例えば頻繁に信
号/画像間の干渉が発生する。典型的な例はこの場合音声信号と雑音との混合で
あり、これは遠隔通信及びビデオ会議において大きな問題となりうる。従って、
本発明は例えばオリジナル音声信号を再現するための信号分離の分野に関する。In multi-channel transmission and multi-channel reception of signals, for example, signal / image interference frequently occurs. A typical example is a mixture of voice signals and noise in this case, which can be a major problem in telecommunications and video conferencing. Therefore,
The invention relates to the field of signal separation, for example to reproduce the original audio signal.
【0003】 混合信号からのソース信号の分離のための典型的な公知の技術は信号の時間平
均又はフィルタリングに基づく。しかしながら、これは計算コストの点で欠点を
生じる。[0003] Typical known techniques for separating a source signal from a mixed signal are based on time averaging or filtering of the signal. However, this has disadvantages in terms of computational costs.
【0004】 いわゆるブラインドチャネル等化(伝送チャネルに関する予めの知識なしの信
号等化)に基づく方法も公知である。しかし、この方法は、常に例えばソース信
号の統計的分布に関する知識のような、ソース信号に関する一定の知識を必要と
する。[0004] Methods based on so-called blind channel equalization (signal equalization without prior knowledge of the transmission channel) are also known. However, this method always requires certain knowledge about the source signal, for example knowledge about the statistical distribution of the source signal.
【0005】 信号分離の問題は、例えば二人の話者が彼らから離れている2つのマイクロフ
ォンによって会話し、この結果、各マイクロフォンが二人の話者の発話した信号
の混合信号を受信する場合にも生じる。従って、混合信号、すなわち重畳された
入力信号の集合を再び分離する、という問題が存在する。L. Molgedy, H. G. Sc
huster, "Separation of a Mixture of Independent Signals using Time-Delay
ed Correlations", Phys. Ref. Left. 72,3634 (1994) からこの場合次のような
方法が公知である:n個の重畳されかつ相関されたソース信号(入力信号)を分
離し、同時にソース強度の混合係数を決定する問題は、固有値問題に還元される
。この固有値問題では、同時に2つの対称的なnxn行列が対角化されなければ
ならない。行列要素は測定可能な時間遅延された相関関数である。この固有値問
題の解決はニューラルネットワークによって行われ、ニューロン間の横方向抑制
相互作用(lateral inhibiting interaction)に対する学習規則がリャプノフ関
数によって決定され、このリャプノフ関数の最小値がこの問題の(縮退した)解
を供給する。[0005] The problem of signal separation is, for example, when two speakers speak with two microphones remote from them, so that each microphone receives a mixed signal of the signals spoken by the two speakers. Also occurs. Therefore, there is a problem that the mixed signal, that is, the set of superimposed input signals is separated again. L. Molgedy, HG Sc
huster, "Separation of a Mixture of Independent Signals using Time-Delay
ed. Correlations ", Phys. Ref. Left. 72, 3634 (1994), in which case the following method is known: The n superimposed and correlated source signals (input signals) are separated and simultaneously sourced. The problem of determining the intensity mixing factor is reduced to an eigenvalue problem, in which two symmetric nxn matrices must be diagonalized at the same time, and the matrix elements have a measurable time-delayed correlation. The solution of this eigenvalue problem is performed by a neural network, the learning rule for lateral inhibiting interaction between neurons is determined by the Lyapunov function, and the minimum value of this Lyapunov function is Provide a (degenerate) solution.
【0006】 この方法は既に音響入力信号にも適用された(F. Ehlers, H.G.Schuster, "Bl
ind Separation of convolutive mixtures and an application in automatic s
peech recognition" IEEE Trans. Signal Proc. (1997) を参照)。[0006] This method has already been applied to acoustic input signals (F. Ehlers, HGSchuster, "Bl
ind Separation of convolutive mixtures and an application in automatic s
peech recognition "IEEE Trans. Signal Proc. (1997)).
【0007】 DE19531388C1から未知の信号(ブラインドチャネル)の非線形混
合に対する信号分離方法及び信号分離装置が公知であり、これを図3に図示する
。[0007] From DE 195 31 388 C1, a signal separation method and a signal separation device for the non-linear mixing of unknown signals (blind channels) are known and are shown in FIG.
【0008】 このドイツ特許は、M個の未知のソース信号X1、X2の非線形重畳からなる
混合信号の分離を処理する。場合によってはあり得る妨害信号を含むM個のソー
ス信号X1、X2のN(N≧M)個の異なる混合が信号評価装置に供給され、こ
の信号評価装置はこれらの信号の統計的分析によって非線形伝達係数(nonlinea
r transmission factor)を決定し、これらの算出された係数によってこの混合
を取り消し、この結果、信号分離装置のN個の出力ができるだけ近似的に重畳の
ないM個のソース信号を含む。これによって非線形混合信号の処理が可能となる
。この場合、非線形とは、ソース信号X1、X2が未知の非線形システムGによ
って混合されることを意味する。この未知のシステムGはいわゆるヴォルテラ(
Volterra)級数によって記述され、信号分離装置G- 1はこのヴォルテラ級数の
係数を決定する。これらの係数の知識によって混合信号の分離が可能である。さ
らに、これらの係数は信号源の位置又は速度検出のための後続の分析に利用でき
る。This German patent deals with the separation of a mixed signal consisting of a non-linear superposition of M unknown source signals X1, X2. N (N≥M) different mixtures of the M source signals X1, X2, possibly including interfering signals, are fed to a signal estimator, which is non-linear by statistical analysis of these signals. Transfer coefficient (nonlinea
r transmission factor) and cancels out this mixing by these calculated coefficients, so that the N outputs of the signal separation device contain the M source signals as close as possible without overlap. This allows processing of non-linear mixed signals. In this case, non-linear means that the source signals X1, X2 are mixed by the unknown non-linear system G. This unknown system G is a so-called Volterra (
Described by a Volterra series, the signal separation device G - 1 determines the coefficients of this Volterra series. The knowledge of these coefficients allows the separation of the mixed signal. In addition, these coefficients can be used for subsequent analysis for signal source position or velocity detection.
【0009】 この印刷物から公知の方法はこの場合実質的に2つのステップから成る: ・第1に、非線形性の選択可能なグレードによって混合の際に一意的に決定さ
れる非線形方程式がスライディング時間窓に対して解かれ、これらの解が時間に
亘って平均される。この時間平均はこの公知の技術の主な欠点である。なぜなら
、この時間平均は計算コスト及び同時に計算時間を上昇させるからである。The method known from this print consists in this case essentially of two steps: firstly, the nonlinear equation uniquely determined during mixing by the selectable grade of nonlinearity has a sliding time window And these solutions are averaged over time. This time averaging is a major drawback of this known technique. This is because this time average increases the calculation cost and at the same time the calculation time.
【0010】 第2に、推定された出力信号の十分に多数の異なるキュムラントから形成され
るポテンシャルが最小化され、このポテンシャルの計算のために必要な値は選択
可能な長さのスライディング時間窓から由来する。この場合、混合システムは非
常にゆっくりと変化し、この変化はもとめられる混合係数の計算の際に無視でき
ると仮定する。このドイツ特許によれば、上記第2のステップの実施のためにコ
スト関数が構成され、最小化される。大域的な最小値に達する場合に、この場合
には伝達係数の最適値が見出された。Second, the potential formed from a sufficiently large number of different cumulants of the estimated output signal is minimized, and the value required for the calculation of this potential is determined from a sliding time window of selectable length. Comes from. In this case, it is assumed that the mixing system changes very slowly and this change is negligible in the calculation of the required mixing coefficients. According to this German patent, a cost function is constructed and minimized for performing the second step. When a global minimum is reached, in this case an optimum value of the transfer coefficient has been found.
【0011】 時間コストならびに計算コストの点で、DE19531388C1に記述され
た方法は、第1の上記の方法ステップの最後に時間平均を実施するために不利で
ある。In terms of time costs as well as computational costs, the method described in DE 195 31 388 C1 is disadvantageous for performing a time averaging at the end of the first above-mentioned method step.
【0012】 従って、本発明の課題は、重畳された統計的に互いに独立した音響信号をきわ
めて低い計算コストで分離することができる方法及び装置を提供することである
。It is therefore an object of the present invention to provide a method and a device which enable the superimposed, statistically independent acoustic signals to be separated at a very low computational cost.
【0013】 上記課題は、独立請求項に記載の構成を有する方法ならびに装置によって解決
される。[0013] The object is achieved by a method and a device having the features of the independent claims.
【0014】 技術システムのパラメータをもとめるための方法において、この方法によって
、出力信号が重畳された統計的に互いに独立した入力信号の集合からもとめられ
、出力信号の統計的独立性が最大化されるようにパラメータがもとめられる。In a method for determining the parameters of a technical system, the method determines the output signal from a superimposed statistically independent set of input signals and maximizes the statistical independence of the output signal. Parameters are determined as follows.
【0015】 技術システムのパラメータをもとめるための装置において、この装置によって
、重畳された統計的に互いに独立した入力信号の集合から出力信号をもとめ、こ
の装置はプロセッサを有し、このプロセッサは、出力信号の統計的独立性が最大
化されるようにパラメータをもとめるように構成されている。In an apparatus for determining parameters of a technical system, the apparatus determines an output signal from a superimposed set of statistically independent input signals, the apparatus comprising a processor, the processor comprising an output It is configured to determine parameters such that the statistical independence of the signal is maximized.
【0016】 本発明の有利な実施形態は従属請求項から得られる。[0016] Advantageous embodiments of the invention result from the dependent claims.
【0017】 パラメータは有利には反復法においてもとめられる。The parameters are advantageously determined in an iterative manner.
【0018】 他の実施形態では、パラメータは分離行列の要素であり、この分離行列によっ
て重畳された入力信号の集合が乗算されるか又は畳み込まれ、これにより出力信
号が形成される。In another embodiment, the parameters are elements of a separation matrix, which is multiplied or convolved with the set of superimposed input signals, thereby forming an output signal.
【0019】 分離行列のパラメータの最適化は、有利には次のステップによって得られる:
すなわち、 分離行列の固有値をもとめるために時間遅延された逆相関計算(time-delayed
decorrelation calculation)を繰り返し、 分離行列の固有値をもとめ、これらの固有値に対して相互相関が最小値をとり
、 キュムラント最小化を実施し、このキュムラント最小化に対するスタート値と
して前のステップでもとめられた固有値が使用される。The optimization of the parameters of the separation matrix is advantageously obtained by the following steps:
In other words, a time-delayed inverse correlation calculation (time-delayed
repeat the decorrelation calculation), find the eigenvalues of the separation matrix, take the minimum cross-correlation for these eigenvalues, implement cumulant minimization, and use the eigenvalues found in the previous step as the start value for this cumulant minimization Is used.
【0020】 キュムラント最小化は、例えばニューラルネットワークのトレーニングによっ
て行われるが、例えば最急降下法又はモンテカルロ・シミュレーションのような
他のあらゆる最小化技術によって行われる。[0020] Cumulant minimization is performed, for example, by training a neural network, but by any other minimization technique, such as, for example, steepest descent or Monte Carlo simulation.
【0021】 1つの実施形態では、分離行列のパラメータの最適化において分離行列の少な
くとも1つの対角線パラメータが予め設定された値にセットされ、これによって
大域的な最小値へのこの最小化プロセスの安定性が保証される。In one embodiment, in optimizing the parameters of the separation matrix, at least one diagonal parameter of the separation matrix is set to a preset value, thereby stabilizing the minimization process to a global minimum. Is guaranteed.
【0022】 分離行列は、有利には有限インパルス応答に限定される。すなわち、分離行列
の個々の要素を形成するためにはFIRフィルタ(Finite Impulse Response)
が使用される。このFIRフィルタは因果的FIRフィルタか又は非因果的FI
Rフィルタである。The separation matrix is advantageously limited to a finite impulse response. That is, an FIR filter (Finite Impulse Response) is used to form the individual elements of the separation matrix.
Is used. The FIR filter can be a causal FIR filter or an acausal FIR filter.
An R filter.
【0023】 さらに、分離行列はキュムラント最小化の間に有利には単位円への射影によっ
て安定化される。Furthermore, the separation matrix is stabilized during cumulant minimization, advantageously by projection onto the unit circle.
【0024】 これらの実施形態は方法にも装置にも当てはまる。装置においてはそれぞれ相
応の方法ステップを実施可能であるか又は実施するようにプロセッサが構成され
ている。These embodiments apply to the method and the device. In the device, a processor is respectively operable or configured to perform the corresponding method steps.
【0025】 本発明ならびに本発明の実施形態は、有利には重畳された統計的に互いに独立
な入力信号、とりわけ音響入力信号の分離のために使用される。The invention as well as embodiments of the invention are advantageously used for the separation of superimposed, statistically independent input signals, in particular acoustic input signals.
【0026】 本発明の方法ならびに装置は任意の個数の入力信号に対して適用可能である。The method and apparatus of the present invention are applicable to any number of input signals.
【0027】 本発明の更に別の利点、構成及び特性を次に実施例に基づいて図面の任意の図
を参照しつつ詳しく説明する。Further advantages, configurations and characteristics of the present invention will now be described in detail based on embodiments with reference to any of the drawings.
【0028】 図1は本発明の実施例による重畳された統計的に互いに独立した音響信号の分
離のためのシステムの適用事例を示す。FIG. 1 shows an application example of a system for separating superimposed statistically independent sound signals according to an embodiment of the present invention.
【0029】 図2は図1のシステムのシンボリックな概略図を示す。FIG. 2 shows a symbolic schematic of the system of FIG.
【0030】 図3は未知の信号の非線形混合に対する従来技術(DE19531388C1
)から公知の信号分離装置を示す。FIG. 3 shows a prior art (DE19531388C1) for nonlinear mixing of unknown signals.
) Shows a known signal separation device.
【0031】 オリジナル音声信号を再現するために、信号の混合から、以降では入力信号と
呼ぶソース信号(オリジナル音声信号及び雑音)間の統計的独立性を利用し、信
号の混合を発生させたダイナミックシステムの逆プロセスが実質的に近似的にト
レーニング(学習)される。音声信号乃至は雑音信号の2つの異なる混合は、例
えば2つのマイクロフォン1、2(図1参照)によって得られる。これらの2つ
のマイクロフォン1、2は互いに間隔をおいて配置されている及び/又は正反対
の方向に配向されている。本発明の方法では、学習フェーズを開始するために、
すなわち学習フェーズに対するスタート値をもとめて設定するために、いわゆる
時間遅延逆相関(TDD、time-delayed decorrelation)が使用される。これに
よって後ほど記述するキュムラント(cumulant)最小化のための計算コストが低
減され、局所的な最小値の危険性が減少される。In order to reproduce the original audio signal, from the signal mixture, a dynamic in which the signal mixture is generated by utilizing the statistical independence between the source signals (the original audio signal and noise), hereinafter referred to as an input signal, is used. The inverse process of the system is substantially trained. Two different mixtures of audio or noise signals are obtained, for example, by two microphones 1, 2 (see FIG. 1). These two microphones 1, 2 are spaced from each other and / or oriented in diametrically opposite directions. In the method of the present invention, to start the learning phase,
That is, a so-called time-delayed decorrelation (TDD) is used to obtain and set the start value for the learning phase. This reduces the computational cost for cumulant minimization, described later, and reduces the risk of local minima.
【0032】 図1は2つのマイクロフォン1、2を示し、これらの2つのマイクロフォン1
、2は第1の入力信号Z1(t)及び第2の入力信号Z2(t)を受信する。こ
れらの入力信号Z1(t)及びZ2(t)は互いにそれぞれ雑音をミックスされ
る。これは混合行列S(参照符号3)によって図1においてシンボリックに図示
されている。受信乃至は伝送の後で、重畳された統計的に互いに独立した入力信
号Z1(t)及びZ2(t)の集合X1(t)及びX2(t)が得られる。これ
らの信号は計算ユニット4に入力され、この計算ユニット4において実質的に2
つのステップが実施される。これら2つのステップはシンボリックに第1のステ
ップのための計算ユニットB(参照符号6)ならびに第2のステップのためのニ
ューラルネットワーク5によって図示されている。FIG. 1 shows two microphones 1, 2 and these two microphones 1
, 2 receive a first input signal Z1 (t) and a second input signal Z2 (t). These input signals Z1 (t) and Z2 (t) are each mixed with noise. This is symbolically illustrated in FIG. 1 by the mixing matrix S (reference 3). After reception or transmission, a set X1 (t) and X2 (t) of superimposed statistically independent input signals Z1 (t) and Z2 (t) is obtained. These signals are input to a calculation unit 4 where substantially two
Two steps are performed. These two steps are symbolically illustrated by a calculation unit B (reference numeral 6) for the first step and a neural network 5 for the second step.
【0033】 計算ユニット4によって2つの出力信号Y1(t)乃至はY2(t)がもとめ
られる。これらの2つの出力信号Y1(t)乃至はY2(t)は計算ユニット4
におけるパラメータの最適な調整によって近似的に入力信号Z1(t)乃至はZ
2(t)に等しい。言い換えれば、計算ユニット4で使用される行列のパラメー
タの最適な調整においてこの計算ユニット4によって実質的に行列S(参照符号
3)によりシンボリックに示されるダイナミックな混合プロセスの逆プロセスが
行われる。この実施例は分離行列のパラメータの調整の最適化プロセスに関する
。The calculation unit 4 determines two output signals Y 1 (t) to Y 2 (t). These two output signals Y1 (t) or Y2 (t) are calculated by the calculation unit 4
Input signals Z1 (t) through Z
2 (t). In other words, in the optimal adjustment of the parameters of the matrix used in the calculation unit 4, the calculation unit 4 performs the inverse process of the dynamic mixing process, which is substantially symbolically indicated by the matrix S (reference numeral 3). This embodiment relates to an optimization process for adjusting the parameters of the separation matrix.
【0034】 計算ユニット4における行列のパラメータは、計算ユニット4における行列プ
ロセスによって得られる出力信号Y1(t)、Y2(t)の間の統計的独立性を
最大化することによって最適化される。この目的のために、出力信号Y1(t)
乃至はY2(t)は計算ユニット4にフィードバックされる(フィードバックル
ープ7乃至は8参照)。反復法によって、出力信号Y1(t)乃至はY2(t)
の統計的独立性がこの反復の前のステップに比べて高まった(従って、この反復
は、後で記述されるコスト関数の大域的な最小値の方向において「適正な」方向
をとる)か否かがもとめられる。The parameters of the matrix in the calculation unit 4 are optimized by maximizing the statistical independence between the output signals Y 1 (t), Y 2 (t) obtained by the matrix process in the calculation unit 4. For this purpose, the output signal Y1 (t)
Alternatively, Y2 (t) is fed back to the calculation unit 4 (see feedback loops 7 and 8). By an iterative method, the output signals Y1 (t) or Y2 (t)
Has increased statistical independence compared to the previous step of this iteration (and thus this iteration takes the "right" direction in the direction of the global minimum of the cost function described later) I can ask for it.
【0035】 図2は図1のスキームの数学的な図示を示し、混合プロセス3は行列S(q)
によって数学的に記述され、計算ユニット4によって行われるべき分離プロセス
が分離行列M(q)によって示されている。FIG. 2 shows a mathematical illustration of the scheme of FIG. 1, where the mixing process 3 comprises a matrix S (q)
And the separation process to be performed by the calculation unit 4 is indicated by the separation matrix M (q).
【0036】 従って、図2には2次元においていわゆるマルチチャネルブラインドソース(
アプリオリな知識なしのマルチチャネルソース)の分離の問題が図示されている
。この場合、混合システムS(q)、ただしqは単位遅延、は安定しており、同
時に安定した反転(inversion)を有すると、すなわちこのシステムが最小フェ
ーズシステム(minimal phase system)であると仮定する。さらに、入力信号Z
1(t)及びZ2(t)(例えば音声乃至は雑音信号)は統計的に互いに独立し
ており、ガウス分布しないと仮定する。重畳された入力信号Z1(t)乃至はZ
2(t)の集合X1(t)及びX2(t)は、分離行列M(q)を有する分離シ
ステムへの入力信号であり、この分離行列M(q)のパラメータ(行列要素)は
出力信号Y1(t)とY2(t)との間の統計的独立性の最大化を目指してトレ
ーニングされる。「トレーニング」とはこの場合例えばニューラルネットワーク
の良く知られた学習プロセスとして公知であり、このニューラルネットワークは
統計的独立性を最大化する技術の例として挙げられる。これは後で記述されるコ
スト関数J(M)の最小化によって行われる。Accordingly, FIG. 2 shows a so-called multi-channel blind source in two dimensions (
The problem of separation of multi-channel sources without a priori knowledge is illustrated. In this case, it is assumed that the mixing system S (q), where q is a unit delay, is stable and at the same time has a stable inversion, ie this system is a minimal phase system. . Further, the input signal Z
Assume that 1 (t) and Z2 (t) (eg, speech or noise signals) are statistically independent of each other and do not have a Gaussian distribution. The superimposed input signals Z1 (t) to Z1
The sets X1 (t) and X2 (t) of 2 (t) are input signals to a separation system having a separation matrix M (q), and the parameters (matrix elements) of the separation matrix M (q) are output signals. Trained to maximize statistical independence between Y1 (t) and Y2 (t). "Training" is in this case known, for example, as the well-known learning process of neural networks, which is mentioned as an example of a technique for maximizing statistical independence. This is done by minimizing a cost function J (M) described later.
【0037】 キュムラント・コスト関数が形成される。このキュムラント・コスト関数はキ
ュムラントオーダ2〜4の対角線キュムラント要素を最小化する:A cumulant cost function is formed. This cumulant cost function minimizes the diagonal cumulant elements of cumulant order 2-4:
【0038】[0038]
【数1】 (Equation 1)
【0039】 この場合、混合行列S(q)によるダイナミックな混合の次の観点が考慮される
: 分離システムの安定性: これは、M(q)が有限インパルス応答(FIRフィルタ)に限定される場合
に達成される。このFIRシステムM(q)の安定性はさらに学習フェーズの間
に単位円への射影が行われることによっても得られる。もしかすると存在しうる
S(q)の反転の非因果性は、入力信号X(t)の適当な時間シフト(遅延)に
よって補償されうる。In this case, the following aspects of the dynamic mixing with the mixing matrix S (q) are considered: Stability of the separation system: M (q) is limited to a finite impulse response (FIR filter) If achieved. The stability of the FIR system M (q) is also obtained by projecting onto the unit circle during the learning phase. The acausality of the inversion of S (q) that may be present can be compensated by a suitable time shift (delay) of the input signal X (t).
【0040】 分離された信号Y(t)の一意性: 定常的な混合の場合には、オリジナルソース信号はスケーリングによって再現
される。ダイナミックな分離の場合には、分離された信号Y(t)の非一意性の
危険性がいやがうえにも大きくなる。Y1(t)及びY2(t)が統計的に互い
に独立している場合には、これらの信号のいかなる線形フィルタリングされた修
正でも常に統計的に独立していることは明らかである。従って、この問題の内在
的な非一意性を低減するために付加的な情報が必要不可欠である。Uniqueness of the separated signal Y (t): In the case of stationary mixing, the original source signal is reproduced by scaling. In the case of dynamic separation, the risk of non-uniqueness of the separated signal Y (t) is even greater. If Y1 (t) and Y2 (t) are statistically independent of each other, it is clear that any linearly filtered modification of these signals is always statistically independent. Therefore, additional information is essential to reduce the inherent non-uniqueness of this problem.
【0041】 データのガウシアン変形: 定常的なブラインドソース分離に対するキュムラントベースのアルゴリズムは
、有効なやり方で、出力信号Y(t)に相応して比較的高いオーダの対角線キュ
ムラントを最小化乃至は除去する。他方で、線形フィルタリングはデータのガウ
ス分布変形を引き起こし、このガウス分布変形において比較的高いオーダのキュ
ムラントは方向0に向かう。従って、これは、コスト関数が局所的最小値に到達
する境界解(Randloesung)に導き、所望の実際の分離(大域的最小値)が行わ
れない。この望ましくないケースを回避するために、分離伝達関数(分離行列)
M(q)の構造が幾つかの限定を受けるようにする。上記の問題を避けるために
は、対角線要素のうちの少なくとも1つ(又は全て)が単位値にセットされるア
プローチを選択する: M11(q)=1 及び M22(q)=1 この仮定は、混合要素S11(q)及び/又はS22(q)が同様に単位値“
1”を有する場合に正確である。その他の場合には、S11(q)及び/又はS
22(q)が安定的な反転を有すると仮定する。このことはM(q)の対角線要
素が単位値にスケーリングされることを可能にする。このアプローチは解の非一
意性を本質的に減少させ、さらに有効なやり方で出力信号の過度なガウス分布変
形の危険性を回避する。たとえ一見したところ上記のようなM(q)の対角線要
素の限定が非常に制限的に作用しても、この仮定は実際のアプリケーションにお
いては通常は満たされる。典型的な例は、2つのマイクロフォンによるレコーデ
ィングに基づく音声信号からの雑音除去であり、この場合これらのマイクロフォ
ンが互いに空間的に分離されているか又は1つのマイクロフォンが話者の方向に
向けられており、他方でもう1つのマイクロフォンが逆方向に向けられており、
そのため話者とは反対方向の第2の信号が実質的にノイズ信号だけを含む。Gaussian Transformation of Data: A cumulant-based algorithm for stationary blind source separation effectively minimizes or eliminates diagonal cumulants of relatively high order corresponding to the output signal Y (t). . On the other hand, linear filtering causes a Gaussian deformation of the data, in which the higher order cumulants go in direction 0. Thus, this leads to a boundary solution (Randloesung) where the cost function reaches a local minimum and the desired actual separation (global minimum) is not performed. To avoid this undesirable case, the separation transfer function (separation matrix)
The structure of M (q) is subject to some limitations. To avoid the above problem, choose an approach where at least one (or all) of the diagonal elements is set to unit value: M11 (q) = 1 and M22 (q) = 1 Similarly, if the mixing element S11 (q) and / or S22 (q)
1 "is true. Otherwise, S11 (q) and / or S11 (q)
Assume that 22 (q) has a stable inversion. This allows the diagonal elements of M (q) to be scaled to unit values. This approach essentially reduces the non-uniqueness of the solution and avoids the risk of excessive Gaussian deformation of the output signal in a more efficient manner. Even though at first glance the diagonal element limitation of M (q) as described above works very restrictively, this assumption is usually satisfied in practical applications. A typical example is denoising from a speech signal based on recording with two microphones, where these microphones are spatially separated from each other or one microphone is oriented towards the speaker. , While the other microphone is pointed in the opposite direction,
Thus, the second signal in the opposite direction to the speaker contains substantially only the noise signal.
【0042】 キュムラントアプローチは、冒頭に挙げた論文 F. Ehlers, H.G.Schuster, "B
lind Separation of convolutive mixtures and an application in automatic
speech recognition" IEEE Trans. Signal Proc. (1997) で行われているような
対角線キュムラントの直接算出に基づく。しかし、これは内在的に数値解法が非
常に面倒であるという欠点を有する。従って、この最小化法の適当な初期設定を
使用する。最小化法のためのスタート値をもとめるために、本発明では時間遅延
逆相関(TDD)の技術が2つの異なる時間遅延の同時的な逆相関に適用される
。このTDD技術は適当な行列固有値問題に還元される。既に述べたように、こ
のTDD技術は本発明において対角線(相互相関)キュムラント最小化問題の開
始のために使用される。[0042] The cumulant approach is described in the paper F. Ehlers, HGSchuster, "B
lind Separation of convolutive mixtures and an application in automatic
speech recognition "based on the direct calculation of diagonal cumulants as done in IEEE Trans. Signal Proc. (1997). However, this has the disadvantage that the numerical solution is inherently very cumbersome. In order to determine a starting value for the minimization method, the technique of time-delay inverse correlation (TDD) uses the technique of time-delay inverse correlation (TDD) for the simultaneous inverse correlation of two different time delays. The TDD technique is reduced to a suitable matrix eigenvalue problem, which, as already mentioned, is used in the present invention to start the diagonal (cross-correlation) cumulant minimization problem.
【0043】 要約すると、この方法は次の2つのステップに分けられる: 1. 異なる遅延ペアに対する周波数領域における固有値問題に基づくTDD法
の繰り返し及び相互相関項が最小値を有する解の算出。In summary, the method can be divided into two steps: 1. Iteration of the TDD method based on eigenvalue problems in the frequency domain for different delay pairs and calculation of the solution whose cross-correlation term has a minimum.
【0044】 2. 上記のステップにおいて算出されたスタート値(FIRパラメータ)に基
づく対角線キュムラント最小化の開始(スタート)。2. Start of diagonal cumulant minimization (start) based on the start value (FIR parameter) calculated in the above steps.
【0045】 次にさらに幾つかの主特徴及び利点をもう一度まとめておく。Next, some more main features and advantages are summarized again.
【0046】 統計的独立性が要求されることを除いて信号特性のアプリオリな知識は必要な
い。No a priori knowledge of signal characteristics is required except that statistical independence is required.
【0047】 ダイナミックな分離システムの安定性はFIRフィルタとしてこのダイナミッ
クな分離システムのコンポーネントを調整することによって保証される。The stability of the dynamic separation system is ensured by adjusting the components of this dynamic separation system as FIR filters.
【0048】 過度なガウス分布変形は次のアプローチによって回避される。すなわち、混合
伝達関数行列(分離行列)の要素のうちの少なくとも1つが単位値にセットされ
るか乃至は単位値にスケーリングされ得る、というアプローチによって回避され
る。Excessive Gaussian deformation is avoided by the following approach. That is, this is avoided by the approach that at least one of the elements of the mixed transfer function matrix (separation matrix) can be set to unit values or scaled to unit values.
【0049】 キュムラント最小化ステップ(ステップ2)は大きな計算コストを必要とする
ので、例えばニューラルネットワークの学習アルゴリズムはTDD法によって初
期設定される。Since the cumulant minimization step (step 2) requires a large calculation cost, for example, the learning algorithm of the neural network is initialized by the TDD method.
【0050】 以下に上述の実施例をコンピュータで実現するためのMatlab,Vers
ion4又はVersionのプログラムを提出する:Matlab, Vers for implementing the above-described embodiment by a computer will be described below.
Submit the ion4 or Version program:
【0051】[0051]
【外1】 [Outside 1]
【0052】[0052]
【外2】 [Outside 2]
【図1】 本発明の実施例による重畳された統計的に互いに独立した音響信号の分離のた
めのシステムの適用事例を示す。FIG. 1 shows an application example of a system for separating superimposed statistically independent sound signals according to an embodiment of the present invention.
【図2】 図1のシステムのシンボリックな概略図を示す。FIG. 2 shows a symbolic schematic of the system of FIG.
【図3】 未知の信号の非線形混合に対する従来技術(DE19531388C1)から
公知の信号分離装置を示す。FIG. 3 shows a signal separation device known from the prior art (DE19531388C1) for nonlinear mixing of unknown signals.
【符号の説明】 1 マイクロフォン 2 マイクロフォン 3 混合行列 4 計算ユニット 5 ニューラルネットワーク 6 計算ユニット 7及び8 フィードバックループ[Description of Signs] 1 microphone 2 microphone 3 mixing matrix 4 calculation unit 5 neural network 6 calculation unit 7 and 8 feedback loop
【手続補正書】特許協力条約第34条補正の翻訳文提出書[Procedural Amendment] Submission of translation of Article 34 Amendment of the Patent Cooperation Treaty
【提出日】平成12年12月22日(2000.12.22)[Submission Date] December 22, 2000 (2000.12.22)
【手続補正1】[Procedure amendment 1]
【補正対象書類名】明細書[Document name to be amended] Statement
【補正対象項目名】特許請求の範囲[Correction target item name] Claims
【補正方法】変更[Correction method] Change
【補正内容】[Correction contents]
【特許請求の範囲】[Claims]
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/16 G10L 9/00 F 21/02 301A H04L 25/03 3/00 539 ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) G10L 15/16 G10L 9/00 F 21/02 301A H04L 25/03 3/00 539
Claims (20)
該方法によって出力信号が重畳された統計的に互いに独立した入力信号の集合か
らもとめられ、前記方法において前記出力信号の統計的独立性が最大化されるよ
うにパラメータがもとめられる、技術システムのパラメータをもとめるための方
法。1. A method for determining a parameter of a technical system, comprising:
A parameter of a technical system, wherein the parameter is determined from a set of statistically independent input signals on which the output signal is superimposed by the method, and wherein the method is such that the statistical independence of the output signal is maximized. Way to find out.
方法。2. The method of claim 1, wherein the parameters are determined in an iterative manner.
畳された入力信号の集合が乗算され、これにより出力信号が形成される、請求項
1又は2記載の方法。3. The method of claim 1, wherein the parameters are elements of a separation matrix, and the set of input signals superimposed by the separation matrix is multiplied to form an output signal.
れる、すなわち、 前記分離行列の固有値をもとめるために時間遅延された逆相関計算(decが使
用され、 前記分離行列の固有値をもとめ、該固有値に対して相互相関が最小値をとり、 キュムラント最小化(5)を実施し、該キュムラント最小化に対するスタート
値として前のステップでもとめられた固有値が使用される、請求項3記載の方法
。4. The optimization of the parameters of the separation matrix is obtained by the following steps: a time-delayed inverse correlation calculation (dec is used to determine the eigenvalues of the separation matrix; 4. The method according to claim 3, wherein the cross-correlation takes the minimum value for the eigenvalue, performs cumulant minimization (5), and uses the eigenvalue determined in the previous step as a start value for the cumulant minimization. the method of.
ーニングによって行われる、請求項4記載の方法。5. The method according to claim 4, wherein the cumulant minimization is performed by training a neural network.
くとも1つの対角線パラメータが予め設定された値にセットされる、請求項3〜
5のうちの1項記載の方法。6. The method of claim 3, wherein at least one diagonal parameter of the separation matrix is set to a preset value in the optimization of the parameters of the separation matrix.
6. The method according to one of the five aspects.
のうちの1項記載の方法。7. The separation matrix according to claim 3, wherein the separation matrix is limited to a finite impulse response.
The method of claim 1.
によって安定化される、請求項3〜7のうちの1項記載の方法。8. The method according to claim 3, wherein the separation matrix is stabilized during cumulant minimization by projection onto a unit circle.
に使用される、請求項1〜8のうちの1項記載の方法。9. The method according to claim 1, which is used for separating superimposed, statistically independent input signals.
るために使用される、請求項1〜8のうちの1項記載の方法。10. The method according to claim 1, which is used for separating superimposed, statistically independent audio input signals.
、 該装置によって重畳された統計的に互いに独立した入力信号の集合から出力信
号をもとめ、 前記装置はプロセッサを有し、該プロセッサは、出力信号の統計的独立性が最
大化されるように前記パラメータをもとめるように構成されている、技術システ
ムのパラメータをもとめるための装置。11. An apparatus for determining parameters of a technical system, comprising: determining an output signal from a set of statistically independent input signals superimposed by the apparatus; the apparatus comprising a processor, the processor comprising: An apparatus for determining a parameter of a technical system, wherein the apparatus is configured to determine the parameter such that statistical independence of an output signal is maximized.
に構成されている、請求項11記載の装置。12. The apparatus of claim 11, wherein the processor is configured to determine the parameters in an iterative manner.
の集合が乗算され、これにより出力信号が形成される、請求項11又は12記載
の装置。13. The processor is configured as follows: the parameters are elements of a separation matrix, and the set of superimposed input signals is multiplied by the separation matrix, thereby forming an output signal. An apparatus according to claim 11 or claim 12.
ayed decorrelation calculation)(6)を繰り返し、 前記分離行列の前記固有値をもとめ、該固有値に対して相互相関が最小値をと
り、 キュムラント最小化(5)を実施し、該キュムラント最小化に対するスタート
値として前のステップでもとめられた固有値が使用される、請求項13記載の装
置。14. The processor is constructed as follows: the optimization of the parameters of the separation matrix is obtained by the following steps: the inverse correlation time-delayed to determine the eigenvalues of said separation matrix. Calculation (time-del
ayed decorrelation calculation) (6) is repeated, the eigenvalue of the separation matrix is obtained, the cross-correlation takes the minimum value for the eigenvalue, cumulant minimization (5) is performed, and the start value for the cumulant minimization is obtained. 14. The apparatus according to claim 13, wherein eigenvalues determined in a previous step are used.
行われる、請求項14記載の装置。15. Apparatus according to claim 14, wherein the processor is configured as follows: cumulant minimization is performed by training a neural network (5).
線パラメータが予め設定された値にセットされる、請求項13〜15のうちの1
項記載の装置。16. The processor is configured as follows: at least one diagonal parameter of the separation matrix is set to a preset value in optimizing the parameters of the separation matrix. 1 out of 15
Item.
記載の装置。17. The apparatus according to claim 13, wherein the processor is configured as follows: the separation matrix is limited to a finite impulse response.
れる、請求項13〜17のうちの1項記載の装置。18. The processor according to claim 13, wherein the processor is configured as follows: the separation matrix is stabilized by projection onto the unit circle during cumulant minimization (5). Item.
めに使用される、請求項11〜18のうちの1項記載の装置。19. The apparatus according to claim 11, which is used for separating superimposed statistically independent input signals.
るために使用される、請求項11〜18のうちの1項記載の装置。20. Apparatus according to claim 11, which is used for separating superimposed, statistically independent audio input signals.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19849549.8 | 1998-10-27 | ||
| DE19849549 | 1998-10-27 | ||
| PCT/DE1999/003304 WO2000025489A1 (en) | 1998-10-27 | 1999-10-14 | Signal separation method and device for non-linear mixing of unknown signals |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2002528778A true JP2002528778A (en) | 2002-09-03 |
Family
ID=7885829
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000578968A Withdrawn JP2002528778A (en) | 1998-10-27 | 1999-10-14 | Method and apparatus for determining parameters of a technical system |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP1125405A1 (en) |
| JP (1) | JP2002528778A (en) |
| WO (1) | WO2000025489A1 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6944579B2 (en) | 2000-11-01 | 2005-09-13 | International Business Machines Corporation | Signal separation method, signal processing apparatus, image processing apparatus, medical image processing apparatus and storage medium for restoring multidimensional signals from observed data in which multiple signals are mixed |
| JP2008072212A (en) * | 2006-09-12 | 2008-03-27 | Toshiba Corp | Mixed signal separation and extraction device |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB0204548D0 (en) | 2002-02-27 | 2002-04-10 | Qinetiq Ltd | Blind signal separation |
| DE102007033877B3 (en) | 2007-07-20 | 2009-02-05 | Siemens Audiologische Technik Gmbh | Method for signal processing in a hearing aid |
| US10264405B1 (en) * | 2017-12-06 | 2019-04-16 | Cognitive Systems Corp. | Motion detection in mesh networks |
| CN112034006B (en) * | 2020-09-09 | 2024-03-12 | 中国葛洲坝集团易普力股份有限公司 | Design method of blasting delay parameters for precise delay control based on multi-objective control |
| CN113591537B (en) * | 2021-05-19 | 2024-03-22 | 西安电子科技大学 | Double-iteration non-orthogonal joint block diagonalization convolution blind source separation method |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5282154A (en) * | 1992-06-01 | 1994-01-25 | Thomson Consumer Electronics, Inc. | System for determining and repairing instability in an IIR filter suitable for use in deghosting apparatus |
| DE19531388C1 (en) * | 1995-08-26 | 1996-07-25 | Heinz Georg Prof Dr Schuster | Blind signal source separation system |
-
1999
- 1999-10-14 WO PCT/DE1999/003304 patent/WO2000025489A1/en not_active Ceased
- 1999-10-14 EP EP99957902A patent/EP1125405A1/en not_active Withdrawn
- 1999-10-14 JP JP2000578968A patent/JP2002528778A/en not_active Withdrawn
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6944579B2 (en) | 2000-11-01 | 2005-09-13 | International Business Machines Corporation | Signal separation method, signal processing apparatus, image processing apparatus, medical image processing apparatus and storage medium for restoring multidimensional signals from observed data in which multiple signals are mixed |
| JP2008072212A (en) * | 2006-09-12 | 2008-03-27 | Toshiba Corp | Mixed signal separation and extraction device |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2000025489A1 (en) | 2000-05-04 |
| EP1125405A1 (en) | 2001-08-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Schobben et al. | A frequency domain blind signal separation method based on decorrelation | |
| Lee et al. | Blind source separation of real world signals | |
| US5383164A (en) | Adaptive system for broadband multisignal discrimination in a channel with reverberation | |
| AU705518B2 (en) | Methods and apparatus for blind separation of delayed and filtered sources | |
| WO2006111369A1 (en) | A method and device for removing echo in an audio signal | |
| KR20010072937A (en) | Acoustic echo and noise cancellation | |
| WO2006111370A1 (en) | A method and device for removing echo in a multi-channel audio signal | |
| CN1351795A (en) | Acoustic echo cancellation | |
| JP2004349806A (en) | Multi-channel acoustic echo canceling method, its apparatus, its program and its recording medium | |
| Mukai et al. | Blind source separation for moving speech signals using blockwise ICA and residual crosstalk subtraction | |
| KR20060015389A (en) | Post-processing device and method for removing cross-channel interference and multi-channel sound source separation device and method using the same | |
| WO2007124117A1 (en) | Methods and systems for reducing acoustic echoes in communication systems | |
| JP2002528778A (en) | Method and apparatus for determining parameters of a technical system | |
| JP4897921B2 (en) | Method and system for reducing acoustic echo in a multi-channel audio communication system | |
| CN108962276B (en) | Voice separation method and device | |
| Rombouts et al. | Generalized sidelobe canceller based combined acoustic feedback-and noise cancellation | |
| JP7348812B2 (en) | Noise suppression device, noise suppression method, and voice input device | |
| CN108766455B (en) | Method and device for denoising mixed signal | |
| Ukai et al. | Multistage SIMO-model-based blind source separation combining frequency-domain ICA and time-domain ICA | |
| Rotili et al. | A robust iterative inverse filtering approach for speech dereverberation in presence of disturbances | |
| CN108074580B (en) | Method and device for removing noise | |
| Fuster et al. | Adaptive filtered-x algorithms for room equalization based on block-based combination schemes | |
| Masuyama et al. | Causal and relaxed-distortionless response beamforming for online target source extraction | |
| Schobben | Efficient adaptive multi-channel concepts in acoustics: Blind signal separation and echo cancellation | |
| Masuyama et al. | Causal distortionless response beamforming by alternating direction method of multipliers |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070109 |