[go: up one dir, main page]

TWI388190B - 用於回聲抑制的濾波器係數的計算設備和方法 - Google Patents

用於回聲抑制的濾波器係數的計算設備和方法 Download PDF

Info

Publication number
TWI388190B
TWI388190B TW098102978A TW98102978A TWI388190B TW I388190 B TWI388190 B TW I388190B TW 098102978 A TW098102978 A TW 098102978A TW 98102978 A TW98102978 A TW 98102978A TW I388190 B TWI388190 B TW I388190B
Authority
TW
Taiwan
Prior art keywords
signal
filter
echo
speaker
static
Prior art date
Application number
TW098102978A
Other languages
English (en)
Other versions
TW200948030A (en
Inventor
Fabian Kuech
Markus Kallinger
Christof Faller
Alexis Favrot
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW200948030A publication Critical patent/TW200948030A/zh
Application granted granted Critical
Publication of TWI388190B publication Critical patent/TWI388190B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
    • H04B3/237Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers using two adaptive filters, e.g. for near end and for end echo cancelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Description

用於回聲抑制的濾波器係數的計算設備和方法
本發明的實施例涉及用於計算自適應濾波器的濾波器係數的設備和方法,所述自適應濾波器用於對麥克風信號進行濾波,以抑制由揚聲器信號導致的回聲,可以在例如會議系統的環境中採用。會議系統的示例包括電話會議系統、視頻會議系統或其他雙向會議系統。
例如,當來自揚聲器的音調、聲音和雜訊被相同房間內或相同聲學環境內的麥克風拾取時,將出現聲學回聲。在電信系統中,這種聲學回饋信號被發送回遠端用戶,該用戶注意到這是其自己的話音的延遲版本。在這種環境下,回聲信號表現為一種非常擾亂的干擾,甚至可能損害互動式的全雙工通信。此外,聲學回聲也可以導致嘯聲效應(howling effects)和聲學回饋環路的其他不穩定性。
WO 2006/111370 A1涉及一種用於去除多聲道音頻信號中的回聲的方法和裝置。對於任何免提電信系統,如電話、音頻或視頻會議系統,聲學回聲控制和雜訊抑制是其重要部分。在這種環境下,在該文獻中描述的用於處理多聲道音頻揚聲器信號和至少一個麥克風信號的方法包括以下步驟:將輸入麥克風信號變換為輸入麥克風短時頻譜;根據揚聲器信號來計算組合的揚聲器信號的短時頻譜;根據輸入麥克風信號來計算組合的麥克風信號的短時頻譜;估計組合的麥克風信號的短時頻譜中回聲的幅度譜或功率譜;計算用於對輸入的麥克風短時頻譜進行幅度修正的增益濾波器;將該增益濾波器應用至至少一個輸入麥克風頻譜;以及將濾波後的輸入麥克風頻譜轉換至時域。
現今所採用的回聲抑制和回聲抵消系統,可以總稱為回聲去除系統,通常具有以下問題:儘管使用了自適應濾波器,但是其不能以最優的方式來處理不同聲音、音調和雜訊分量。例如,如果一個分量相比於另一分量占優,則在這樣的通信系統的麥克風信號中將可能出現揚聲器信號的回聲的非最優抑制。另一方面,在不同源的分量的偏差合成的情況下,由於利用了回聲抑制或回聲抵消系統,可能出現音調偽像,該音調偽像也被感知為極其惱人。
因此,基於該現有技術,本發明的目的是提高回聲抑制系統或回聲抵消系統的聲音品質。
這個目的是通過依據申請專利範圍第1項所述的設備、依據申請專利範圍第23項所述的方法或依據申請專利範圍第24項所述的程式來實現的。
一種用於計算自適應濾波器的濾波器係數的設備的實施例,所述自適應濾波器用於對麥克風信號進行濾波,以抑制由揚聲器信號導致的回聲,所述設備包括:提取裝置,用於從揚聲器信號或從揚聲器信號導出的信號中提取靜態分量信號或非靜態分量信號。所述裝置還包括計算裝置,用於基於所提取的靜態分量信號或所提取的非靜態分量信號來計算自適應濾波器的濾波器係數。
在這種環境下,一種用於計算自適應濾波器的濾波器係數的方法的實施例,所述自適應濾波器用於對麥克風信號進行濾波,以抑制由揚聲器信號導致的回聲,所述方法包括:從揚聲器信號或從揚聲器信號導出的信號中提取靜態分量信號或非靜態分量信號;以及基於所提取的靜態分量信號或所提取的非靜態分量信號來計算自適應濾波器的濾波器係數。
本發明的實施例基於以下發現:可以通過以下方式來實現音頻品質的改進:在計算用於抑制麥克風信號中的回聲的自適應濾波的濾波器係數的環境中,可以改進揚聲器信號或從揚聲器信號導出的信號的統計特性;針對其統計特性而對揚聲器信號進行分解。為此,根據本發明的實施例,針對靜態分量和/或非靜態分量對揚聲器信號或從揚聲器信號導出的信號進行分析,其中,從相應的揚聲器信號或從揚聲器信號導出的信號中提取一個或更多相應的分量信號。然後,基於所提取的靜態分量信號或所提取的非靜態分量信號來執行對自適應濾波器的濾波器係數的計算。
例如,信號(即例如揚聲器信號或從揚聲器信號導出的信號)的靜態分量在與頻率相關的域中可以表示為與能量相關的值,該與能量相關的值隨時間僅有很少變化,或可以形成相應的靜態分量。因此,例如可以在與頻率相關的域中確定這樣的信號的靜態分量,其中,為相應信號的帶通信號確定與能量相關的值,並執行在時間過程上的平均。在使用不同計算規定時,平均能夠以浮動平均(floating averaging)來執行。例如,在利用IIR濾波器類型的結構時(IIR=無限沖激回應),可以以遞迴方式來執行這樣的計算。類似地,也可以使用FIR濾波器類型的結構(FIR=有限沖激回應)來執行相應的平均。
相應地,可以基於相應信號的相應帶通信號來確定揚聲器信號或導出的信號中的非靜態分量。例如,在本發明的實施例中,例如,可以基於靜態分量信號和增益濾波器來確定相關聯的非靜態分量信號。在實施例中,增益濾波器還可以取決於至少一個控制參數,在本發明的實施例中,例如基於相干函數來確定所述控制參數,所述相干函數考慮了揚聲器信號和麥克風信號,或由其導出的信號。
在本發明的實施例中,可以基於靜態分量信號來計算第一濾波器係數,可以基於非靜態分量信號來計算第二濾波器係數,基於第一濾波器係數和第二濾波器係數來最終確定自適應濾波器的濾波器係數。例如,可以如下進行:使得自適應濾波器的濾波器係數與基於第一濾波器係數的第一濾波器以及基於第二濾波器係數的第二濾波器的串聯連接相對應。在本發明的實施例中,也可以基於第一濾波器係數或基於第二濾波器係數來確定濾波器係數。
在本說明書的其他過程中,將對其他實施例的結構和操作模式進行描述。根據具體實施例,靜態分量信號和非靜態分量信號可以是從相應信號估計出的信號。類似地,根據本發明的實施例的設備還可以包括抑制濾波裝置,所述抑制濾波裝置被配置為基於濾波器係數來對麥克風信號進行濾波。
參照附圖,以下將更詳細地解釋本發明的實施例。因此,根據附圖,將更好地理解本發明的實施例。
在參照第二圖至第十五圖描述在使用靜態和非靜態信號分量分離的同時實現聲學回聲抑制的本發明的各種實施例之前,首先參照第一圖來示意聲學回聲去除問題的一般設置。
例如,任何時候當揚聲器的音調、聲音或雜訊被相同房間內或相同聲學環境內的麥克風拾取時,將出現聲學回聲。在電信系統中,這些聲學回饋信號被發送回遠端用戶,該用戶注意到這是其自己的話音的延遲版本。在這樣的環境下,回聲信號表現為一種非常擾亂的干擾,甚至可能損害互動式的全雙工通信。此外,聲學回聲可以導致嘯聲效應和聲學回饋環路的其他不穩定性。因此,在適於全雙工的免提電信系統中,需要回聲控制,用於抑制揚聲器和麥克風之間的耦合。第一圖示意了聲學回聲問題。
因此,第一圖示出了在聲學環境120(例如可以是房間)中可以提供的揚聲器100和麥克風110。類似地,聲學環境120也可以是車輛的內部。
在這種環境下,使揚聲器信號130對揚聲器100可用,在第一圖中,也將揚聲器信號130稱為x[n],n是整數時間索引。麥克風110拾取源自聲學環境120的雜訊、聲音和音調,並產生麥克風信號140(在第一圖中也被稱為y[n])。將揚聲器信號130和麥克風信號140提供給回聲去除處理單元150作為輸入信號,回聲去除處理單元150在輸出處輸出麥克風信號140的回聲抑制後的信號160(在第一圖中也被稱為e[n])。
因此,第一圖基本示意了在雙向通信系統中可能出現的聲學回聲問題。由揚聲器輸出的電信系統的遠端的信號在直接路徑170上到達麥克風,並經由反射路徑180-1、180-2(也被稱為間接路徑)到達麥克風。出於這種原因,麥克風110不僅拾取本地(近端)的話音,而且也記錄了回聲,然後將回聲回饋給遠端的用戶。
換言之,揚聲器信號x[n]被回饋入麥克風信號y[n]。回聲去除處理單元150中執行的回聲去除處理理想地去除該回聲,同時允許電信系統的本地近端的話音通過。
處理這些回聲的一種傳統方法是將聲學回聲抵消器(AEC)與回聲信號的傳播路徑並行放置,參考文獻[1]中描述了該方法。在這種聲學回聲抵消器中,對回聲信號的數位副本進行估計,然後從測量或觀察到的麥克風信號中減去該副本。抵消聲學回聲的標準方法依賴於以下假設:可以使用線性FIR(FIR=有限沖激回應)濾波器來對回聲路徑進行建模,並相應地實現聲學回聲抵消器,這也在[1]中進行了描述。由於回聲路徑典型地是未知的,而且可能在操作時間期間改變,因此,典型地,以自適應方式來實現這樣的聲學回聲抵消器的線性濾波器。為了能夠對典型回聲路徑進行建模,典型地,使用數百毫秒的長度(與相應的採樣率有關)的FIR濾波器,這也意味著較高的計算複雜度水準。
實際上,由於各種原因,這些傳統方法可實現的回聲衰減通常不夠高。這些各種原因包括例如:長迴響時間(回聲拖尾效應)、非線性回聲分量和收斂問題;其中回聲拖尾效應導致回聲路徑的建模不足(undermodeling);非線性回聲分量例如是由振動效應或尤為低成本的音頻硬體的非線性性態而導致;如參考文獻[2]中所述,收斂問題出現在回聲路徑的較高的時間改變率的情況下。因此,如參考文獻[3]所述,將聲學回聲抵消器與非線性後處理器組合,以去除回聲抵消器無法消除的殘留回聲和回聲分量。通常,如在參考文獻[4]中所述,以頻率選擇性的方式來執行殘留回聲的抑制。確實,幾乎所有的聲學回聲抵消器使用這樣的後處理器,這是由於它們經常不能充分減少回聲以使其變為不可聽見。
近來,在參考文獻[5,6]提出了多種在子帶域中操作的聲學回聲抑制器,這些抑制器與上述非線性後處理器類似,但不需要聲學回聲抵消器,不需要估計回聲路徑的沖激回應。這些系統聲稱具有較低的計算複雜度並具有魯棒性,同時能夠實現高度的雙工性。
參考文獻[6]中提出的回聲抑制器方案應用短時傅立葉變換(STFT)來計算揚聲器和麥克風信號的頻譜。將兩個信號的短時變換後的信號之間的延遲d應用至相應的揚聲器信號,所述延遲值被選擇為考慮回聲路徑的沖激回應的多數效應。
然後,對用於模仿初始回聲路徑的效應的實數值回聲估計濾波器進行估計。為了獲得估計的回聲幅度譜,對揚聲器頻譜應用估計的延遲值和回聲估計濾波器。使用回聲幅度譜的估計,計算實數值的回聲抑制濾波器,並將其應用至麥克風信號頻譜以抑制回聲。
然而,上述聲學回聲抑制系統的缺點在於,在與由靜態和非靜態信號分量的混合組成的揚聲器信號相結合時不能很好地執行功能。例如,當在有雜訊的環境中記錄遠端話音時就是如此。此時揚聲器信號和回聲信號包含非靜態的遠端話音和靜態的遠端背景雜訊。
當前的聲學回聲抑制系統僅為揚聲器信號確定一個回聲信號去除濾波器。因此,這些方法未考慮以下情況:具有不同特性的回聲分量導致近端信號中的不同類型的干擾,因此應當對這些干擾進行區別處理。
第二圖示出了用於計算自適應濾波器210的濾波器係數的設備200的第一實施例,如相關聯的方法一樣,所述設備利用靜態信號與非靜態信號的分離來改進回聲抑制,從而提高可實現的音頻品質。因此,本發明的實施例能夠根據信號的統計屬性和特徵來進行不同類型的信號抑制的處理,這實現了更有效的較不容易產生偽像的回聲抑制。
作為介紹,在結合第三圖至第五圖來解釋本發明的各種實施例的其他實現細節之前,應當首先解釋根據本發明的實施例的設備200的框圖。在這種環境下,指出以下內容是有用的:即使在圖中示出並描述了根據本發明的實施例的設備的框圖,也可以將所述框圖理解為在指示流程方向的同時描述相應方法步驟的相應方法的流程圖。換言之,結合本說明書描述的框圖也可以被理解為反映各裝置和單元的各方法步驟的相應流程圖。
此外,在此注意以下內容是有用的:在本說明書的環境下,相同或相似的參考標號應當用於在功能上相同或相似的裝置、物件和結構。另一方面,由相同或相似的參考標號表示的裝置、單元和物件包括相同或相似的結構和功能特徵。換言之,在本說明書中,相同的參考標號表示在操作、功能、結構上相同或在操作、功能或結構上相似的裝置、單元和物件。除非明確地排除,可以將描述段落從一個實施例轉移至另一實施例,因此這允許對本發明的實施例進行更簡短和更簡明的表示。
此外,在本說明書中,概括性參考標號應當用於在一幅圖或一個實施例中出現多於一次的裝置、結構和物件。例如,在第一圖中,確實為第一圖中所示的兩個間接路徑180-1、180-2給出了不同的參考標號,但是,如果表示間接路徑本身,或如果描述其總體特徵,在本說明書中應當僅使用概括性參考標號180。這也是為了改進本說明書的易於理解和簡明性。
第二圖所示的設備200包括輸入220,用於第二圖中未示出的揚聲器的揚聲器信號。輸入220的輸入側耦合至時間/頻率轉換裝置230,在第二圖中,以虛線將時間/頻率轉換裝置230描述為設備200的可選元件。時間/頻率轉換裝置230耦合至可選的第一回聲估計濾波器240,然而,第一回聲估計濾波器240也是可選元件,不一定要在設備200的環境內實現。回聲估計濾波器240的輸出耦合至提取裝置250的輸入250a,提取裝置250的第一輸出250c和第二輸出250d經由第一輸入260a和第二輸入260b耦合至可選的第二回聲估計濾波器260。在本發明的實施例中,可以省去該回聲估計濾波器的實現。例如,在設備200的本發明的不同實施例中,可以實現第一回聲估計濾波器240和第二回聲估計濾波器260,以完全相同的方式,可以實現設備200而完全無需第一或第二回聲估計濾波器240、260中的任一個。當然,其中僅實現兩個回聲估計濾波器240、260之一的實現方式也是可能的。其他元件的實現也是可能的。
如果存在第二回聲估計濾波器260,則其第一輸出260c和第二輸出260d耦合在計算裝置270的第一輸入270a和第二輸入270b處,計算裝置270用於計算自適應濾波器210的濾波器係數。計算裝置270也經由輸出270d耦合至自適應濾波器210的輸入。
此外,自適應濾波器210的輸入經由可選的時間/頻率轉換裝置290耦合至用於麥克風信號的輸入280。自適應濾波器210的輸出經由可選的頻率/時間轉換裝置300耦合至用於回聲抵消後的麥克風信號的輸出。此外,輸入280可選地經由時間/頻率轉換裝置290耦合至提取裝置250的第二輸入250b並耦合至計算裝置270的第三輸入270c。然而,提取裝置250和計算裝置270的這兩個輸入250b、270c是可選的,在本發明的各種實施例中可以互相獨立地實現。
例如,可以在第一圖所示的回聲去除處理單元150中實現設備200。
在更詳細地解釋第二圖所示的設備200的實施例的操作模式之前,也應提到,基本上可以在分立電路中、在積體電路中或其他更複雜的電路中實現本發明的實施例。例如,也可以在資料處理裝置(即處理器)、集成系統(SOC=片上系統)、專用積體電路(ASIC)或其他積體電路和專用處理器中實現本發明的實施例。在這種環境下,很可能以時間上連續的方式在不同裝置中採用相應資料處理裝置的相同電路部分。例如,首先,在提取裝置250的功能的環境中,其次在計算裝置270的功能的環境中,可以使用處理器的算術邏輯單元(ALU)的相同邏輯門。然而,這兩個裝置尤其在其他特徵上有所不同,例如在上述情況下,在共同定義不同裝置的不同控制命令方面有所不同。因此,不同裝置的部分或完全重疊的電路工程實現是很可能的。
尤其出於這種原因,在本說明書中,將互相耦合的裝置、元件和結構理解為間接或直接互相連接的裝置、元件和結構。例如,如果有基於資料處理裝置的實現,則可以通過記憶體中的儲存位置(其中鎖存有信號形式的中間結果)來進行耦合。
然而,此外,即使在本說明書的其他過程中主要描述了數位實現,但是本發明的實施例基本上不局限於數字實現。例如,原則上,類比實現或包括類比和數位元件的混合實現是可行的。在這種情況下,例如,可以採用附加的A/D或D/A轉換器(類比/數位和數位/類比轉換器),以可能將一種類型的信號形成為另一種類型的信號。
對於第二圖所示的設備200的操作模式,可以使用可選存在的時間/頻率轉換裝置230將設備200的輸入220處可用的揚聲器信號變換至與頻率相關的域。在對資料塊(幀)進行操作的實現方式的情況下,時間/頻率轉換裝置230確保了相應資料塊向頻譜表示的轉換,使得在時間/頻率轉換裝置230的輸出處提供的頻譜表示與時域中的資料塊相對應。根據具體實現方式,在時間/頻率轉換裝置230的環境中,可以使用基於傅立葉變換的轉換器裝置、基於子帶的轉換器裝置或基於QMF的轉換器裝置(QMF=正交鏡像濾波器)。不論所實現的時間/頻率轉換裝置230的具體操作模式,所述轉換器230將在其輸入處提供的信號(存在于時域中)轉換為多個帶通信號。每個帶通信號具有與其相關聯的特徵頻率,所述特徵頻率可以是例如:中心頻率、相應頻帶的下截止頻率或相應頻帶的上截止頻率。根據具體實現方式,各個帶通信號可以具有多於一個的特徵頻率或可以具有與其相關聯的其他特徵參數。
第一回聲估計濾波器240表示了一種對(第一圖中的)聲學環境120進行調製的可能性,使得在其輸出處出現的信號理想地包括與由於揚聲器信號而被麥克風信號所拾取的信號相對應的幅度譜。然而,如以上已經解釋過的,第一回聲估計濾波器240是可能不被實現的可選濾波器。
現在,將揚聲器信號或由可選元件230、240可選地處理、濾波並相應地導出的信號在提取裝置250的第一輸入處提供給提取裝置250。提取裝置250被配置為根據揚聲器信號或根據從揚聲器信號導出的信號來產生靜態分量信號和非靜態分量信號。如在本發明的實施例的其他描述中應當看到的,例如,這可以通過對輸入信號進行平均以確定靜態分量信號來實現。
根據具體實現方式,信號可以是與“實際”靜態分量偏離的估計的信號。相應地,可以根據靜態分量信號,可能同時使用第二圖中未示出的增益濾波器,來確定非靜態分量或非靜態分量信號。
在本發明的其他實施例中,例如,提取裝置250也可以使用與所描述的措施不同的穩態措施。
對於非靜態分量或非靜態分量信號,也可以通過輸入信號中時間變化的比較來確定所述分量或信號。此外,在設備200的環境中或在設備200周圍實現話音編解碼器的情況下,在提取裝置中可以使用預測措施,以提取上述兩個信號中的至少一個。例如,這樣的預測措施可以表示LPC編解碼器的誤差信號(LPC=線性預測編碼)。
提取裝置250包括以上已經描述的兩個輸出,根據實現方式在兩個輸出處可以提供不同的信號。例如,典型地,在提取裝置250的第一輸出處至少提供靜態分量信號或非靜態分量信號。在第二輸出處可以提供兩個分量信號中的另一個,或提供包括與第一輸出處輸出的信號相關的資訊的信號。例如,該信號可以是用於計算裝置270中的相應信號的進一步處理的參數,或可以僅為指示發送兩個分量信號中的哪一個的控制信號。
可選的第二回聲估計濾波器260在功能上總體與第一回聲估計濾波器240相對應。一般地,在被實現為以這種方式來執行回聲估計的情況下,第二回聲估計濾波器260也能夠對輸入220處提供的揚聲器信號進行估計,從而在不存在其他噪音源的理想情況下獲得與麥克風記錄的信號相對應的信號。可選地,第一回聲估計濾波器240和第二回聲估計濾波器260可以包括延遲裝置,該延遲裝置考慮了由麥克風拾取的揚聲器的回聲的延遲。換言之,濾波器240、260通過延遲裝置的附加實現或由於其內部結構,也可以用於對揚聲器信號或由其導出的信號進行延遲。一般地,此外,一方面回聲估計和另一方面延遲的兩個功能的分離當然也是可能的,例如第一回聲估計濾波器240僅用於延遲相應信號,而第二回聲估計濾波器260執行實際的回聲估計。
然後,將第二回聲估計濾波器260提供的信號提供給計算裝置270,計算裝置270繼而被配置為基於所提取的靜態分量信號或所提取的非靜態分量信號來計算或確定自適應濾波器210的濾波器係數。根據具體實現方式,出於這種目的,計算裝置270也可以依賴於在輸入280處提供的麥克風信號,或依賴於被轉換至與頻率相關的域的麥克風信號。如以下更詳細描述的,該信號可以對提取裝置250可用。
然後,從計算裝置270獲得濾波器係數的自適應濾波器210執行麥克風信號的實際頻譜修正,以在其輸出提供麥克風信號的至少部分回聲抵消後的版本以待進一步處理。根據具體實現方式,通過頻率/時間轉換裝置300,可以將按照這種方式進行回聲抵消或頻譜修正的麥克風信號轉換回時域,或可以在輸出310上直接將其輸出。例如,在相應麥克風信號是在頻域中,或總之在與頻率相關的域中進行編碼的情況下,轉換裝置300執行的向時域的逆變換可能是無用的。
在結合第三圖A至第五圖E更詳細地描述第二圖所示的設備200的框圖中的各個元件之前,在此應當注意,一般地,可以在與頻率相關的域中執行揚聲器信號或從揚聲器信號導出的信號的處理,以便相應地處理單獨的相關聯的帶通信號、多個帶通信號、多數帶通信號或全部帶通信號。
也應當注意,根據具體實現方式,例如在使用與能量相關的值時,各個裝置和濾波器可以操作。與能量相關的值是被形成為以實數值為底的偶數指數次冪的值,或是被形成為值的幅度(絕對值)的任意次冪的值。例如,如果在各個濾波器或在各個裝置中處理短時頻譜,則例如,所述頻譜可以對與能量相關的值進行操作、對被形成為相關聯頻譜係數的幅度平方的能量值進行操作。類似地,可以使用指數1來使用幅度譜,即相應頻譜係數的絕對值。換言之,與基於任意值z(z為實數值或複數值)的∣z∣m (m為正數,例如自然數)成比例的值可以用作與能量相關的值。此外,在實數值z的情況下,與z2m 成比例的值可以用作與能量相關的值。
第三圖A示出了可以在設備200的環境中實現的根據本發明的實施例的提取裝置250的框圖。該提取裝置250僅包括第一輸入250a,該輸入耦合至第二圖中可選的第一回聲估計濾波器240的輸出。然而,第三圖A所示的提取裝置250不包括第二輸入(第二圖中的輸入250b)。
提取裝置250的第一輸入250a耦合至平均裝置320,平均裝置320被配置為確定在輸入250a處提供的信號的均值。這裏,術語信號不僅包括時域信號(時間信號),也包括頻域或與頻率相關的域中的信號,其中相應信號是時域中的信號的頻譜表示。類似地,信號也可以包括和發送從上述信號導出的資訊,如頻域中的值的幅度(頻譜幅度)、能量值(幅度平方)、頻譜和其他導出的值和量。
在第三圖A所示的提取裝置250中,在平均裝置320的輸出處,輸出在輸入250a處提供的所述信號作為提取裝置250的第一輸出250c處的靜態分量信號。如第二圖也示出的,第一輸出250c耦合至可選的第二回聲估計濾波器260和/或耦合至計算裝置270。
與在平均裝置320的輸出處提供的靜態分量信號一起,還將在第一輸入250a處提供的信號提供給增益濾波器330,增益濾波器330在輸出處輸出非靜態分量信號,並將其轉發給提取裝置250的第二輸出250d。增益濾波器330被配置為基於在第一輸入250a處輸入的揚聲器信號,或基於由其導出的信號,以及基於靜態分量信號來確定非靜態分量信號。關於平均裝置320和增益濾波器330的其他功能,應參照上述關於第二圖給出的解釋,並參照在本說明書的其他過程中給出的其他解釋。
第三圖B示出了在本發明的實施例中可以採用的、設備200中的另一種提取裝置250。第三圖B所示的提取裝置250與第三圖A中所示的提取裝置250的本質區別在於,第三圖B所示的提取裝置250還包括參數計算裝置340,參數計算裝置340的輸入側也耦合至第一輸入250a。參數計算裝置340的輸出耦合至增益濾波器330,參數計算裝置340向增益濾波器330提供控制參數用於計算非靜態分量信號。關於操作模式的更具體細節應參照以下描述。
作為可選元件,第三圖B所示的提取裝置250還包括結合第二圖已經描述過的第二輸入250b,第二輸入250b可以一方面間接耦合至參數計算裝置340的另一輸入,另一方面,如第二圖也示出的,耦合至用於麥克風信號的輸入280。在這種情況下,可以在利用時間/頻率轉換裝置290的同時實現該間接耦合。關於參數計算裝置340的操作模式,也應參照以下描述。
第三圖C示出了可以在第二圖的設備200中採用的提取裝置250的另一潛在實現方式。這裏,第三圖C所示的提取裝置250基於第三圖B所示的提取裝置250,也示出了作為可選元件的參數計算裝置340及其連接。與第三圖B所示的提取裝置250不同,第三圖C所示的提取裝置250包括分配裝置350,在每種情況下,分配裝置350的一個輸入分別耦合至平均裝置的輸出和增益濾波器330的輸出。向分配裝置350提供平均裝置320的靜態分量信號和增益濾波器330的非靜態分量信號。
在輸出側,分配裝置350耦合至提取裝置250的第一輸出250c和第二輸出250d。分配裝置350被實現為,基於其可用的兩個分量信號來確定經由第一輸出250c向後續元件提供兩個分量信號中的哪一個。根據關心兩個分量信號中的哪一個,分配裝置350還經由提取裝置250的第二輸出250d輸出控制信號,所述控制信號包括例如關於在第一輸出250c處出現兩個分量信號中的哪一個的資訊,或者,分配裝置350輸出包括參數的相應控制信號,用於輸出的分量信號的進一步處理。關於例如在控制信號的環境中可以發送的不同參數,應當參照以下描述。
根據具體實現方式,分配裝置350可以被實現為使得其將與另一分量信號相比包括更高的響度、更高的能量或更高的能量值的分量信號傳送至第一輸出250c。例如,對不同的頻帶信號可以輸出不同的分量信號。
因此,第三圖C所示的提取裝置250與第三圖A和第三圖B所示的提取裝置250的區別尤其在於:在提取裝置250的第一輸出250c處僅輸出兩個分量信號之一。如結合第二圖已經解釋過的,第三圖C所示的提取裝置250僅輸出控制信號,所述控制信號包括與在第一輸出250c處輸出的分量信號相關的資訊。
第四圖A示出了第二圖中也示為可選元件的第二回聲估計濾波器260的第一實施例。可選的第二回聲估計濾波器260包括兩個濾波器級360-1、360-2,每個濾波器級的輸入分別耦合至第二回聲估計濾波器260的輸入260a、260b。此外,兩個濾波器級360-1、360-2的輸出分別耦合至第二回聲估計濾波器260的輸出260c、260d。
在這種環境下,可以結合第三圖A和第三圖B中所示的提取裝置250來採用第四圖A所示的可選的第二回聲估計濾波器260。更具體地,第四圖A所示的第二回聲估計濾波器260能夠執行並行處理,通過濾波器級360-1來處理靜態分量信號,通過濾波器級360-2來處理非靜態分量信號。一般地,根據是否採用不同的回聲估計濾波器以針對靜態和非靜態分量信號來對聲學環境120(如第一圖所示)進行調製,可以將兩個濾波器級360-1、360-2配置為相同或不同。自然,在電路工程方面,例如當也實現一個信號的鎖存或緩存時,也可以使用相同的電路元件來實現兩個濾波器級360-1、360-2。
如結合第二圖對回聲估計濾波器240、260的兩部分實現方式的可能性的討論中已經解釋的,濾波器級360也可以是僅實現例如延遲的濾波器級。當然,在第二回聲估計濾波器260的環境中,也可以使用與所述回聲估計濾波器級不同的其他濾波器級。例如,濾波器級360包括可選的控制輸入,用於接收控制信號,以實現濾波效應,使其被調整或影響。
第四圖B示出了可選的第二回聲估計濾波器260的另一實現形式,其與第四圖A所示的區別僅在於,僅實現了一個濾波器級360,該濾波器級360連接在第一輸入260a和第一輸出260c之間。在第四圖所示的實施例中,將第二輸入260b處輸入的信號傳送至第二輸出260d。
因此,例如在第三圖C所示的提取裝置250的環境中,可以採用第四圖B中所示的第二回聲估計濾波器260。在這種情況下,回聲估計濾波器260不對控制信號進行修正,該控制信號包括關於第一輸入260a處輸入的分量信號的資訊。
當然,在一個實施例中,例如當濾波器級360只對兩個分量信號之一進行修正時,也可以使用第三圖A和第三圖B所示的提取裝置250來實現第四圖B所示的回聲估計濾波器。這裏,當然也可以使用回聲估計濾波器260的鏡像版本,其對第二輸入260b處輸入的信號進行濾波。
第五圖A示出了可以結合第二圖中的設備200來採用的根據本發明的實施例的計算裝置270的實現方式。這裏,計算裝置270再次包括第一輸入270a和第二輸入270b。計算裝置270還包括第一和第二濾波器計算裝置370-1、370-2,第一和第二濾波器計算裝置370-1、370-2的輸入側分別耦合至計算裝置270的兩個輸入270a、270b之一。更具體地,濾波器計算裝置370-1的輸入側耦合至第一輸入270a,以接收例如靜態分量信號。相應地,第二濾波器計算裝置370-2耦合至第二輸入270b,以從例如根據第三圖A或第三圖B來實現的提取裝置250接收非靜態分量信號。當第二回聲估計濾波器260連接在提取裝置250和計算裝置270之間時,將從相應的分量信號導出的信號饋送至兩個濾波器計算裝置370。
兩個濾波器計算裝置370使用一個輸出耦合至組合裝置380,就組合裝置380而言,其在輸出側耦合至輸出270d。作為可選元件,第五圖A所示的計算裝置270還包括第三輸入270c,在計算裝置270內,第三輸入270c耦合至兩個濾波器計算裝置370,如第二圖中也示出的,第三輸入270c直接或間接耦合至用於麥克風信號的輸入280。
關於計算裝置270的操作模式,濾波器計算裝置370被配置為,基於對其可用的分量信號,並可選地考慮來自輸入280的麥克風信號,計算相應的濾波器係數,隨後,濾波器計算裝置370使相應的濾波器係數對組合裝置380可用。如果從相應分量信號導出的信號(可能經過第二回聲估計濾波器260的修正)對兩個濾波器計算裝置370可用,則濾波器計算裝置370基於這些信號來執行相應計算。然而,不考慮這一點,濾波器計算裝置370被配置為基於提取裝置250提供的分量信號,分別計算第一和第二濾波器係數。
然後,組合裝置380將按照這種方式計算的第一和第二濾波器係數組合為濾波器係數集合,然後經由計算裝置270的輸出270d,將其作為輸入資料提供給自適應濾波器210。可以通過多種不同操作來完成該組合。根據實際實現的濾波器技術,尤其也根據所使用的時間/頻率轉換裝置230、290,並根據相關聯的頻率/時間轉換裝置300,可以實現用於組合第一濾波器係數和第二濾波器係數的多種不同的可能性,以獲得自適應濾波器210的濾波器係數。在本說明書的其他過程中,將更詳細地解釋相應示例。
第五圖B示出了與第五圖A中非常類似的第二計算裝置270。其與第五圖A所示的計算裝置270的區別僅在於,現在實現了選擇裝置390來代替第五圖A中的組合裝置380,所述選擇裝置390被實現為:基於第一濾波器係數和第二濾波器係數,在輸出270d處輸出濾波器係數集合,該集合或基於第一濾波器計算裝置370-1的第一濾波器係數,或基於第二濾波器計算裝置370-2的第二濾波器係數。換言之,選擇裝置390被實現為基於靜態分量信號或基於非靜態分量信號來確定自適應濾波器210的濾波器係數。
這裏,選擇裝置390很可能基於計算裝置370的相應濾波器係數集合來執行更複雜的數學關係。然而,其與第五圖A中的計算裝置270的組合裝置380的區別在於,其僅考慮了濾波器計算裝置370輸出的兩個濾波器係數集合中的一個集合。
第五圖C示出了另一計算裝置270,其與第五圖A所示的計算裝置270的區別在於,第五圖A中的計算裝置270僅包括耦合至計算裝置270的第一輸入270a的濾波器計算裝置370。此外,在第五圖C所示的計算裝置270中,濾波器計算裝置370耦合至第二輸入270b,並被實現為經由第二輸入270b獲得用於確定濾波器係數的參數。此外,作為可選元件,第五圖C的濾波器計算裝置370也可以耦合至第三輸入270c,以可能基於麥克風信號來執行濾波器係數的計算。
因此,第五圖C所示的計算裝置270與如下的計算裝置相對應:其可以結合第三圖C所示的提取裝置250來操作,並可以結合第四圖B所示的第二回聲估計濾波器260來操作。經由提取裝置250的第二輸出250d,用於在濾波器計算裝置370的環境中進行計算的相應參數經由計算裝置270的第二輸入270b直接發送至相應的濾波器計算裝置370。出於這種原因,第二輸入270b耦合至濾波器計算裝置370的參數輸入,經由該參數輸入,所述濾波器計算裝置370可以接收用於計算濾波器係數的附加參數。
由於使用了該計算裝置270,僅實現了單個濾波器計算裝置370,因此,可以省去組合裝置和選擇裝置。
第五圖D示出了另一計算裝置270,其在結構和操作模式上與第五圖C中的計算裝置270非常類似。與第五圖C所示的計算裝置270不同,第五圖D所示的計算裝置270還包括參數確定裝置400,該參數確定裝置400耦合在第二輸入270b與濾波器計算裝置370的相應參數輸入之間。
與第五圖C所示的計算裝置270不同,第五圖D所示的計算裝置270可以在設備200的環境中操作,其中,提取裝置250經由第二輸出250d提供控制信號,該控制信號僅包括與提取裝置250經由相應的第一輸出250c輸出了兩個分量信號中的哪一個相關的資訊。如果在濾波器計算裝置370的環境中使用的用於計算兩個分量信號(或基於兩個分量信號的信號)的濾波器係數的規定僅在參數上有區別,則在利用第五圖D所示的計算裝置270時,參數確定裝置400可以根據所發送的分量信號來計算相應參數。因此,例如,可以將參數確定裝置400實現為記憶體或計算電路。如果將其實現為記憶體,則可以實現為唯讀記憶體(ROM)、非易失性記憶體(NVM)或隨機存取記憶體(REM)。
第五圖E示出了另一計算裝置270,根據基於其來計算自適應濾波器210的濾波器係數的分量信號,該計算裝置270包括兩個濾波器計算裝置370-1、370-2。這裏,兩個濾波器計算裝置370的輸入端均耦合至第一輸入270a。除了在可選的第三輸入270c處的可選耦合之外,兩個濾波器計算裝置370中的每一個還分別耦合至分配點410的輸入,該分配點的輸出耦合至計算裝置270的輸出。分配點410還包括控制輸入,該控制輸入耦合至計算裝置270的第二輸入270b。
因此,基於在第一輸入270a處輸入的信號,第五圖E中的計算裝置270能夠基於濾波器計算裝置370-1來計算第一濾波器係數集合,並基於第二濾波器計算裝置370-2來計算第二濾波器係數集合。根據經由第二輸入270b轉發至分配點410的控制輸入的信號做出以下選擇:將濾波器計算裝置370計算的兩個濾波器係數中的哪個濾波器係數最終轉發至輸出270d。分配點410根據在其控制輸入處的控制信號,將兩個輸入之一耦合至輸出270d。
因此,例如,第五圖E的計算裝置270可以結合第三圖C所示的提取裝置250來操作,其中,經由第二輸出250d發送控制信號,該控制信號包括與經由第一輸出250c發送的分量信號相關的資訊。因此,例如,如果在濾波器計算裝置370的環境中使用的針對兩個分量信號的計算規定之間的區別達到這樣的程度,即由於參數上的簡單改變而使得不能有效地對其進行轉換,則可以實現第五圖C所示的計算裝置270。
當然,這裏應注意,第三圖A至第三圖C中描述的各種提取裝置250、第四圖A和第四圖B中描述的各種回聲估計濾波器260以及第五圖A至第五圖E中描述的各種計算裝置270可以在各個方面互相組合。例如,在第五圖E所示的計算裝置中,可以使用這樣的裝置來取代分配點410:除了執行選擇要耦合至輸出270d的濾波器計算裝置370之外,還執行其他操作,例如基於濾波器係數的計算。
在第二圖至第五圖中已經描述的本發明的實施例表現了一種新技術,能夠實現靜態和非靜態回聲分量的單獨抑制。這是通過分別根據揚聲器信號中的波動和靜態分量來估計回聲而實現。然後,在本發明的實施例中,對兩種信號類型計算兩個相應的回聲去除濾波器。可以對這些回聲去除濾波器進行單獨優化,以實現最佳可能的回聲抑制性能,同時最小化近端信號的偽像和干擾。
其他描述被組織如下。首先,提出一種揚聲器信號的模型。隨後,根據該模型,將靜態和非靜態分量分離,可以基於靜態分量的估計來進行該分離。然後,基於回聲估計濾波器來對靜態和非靜態回聲分量的功率譜進行估計。相應地,在本發明的一些實施例中,計算兩個回聲去除濾波器。隨後,基於對回聲去除濾波器的後驗性能的分析來適配靜態和非靜態分量的分離。
關於信號建模,要說明的是,由於只能考慮真實回聲路徑長度的一部分,因此,在實際條件下,使用回聲估計濾波器對回聲成分譜或回聲功率譜的估計典型地不是非常精確。為了防止這些不精確性導致殘留回聲,計算回聲去除濾波器使其強烈地抑制回聲,使其不留下殘留回聲。這是通過對回聲功率譜進行過高估計並通過時間平滑(有利於較小的增益濾波器值)來實現的。
當揚聲器信號包含靜態雜訊時,回聲抑制器將試圖抑制所述靜態雜訊的回聲。由於上述強烈的回聲抑制濾波器,這經常不僅導致靜態雜訊回聲的抑制,而且導致對靜態近端雜訊和遠端話音的損害。
這裏提出的方法通過針對靜態和非靜態信號分別使用兩個不同的回聲抑制路徑來消除這一問題,在第六圖中也示意了這種方法。
第六圖示出了根據本發明的實施例的設備200的框圖,設備200包括揚聲器100和麥克風110。揚聲器100具有對其可用的揚聲器信號x[n],將該信號提供給提取裝置250。提取裝置250也被稱為穩態鑒別器(靜態鑒別)。如結合第二圖已經解釋的,提取裝置250包括兩個輸出,這兩個輸出耦合至計算裝置270。此外,計算裝置270也具有對其可用的麥克風110的信號y[n]。
也如第五圖A所示,計算裝置270包括用於靜態分量信號的第一濾波器計算裝置370-1以及用於非靜態分量信號的濾波器計算裝置370-2,這些信號由提取裝置250輸出。此外,向兩個濾波器計算裝置370分別提供麥克風信號。
基於在每種情況下對其可用的信號,兩個濾波器計算裝置370計算濾波器係數HW 和HS ,並將其提供給組合裝置380。為此,兩個濾波器計算裝置370分別使用一個輸出耦合至組合裝置380。就組合裝置380而言,其向自適應濾波器210輸出基於兩個濾波器係數集合HW 和HS 來計算或確定的濾波器係數。
為了最終從麥克風信號y[n]獲得回聲抑制後的信號e[n],自適應濾波器210還耦合至麥克風,以接收輸入處的麥克風信號。在自適應濾波器210的輸出處提供回聲抑制後的信號e[n]。
因此,自適應濾波器210進行實際的回聲抑制,其中,兩個濾波器計算裝置370中的每一個計算採取相應濾波器係數的形式的回聲去除濾波器,然後,組合裝置380將其組合為有效的回聲去除濾波器。
關於第六圖中的表示,要注意的是,第六圖所示的框圖是簡化框圖,其中為了簡化表示,未示出例如可能實現的時間/頻率轉換裝置以及回聲估計濾波器。
應當對非靜態(話音)回聲進行強烈抑制,以避免在這種情況下可能被感知為惱人的殘留回聲。然而,典型地,以較不強烈的方式來對可能源自揚聲器信號中的靜態雜訊的靜態回聲進行抑制,以防止如音調干擾之類的偽像。
為了產生合適的模型,可以根據以下等式將從揚聲器發射的信號x[n]分為:
x[n]=xS [n]+xW [n] (1)
其中,xS [n]對非靜態話音的成分進行建模,xW [n]對靜態雜訊的成分進行建模。使用變數n來表示離散時間索引。
關於靜態和非靜態分量的分離,首先對等式(1)所示的模型的兩端均執行短時傅立葉分析(STFT),產生:
X[k,m]=Xs [k,m]+Xw [k,m], (2)
其中m表示頻率,k是時間資料塊索引。m和k都是整數。在等式(2)中,揚聲器功率譜|X[k,m]2 中的非靜態和靜態分量表示為|Xs [k,m]2 和|Xw [k,m]2 。可以合理假定xs [n]和xw [n]不相關,並具有接近零的均值。
然後,|X[k,m]2 由以下給出:
出於這種原因,可以根據以下等式,通過從揚聲器信號的功率譜|X[k,m]2 中減去靜態分量信號的功率譜的估計|Xw [k,m]2 來恢復揚聲器信號的非靜態分量信號xs [n]的暫態功率譜
實際上,根據以下等式,通過對揚聲器信號的功率譜|X[k,m]2 進行濾波來估計
根據參考文獻[7],濾波器Fx [k,m](也被稱為增益濾波器)可以被寫為其一般形式,如下:
其中γx 是指數,βx 是控制參數或在靜態信號分量被低估或高估的情況下用於控制靜態信號分量的抑制強度的參數。參照第八圖將針對1kHz的頻率來示意靜態和非靜態分量的分離。
在第二圖至第六圖所描述的實施例中,由提取裝置250的增益濾波器330來執行等式(5)和(6)所描述的功能。
通過隨時間來更新估計的雜訊短時功率譜,可以執行靜態雜訊估計。在每個資料塊(幀)k處,以如下方式來更新雜訊功率譜:使用用於確定存在話音還是雜訊的兩個時間常數來執行單極平均(single-pole averaging)。較小的上升時間常數(attack time constant)反映當前資料塊包括雜訊。較大的釋放時間常數反映當前資料塊包括話音。
實際上,這是根據以下等式來實現的:
其中μ1 是上升時間常數,μ2 是釋放時間常數。更具體地,等式(7)中出現的參數μ1 和μ2 是無量綱參數,其中適用μ12 。然而,例如考慮到採樣頻率,這些參數可以被解釋為並稱為上述時間常數。如以下的比例關係式(16)也要示出的,每個實際時間常數和參數互相成反比。考慮到採樣率,上升時間常數μ1 可以包括例如10000ms=10s的值,而釋放時間常數可以與10ms的值相對應。
在第二圖至第六圖描述的本發明的實施例中,由提取裝置250的平均裝置320來實現等式(7)的功能。
對於回聲功率估計,根據以下等式,通過將回聲估計濾波器G[k,m]應用至揚聲器功率譜的時間延遲的版本,可以實現回聲信號的回聲頻譜的估計:
其中,表示麥克風信號中的回聲的功率譜的估計。在使用等式(3)時,由非靜態揚聲器信號分量導致的回聲由以下給出:
靜態揚聲器信號分量給出的回聲為:
根據例如結合第二圖至第五圖所示的本發明的實施例的具體實現方式,例如,可以使用第一回聲估計濾波器240來實現等式(8)所描述的功能。相應地,可以使用由兩個濾波器級360-1、360-2組成的第二回聲估計濾波器260來實現等式(9)和(10)所描述的功能。
如上所述,也可以使用所述回聲估計濾波器240、260來實現等式(8)至(10)中出現的、具有延遲值d的信號延遲功能。可選地,如果不實現獨立的延遲裝置,自然也可以使用時間/頻率轉換裝置230來實現所述延遲功能。
關於回聲去除濾波器,計算相關聯的回聲去除濾波器Hs [k,m]和Hw [k,m]並將其應用至麥克風信號,以抑制來自非靜態和靜態回聲估計的回聲信號。在包括例如第五圖A所示的計算裝置270的實施例的情況下,這是根據以下等式來實現的:
E[k,m]=Hs [k,m]Hw[k,m]Y[k,m]。 (11)
在這種情況下,在組合裝置380中執行回聲去除濾波器Hs [k,m]和Hw [k,m]的相應濾波器係數的相乘,這與相應回聲去除濾波器的串聯連接相對應。在基於頻率的域中進行的相應濾波器係數的相乘與時域中的相應沖激回應的卷積相對應。
通過以等式(11)也示出的因式分解的方式來實現回聲去除濾波器,可以引入不同的增益因數作為不同回聲分量的參數。例如,可以根據以下等式來計算非靜態回聲去除濾波器的濾波器分量:
可以根據以下等式來計算靜態回聲去除濾波器的濾波器分量:
設計參數βs 、γs 、βw 和γw 可以用於控制每個回聲去除濾波器的期望性能。根據本發明的實施例的具體實現方式,所述設計參數可以被選擇為固定、設計為可自適應、可編程或可以任何其他方式修改。例如,指數參數的典型選擇是γs =γw=2。
使用所謂的高估參數βs 和βw 來控制回聲衰減的強烈性。例如,通過增大高估參數,可以增大相應的回聲去除濾波器的強烈性。因此,靜態回聲去除濾波器Hw [k,m]的典型選擇是對於參數βw =2,以便僅應用適度的回聲衰減。
另一方面,要以高度強烈的方式來設計負責對非靜態回聲分量進行抑制的回聲去除濾波器,以有效衰減回聲信號中的干擾話音分量。因此,通常要將高估因數βs 設計為大於βw ,使得典型地βsw 。如果選擇了βw =2,則βs 可以包括例如20>βs >2=βw 範圍內的值(例如βs =4)。一般地,βs 和βw 屬於相同的數量級。
限制值Ls 和Lw 確定所允許的最大回聲衰減,以分貝(dB)為單位。靜態回聲去除濾波器的典型值為Lw =-10dB或-15dB,該值有利地限制了靜態回聲的衰減,以減小意外的偽像。在遠端處的非靜態話音的情況下,該衰減應確保相應回聲分量的完全衰減,這與用於非靜態分量信號的Ls 約為-60dB的限制值相對應。
在第二圖至第六圖所示的實施例中,在濾波器計算裝置370的環境中,可以實現並實施等式(12)和(13)所表示的功能。
在本發明的一些實施例中,不是通過應用等式(12)和(13)所描述的回聲去除濾波器來直接執行實際的回聲抑制。而是基於相應的時間平滑的版本來執行相應的回聲去除。如上述設計參數的情況一樣,典型地,手動調諧並分別針對非靜態和靜態回聲抑制來優化時間平滑參數。因此,由於對靜態雜訊分量的抑制的要求與對非靜態話音抑制的要求不同,因此可以進一步提高可感知的音頻品質。
例如,可以在濾波器計算裝置370本身的環境中,或在其下游的任何裝置中,例如在組合裝置380、選擇裝置390或分配點410中執行這種功能。如果需要,也可以在自適應濾波器210的環境中直接執行這種時間平滑。
對於上述品質的改進,例如,如參考文獻[8]所述,已經知道,在抑制了靜態信號分量的情況下,要應用增大的平滑,以避免所謂的音調干擾。另一方面,也應當確保所應用的非靜態回聲去除濾波器的衰減偏愛較小的值,以產生充分高的回聲衰減,所述衰減是由回聲路徑的迴響而導致的。然而,這不應使自適應濾波器210的跟蹤能力在回聲水準快速改變的情況下退化。這種討論傾向於是一種定性討論,清楚地示出了由等式(12)和(13)所示的回聲去除濾波器的獨立調整和優化的必要性。
第七圖採取更大更完整的框圖或在本說明書的上下文中提出並描述的聲學回聲衰減演算法的流程圖的形式,示出了本發明的另一實施例。第七圖示出的本發明的實施例與第二圖所描述的實施例很類似。這裏,設備200也包括採取短時傅立葉變換單元(STFT)形式的時間/頻率轉換裝置230,向該裝置提供了揚聲器信號x[n]。作為示例,第七圖的上部將揚聲器信號x[n]的曲線示為時間的函數,基於時間索引n來繪出該曲線。
在將信號x[n]從時域轉換至頻域之外,時間/頻率轉換裝置230也執行上述延遲值為d的延遲。因此,在時間/頻率轉換裝置230的輸出處,頻譜X[k-d,m]可用,該頻譜一般是複數值頻譜。將所述頻譜X[k-d,m]提供給提取裝置250,繼而在第七圖中由字母SD(靜態鑒別)來表示該提取裝置250。如結合第二圖至第五圖中描述的實施例已經解釋的,在第七圖所示的實施例中,提取裝置250也提供頻域中的靜態分量信號Xw [k,m]和頻域中的非靜態分量信號Xs [k,m]。所述分量信號對計算裝置270可用。
此外,第七圖所示的設備200的實施例包括時間/頻率轉換裝置290,該裝置也被實現為短時傅立葉變換單元(STFT)的形式。例如,如第七圖的上部曲線430所示,向所述時間/頻率轉換裝置290提供麥克風信號y[n]作為輸入信號。時間/頻率轉換裝置290也產生頻域中的麥克風信號Y[k,m]的相應表示,其中索引k再次表示資料塊,而索引m表示頻帶或頻率值或頻譜係數。該頻譜Y[k,m]一般也是複數值頻譜。
然而,與時間/頻率轉換裝置230不同,時間/頻率轉換裝置290不包括附加的延遲功能。一般地,由於與電路和其他元件中的電信號的傳播速度相比,聲波的傳播速度(音速)明顯更低(聲波的傳播速度導致了與相關聯的揚聲器信號x[n]相比,由麥克風拾取的信號y[n]中的延遲),因此不需要附加延遲功能。
為了示意這一點,對在第七圖的上部的兩條曲線420、430,示出了與揚聲器信號x[n]相關的第一大括弧440。在第七圖中,示出了與麥克風信號y[n]相關的第二大括弧450,大括弧450表示與揚聲器信號x[n]中由大括弧440所表示的部分相對應的麥克風信號y[n]的範圍。因此,揚聲器信號x[n]與麥克風信號y[n]互相偏移延遲值d,第七圖中的箭頭460也示出了這一點。
在第七圖所示的實施例中,向回聲估計濾波器裝置470提供揚聲器信號和麥克風信號的頻譜,回聲估計濾波器裝置470基於輸入的信號來估計回聲估計濾波器或其分量。這些濾波器係數也被發送至計算裝置270。
計算裝置270繼而包括用於靜態分量信號和非靜態分量信號的兩個濾波器計算裝置370-1、370-2,在第七圖所示的實施例中,還向兩個濾波器計算裝置370-1、370-2提供了麥克風信號的頻譜和回聲估計濾波器的濾波器係數。因此,這兩個濾波器計算裝置370不僅實現了如結合第二圖至第五圖的實施例所解釋的實際的濾波器計算功能,而且也實現了第二回聲估計濾波器260中包含的功能。
如結合第五圖A也示出的,兩個濾波器計算裝置370(在第七圖中也被稱為ERF(回聲去除濾波器))均耦合至組合裝置380,在第七圖中將組合裝置380稱為FC(濾波器組合)。所述組合裝置380將從兩個濾波器計算裝置獲得的濾波器係數進行組合,以產生自適應濾波器210的濾波器係數。
相應地,如結合第二圖和第五圖所討論的實施例所示,組合裝置380耦合至自適應濾波器210,在第七圖中將自適應濾波器210稱為SM(頻譜修正)。所述自適應濾波器210基於也對其可用的麥克風信號y[n]的頻譜表示Y[k,m]來執行相關聯的頻譜修正,以衰減或抑制麥克風信號中包含的回聲。
最後,自適應濾波器210耦合至頻率/時間轉換裝置300,頻率/時間轉換裝置300是逆短時傅立葉變換單元(ISTFT)。頻率/時間轉換裝置300在時域中輸出回聲消除後的信號e[n]。
採取例如相同於第七圖所示的相應方法或設備200形式的本發明的實施例,能夠減小由於自適應濾波器210的頻譜修正而引入的偽像的數目。換言之,因此,本發明的實施例能夠對其進行功率控制。當僅存在遠端話音時,回聲抑制處理應當充分強烈,不允許任何信號通過,因此,在這種情況下,可能不需要將非靜態和靜態信號和分量信號分離。出於這種原因,在這種情況下,通過檢測剛剛描述的情況來相應地適配等式(6)中的控制參數βx 是可取的,該控制參數正好控制或至少影響從揚聲器信號中減去的靜態分量信號的幅度。
當揚聲器信號僅輸出遠端話音時,為了在這些情況之間進行區分,計算兩個不同的參數。這首先包括所謂的預測增益,該預測增益與揚聲器聲道和麥克風聲道之間的相干函數的全頻帶平均相對應。第二個參數使用揚聲器聲道內的語音活動性,例如,可以從揚聲器信號的時間信號電平的比較或從例如適於語音傳送的編解碼器專用的編解碼器專用參數導出該語音活動性。這些編解碼器包括例如基於LPC的編解碼器或基於CELP的編解碼器(CELP=碼激勵線性預測或碼本激勵線性預測),術語編解碼器(codec)是由英文術語編碼器(coder)和解碼器(decoder)的縮寫組合而成的人造詞。
預測增益或回聲預測增益ω[k]描述了麥克風信號和延遲的揚聲器信號之間的相似程度。基於揚聲器信號的延遲的功率譜|Xd [k,m]|2 與麥克風信號的功率譜|Y[k,m]|2 之間的平方相干函數,根據以下等式來執行預測增益ω[k]的計算:
其中E{...}表示數學期望值。在相干函數Γd [k,m]的短時估計的環境中,可以根據以下等式,通過計算或逼近期望值來獲得所述數學期望值:
因數α確定了估計隨時間的平滑度。由於等式(15)與指數衰落大致對應,因此該因數具有相關聯的時間常數。以秒表示的該指數衰落的時間常數Tα 近似為:
其中fs 表示採樣頻率。換言之,比例關係式(16)示意了與採樣率fs 相關的實際上無量綱的因數(這裏是α)如何被表示為時間常數(這裏是Tα )。
然後,根據以下等式,將預測增益ω[k]計算為相干函數Γd [k,m]在頻率(由索引m=0,...,M-1表示)上的均值:
其中M表示頻帶的數目。
接近于1的回聲增益因數意味著可以基於延遲的揚聲器信號來(幾乎)完全預測麥克風信號。因此,麥克風信號僅包含遠端話音的可能性趨近與1。然後,可以相對于預測增益ω來控制控制參數βx 。任何時候當預測增益較高時,僅存在遠端話音,回聲衰減應當充分強烈以去除所有(回聲)信號。因此,將雜訊保持在非靜態路徑內,並使用以分貝(dB)為單位的最低限制值Ls 來去除雜訊,其中控制參數選擇為βxw =0。任何時候當預測增益較低時,可能存在遠端和近端話音,因此,回聲抑制應較不強烈,以不引入偽像。在這種情況下,處理雜訊使其通過靜態路徑,並使用以分貝(dB)為單位的限制值Lw 來去除雜訊。此外,在這種情況下,使用控制參數βxw
然而,在這種情況下應當注意,如果揚聲器信號僅包含由麥克風拾取的雜訊而不存在話音,則預測增益可能較高。為了防止在這種情況下將控制參數βx 的值選擇得過大(這可能導致過度抑制),使用第二控制參數,即揚聲器聲道內的語音活動性。因此,實際上,僅當在揚聲器聲道內話音為活動時,上述用於根據預測增益ω來計算控制參數βx 的規則才適用。
在第七圖所示的實施例中,使用計算裝置270,更具體地,使用兩個濾波器計算裝置370和組合裝置380來執行等式(14)至(17)所述的這種功能。自然,在第二圖至第五圖所描述的實施例的環境中,相應的實現方式也是可能的:其中計算裝置270可以不僅具有經由輸入280向其提供的麥克風信號(在第二圖中可選地繪出),也具有經由輸入220向其提供的可能未修正的揚聲器信號。
為了更詳細地示意本發明的實施例的操作模式,以下結合第八圖至第十圖來描述信號處理。第八圖示出了揚聲器信號中的靜態分量和非靜態分量的分離或提取。在部分圖示(a)中,第八圖示出了在1kHz頻率處的揚聲器功率譜,並將其繪製為約5s至約7.5s範圍內的時間的函數。這裏,部分圖示(c)的橫坐標應用於所有三個部分圖示(a)至(c)。部分圖示(b)示出了非靜態分量的相應功率譜,而部分圖示(c)反映了靜態分量的相應功率譜。
在部分圖示第八圖(a)中的相關聯的功率譜包括較高成分的每種情況下,部分圖示第八圖(b)中所示的非靜態分量或相關聯的非靜態分量信號也包括相應較高的值。然而,在這些範圍之間的區域中,非靜態分量幾乎完全消失。
相反,與第八圖(b)的非靜態分量相比,通過根據等式(7)的浮動、遞迴平均來確定的靜態分量表現出了在幅度上明顯更小的值,而且表現出了由於浮動平均而明顯更加平滑的曲線。具體地,第八圖(c)中的靜態分量和/或在從約6.4s開始的時間段中的相關聯的靜態分量信號表現出結合比例關係式(16)也提到過的指數或類似指數的下降。這裏,這種衰落是由於以下事實:在這個範圍中,第八圖(a)中的功率譜不再包括由於相應的話音信號造成的較高的值。超過靜態分量的頻譜成分相應地下降。
基於第八圖所示的資料,第九圖描述了相關聯的回聲去除濾波器。更具體地,第九圖示出了針對1kHz頻率的兩個相關聯的回聲去除濾波器曲線Hs 和Hw ,這些曲線是基於等式(12)和(13)來計算的。部分圖示第九圖(a)示出了用於1kHz頻率處的非靜態分量的回聲去除濾波器Hs ,所述濾波器是根據等式(12)來計算的。部分圖示(b)示出了根據等式(13)的用於靜態分量的相應回聲去除濾波器Hw
第十圖所示的是基於相同的資料,然而,如部分圖示第十圖(c)的橫坐標所示,在更大的時間規模上繪出了該資料,部分圖示第十圖(c)的橫坐標也適用於部分圖示(a)和(b)。第十圖中,在部分圖示第十圖(a)中示意了控制參數βx 的強度與靜態/非靜態分離之間的關係,在部分圖示第十圖(b)中示意了預測增益ω的強度,並在部分圖示第十圖(c)中示意了揚聲器聲道的語音活動性。
更具體地,如在以上描述中介紹的,第十圖示意了控制參數βx 和兩個控制參數ω和語音活動性之間的關係。第十圖下的仿真的第一個三分之一與僅存在遠端話音的情況相對應,該情況的特徵在於具有較高的預測增益。在這種情況下,將控制參數βx 設置為值βxw =0,從而以較強烈的方式來抑制非靜態分量,並也抑制靜態分量,以便不允許任何信號通過。
該仿真的第二個三分之一與僅在遠端存在話音的情況相對應,可以通過較低的預測增益ω以及在揚聲器信號中缺少語音活動性來識別和檢測出該情況。然後,將控制參數βx 選擇為較大,以允許所有靜態分量通過靜態路徑並以盡可能小的強烈性來去除靜態分量,從而不引入任何偽像。該仿真的最後三分之一與雙向通話(double-talk)的情況相對應,在雙向通話中,控制參數βx 的範圍在任何時候在揚聲器聲道中存在語音活動性時的低值和未檢測到語音活動性時的較大值之間。
例如,在第六圖(也可以被認為是根據本發明的相應實施例的總體流程圖)所示的目前已經描述的本發明的實施例中,不是通過對相應的揚聲器信號進行分離,而是通過對總回聲信號進行估計來實現靜態和非靜態回聲分量的分別抑制。
在本發明的這些實施例中,根據等式(8),通過將回聲估計濾波器G[k,m]或G[k,m]2 應用至揚聲器功率譜的延遲版本來實現回聲信號的功率譜的估計,其中表示回聲的功率譜的估計,所述估計包含在麥克風信號中。根據等式(3)將揚聲器功率譜分離為靜態分量和非靜態分量導致:由等式(10)給出了源自非靜態的揚聲器信號分量的回聲,由等式(9)給出了源自靜態揚聲器信號分量的回聲。
使用非靜態和靜態回聲估計,可以計算相應的回聲去除濾波器Hs [k,m]和Hw [k,m]。然後,將這些回聲去除濾波器組合,並應用至麥克風信號,以抑制回聲信號,根據以下等式來進行該處理:
E[k,m]=H[k,m]Y[k,m], (18)
其中H[k,m]由以下等式給出:
H[k,m]=combination(Hs [k,m],Hw [k,m])。(19)
對不同的回聲去除濾波器Hs [k,m]和Hw [k,m]進行組合的一種可能性是根據等式(11)來使用上述兩者的乘積,這與將兩個濾波器串聯連接相對應。
另一種可能性是根據以下等式來使用回聲去除濾波器的相應最小值:
E[k,m]=min(Hs [k,m],Hw [k,m])Y[k,m] ,(20)
其中,函數min(...)表示相應值的最小值。換言之,在這種情況下,適用以下關係:combination(...)=min(...)。
如上所述,例如,可以在組合裝置380中,也可以在選擇裝置390或分配點410中執行這些計算。此外,例如,也可以在相應裝置中執行基於線性組合或非線性等式的各個抑制濾波器的更複雜的組合和計算。類似地,可以不以逐帶通信號的方式,而是基於帶通信號組,或以相同方式對所有帶通信號執行相應組合。
通過以這種組合的方式來實現回聲去除濾波器,可以對不同的回聲分量引入不同的增益。根據等式(12)來計算非靜態回聲去除濾波器,而根據等式(13)來計算靜態回聲去除濾波器。
通常,不是基於根據等式(12)和(13)的回聲去除濾波器的直接應用,而是基於相應的時間平滑的版本來執行實際的回聲抑制。如在上述設計參數的情況下一樣,也可以針對非靜態和靜態回聲抑制分別手動調整時間平滑參數。按照這種方式,由於對靜態雜訊分量的抑制的要求與對非靜態話音分量的抑制的要求不同,因此可以進一步提高感知的音頻品質。
例如,眾所周知,在要抑制靜態信號分量的情況下使用更強的平滑是可取的,以避免所謂的音樂音調。另一方面,要確保被應用至非靜態回聲去除濾波器的平滑偏愛較小的值,以充分抑制源自回聲路徑的較長成分或是回聲路徑的長拖尾的回聲。然而,這不應損害在回聲水準快速改變的情況下的抑制行為。這種定性討論清楚地示出了根據等式(12)和(13)的兩個不同的回聲去除濾波器的獨立適配和優化的必要性。
以下將描述根據本發明採取方法和/或裝置形式的另一實施例的另一措施,其中,將分離的回聲去除濾波器應用至靜態信號分量和非靜態信號分量。第十一圖示出了包括相應自適應濾波器210的設備200的相應框圖。由於大量的結構相似性,以下將尤其參考第二圖至第五圖和第六圖和第七圖所示的實施例的描述。
根據本發明的實施例的設備200再次包括揚聲器100或揚聲器100的端子或相應揚聲器信號x[n]的輸入。在被稱為DFT(離散傅立葉變換)的時間/頻率轉換裝置230的環境中,將所述揚聲器信號x[n]變換為揚聲器信號的頻譜表示X[k,m]。將所述揚聲器信號提供給延遲裝置480,延遲裝置480產生其延遲版本X[k-d(k,m),m],其中d(k,m)為相應的延遲值。
然後,將延遲裝置480延遲後的信號提供給第一回聲估計濾波器240,第一回聲估計濾波器240基於濾波器係數G[k,m]來產生回聲估計信號。將所述回聲估計信號提供給提取裝置250,提取裝置250基於該估計的回聲信號的頻譜係數,產生該信號的非靜態和靜態功率譜作為揚聲器信號的(導出的)分量信號。因此,提取裝置250將信號輸出至計算裝置270。
麥克風110的麥克風信號y[n]也被提供給時間/頻率轉換裝置290,時間/頻率轉換裝置290被配置為DFT,從時間信號y[n]產生時間信號y[n]的頻譜表示Y[k,m]。經由能量值計算裝置490來提供該信號,能量值計算裝置490基於麥克風信號的頻譜分量,通過對各個值的(絕對)幅度求平方來確定所述頻譜分量的功率譜。所獲得的功率譜也被提供給計算裝置270,與上述功率譜一起,計算裝置270計算兩個回聲去除濾波器Hs [k,m]和Hw [k,m]以及實際自適應濾波器H[k,m]的濾波器係數,並將其轉發給自適應濾波器210。
自適應濾波器210也耦合至時間/頻率轉換裝置290的輸出,因此也接收麥克風信號y[n]的頻譜分量Y[k,m],自適應濾波器210考慮濾波器係數H[k,m],根據該頻譜分量Y[k,m]來產生頻域或與頻率相關的域中的回聲抑制後的信號E[k,m]。然後,將該回聲抑制後的信號提供給頻率/時間轉換裝置300,頻率/時間轉換裝置300被配置為IDFT(逆DFT),頻率/時間轉換裝置300最終將該信號轉換回時域。
為了確定延遲裝置480的延遲值d(k,m),並為了確定回聲估計濾波器240的回聲估計濾波器係數,將揚聲器信號的頻譜表示X[k,m]和麥克風信號的頻譜表示Y[k,m]均發送至相應的能量計算裝置500、510,能量計算裝置500、510耦合至兩個時間/頻率轉換裝置230、290的輸出。能量計算裝置500耦合至時間/頻率轉換裝置230的輸出,能量計算裝置510耦合至頻率/時間轉換裝置300的輸出。
與能量值計算裝置490類似,能量計算裝置500、510中的每一個通過對相應頻譜分量的幅度求平方來計算功率譜,並將這些值提供給另一計算裝置520。然後,另一計算裝置520基於對其可用的值來確定延遲d(k,m)的估計以及回聲估計濾波器240的濾波器係數G[k,m]的值。然後,將上述相應值一方面發送至延遲裝置480,另一方面發送至回聲估計濾波器240,另一計算裝置520與延遲裝置480和回聲估計濾波器240耦合。
因此,從第十一圖所示的實施例中可以看出,可以基於回聲信號頻譜的估計來執行相應分量信號的分離,是根據以下等式來計算的:
在回聲估計濾波器240中進行該計算。
根據等式(12)和(13)的兩個回聲去除濾波器Hs [k,m]和Hw [k,m]的定義保持不變。組合的回聲去除濾波器H[k,m]的確定也保持不變。
因此,第十一圖中描述的另一種方法或相關聯的設備200是基於以下假設:估計的回聲信號中的靜態和非靜態回聲分量也是不相關的,使得:
然後,通過從估計的回聲信號的功率譜中減去回聲估計中的靜態分量的估計,可以確定靜態回聲分量的估計的功率譜。因此有:
實際上,根據以下等式,通過對估計的回聲信號的功率譜進行濾波來估計信號
採用與增益濾波器Fx [k,m]或Fx [k,m]2 類似確定的另一濾波器Fy [k,m]或其平方Fy [k,m]2 作為濾波器,因此在此不對其進行詳細討論和解釋。提取裝置250也基於相應的導出的信號來執行該功能。
在此應注意,第十一圖所示的實施例涉及回聲信號的估計的頻譜已經可用的情況。當然,相應的方法也能夠適用於在僅已知根據等式(8)的估計的回聲信號的估計的功率信號的情況。將結合第十二圖所示的實施例來更詳細地描述這種情況。
第十一圖示出了聲學回聲衰減措施的框圖,其中基於估計的回聲頻譜來應用靜態和非靜態回聲分量的分離,而第十二圖中所示的框圖示意了一種類似的措施。然而,相反地,後者是基於如下聲學回聲衰減措施:基於回聲信號的估計的功率譜來應用靜態和非靜態回聲分量的分離。
因此,第十一圖和第十二圖所示的兩個實施例不僅操作模式非常相似,而且,如以下描述所示,其結構也非常相似。
更具體地,第十二圖所示的實施例與第十一圖所示的實施例的本質區別在於,能量計算裝置500不再專門地連接在另一計算裝置520的上游以用於被轉換至頻域的揚聲器信號x[n],而是直接連接至時間/頻率轉換裝置230(仍被配置為DFT)的輸出。按照這種方式,不僅不再向另一計算裝置520提供實際的頻譜分量,而且也不再向延遲裝置480、回聲估計濾波器240和提取裝置250提供實際的頻譜分量,而是向它們提供實際的頻譜分量的功率譜。
然而,除此之外,第十一圖和第十二圖中所示的兩個實施例的區別僅在於,在各個元件和裝置中,可能或多或少以不同的方式來進行相應的計算。例如,不再在提取裝置250中執行對各個頻譜分量的與能量相關的值的相應計算,這是由於能量值計算裝置500先前已經執行了該計算。
第十三圖示出了本發明的另一實施例,其中,例如向相應設備200提供了多於一個揚聲器信號或多於一個麥克風信號。換言之,第十三圖所示的實施例是一種多聲道裝置。
儘管以上討論和描述的本發明的實施例僅針對單獨聲道或單個聲道的情況,其中僅有一個揚聲器信號和一個麥克風信號可用,但是,如以下所解釋的,本發明的實施例不局限於單獨聲道的情況。類似地,所述實施例也可以應用至具有多聲道能力的聲學回聲衰減系統。
由於第十三圖所示的設備200的實施例在結構上與第二圖所示的實施例非常相似,因此,在操作模式、連接和其他方面,以下參照結合第二圖至第五圖的描述。
第十三圖所示的設備200的多聲道變型包括多個輸入220-1、220-2……,若干揚聲器信號可以從這些輸入耦合入設備200。相應地,設備200也包括可選的多個相應的時間/頻率轉換裝置230-1、230-2……,如結合第二圖已經詳細闡述的,這些時間/頻率轉換裝置可以執行將相應揚聲器信號從時域向與頻率相關的域的變換或轉換。
多個時間/頻率轉換裝置230耦合至捆綁(bundling)裝置530的相應數目的輸入,捆綁裝置530基於輸入的揚聲器信號來形成公共的、導出的揚聲器信號,然後,根據可選的第一回聲估計濾波器240是否存在來將其轉發至第一回聲估計濾波器240或提取裝置250。如結合第二圖所示的實施例已經描述的,提取裝置250可以耦合至可選的第二回聲估計濾波器260或直接耦合至計算裝置270。所述裝置最終在其輸出處輸出計算後的濾波器係數。
與第二圖所示的實施例不同,第十三圖中的設備200的多聲道變型還包括另一捆綁裝置540,該另一捆綁裝置540的輸入側經由可選的時間/頻率轉換裝置290-1、290-2……耦合至用於相應麥克風信號的相應數目的輸入280-1、280-2……。與捆綁裝置530類似,另一捆綁裝置540基於存在于時域或與頻率相關的域中並對其可用的麥克風信號來確定導出的、有效的或公共的麥克風信號,可選地,該導出的、有效的或公共的麥克風信號對提取裝置250或對計算裝置270可用。
第十三圖所示的設備200的多聲道變型還包括用於每個麥克風信號或每個麥克風信號輸入280的自適應濾波器210-1、210-2……,所述自適應濾波器210-1、210-2……可能經由可選的時間/頻率轉換裝置290-1、290-2……耦合至相應的輸入280-1、280-2……。相應地,自適應濾波器210-1、210-2……可能經由多個可選的頻率/時間轉換裝置300-1、300-2……分別耦合至輸出310-1、310-2……。自適應濾波器210濾波後的輸出信號是回聲清除或頻譜修正後的信號,然後,該信號在所述輸出310處對設備200可用。
自適應濾波器210-1、210-2……都並行地耦合至計算裝置270的輸出,所述計算裝置270在該輸出處提供自適應濾波器的濾波器係數。換言之,在如第十三圖所示的本發明的實施例中,從功能的觀點來看,使用相同的自適應濾波器,即基於相同的濾波器係數,對多個麥克風信號中的所有麥克風信號進行濾波,以獲得相應麥克風信號的頻譜修正或回聲消除後的版本。
因此,如果x1 [n]是第1個揚聲器的信號,其中1是從0至L-1範圍內的整數,L表示不同揚聲器或揚聲器信號的數目,與等式(1)類似,可以根據以下等式引入相同的模型:
x1 [n]=xs,1 [n]+xw,1 [n], (25)
其中xs,1 [n]對第1個揚聲器信號中包含的非靜態話音的成分進行調製,xw,1 [n]對第1個揚聲器信號中包含的靜態雜訊的成分進行調製。根據等式(2),等式(25)的STFT域表示由以下等式給出:
x1 [k,m]=xs,1 [k,m]+xw,1 [k,m]。(26)
然後,在第十三圖所示的捆綁裝置530中,根據以下等式,通過將各個揚聲器信號的頻譜進行組合來計算所有揚聲器聲道的公共的、捆綁的功率譜:
其中L表示揚聲器聲道的數目。然後針對根據等式(27)的公共的或捆綁的功率譜,執行根據等式(5)和(7)的非靜態和靜態信號分量的分離。
與此類似,也根據以下等式來計算麥克風聲道的公共的或捆綁的功率譜:
其中,Yp [k,m]表示第p個麥克風110的信號,P表示麥克風的數目。索引p仍是從0至P-1範圍內的整數。在第十三圖所示的實施例中,可以由另一捆綁裝置540來執行該計算。
如在本說明書的之前段落中所解釋的,為了確定根據等式(12)和(13)的兩個回聲去除濾波器,在其他演算法步驟的過程中使用根據等式(27)的揚聲器(功率)頻譜|X[k,m]2 和根據等式(28)的麥克風(功率)頻譜|Y[k,m]2 。也可以基於根據等式(27)和(28)的公共的或捆綁的頻譜來執行結合根據等式(14)至(17)的性能控制而描述的控制參數βx 的確定。
然後,對每個麥克風信號獨立地執行頻譜修正環境內的實際回聲抑制,但是,根據以下等式,對每個麥克風信號使用相同的回聲去除濾波器210:
Ep [k,m]=Hs [k,m]Hw [k,m]Yp [k,m] (29)
其中p=0,1,...,P-1。與此類似,如以上所解釋的,也可以以不同的方式來實現回聲去除濾波器210,例如以與等式(19)類似的方式來實現。
在此值得注意的是,例如,如第十三圖所示,在設備200的多聲道變型的環境中,揚聲器信號的數目L和麥克風信號的數目P應當彼此相同和不同。原則上,針對揚聲器信號和麥克風信號,可以提供任意數目的輸入。此外,向多個揚聲器信號輸入和多個麥克風信號輸入提供相應的捆綁裝置530、540不是絕對必要的。在本發明的實施例中,很可能僅對相應捆綁裝置530實現多個揚聲器信號輸入,而無需對相應的另一捆綁裝置540實現多於一個麥克風信號輸入。例如,當由於經由包括若干揚聲器的聲音系統(例如可以在汽車中實現)來重現遠端用戶的通信信號,因而有單個麥克風但有多個揚聲器時,可以採用這樣的系統。
此外,例如在會議系統的環境中,當僅實現了一個中心揚聲器,而多個說話者中的每一個都具有對其可用的麥克風時,不必可能地對相應捆綁裝置530實現揚聲器信號的多於一個的輸入。在這種情況下,僅實現另一捆綁裝置540可能是可取的。
此外,在此值得注意的是,捆綁裝置530、540自然可能被配置為使得其是為比實際向其提供的更多的揚聲器信號和麥克風信號而設計的。相應地,設備200可以包括比實際使用的更多的相應輸入220、280。在這種情況下,例如,上游電路(如可選的時間/頻率轉換裝置230、290或捆綁裝置530、540本身)可以確定活動聲道的數目並相應地選擇參數L和P。當然,也可以實現從外部提供要列入考慮的聲道數目和可能的麥克風和揚聲器信號的數目。
在此也應注意,如果將相應參數L和P發送給捆綁裝置530、540,第十三圖所示的實施例自然也可以在僅有單個揚聲器信號和單個麥克風信號的情況下工作。原則上,等式(27)和(28)也適用於P=1和/或L=1的情況。因此,第十三圖所示的實施例表示了第二圖所示的實施例的“向下相容”的擴展。
關於頻率解析度,與STFT的頻率解析度偏離可能是可取的。STFT的均勻頻譜解析度不能很好適合於人類感知。因此,有利地,如也在參考文獻[9]中示出的,將均勻間隔的係數|X[k,m]|2 和|Y[k,m]|2 分組為多個非重疊分區或組,這些分區或組包括對例如在參考文獻[10]中所述的人類聽覺系統的頻率解析度進行模仿的帶寬。
如參考文獻[10]所述,對於16kHz的採樣率,512個樣本和15個組或分區的STFT的DFT塊長度是一種合適的選擇,其中每個分區具有大致與等效矩形帶寬(ERB)的兩倍相對應的帶寬。這些頻帶與如第十四圖中所示的分區相對應。
第十四圖示出了如何將均勻STFT頻譜的頻譜係數分組或劃分為分區或組以模仿人類聽覺系統的非均勻頻率解析度。第十四圖所示的頻率軸從0Hz延伸至約8000Hz,這與基於16kHz採樣頻率的有效頻帶相對應。
僅對每個組的中心頻率來計算不同的增益濾波器。此外,與均勻STFT的全頻譜解析度的情況相比,這還帶來了計算複雜度的降低。在對均勻STFT信號頻譜應用最後的分區或組增益濾波器之前,使用Hann插值濾波器對所述STFT信號頻譜進行插值。
第十五圖(a)示出了用於在頻率上對增益濾波器進行平滑的相應Hann插值濾波器。第十五圖(b)以實線示出了增益濾波器係數,可以通過在各個分區中對增益濾波器的值進行插值來獲得這些係數,對所述增益濾波器的值而言,在第十五圖(b)中使用黑體的點來示出了所述增益濾波器的值。
第十五圖中的部分圖示(a)精確描述了這些Hann濾波器,而部分圖示(b)示出了在插值之前和之後增益濾波器值的示例。第十五圖(b)中所示點表示插值之前的值,而實線與插值之後的所述值相對應。增益濾波器的頻率平滑導致所產生的頻譜作為頻率的函數具有更平滑的變化,從而減小了音樂音調和其他偽像。
如之前對本發明的實施例的描述所示,作為簡要概括,在一些情況下,本發明的實施例包括功能單元,所述功能單元包括以下步驟。本發明的實施例執行:接收至少一個揚聲器信號;接收至少一個麥克風信號;將揚聲器信號和麥克風信號轉換為短時頻譜;計算相應的揚聲器和麥克風的功率譜;將揚聲器功率譜提取或分離為靜態和非靜態功率譜;使用靜態揚聲器功率譜來計算回聲去除增益濾波器;使用非靜態揚聲器功率譜來計算回聲去除增益濾波器;將增益濾波器應用至麥克風頻譜以抑制回聲;以及將回聲抑制後的麥克風頻譜轉換回時域。
根據環境,可以以硬體或軟體形式來實現本發明方法的實施例。實現方式可以在數位儲存介質上進行,尤其是具有電可讀的控制信號的盤、CD或DVD,其可以與可編程電腦系統交互,以執行本發明方法的實施例。一般地,因此,本發明的實施例也在於具有程式碼的軟體程式產品或電腦程式產品或程式產品,所述程式碼儲存在機器可讀載體上,當軟體程式產品在電腦或處理器上執行時,所述程式碼執行本發明方法的實施例。換言之,因此,本發明的實施例可以被實現為具有程式碼的電腦程式或軟體程式或程式,當程式在處理器上執行時,所述程式碼執行本方法。處理器可以包括電腦、晶片卡(智慧卡)、集成系統(SOC=片上系統)、專用積體電路(ASIC)或其他積體電路(IC)。
參考文獻
[1] C. Breining,P. Dreiseitel,E. Hnsler,A. Mader,B. Nitsch,H. Puder,T. Schertler,G. Schmidt,and J. Tilp. Acoustic echo control. IEEE Signal Processing Magazine,16(4):42-69,July 1999.
[2] A. N. Birkett and R. A. Goubran. Limitations of handsfree acoustic echo cancellers due to nonlinear loudspeaker distortion and enclosure vibration effects. In Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics,pp. 13-16,New Paltz,Oct. 1995.
[3] G. Schmidt and E. Hnsler. Acoustic echo and noise control:a practical approach. Hoboken:Wiley,2004.
[4] W. L. B. Jeannes,P. Scalart,G. Faucon,and C. Beaugeant. Combined noise and echo reduction in hands-free systems:a survey. IEEE Transactions on Speech and Audio Processing,9(8):808-820,Nov. 2001.
[5] C. Faller and J. Chen. Suppressing acoustic echo in a sampled auditory envelope space. IEEE Trans. on Speech and Audio Proc.,13(5):1.048-1.062,Sept. 2005.
[6] C. Faller and C. Tournery. Estimating the delay and coloration effect of the acoustic echo path for low complexity echo suppression. In Proc. Intl. Works. on Acoust. Echo and Noise Control(IWAENC),Sept. 2005.
[7] W. Etter and G. S. Moschytz. Noise reduction by noise-adaptive spectral magnitude expansion. J. Audio Eng. Soc.,42:341-349,May 1994.
[8] O. Capp' e. Elimination of the musical noise phenomenon with the ephrain and malah noise suppressor. IEEE Trans. Speech and Audio Processing,2(2):345-349,April 1994.
[9] C. Faller and F. Baumgarte. Binaural Cue Coding-Part II:Schemes and applications. IEEE Trans. on Speech and Audio Proc.,11(6):520-531,Nov. 2003.
[10] B. R. Glasberg and B. C. J. Moore. Derivation of auditory filter shapes from notched-noise data. Hear. Res.,47:103-138,1990.
100...揚聲器
110...麥克風
120...聲學環境
130...揚聲器信號
140...麥克風信號
150...回聲去除處理單元
160...回聲抑制後的信號
170...直接路徑
180...間接路徑
200...裝置
210...自適應濾波器
220...輸入
230...時間/頻率轉換裝置
240...回聲估計濾波器
250...提取裝置
260...回聲估計濾波器
270...計算裝置
280...輸入
290...時間/頻率轉換裝置
300...頻率/時間轉換裝置
310...輸出
320...平均裝置
330...增益濾波器
340...參數計算裝置
350...分配裝置
360...濾波器級
370...濾波器計算裝置
380...組合裝置
390...選擇裝置
400...參數確定裝置
410...分配點
420...曲線
430...曲線
440...大括弧
450...大括弧
460...箭頭
470...回聲估計濾波器裝置
480...延遲裝置
490...能量值計算裝置
500...能量值計算裝置
510...能量值計算裝置
520...另一計算裝置
530...捆綁裝置
540...另一捆綁裝置
第一圖示出了聲學回聲去除問題的一般設置;
第二圖示出了根據本發明的實施例的用於計算濾波器係數的設備的框圖;
第三圖A至第三圖C示出了根據本發明的實施例的不同的提取裝置的框圖;
第四圖A和第四圖B示出了根據本發明的實施例的可選的回聲估計濾波器的框圖;
第五圖A至第五圖E示出了根據本發明的各種實施例的計算裝置的框圖;
第六圖示出了根據本發明的另一實施例的框圖;
第七圖示出了採取用於計算濾波器數的設備的形式的本發明的另一實施例的框圖;
第八圖(a)至第八圖(c)示意了揚聲器信號中的靜態分量和非靜態分量的分離;
第九圖(a)示出了用於在1kHz頻率處的非靜態分量的回聲抑制濾波器;
第九圖(b)示出了用於信號的靜態分量的相關聯的回聲抑制濾波器;
第十圖(a)至第十圖(c)示意了靜態分量和非靜態分量的強度之間的關係、預測增益以及揚聲器聲道的語音活動性;
第十一圖示出了本發明的另一實施例的框圖;
第十二圖示出了本發明的另一實施例的框圖;
第十三圖示出了用於多聲道實現的本發明的實施例的框圖;
第十四圖示出了將均勻的短時傅立葉變換頻譜分組為多個組,以模仿人類聽覺系統的非均勻頻率解析度的示意圖;
第十五圖(a)示出了用於在頻率上對增益濾波器進行平滑的Hann插值濾波器;以及
第十五圖(b)示出了增益濾波器係數的過程及其插值後的曲線。
200...裝置
210...自適應濾波器
220...輸入
230...時間/頻率轉換裝置
240...回聲估計濾波器
250...提取裝置
260...回聲估計濾波器
270...計算裝置
280...輸入
290...時間/頻率轉換裝置
300...頻率/時間轉換裝置
310...輸出

Claims (24)

  1. 一種用於計算自適應濾波器(210)的濾波器係數的設備(200),所述自適應濾波器(210)用於對麥克風信號進行濾波,以抑制由揚聲器信號導致的回聲,所述設備包括:提取裝置(250),用於從揚聲器信號或從由揚聲器信號導出的信號提取靜態分量信號或非靜態分量信號;以及計算裝置(270),用於基於所提取的靜態分量信號或所提取的非靜態分量信號來計算自適應濾波器(210)的濾波器係數。
  2. 依據申請專利範圍第1項所述的設備(200),其中,所述提取裝置(250)被配置為:基於揚聲器信號或所導出信號的帶通信號的能量相關值的平均來提取靜態分量信號。
  3. 依據申請專利範圍第2項所述的設備(200),其中,所述提取裝置(250)被配置為以如下形式來執行所述平均:對所述帶通信號所基於的當前資料塊的值、並僅對在時間上位於所述當前資料塊之前的至少一個資料塊的值進行浮動平均。
  4. 依據申請專利範圍第2項所述的設備(200),其中,所述提取裝置(250)被配置為以如下形式來執行所述平均:根據當前資料塊的能量相關值與之前的資料塊的能量相關值或之前獲得的平均的值之間的比較,基於不同的計算規定來進行浮動平均。
  5. 依據申請專利範圍第3項所述的設備(200),其中,所述提取裝置(250)被配置為:基於根據加法參數來進行的當前資料塊的能量相關值與之前計算的平均的值的相加,執行浮動平均的遞迴計算;所述加法參數在當前資料塊的能量相關值大於之前確定的平均的值的情況下比在當前資料塊的能量相關值小於之前確定的平均的值的情況下更小。
  6. 依據申請專利範圍第1項所述的設備(200),其中,所述提取裝置(250)被配置為基於揚聲器信號或所導出信號的帶通信號來提取非靜態分量信號。
  7. 依據申請專利範圍第1項所述的設備(200),其中,所述提取裝置(250)被配置為:基於靜態分量信號和增益濾波器來提取非靜態分量信號。
  8. 依據申請專利範圍第7項所述的設備(200),其中,所述提取裝置(250)被配置為使得所述增益濾波器依賴於可變或不可變的控制參數。
  9. 依據申請專利範圍第8項所述的設備(200),其中,所述提取裝置(250)被配置為基於相干函數來確定增益濾波器的控制參數,所述相干函數基於揚聲器信號或從揚聲器信號導出的信號並基於麥克風信號或從麥克風信號導出的信號。
  10. 依據申請專利範圍第9項所述的設備(200),其中,所述提取裝置(250)被配置為:基於相干函數在揚聲器信號或從揚聲器信號導出的信號的多個帶通信號上以及在麥克風信號或從麥克風信號導出的信號的多個帶通信號上的平均值來確定所述控制參數。
  11. 依據申請專利範圍第1項所述的設備(200),其中,所述設備(200)還包括捆綁裝置(540),所述捆綁裝置(540)用於對多個麥克風信號進行捆綁,以獲得捆綁的麥克風信號作為所述麥克風信號或作為所導出的麥克風信號。
  12. 依據申請專利範圍第1項所述的設備(200),其中,所述提取裝置(250)被配置為輸出靜態分量信號和非靜態分量信號,所述計算裝置(270)被配置為基於靜態分量信號來計算第一濾波器係數並基於非靜態分量信號來計算第二濾波器係數,所述計算裝置(270)還被配置為基於第一和第二濾波器係數來確定濾波器係數。
  13. 依據申請專利範圍第12項所述的設備(200),其中,所述提取裝置(250)被配置為計算濾波器係數,使得所述濾波器係數與第一濾波器和第二濾波器的串聯連接相對應,所述第一濾波器係數與所述第一濾波器相對應,所述第二濾波器係數與所述第二濾波器相對應。
  14. 依據申請專利範圍第1項所述的設備(200),其中,所述提取裝置(250)被配置為輸出靜態分量信號和非靜態分量信號,所述計算裝置(270)被配置為基於靜態分量信號來計算第一濾波器係數並基於非靜態分量信號來計算第二濾波器係數,所述計算裝置還被配置為基於第一濾波器係數或基於第二濾波器係數來確定濾波器係數。
  15. 依據申請專利範圍第14項所述的設備(200),其中,所述計算裝置(270)被配置為:基於與較高的衰減水準相對應的第一濾波器係數或第二濾波器係數的濾波器係數來確定濾波器係數。
  16. 依據申請專利範圍第1項所述的設備(200),其中,所述提取裝置(250)被配置為提供靜態分量信號或非靜態分量信號以及控制資訊信號,所述控制資訊信號包括與輸出的分量信號相關的資訊,所述計算裝置(270)被配置為:基於所述提取裝置(250)輸出的信號、基於從所述提取裝置(250)輸出的信號導出的信號、以及基於所述控制資訊信號中包括的資訊,來計算濾波器係數。
  17. 依據申請專利範圍第16項所述的設備(200),其中,所述提取裝置(250)被配置為:根據靜態分量信號的能量相關值與非靜態分量信號的能量相關值之間的關係,向所述計算裝置(270)輸出靜態分量信號或非靜態分量信號。
  18. 依據申請專利範圍第1項所述的設備(200),其中,所述提取裝置(250)被配置為提取靜態分量信號或非靜態分量信號作為估計的信號。
  19. 依據申請專利範圍第1項所述的設備(200),其中,所述提取裝置(250)被配置為輸出靜態分量信號和非靜態分量信號。
  20. 依據申請專利範圍第1項所述的設備(200),還包括自適應濾波器(210),以基於所述濾波器係數來對麥克風信號進行濾波。
  21. 依據申請專利範圍第1項所述的設備(200),還包括捆綁裝置(540)和多個自適應濾波器(210),以基於計算裝置(270)的相同濾波器係數來對多個麥克風信號中的至少兩個麥克風信號進行濾波。
  22. 依據申請專利範圍第1項所述的設備(200),還包括捆綁裝置(530),所述捆綁裝置(530)用於對多個揚聲器信號進行捆綁,以獲得捆綁的揚聲器信號作為所述揚聲器信號或所述由揚聲器信號導出的信號。
  23. 一種用於計算自適應濾波器(210)的濾波器係數的方法,所述自適應濾波器(210)用於對麥克風信號進行濾波,以抑制由揚聲器信號導致的回聲,所述方法包括:從揚聲器信號或從由揚聲器信號導出的信號提取靜態分量信號或非靜態分量信號;以及基於所提取的靜態分量信號或所提取的非靜態分量信號來計算所述自適應濾波器的濾波器係數。
  24. 一種包括程式碼的程式,當所述程式在處理器上運行時,所述程式碼用於執行根據申請專利範圍第23項所述的方法。
TW098102978A 2008-01-31 2009-01-23 用於回聲抑制的濾波器係數的計算設備和方法 TWI388190B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US2500608P 2008-01-31 2008-01-31
DE102008039330A DE102008039330A1 (de) 2008-01-31 2008-08-22 Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung

Publications (2)

Publication Number Publication Date
TW200948030A TW200948030A (en) 2009-11-16
TWI388190B true TWI388190B (zh) 2013-03-01

Family

ID=40847455

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098102978A TWI388190B (zh) 2008-01-31 2009-01-23 用於回聲抑制的濾波器係數的計算設備和方法

Country Status (12)

Country Link
US (1) US8462958B2 (zh)
EP (1) EP2238590B1 (zh)
JP (1) JP4954334B2 (zh)
KR (1) KR101169535B1 (zh)
CN (1) CN101933088B (zh)
AU (1) AU2009210295B9 (zh)
CA (1) CA2713450C (zh)
DE (1) DE102008039330A1 (zh)
ES (1) ES2585406T3 (zh)
MX (1) MX2010008372A (zh)
TW (1) TWI388190B (zh)
WO (1) WO2009095161A1 (zh)

Families Citing this family (108)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8150052B2 (en) * 2008-10-15 2012-04-03 Hewlett-Packard Development Company, L.P. Integrating acoustic echo cancellation as a subsystem into an existing videoconference and telepresence system
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9307340B2 (en) 2010-05-06 2016-04-05 Dolby Laboratories Licensing Corporation Audio system equalization for portable media playback devices
CN102893633B (zh) * 2010-05-06 2015-04-15 杜比实验室特许公司 用于便携式媒体回放装置的音频系统均衡化
US9245538B1 (en) * 2010-05-20 2016-01-26 Audience, Inc. Bandwidth enhancement of speech signals assisted by noise reduction
EP2444967A1 (en) 2010-10-25 2012-04-25 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Echo suppression comprising modeling of late reverberation components
US9420390B2 (en) 2011-02-03 2016-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Estimation and suppression of harmonic loudspeaker nonlinearities
US9462399B2 (en) 2011-07-01 2016-10-04 Dolby Laboratories Licensing Corporation Audio playback system monitoring
US20130066638A1 (en) * 2011-09-09 2013-03-14 Qnx Software Systems Limited Echo Cancelling-Codec
US8896651B2 (en) * 2011-10-27 2014-11-25 Polycom, Inc. Portable devices as videoconferencing peripherals
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
US8737188B1 (en) * 2012-01-11 2014-05-27 Audience, Inc. Crosstalk cancellation systems and methods
US9524638B2 (en) * 2012-02-08 2016-12-20 Qualcomm Incorporated Controlling mobile device based on sound identification
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
JP5897343B2 (ja) * 2012-02-17 2016-03-30 株式会社日立製作所 残響除去パラメータ推定装置及び方法、残響・エコー除去パラメータ推定装置、残響除去装置、残響・エコー除去装置、並びに、残響除去装置オンライン会議システム
CN103325379A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
CN103516921A (zh) 2012-06-28 2014-01-15 杜比实验室特许公司 通过隐藏音频信号的回声控制
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
JP5296247B1 (ja) * 2012-07-02 2013-09-25 リオン株式会社 音処理装置及びフィードバックキャンセル方法
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9768884B2 (en) * 2012-10-17 2017-09-19 Acacia Communications, Inc. Multi-range frequency-domain compensation of chromatic dispersion
EP2760024B1 (en) * 2013-01-29 2017-08-02 2236008 Ontario Inc. Noise estimation control
US9318092B2 (en) 2013-01-29 2016-04-19 2236008 Ontario Inc. Noise estimation control system
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
JP6087762B2 (ja) * 2013-08-13 2017-03-01 日本電信電話株式会社 残響抑圧装置とその方法と、プログラムとその記録媒体
GB2515592B (en) * 2013-12-23 2016-11-30 Imagination Tech Ltd Echo path change detector
JP6295722B2 (ja) * 2014-02-28 2018-03-20 沖電気工業株式会社 エコー抑圧装置、プログラム及び方法
JP6349899B2 (ja) * 2014-04-14 2018-07-04 ヤマハ株式会社 放収音装置
US9398374B2 (en) * 2014-08-12 2016-07-19 Cirrus Logic, Inc. Systems and methods for nonlinear echo cancellation
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
US9479650B1 (en) * 2015-05-04 2016-10-25 Captioncall, Llc Methods and devices for updating filter coefficients during echo cancellation
US10504501B2 (en) 2016-02-02 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive suppression for removing nuisance audio
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9826306B2 (en) 2016-02-22 2017-11-21 Sonos, Inc. Default playback device designation
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
KR20170142001A (ko) * 2016-06-16 2017-12-27 삼성전자주식회사 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체
US9922637B2 (en) 2016-07-11 2018-03-20 Microsoft Technology Licensing, Llc Microphone noise suppression for computing device
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US20180136352A1 (en) * 2016-11-14 2018-05-17 Symroc Business And Project Management Ltd. Vibration-analysis system and method therefor
WO2018155164A1 (ja) * 2017-02-24 2018-08-30 株式会社Jvcケンウッド フィルタ生成装置、フィルタ生成方法、及びプログラム
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
CN110741563B (zh) * 2017-06-12 2021-11-23 铁三角有限公司 语音信号处理装置、方法及其存储介质
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
CN107644649B (zh) * 2017-09-13 2022-06-03 黄河科技学院 一种信号处理方法
US10446165B2 (en) * 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
US11017798B2 (en) 2017-12-29 2021-05-25 Harman Becker Automotive Systems Gmbh Dynamic noise suppression and operations for noisy speech signals
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
EP3796629B1 (en) * 2019-05-22 2022-08-31 Shenzhen Goodix Technology Co., Ltd. Double talk detection method, double talk detection device and echo cancellation system
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
CN113160782B (zh) * 2020-01-22 2022-11-01 百度在线网络技术(北京)有限公司 音频处理的方法、装置、电子设备及可读存储介质
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
WO2021188665A1 (en) 2020-03-17 2021-09-23 Dolby Laboratories Licensing Corporation Wideband adaptation of echo path changes in an acoustic echo canceller
US12231603B2 (en) 2020-03-23 2025-02-18 Dolby Laboratories Licensing Corporation Echo residual suppression
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US12387716B2 (en) 2020-06-08 2025-08-12 Sonos, Inc. Wakewordless voice quickstarts
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US12283269B2 (en) 2020-10-16 2025-04-22 Sonos, Inc. Intent inference in audiovisual communication sessions
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
WO2022103290A1 (en) 2020-11-12 2022-05-19 "Stc"-Innovations Limited" Method for automatic quality evaluation of speech signals using neural networks for selecting a channel in multimicrophone systems
CN113345456B (zh) * 2021-05-31 2023-06-06 北京小米移动软件有限公司 回声分离方法、装置及存储介质
US12322390B2 (en) 2021-09-30 2025-06-03 Sonos, Inc. Conflict management for wake-word detection processes
US20250159083A1 (en) * 2021-09-30 2025-05-15 Dolby Laboratories Licensing Corporation Robust foreground/background filtering control for acoustic echo cancellation
EP4409933A1 (en) 2021-09-30 2024-08-07 Sonos, Inc. Enabling and disabling microphones and voice assistants
US12327549B2 (en) 2022-02-09 2025-06-10 Sonos, Inc. Gatekeeping for voice intent processing
US12363260B1 (en) 2023-04-27 2025-07-15 Zoom Communications, Inc. Correcting audio feedback using contextual information

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61242127A (ja) * 1985-04-19 1986-10-28 Fujitsu Ltd エコ−キヤンセラ
JPS62110336A (ja) * 1985-11-08 1987-05-21 Matsushita Electric Ind Co Ltd エコ−キヤンセル装置
JPH01129623A (ja) * 1987-11-16 1989-05-22 Hitachi Ltd エコーキヤンセラ
JPH04335721A (ja) * 1991-05-13 1992-11-24 Matsushita Electric Ind Co Ltd エコーキャンセラー装置
JPH0832494A (ja) * 1994-07-13 1996-02-02 Mitsubishi Electric Corp ハンズフリー通話装置
JP2947093B2 (ja) 1994-11-02 1999-09-13 日本電気株式会社 適応フィルタによるシステム同定の方法および装置
US5610909A (en) * 1995-05-31 1997-03-11 Lucent Technologies Inc. Multistage echo canceler including time variation compensation
US5872728A (en) 1996-06-20 1999-02-16 International Business Machines Corporation Process for computing the coefficients of an adaptive filter in an echo-cancellor
US5930366A (en) 1997-08-29 1999-07-27 Telefonaktiebolaget L M Ericsson Synchronization to a base station and code acquisition within a spread spectrum communication system
US6442275B1 (en) 1998-09-17 2002-08-27 Lucent Technologies Inc. Echo canceler including subband echo suppressor
US6590881B1 (en) 1998-12-04 2003-07-08 Qualcomm, Incorporated Method and apparatus for providing wireless communication system synchronization
FR2791492B1 (fr) * 1999-03-26 2001-06-08 France Telecom Procede et dispositif d'identification adaptative, et annuleur d'echo adaptatif mettant en oeuvre un tel procede
US6665645B1 (en) * 1999-07-28 2003-12-16 Matsushita Electric Industrial Co., Ltd. Speech recognition apparatus for AV equipment
JP4345208B2 (ja) * 2000-08-25 2009-10-14 沖電気工業株式会社 反響及び雑音除去装置
JP3507020B2 (ja) * 2000-09-08 2004-03-15 日本電信電話株式会社 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
JP2002111552A (ja) * 2000-09-29 2002-04-12 Fujitsu Ltd 音響エコーキャンセラ及びハンズフリー電話機
EP1429315B1 (en) 2001-06-11 2006-05-31 Lear Automotive (EEDS) Spain, S.L. Method and system for suppressing echoes and noises in environments under variable acoustic and highly fedback conditions
AU2003233019A1 (en) * 2002-06-19 2004-01-06 Koninklijke Philips Electronics N.V. Non stationary echo canceller
US7889804B2 (en) 2003-05-30 2011-02-15 Mohammad Jaber Borran Partially coherent constellations for multiple-antenna systems
JP4403776B2 (ja) * 2003-11-05 2010-01-27 沖電気工業株式会社 エコーキャンセラ
DE602004008973T2 (de) * 2004-05-14 2008-05-15 Loquendo-Società per Azioni Rauschminderung für die automatische spracherkennung
US7383179B2 (en) * 2004-09-28 2008-06-03 Clarity Technologies, Inc. Method of cascading noise reduction algorithms to avoid speech distortion
EP1715669A1 (en) 2005-04-19 2006-10-25 Ecole Polytechnique Federale De Lausanne (Epfl) A method for removing echo in an audio signal
WO2006111370A1 (en) 2005-04-19 2006-10-26 Epfl (Ecole Polytechnique Federale De Lausanne) A method and device for removing echo in a multi-channel audio signal
EP1879181B1 (en) * 2006-07-11 2014-05-21 Nuance Communications, Inc. Method for compensation audio signal components in a vehicle communication system and system therefor

Also Published As

Publication number Publication date
HK1149622A1 (zh) 2011-10-07
AU2009210295A1 (en) 2009-08-06
WO2009095161A1 (en) 2009-08-06
TW200948030A (en) 2009-11-16
DE102008039330A1 (de) 2009-08-13
CN101933088B (zh) 2016-05-11
AU2009210295B9 (en) 2014-01-30
ES2585406T3 (es) 2016-10-05
EP2238590A1 (en) 2010-10-13
CA2713450C (en) 2014-07-29
US8462958B2 (en) 2013-06-11
RU2010132161A (ru) 2012-02-10
CN101933088A (zh) 2010-12-29
CA2713450A1 (en) 2009-08-06
KR101169535B1 (ko) 2012-07-31
JP2011514706A (ja) 2011-05-06
EP2238590B1 (en) 2016-06-01
AU2009210295B2 (en) 2013-05-02
KR20100114059A (ko) 2010-10-22
MX2010008372A (es) 2010-08-23
JP4954334B2 (ja) 2012-06-13
BRPI0905794A2 (pt) 2020-08-11
US20110019833A1 (en) 2011-01-27

Similar Documents

Publication Publication Date Title
TWI388190B (zh) 用於回聲抑制的濾波器係數的計算設備和方法
JP5671147B2 (ja) 後期残響成分のモデリングを含むエコー抑制
Faller et al. Suppressing acoustic echo in a spectral envelope space
TWI458331B (zh) 用於計算回聲抑制濾波器的控制資訊的裝置和方法,以及用於計算延遲值的裝置和方法
Eneroth Stereophonic acoustic echo cancellation: Theory and implementation
AU2011322792B9 (en) Echo suppression comprising modeling of late reverberation components
RU2485607C2 (ru) Устройство и способ расчета коэффициентов фильтра эхоподавления
Schönle et al. Hands-free audio and its application to telecommunication terminals
HK1149622B (zh) 用於回声抑制的泸波器系数的计算设备和方法
HK1189312B (zh) 包含晚期混响成分的模型化的回声抑制技术
BRPI0905794B1 (pt) Equipamento e método para computar coeficientes de filtro para supressão de eco