DE102020111851A1

DE102020111851A1 - Audiowiedergabe mit mehrkanaliger akustischer echokompensation

Info

Publication number: DE102020111851A1
Application number: DE102020111851.1A
Authority: DE
Inventors: Markus Christoph
Original assignee: Harman Becker Automotive Systems GmbH
Current assignee: Harman Becker Automotive Systems GmbH
Priority date: 2020-04-30
Filing date: 2020-04-30
Publication date: 2021-11-04
Also published as: KR20210134216A

Abstract

Ein Audiowiedergabesystem und -verfahren beinhalten das Übertragen eines Audiosignals, das einen ersten Audioinhalt darstellt, über eine erste Eingangsleitung; das Übertragen eines Audiosignals, das einen zweiten Audioinhalt darstellt, über eine zweite Eingangsleitung; und das Empfangen des Audiosignals, das den ersten Audioinhalt darstellt, durch eine erste Audiowiedergabevorrichtung, die mit der ersten Eingangsleitung verbunden ist, und das Wiedergeben der Audiosignale, die den ersten Audioinhalt darstellen, über einen ersten Lautsprecher oder eine erste Gruppe von Lautsprechern der ersten Audiowiedergabevorrichtung. Das System und das Verfahren beinhalten ferner das Empfangen des Audiosignals, das den zweiten Audioinhalt darstellt, durch eine zweite Audiovorrichtung, die mit der zweiten Eingangsleitung verbunden ist, das Wiedergeben des Audiosignals, das den zweiten Audioinhalt darstellt, über einen zweiten Lautsprecher oder eine zweite Gruppe von Lautsprechern der zweiten Audiovorrichtung und das Aufnehmen von Ton, der von dem ersten Lautsprecher oder der erste Gruppe von Lautsprechern und dem zweiten Lautsprecher oder der zweiten Gruppe von Lautsprechern stammt, über mindestens ein Mikrofon oder eine Gruppe von Mikrofonen der zweiten Audiovorrichtung, um mindestens ein Mikrofonsignal zu erzeugen; und eine im Allgemeinen mehrkanalige akustische Echokompensation auf Grundlage des mindestens einen Mikrofonsignals, der beiden Audiosignale, die den ersten Audioinhalt und den zweiten Audioinhalt darstellen, wobei die im Allgemeinen mehrkanalige akustische Echokompensation Kompensationsfilterung, um die Impulsantworten von akustischen Pfaden zwischen jeder Eingangsleitung und dem mindestens einen Mikrofon oder der Gruppe von Mikrofonen zu modellieren und Anpassen der Kompensationsfilterung umfasst.

Description

HINTERGRUND
1. Gebiet der Technik
Die Offenbarung betrifft ein System und ein Verfahren (allgemein als „System“ bezeichnet) zur Audiowiedergabe mit mehrkanaliger akustischer Echokompensation.
2. Stand der Technik
Set-Top-Boxen verwenden zunehmend intelligente Lautsprecher, die eines oder mehrere Mikrophone und einen oder mehrere Lautsprecher beinhalten, um Sprachsteuerung der Set-Top-Boxen zu ermöglichen. Normalerweise sind die Set-Top-Boxen über eine drahtgebundene oder drahtlose Verbindung mit Datenleitungen verbunden, um Inhalte wie etwa Fernsehkanäle zu empfangen und beispielsweise Fernseh- oder Internetzugang zu haben. Über die Datenleitung übertragene Daten werden über die Set-Top-Box einer externen Vorrichtung, wie etwa einem Fernsehgerät oder einem Audiosystem, bereitgestellt. Es können Situationen auftreten, in denen Audiosignale, die durch die Set-Top-Box gestreamt werden, von einer externen Vorrichtung wiedergegeben werden, die sich in einer beliebigen Entfernung von der Set-Top-Box und damit von den Positionen des einen oder der mehreren verwendeten Mikrofone, die zur Sprachsteuerung eingesetzt werden, befindet. Auf diese Weise können ein oder mehrere beliebige Echopfade zwischen einer oder mehreren Audiosignalleitungen stromaufwärts des einen oder der mehreren Lautsprecher der externen Vorrichtung und des einen oder der mehreren Mikrofone der Set-Top-Box eingerichtet werden. Wenn die Set-Top-Box beispielsweise zur Beantwortung von Fragen verwendet wird, können ihr einer oder ihre mehreren Lautsprecher zur Wiedergabe der Antworten verwendet werden, wobei noch mindestens ein anderer Echopfad zwischen der einen oder den mehreren Audiosignalleitungen und dem einen oder den mehreren Mikrofonen der Set-Top-Box hergestellt wird, der im Vergleich zu dem einen oder den mehreren Echopfaden zwischen der einen oder den mehreren Audiosignalleitungen der externen Vorrichtung und dem einen oder den mehreren Mikrofonen der Set-Top-Box völlig andere Eigenschaften aufweisen kann.
Normalerweise verarbeiten Set-Top-Boxen nur Mono- und Stereosignale. Daher wurden in der Vergangenheit nur akustische Mono- oder Stereo-Echokompensatoren (acoustic echo cancellers - AEC) in den Set-Top-Boxen verwendet, die eine erhebliche Anzahl von möglichen Echopfaden bewältigen müssen. Um dies zu handhaben, war es beispielsweise erforderlich, die von den externen Vorrichtungen wiedergegebenen (Stereo-)Signale vollständig stummzuschalten, sobald die Sprachsteuerung aktiv wurde, z. B. beim Erkennen eines Schlüsselworts oder eines durch die externe Vorrichtung wiedergegeben Text-zu-Sprache-Signals (text-to-speech - TTS). Darüber hinaus wird ein im Allgemeinen mehrkanaliger akustischer Echokompensator (multichannel, acoustic echo canceller - MAEC) eingesetzt und, um eine konstante Neuanpassung des im Allgemeinen mehrkanaligen akustischen Echokompensatorsystems zu vermeiden, muss ein konstantes, zeitlich gut abgestimmtes Speicher- und Wiederherstellungsverfahren umgesetzt werden. Daher besteht ein Bedarf an einem effizienteren, im Allgemeinen mehrkanaligen akustischen Echokompensator.
ZUSAMMENFASSUNG
Ein Audiowiedergabesystem beinhaltet eine erste Eingangsleitung zum Übertragen eines Audiosignals, das einen ersten Audioinhalt darstellt; eine zweite Eingangsleitung zum Übertragen eines Audiosignals, das einen zweiten Audioinhalt darstellt; und eine erste Audiowiedergabevorrichtung, die mit der ersten Eingangsleitung zum Empfangen des Audiosignals, das den ersten Audioinhalt darstellt, verbunden ist, wobei die erste Audiowiedergabevorrichtung einen ersten Lautsprecher oder eine erste Gruppe von Lautsprechern zum Wiedergeben der Audiosignale, die den ersten Audioinhalt darstellen, umfasst. Das System beinhaltet ferner eine zweite Audiovorrichtung, die mit der zweiten Eingangsleitung verbunden ist, zum Empfangen eines Audiosignals, das den zweiten Audioinhalt darstellt, wobei die zweite Audiovorrichtung einen zweiten Lautsprecher oder eine zweite Gruppe von Lautsprechern zum Wiedergeben des Audiosignals umfasst, das den zweiten Audioinhalt darstellt, und die zweite Audiovorrichtung ferner mindestens ein Mikrofon oder eine Gruppe von Mikrofonen zum Aufnehmen von Ton umfasst, der von dem ersten Lautsprecher oder der ersten Gruppe von Lautsprechern und dem zweiten Lautsprecher oder der zweiten Gruppe von Lautsprechern stammt, um mindestens ein Mikrofonsignal zu erzeugen; und einen im Allgemeinen mehrkanaligen akustischen Echokompensator, der das mindestens eine Mikrofonsignal und die zwei Audiosignale empfängt, die den ersten Audioinhalt und den zweiten Audioinhalt darstellen, wobei der im Allgemeinen mehrkanalige akustische Echokompensator eine Vielzahl von Kompensationsfiltern umfasst, die dazu konfiguriert sind, die Impulsantworten von akustischen Pfaden zwischen jeder Eingangsleitung und dem mindestens einen Mikrofon oder der Gruppe von Mikrofonen zu modellieren und Impulsantworten der Kompensationsfilter anzupassen.
Ein Audiowiedergabeverfahren beinhaltet das Übertragen eines Audiosignals, das einen ersten Audioinhalt darstellt, über eine erste Eingangsleitung; das Übertragen eines Audiosignals, das einen zweiten Audioinhalt darstellt, über eine zweite Eingangsleitung; und das Empfangen des Audiosignals, das den ersten Audioinhalt darstellt, durch eine erste Audiowiedergabevorrichtung, die mit der ersten Eingangsleitung verbunden ist, und das Wiedergeben des Audiosignals, das den ersten Audioinhalt darstellt, über einen ersten Lautsprecher oder eine erste Gruppe von Lautsprechern der ersten Audiowiedergabevorrichtung. Das Verfahren beinhaltet ferner das Empfangen des Audiosignals, das den zweiten Audioinhalt darstellt, durch eine zweite Audiovorrichtung, die mit der zweiten Eingangsleitung verbunden ist, das Wiedergeben des Audiosignals, das den zweiten Audioinhalt darstellt, über einen zweiten Lautsprecher oder eine zweite Gruppe von Lautsprechern der zweiten Audiovorrichtung und das Aufnehmen von Ton, der von dem ersten Lautsprecher oder der erste Gruppe von Lautsprechern und dem zweiten Lautsprecher oder der zweiten Gruppe von Lautsprechern stammt, über mindestens ein Mikrofon oder eine Gruppe von Mikrofonen der zweiten Audiovorrichtung, um mindestens ein Mikrofonsignal zu erzeugen; und eine im Allgemeinen mehrkanalige akustische Echokompensation auf Grundlage des mindestens einen Mikrofonsignals, der beiden Audiosignale, die den ersten Audioinhalt und den zweiten Audioinhalt darstellen, wobei die im Allgemeinen mehrkanalige akustische Echokompensation Kompensationsfilterung, um die Impulsantworten von akustischen Pfaden zwischen jeder Eingangsleitung und dem mindestens einen Mikrofon oder der Gruppe von Mikrofonen zu modellieren und Anpassen von Impulsantworten der Kompensationsfilterung umfasst.
Andere Systeme, Verfahren, Merkmale und Vorteile sind oder werden für den Fachmann nach Prüfung der folgenden detaillierten Beschreibung und der beigefügten Figuren offensichtlich. Es ist beabsichtigt, dass alle derartigen zusätzlichen Systeme, Verfahren, Merkmale und Vorteile in dieser Beschreibung enthalten sind, in den Umfang der Erfindung fallen und durch die folgenden Ansprüche geschützt sind.
Figurenliste
Das System kann unter Bezugnahme auf die folgenden Zeichnungen und Beschreibungen besser verstanden werden. Die Komponenten in den Figuren sind nicht notwendigerweise maßstabsgetreu, stattdessen liegt der Schwerpunkt darauf, die Prinzipien der Erfindung zu veranschaulichen. Darüber hinaus bezeichnen in den Figuren gleiche Bezugszeichen entsprechende Teile in den verschiedenen Ansichten.

1 ist ein schematisches Diagramm, das eine grundlegende Signalverarbeitungsstruktur für eine adaptive Berechnung von Filterkoeffizienten eines Filters mit endlicher Impulsantwort (finite impulse response filter - FIR-Filter) veranschaulicht, wobei das FIR-Filter eine Übertragungsfunktion aufweist, die ungefähr einer vordefinierten Zielfunktion entspricht.
2 ist ein schematisches Diagramm, das eine Modifikation der Struktur aus 1 unter Verwendung eines Vollband-FIR-Filters, einschließlich adaptiver Verzögerungszuweisung, darstellt.
3 ist ein schematisches Diagramm, das ein beispielhaftes System veranschaulicht, das eine Mono(phone)-Set-Top-Box und eine externe Stereo(phone)-Vorrichtung beinhaltet.
4 ist ein schematisches Diagramm, das einen beispielhaften einkanaligen akustischen Echokompensator veranschaulicht, der in dem in akustischen Echoregler anwendbar ist, der in dem in 3 gezeigten System verwendet wird.
5 ist ein Flussdiagramm, das ein beispielhaftes Audiowiedergabeverfahren unter Verwendung von zwei Audiowiedergabevorrichtungen veranschaulicht.

DETAILLIERTE BESCHREIBUNG
1 veranschaulicht eine grundlegende Signalverarbeitungsstruktur für eine adaptive Berechnung von Filterkoeffizienten g_k (k = 0, 1, ..., K-1) eines Filters mit endlicher Impulsantwort (finite impulse response filter-FIR-Filter) 101, wobei der Index k den Filterkoeffizienten kennzeichnet und K die Filterlänge (d. h. die Anzahl von Abgriffen eines FIR-Filters) kennzeichnet. Das FIR-Filter 101 weist eine (diskrete) Übertragungsfunktion G(z) auf, die nach erfolgreicher Anpassung der Filterkoeffizienten g_k[n] ungefähr einer gewünschten Übertragungsfunktion P(z) eines (im Allgemeinen) unbekannten Systems 102 entspricht. Um das adaptive Filterentwurfsverfahren durchzuführen, wird dem unbekannten System 102, wie etwa einem Lautsprecher-Raum-Mikrofon-(LRM-)System und dem FIR-Filter 101ein Testsignal (Eingangssignal x[n]) zugeführt, bei dem es sich beispielsweise um weißes Rauschen oder ein beliebiges anderes Signal handelt, das eine Bandbreite aufweist, die zumindest das Durchlassband der Übertragungsfunktion P(z) des unbekannten Systems beinhaltet. Das Ausgangssignal y[n] des FIR-Filters 101 wird (z. B. durch einen Subtrahierer 104) von dem Ausgangssignal des Systems 102, d. h. von dem gewünschten Signal d[n], subtrahiert. Die Differenz d[n]-y[n] wird als Fehlersignal e[n] verwendet und einer Anpassungseinheit 103 zugeführt. Die Anpassungseinheit 103 berechnet aus dem Fehlersignal und dem Eingangssignal x[n] (in diesem Zusammenhang auch als Referenzsignal bezeichnet) während jedes Abtastzeitintervalls n einen aktualisierten Satz von FIR-Filterkoeffizienten g_k[n]. Beispielsweise kann ein LMS-Algorithmus (leasts mean square) oder ein NLMS-Algorithmus (normalized least mean square) zur Anpassung der Filterkoeffizienten eingesetzt werden. Es können jedoch auch andere Anpassungsalgorithmen verwendet werden. Nach der Konvergenz des Anpassungsalgorithmus stellen die FIR-Filterkoeffizienten g_k[n] eine Übertragungsfunktion G(z) dar, die eine optimale Annäherung an die Übertragungsfunktion P(z) des unbekannten Systems ist.
Um den mit der Verwendung von FIR-Filtern verbundenen Rechenaufwand zu verringern, wird das Spektrum eines zu filternden Vollband-Eingangssignals in eine Anzahl von Schmalbandsignalen (Teilbandsignalen) unterteilt, um jedes Schmalbandsignal getrennt zu filtern. Die Aufteilung eines Vollbandsignals in mehrere Teilbandsignale kann über eine Filterbank oder dergleichen umgesetzt werden. Schließlich werden die verarbeiteten Teilbandsignale zu einem einzigen Vollband-Ausgangssignal kombiniert, z. B. über eine Synthesefilterbank. Bei den in dieser Schrift nachstehend beschriebenen Systemen und Verfahren wird das Vollbandsignal in seiner Gesamtheit mittels Breitbandverarbeitung verarbeitet, z. B. im Zeitbereich oder Frequenzbereich oder einer Kombination davon. Wie bei vielen modernen Audiosystemen sollte nicht nur die Größe, sondern auch die Phase entzerrt werden, um einen gewünschten Klangeindruck für einen Hörer zu erzeugen. Daher stellt die Übertragungsfunktion im Allgemeinen ein nicht minimales Phasenfilter mit einer nicht linearen Phasencharakteristik dar.
Wie vorstehend erwähnt, verhält sich die Übertragungsfunktion P(z) des unbekannten Systems im Allgemeinen wie ein nicht minimales Phasenfilter, das eine nicht lineare Gruppenverzögerungscharakteristik über der Frequenz aufweist. Um Signalausbreitungsverzögerungen zu kompensieren, kann eine Verzögerungsleitung in den Signalpfad eingefügt werden, die zudem das Entzerrungsfilter enthält. Somit wird der Verzögerungsausgleich nicht durch zusätzliche FIR-Filterkoeffizienten erreicht, was rechnerisch ineffizient ist. Da die Verzögerungswerte sowie die Anzahl von Filterkoeffizienten von der zu realisierenden Übertragungsfunktion P(z) des unbekannten Systems (d. h. der Größe und der Phasenantwort) abhängen, können die Verzögerungswerte wie in dieser Schrift nachstehend beschrieben als adaptive Verzögerung adaptiv bestimmt werden. Folglich wird eine zusätzliche Verzögerungszeit Δ für das FIR-Filter 101 und seine Übertragungsfunktion G(z) adaptiv bestimmt. 2 veranschaulicht eine Modifikation der in 1 gezeigten Struktur mit einer zusätzlichen Verzögerungsleitung 201, die eine Verzögerungszeit Δ in dem Filterpfad erzeugt, und einer adaptiven Verzögerungszuweisungseinheit 202, die die Verzögerungsleitung 201 und das FIR-Filter 101 auf Grundlage des Fehlersignals e[n] und des Eingangs-(Referenz-)signals x[n] steuert.
Wie in dem in 1 gezeigten Beispiel wird das Vollband-Eingangssignal x[n] (z. B. bandbegrenztes weißes Rauschen) dem System 102 mit der Übertragungsfunktion P(z) des unbekannten Systems zugeführt, wodurch das gewünschte Signal d[n] erzeugt wird. Das gewünschte Signal d[n] und das Eingangssignal x[n] werden z. B. im Zeitbereich verarbeitet. Das Eingangssignal x[n] wird dem FIR-Filter mit der Übertragungsfunktion G(z) zugeführt, wodurch das gefilterte Signal y[n] erzeugt wird. Das gefilterte Signal y[n] wird von dem gewünschten Signal d[n] subtrahiert, was das Fehlersignal e[n] ergibt. Die Anpassungseinheit 103 optimiert die Filterkoeffizienten g_k, d. h. die Impulsantwort G(z) des Filters des FIR-Filters 101, sodass der optimale Satz von Filterkoeffizienten g_k zu einer minimierten Norm (z. B. LMS- oder NLMS-Algorithmus) des Fehlersignals e[n] führt. Die Verzögerungsleitung, die die Verzögerungszeit Δ bereitstellt, ist stromaufwärts oder stromabwärts des FIR-Filters G_m(z) verbunden. Die adaptive Verzögerungszuweisungseinheit 202 passt die Verzögerungszeit Δ der Verzögerungsleitung 201 gemäß einem adaptiven Verzögerungszuweisungsalgorithmus dynamisch an.
Die FIR-Filterkoeffizienten, die dem FIR-Filter 101 wie vorstehend erläutert adaptiv zugeordnet sind, können als unendliche Impulsantwort betrachtet werden, die durch Multiplikation mit einer Rechteck-Fensterfunktion gekürzt wird und eine endliche Impulsantwort ergibt. Für das FIR-Filter 101 kann diese Rechteck-Fensterfunktion (entlang der Zeitachse) verschoben werden, wobei die jeweilige Zeitverschiebung die effektive Verzögerungszeit Δ der Verzögerungsleitung darstellt, die in den Signalpfad des FIR-Filters 101 eingebunden ist.
Der adaptive Verzögerungszuweisungsalgorithmus zielt darauf ab, eine Verzögerungszeit Δ (d. h. eine Zeitverschiebung des Rechteck-Fensters) zu finden, die zu einer endlichen Impulsantwort mit maximaler Energie des FIR-Filters 101 führt. Das heißt, bei der Bestimmung der Verzögerungszeit Δ wird nur die Energie der FIR-Filterkoeffizienten g_k[n] berücksichtigt. Dies ist jedoch nicht unbedingt der einzig praktikable Ansatz. Als Alternative kann die Verzögerungszeit Δ so gewählt werden, dass eine Norm des Fehlersignals e[n] minimiert wird. Die Verwendung eines derartigen Kriteriums führt zu einer langsamen Konvergenz, während ausreichend gute Ergebnisse erzielt werden. Alternativ kann die Verzögerungszeit Δ so gewählt werden, dass die Gesamtenergie der FIR-Filterkoeffizienten g_k[n] bei einem Maximum (einem absoluten Maximum) liegt.
Es wird angemerkt, dass beim Anpassen (z. B. Erhöhen) der Verzögerungszeit Δ der Verzögerungsleitung die Filterimpulsantwort (die FIR-Filterkoeffizienten) nach links (d. h. in Richtung kleinerer Zeitwerte) verschoben wird, wodurch die Gesamtverzögerungszeit (einschließlich der Verzögerungszeit der Verzögerungsleitung und des FIR-Filters) konstant gehalten wird. Dies vermeidet die Notwendigkeit einer langen Neuanpassung der FIR-Filterkoeffizienten aufgrund der Variation der Verzögerungszeit Δ. Der Anpassungszeitraum, in dem die adaptive Verzögerungszuweisung durchgeführt wird, sollte jedoch beträchtlich länger sein als eine Anpassungsschrittlänge des LMS- oder NLMS-Algorithmus, sodass die Anpassung der FIR-Filterkoeffizienten g_k in einem stabilen Zustand ist, wenn die adaptive Verzögerungszuweisung initiiert wird.
3 zeigt eine Signalflussstruktur eines beispielhaften Audiowiedergabesystems mit zwei Audiowiedergabevorrichtungen, einer Set-Top-Box 301 und einer externen Vorrichtung 302 und ferner einem MAEC 312, der die vorstehend in Verbindung mit den 1 und 2 beschriebenen Filter nutzen kann. Dem in 3 gezeigten beispielhaften System wird ein Signal, das einen ersten Audioinhalt darstellt, hier ein Stereosignal, das zwei Kanäle aufweist, z. B. von einer Stereomusikquelle 303, und ein Signal, das einen zweiten Audioinhalt darstellt, hier ein Signal mit einem Kanal zum Liefern eines Text-zu-Signal-(TTS-)Signals, z. B. von einer Text-zu-Signal-Quelle 304, zugeführt. Anstelle einer Stereoquelle kann eine Monoquelle (nicht gezeigt) in Verbindung mit einem Lautsprecher oder einer Gruppe von Lautsprechern verwendet werden und umgekehrt. Die beiden Kanäle des Stereosignals und der eine Kanal des TTS-Signals werden mit einem zweikanaligen Entzerrer 305 bzw. einem einkanaligen Entzerrer 306 gefiltert, um ein erstes AEC-Referenzsignal LeftAecRef, das einem Kanal des Stereosignals entspricht, ein zweites AEC-Referenzsignal RightAecRef, das dem anderen Kanal des Stereosignals entspricht, und ein drittes AEC-Referenzsignal TtsAecRef, das dem Kanal des TTS-Signals entspricht, bereitzustellen. Das erste AEC-Referenzsignal LeftAecRef wird von einem ersten Lautsprecher 307 (oder einer ersten Gruppe von Lautsprechern) wiedergegeben, der in der externen Vorrichtung 302 angeordnet ist, das zweite AEC-Referenzsignal RightAecRef wird von einem zweiten Lautsprecher 308 (oder einer zweiten Gruppe von Lautsprechern) wiedergegeben, der in der externen Vorrichtung 302 angeordnet ist, und das dritte AEC-Referenzsignal TtsAecRef wird von einem dritten Lautsprecher 309 (oder einer dritten Gruppe von Lautsprechern) wiedergegeben, der in der Set-Top-Box 301 angeordnet ist. Die Set-Top-Box 301 beinhaltet ferner mindestens ein Mikrofon, hier zwei Mikrofone 310 und 311, die Mikrofonsignale LeftMic und RightMic erzeugen. Die Mikrofonsignale LeftMic und RightMic, das erste AEC-Referenzsignal LeftAecRef, das zweite AEC-Referenzsignal RightAecRef und das dritte AEC-Referenzsignal TtsAecRef werden dem MAEC 312 zugeführt, der zwei echoreduzierte Fehlersignale e_L und e_R erzeugt. Tonübertragungspfade, die durch Übertragungsfunktionen h_ij beschrieben sind, werden zwischen jedem der i (hier z. B. drei) Eingangssignalkanäle und jedem der j (hier z. B. zwei) Mikrofone eingerichtet, was in dem vorliegenden Beispiel sechs Übertragungsfunktionen h_ij mit i = 1 ... 3 und j = 1, 2 bedeutet. Die Übertragungspfade zwischen den Mikrofonen und dem Lautsprecher, die alle in der Set-Top-Box angeordnet sind, sind im Allgemeinen erheblich kürzer als die Entfernungen zwischen den Mikrofonen in der Set-Top-Box und den Lautsprechern in der externen Vorrichtung. Je kürzer die Entfernung, desto kürzer die Verzögerung des Tons (des akustischen Signals).
In einem in 4 gezeigten beispielhaften AEC-Filter, der in dem MAEC 312 des in 3 gezeigten Systems angewendet werden kann, ist die Tonübertragung zwischen einem beispielhaften Lautsprecher (nicht gezeigt) und einem beispielhaften Mikrofon (nicht gezeigt), die durch eine Übertragungsfunktion h(z) beschrieben ist, modelliert. Das akustische Echo des von dem Lautsprecher übertragenen Tons wird von dem Mikrofon aufgenommen und in ein elektrisches Senkensignal y(n) umgewandelt, das als Faltung des Quellensignals x(n) mit dieser Übertragungsfunktion h(z) betrachtet werden kann. Das adaptive AEC-Filter, das eine Aktualisierungssteuerung 403 (Korrelationsteil) und ein steuerbares Filter 402 (Faltungsteil) in Verbindung mit einem Subtrahierer 401 beinhalten kann, modelliert mit seiner Übertragungsfunktion die echte Übertragungsfunktion h(z) zwischen dem Lautsprecher und dem Mikrofon. Das steuerbare Filter 402 kann ein Filter mit endlicher Impulsantwort (finite impulse response filter- FIR-Filter) sein, dessen Filterkoeffizienten oder Filtergewichte w(n) von der Aktualisierungssteuerung 403 mit einer vorbestimmten Schrittgröße durch Korrelieren eines echofreien oder zumindest echoreduzierten Restsignals, das als Fehlersignal e(n) bezeichnet wird, mit dem Quellensignal x(n) aktualisiert werden. Durch Falten des Eingangssignals x(n) mit den Filterkoeffizienten w(n) in dem steuerbaren Filter 402 schätzt das adaptive Filter das unbekannte akustische Echo, das durch das geschätzte Echosignal d(n) angezeigt wird, das von dem steuerbaren Filter 402 ausgegeben wird. Diese Schätzung des akustischen Echosignals d(n) wird von dem Senkensignal y(n), das das echte Echo darstellt, über den Subtrahierer 401 subtrahiert, um das echofreie oder zumindest echoreduzierte Restsignal, d. h. das Fehlersignal e(n), bereitzustellen. Das Fehlersignal e(n) zeigt zudem an, wie genau/ungenau die Schätzung ist. Das adaptive AEC-Filter kann wie vorstehend in Verbindung mit den 1 und 2 beschrieben umgesetzt sein.
Die in 4 gezeigte Struktur kann in Bezug auf jede der sechs Übertragungsfunktionen h_ij entsprechend angewendet werden. Dies bedeutet, dass der in 31 gezeigte MAEC 312 sechs Kompensationsfilter (nicht gezeigt) beinhaltet, die eine ähnliche oder identische Struktur wie die in 4 gezeigte aufweisen, um die Übertragungsfunktionen h_ij auf Grundlage der Mikrofonsignale LeftMic und RightMic, die dem Senkensignal y(n) aus 4 entsprechen, des ersten AEC-Referenzsignals LeftAecRef, des zweiten AEC-Referenzsignals RightAecRef und des dritten AEC-Referenzsignals TtsAecRef, die dem Senkensignal x(n) aus 4 entsprechen, zu kompensieren.
Unter Bezugnahme auf 5 beinhaltet ein beispielhaftes Audiowiedergabeverfahren das Übertragen von zwei Audiosignalen, die einen ersten Audioinhalt darstellen, über eine erste Eingangsleitung (Verfahren 501), das Übertragen eines Audiosignals, das einen zweiten Audioinhalt darstellt, über eine zweite Eingangsleitung (Verfahren 502) und das Empfangen der Audiosignale, die den ersten Audioinhalt darstellen, durch eine Audiowiedergabevorrichtung, die mit der ersten Eingangsleitung verbunden ist, und das Wiedergeben der Audiosignale, die den ersten Audioinhalt darstellen, über mindestens einen ersten Lautsprecher (oder eine erste Gruppe von Lautsprechern) der Audiowiedergabevorrichtung (Verfahren 503). Das Verfahren beinhaltet ferner das Empfangen des Audiosignals, das den zweiten Audioinhalt darstellt, durch eine Set-Top-Box, die mit der zweiten Eingangsleitung verbunden ist, und das Wiedergeben des Audiosignals, das den zweiten Audioinhalt darstellt, über einen zweiten Lautsprecher (oder eine zweite Gruppe von Lautsprechern) in der Set-Top-Box und das Aufnehmen von Ton, der von dem ersten Lautsprecher (oder der ersten Gruppe von Lautsprechern) und dem zweiten Lautsprecher (oder der zweiten Gruppe von Lautsprechern) stammt, über mindestens ein Mikrofon (oder eine Gruppe von Mikrofonen) der Set-Top-Box, um mindestens ein Mikrofonsignal zu erzeugen (Verfahren 504). Das Verfahren beinhaltet ferner eine im Allgemeinen mehrkanalige akustische Echokompensation auf Grundlage des mindestens einen Mikrofonsignals und der beiden Audiosignale, die den ersten Audioinhalt und den zweiten Audioinhalt darstellen, wobei die im Allgemeinen mehrkanalige akustische Echokompensation Kompensationsfilterung, um die Impulsantworten von akustischen Pfaden zwischen jedem AEC-Referenzsignal (z. B. Lautsprecheransteuersignal, Eingangsleitung usw.) und dem (mindestens einen) Mikrofon (oder der Gruppe von Mikrofonen) zu modellieren und Anpassen der Impulsantworten der Kompensationsfilterung (Verfahren 505) umfasst.
In einem anderen Beispiel kann die Steuerung zum Anpassen der Verzögerungszeit das Durchführen einer Maximierung der Energie der Impulsantwort des entsprechenden Kompensationsfilters in dem im Allgemeinen mehrkanaligen akustischen Echokompensator ermöglichen. In einem weiteren Beispiel kann die Steuerung zum Anpassen der Verzögerungszeit in einem Zeitbereich und über ein volles Frequenzband, bezogen auf jeweilige Filtereingangssignale, eine Suche nach der absoluten Hauptspitze der Impulsantworten durchführen.
In einem anderen Beispiel ist in dem im Allgemeinen mehrkanaligen akustischen Echokompensator nur das Kompensationsfilter, das einem akustischen Pfad entspricht, dessen Impulsantwort sich im Laufe der Zeit dynamisch ändern kann, mit einer Verzögerungsleitung in Reihe geschaltet.
Die Steuerung kann das Steuern der mindestens einen Verzögerungsleitung nur dann ermöglichen, wenn die zu kompensierende Verzögerungszeit einen vorbestimmten Schwellenwert (z. B. 30 ms) überschreitet. Alternativ kann die Steuerung die mindestens eine Verzögerungsleitung nur dann steuern, wenn die Verzögerung durch einen elektrischen Signalübertragungspfad (z. B. HDMI- oder Bluetooth-Pfad) verursacht wird.
Die mindestens eine Verzögerungsleitung kann mindestens eines von stromaufwärts und stromabwärts des entsprechenden Kompensationsfilters verbunden sein. Ferner kann der im Allgemeinen mehrkanalige akustische Echokompensator mindestens eines von nicht kontinuierlichem Anpassen, nicht kontinuierlichem Neuladen oder nicht kontinuierlichem Rekonstruieren der Impulsantwort des entsprechenden Kompensationsfilters ermöglichen. In einem weiteren Beispiel beinhaltet mindestens eine von der externen Vorrichtung und der Set-Top-Box mehr als einen Signalkanal.
Durch Verwendung einer mehrkanaligen akustischen Echokompensation auf Grundlage von mindestens zwei unabhängigen Referenzkanälen, z. B. zwei für Stereomusik, die über die externe Vorrichtung übertragen wird, und einem für das TTS-Signal, das über die Set-Top-Box übertragen wird, während die entsprechenden Referenzsignale von einem gewünschten Teil innerhalb des Signalflusses (z. B. nach dem Entzerren) genommen werden, können die beiden Stereokanäle und der eine TTS-Kanal parallel verwendet werden, ohne dass Stereo-Audio stummgeschaltet werden muss, während die Sprachsteuerung aktiv ist. Darüber hinaus ermöglichen die in dieser Schrift beschriebenen Systeme und Verfahren, falls gewünscht, die unabhängige Verwendung des zuvor erwähnten adaptiven Verzögerungszuweisungsalgorithmus für jedes der mindestens zwei AEC-Referenzsignale, wodurch die effizienteste Verwendung des gegebenen MAEC-Systems erreicht wird.
Das in dieser Schrift vorgestellte Konzept kann im Zeitbereich durchgeführt werden und nur das Suchen nach der absoluten Hauptspitze der Impulsantwort beinhalten. Ferner kann eine Verzögerung, die eine bestimmte minimale Latenz überschreitet, dynamisch kompensiert werden, indem die Verzögerung aus der angepassten Impulsantwort extrahiert und eine dynamische Verzögerungsleitung vor oder nach dem adaptiven Filter eingefügt wird. Insbesondere kann ein unbekanntes System im Spektralbereich unter Verwendung eines Constraint-FDAF (frequency domain adaptive filter) geschätzt werden. Die absolute Hauptspitze (Maximum) wird gesucht und ihre Position innerhalb der Impulsantwort wird (zwischen)gespeichert. In dem Fall, dass sich die maximale (absolute) Spitze an einer Position befindet, die einen bestimmten Mindestwert (z. B. 30 Millisekunden) überschreitet, kann die Differenz über eine Verzögerungsleitung dynamisch kompensiert werden. Dabei kann der Mindestwert so gewählt werden, dass er dazu in der Lage ist, eine dynamische akustische Variation der sekundären Quelle zu den Mikrofonen von bis zu 10 Metern zu ermöglichen, was als der schlimmste Fall betrachtet werden kann, da an Positionen, die diese Entfernung überschreiten, Sprachsteuerung wahrscheinlich nicht mehr möglich ist.
Darüber hinaus weisen typische Wohnzimmer normalerweise keine derart großen Abmessungen auf. Diese minimale Latenz muss innerhalb des adaptiven Filters gehalten werden, um Entfernungen der Quelle zu dem Mikrofon von etwa 0 m, d. h. wenn sich die Quelle in unmittelbarer Nachbarschaft zu dem Mikrofon befindet, bis zu einer maximalen Entfernung (z. B. 10 m, wie bereits erwähnt) zu bewältigen. Dies vermeidet sicher, dass Probleme auftreten, z. B. kann das System, wenn die vollständige Verzögerung kompensiert wird, unter bestimmten Umständen (z. B. wenn eine Quelle zuerst in einer großen Entfernung aktiv ist und dann (während sie nicht aktiv ist) in die Nähe der Vorrichtung bewegt wird, bevor sie erneut aktiviert wird) auf Grund der dann geltenden akausalen Bedingung steckenbleiben. Unter derartigen akausalen Bedingungen würde eine adaptive Verzögerungszuweisung fehlschlagen, da die maximale Spitze der Impulsantwort zu früheren (akausalen) Zeitpunkten verschoben würde und sich daher außerhalb des beobachtbaren Bereichs befinden würde. Somit kann ein derartiges adaptives Verzögerungszuweisungskonzept mehr oder weniger nur mögliche elektrische Verzögerungen kompensieren, die z. B. von verwendeten Übertragungsprotokollen, wie etwa High Definition Multimedia Interface (HDMI), Bluetooth usw. stammen.
Dies bedeutet, dass die erfasste Verzögerungszeit nicht vollständig kompensiert wird, um Nachteile zu vermeiden, die auftreten können, wenn beispielsweise nur ein akustischer Stereo-Echokompensator zum Schätzen der Raumimpulsantwort verwendet wird, da in einem derartigen Fall der akustische Stereo-Echokompensator dazu in der Lage sein muss, die Raumimpulsantwort zu schätzen, unabhängig davon, ob ein Audiosignal über den/die Lautsprecher der Set-Top-Box oder der externen Vorrichtung übertragen wird. Wenn beispielsweise anfänglich die Lautsprecher der externen Vorrichtung verwendet werden, um ein von der Set-Top-Box bereitgestelltes Audiosignal zu übertragen und das Audiosignal nicht nur einer akustischen Verzögerung, sondern auch einer elektrischen Verzögerung (die z. B. durch den Signalübertragungspfad, wie etwa HDMI, Bluetooth usw., verursacht wird) unterliegt, wobei die Gesamtverzögerungszeit vollständig kompensiert wird, wird ein Audiosignal, das anschließend über den Lautsprecher der Set-Top-Box übertragen wird, überkompensiert, d. h. die Kompensationszeit ist im Vergleich zu der tatsächlichen Verzögerungszeit zu lang, sodass die adaptiven Filter kausal arbeiten und die tatsächliche Raumimpulsantwort nicht mehr schätzen können.
Um dieses Problem anzugehen, sind die adaptiven Filter normalerweise mit einer wesentlich höheren Komplexität ausgelegt, um eine grundlegende Kompensation aller möglichen akustischen Abweichungen, wie etwa Entfernungen von bis zu 10 Metern, zu ermöglichen und nur erfassbare Verzögerungen, die von dem elektrischen Übertragungspfad herrühren, dynamisch zu kompensieren. Dies ermöglicht beispielsweise das Variieren der Entfernung zwischen den Lautsprechern der externen Vorrichtung und des Lautsprechers der Set-Top-Box innerhalb eines bestimmten Maximalbereichs, ohne ein kausales Verhalten der Filter hervorzurufen. Durch Ändern der Betriebsart, z. B. Umschalten zwischen den Lautsprechern der externen Vorrichtung und dem Lautsprecher der Set-Top-Box, kann eine Verzögerungsleitung, die nur die elektrisch hervorgerufenen Verzögerungszeiten kompensiert, auf Null gesetzt werden, wenn sichergestellt werden kann, dass keine elektrisch hervorgerufenen Verzögerungszeiten zu erwarten sind. Die vorstehend beschriebene Situation kann verbessert werden, indem der von den Lautsprechern der externen Vorrichtung einerseits und von den Lautsprechern der Set-Top-Box andererseits ausgehenden Ton getrennt verarbeitet wird, z. B. über einen mehrkanaligen akustischen Echokompensator, der getrennte Raumimpulsantworten für verschiedene Übertragungspfade verwendet, wodurch die Pfade, die an den Lautsprechern der Set-Top-Box beginnen, unverändert bleiben können und eine adaptive Verzögerungszuweisung nur für den Pfad gesteuert werden kann, der an dem Lautsprecher der externen Vorrichtung beginnt.
Die vorstehend beschriebenen Verfahren können in einem computerlesbaren Medium, wie etwa einer CD-ROM, einer Platte, einem Flash-Speicher, einem RAM oder ROM, einem elektromagnetischen Signal oder einem anderen maschinenlesbaren Medium als Anweisungen zur Ausführung durch einen Prozessor codiert werden. Alternativ oder zusätzlich kann eine beliebige Art von Logik verwendet werden und kann als analoge oder digitale Logik unter Verwendung von Hardware, wie etwa eines oder mehrerer integrierter Schaltkreise (einschließlich Verstärkern, Addierern, Verzögerungen und Filtern) oder eines oder mehrerer Prozessoren, die Verstärkungs-, Addier-, Verzögerungs- und Filteranweisungen ausführen; oder in Software in einer Anwendungsprogrammierschnittstelle (application programming interface - API) oder in einer Dynamic Link Library (DLL), Funktionen, die in einem geteilten Speicher verfügbar sind oder als Local oder Remote Procedure Calls definiert sind; oder als Kombination von Hardware und Software umgesetzt werden.
Das Verfahren kann durch Software und/oder Firmware umgesetzt werden, die auf oder in einem computerlesbaren Medium, einem maschinenlesbaren Medium, einem Signalausbreitungsmedium und/oder einem signaltragenden Medium gespeichert ist. Das Medium kann eine beliebige Vorrichtung umfassen, die ausführbare Anweisungen zur Verwendung von oder in Verbindung mit einem System, einer Anordnung oder einer Vorrichtung zur Ausführung von Befehlen enthält, speichert, kommuniziert, verbreitet oder transportiert. Das maschinenlesbare Medium kann selektiv ein elektronisches, magnetisches, optisches, elektromagnetisches oder Infrarot-Signal oder ein Halbleitersystem, eine Anordnung, eine Vorrichtung oder ein Ausbreitungsmedium sein, ist jedoch nicht darauf beschränkt. Eine nicht vollständige Liste von Beispielen für ein maschinenlesbares Medium beinhaltet: eine magnetische oder optische Platte, einen flüchtigen Speicher, wie etwa einen Direktzugriffsspeicher (Random Access Memory - „RAM“), einen Nur-Lese-Speicher (Read-Only Memory - „ROM“), einen löschbaren programmierbaren Nur-Lese-Speicher (d. h. einen Erasable Programmable Read-Only Memory - EPROM) oder einen Flash-Speicher oder eine optische Faser. Ein maschinenlesbares Medium kann zudem ein greifbares Medium beinhalten, auf das ausführbare Anweisungen gedruckt werden, da die Logik elektronisch als Bild oder in einem anderen Format (z. B. durch einen optischen Scan) gespeichert, dann kompiliert und/oder interpretiert oder auf andere Weise verarbeitet werden kann. Das verarbeitete Medium kann dann in dem m Speicher eines Computers und/oder einer Maschine gespeichert werden.
Die Systeme können zusätzliche oder andere Logik beinhalten und können auf viele verschiedene Arten umgesetzt werden. Eine Steuerung kann als Mikroprozessor, Mikrocontroller, anwendungsspezifische integrierte Schaltung (application specific integrated circuit - ASIC), diskrete Logik oder eine Kombination anderer Arten von Schaltungen oder Logik umgesetzt werden. Gleichermaßen können die Speicher DRAM, SRAM, Flash oder andere Speicherarten sein. Parameter (z. B. Bedingungen und Schwellenwerte) und andere Datenstrukturen können getrennt gespeichert und verwaltet werden, können in einen einzelnen Speicher oder eine einzelne Datenbank integriert werden oder können auf viele verschiedene Arten logisch und physisch organisiert werden. Programme und Befehlssätze können Teile eines einzelnen Programms, getrennter Programme oder auf mehrere Speicher und Prozessoren verteilt sein.
Die Beschreibung der Ausführungsformen wurde zum Zwecke der Veranschaulichung und Beschreibung dargestellt. Geeignete Modifikationen und Variationen der Ausführungsformen können in Anbetracht der vorstehenden Beschreibung durchgeführt werden oder können durch Durchführen der Verfahren erreicht werden. Beispielsweise können, sofern nicht anders angegeben, eines oder mehrere der beschriebenen Verfahren durch eine geeignete Vorrichtung und/oder eine Kombination von Vorrichtungen durchgeführt werden. Die beschriebenen Verfahren und zugehörigen Aktionen können zudem zusätzlich zu der in dieser Anmeldung beschriebenen Reihenfolge auch parallel und/oder gleichzeitig in verschiedenen Reihenfolgen ausgeführt werden. Die beschriebenen Systeme sind beispielhafter Natur und können zusätzliche Elemente beinhalten und/oder Elemente weglassen.
Wie in dieser Anmeldung verwendet, sollte ein Element oder ein Schritt, das/der im Singular aufgeführt ist und dem das Wort „ein“ oder „eine“ vorangeht, so verstanden werden, dass der Plural der Elemente oder Schritte nicht ausgeschlossen ist, sofern kein derartiger Ausschluss angegeben ist. Darüber hinaus sollen Verweise auf „eine Ausführungsform“ oder „ein Beispiel“ der vorliegenden Offenbarung nicht so ausgelegt werden, dass sie die Existenz zusätzlicher Ausführungsformen ausschließen, die ebenfalls die aufgeführten Merkmale einbeziehen. Die Ausdrücke „erstes“, „zweites“ und „drittes“ usw. werden lediglich als Bezeichnungen verwendet und sollen ihren Objekten keine numerischen Anforderungen oder eine bestimmte Positionsreihenfolge auferlegen.
Während verschiedene Ausführungsformen der Erfindung beschrieben wurden, wird es für den Durchschnittsfachmann offensichtlich sein, dass innerhalb des Umfangs der Erfindung viele weitere Ausführungsformen und Umsetzungen möglich sind. Insbesondere erkennt der Fachmann die Austauschbarkeit verschiedener Merkmale aus verschiedenen Ausführungsformen. Obwohl diese Techniken und Systeme im Zusammenhang mit bestimmten Ausführungsformen und Beispielen offenbart wurden, versteht es sich, dass diese Techniken und Systeme über die spezifisch offenbarten Ausführungsformen hinaus auf andere Ausführungsformen und/oder Verwendungen und offensichtliche Modifikationen davon erweitert werden können.

Claims

Audiowiedergabesystem, umfassend: eine erste Eingangsleitung zum Übertragen eines Audiosignals, das einen ersten Audioinhalt darstellt; eine zweite Eingangsleitung zum Übertragen eines Audiosignals, das einen zweiten Audioinhalt darstellt; eine erste Audiowiedergabevorrichtung, die mit der ersten Eingangsleitung zum Empfangen des Audiosignals, das den ersten Audioinhalt darstellt, verbunden ist, wobei die erste Audiowiedergabevorrichtung einen ersten Lautsprecher oder eine erste Gruppe von Lautsprechern zum Wiedergeben des Audiosignals, das den ersten Audioinhalt darstellt, umfasst; eine zweite Audiovorrichtung, die mit der zweiten Eingangsleitung zum Empfangen eines Audiosignals, das den zweiten Audioinhalt darstellt, verbunden ist, wobei die zweite Audiovorrichtung einen zweiten Lautsprecher oder eine zweiten Gruppe von Lautsprechern zum Wiedergeben des Audiosignals, das den zweiten Audioinhalt darstellt, umfasst und die zweite Audiovorrichtung ferner ein Mikrofon oder eine Gruppe von Mikrofonen zum Aufnehmen von Ton, der von dem ersten Lautsprecher oder der ersten Gruppe von Lautsprechern und dem zweiten Lautsprecher oder der zweiten Gruppe von Lautsprechern stammt, umfasst, um mindestens ein Mikrofonsignal zu erzeugen; und einen im Allgemeinen mehrkanaligen akustischen Echokompensator, der das Mikrofonsignal und die beiden Audiosignale, die den ersten Audioinhalt und den zweiten Audioinhalt darstellen, empfängt, wobei der im Allgemeinen mehrkanalige akustische Echokompensator eine Vielzahl von Kompensationsfiltern umfasst, die dazu konfiguriert sind, die Impulsantworten von akustischen Pfaden zwischen jeder Eingangsleitung und dem mindestens einen Mikrofon oder der Gruppe von Mikrofonen zu modellieren und Impulsantworten der Kompensationsfilter anzupassen.
System nach Anspruch 1, wobei der im Allgemeinen mehrkanalige akustische Echokompensator ferner Folgendes umfasst: mindestens eine Verzögerungsleitung, wobei die Verzögerungsleitung betriebsmäßig mit einem der Kompensationsfilter in Reihe geschaltet ist; und eine Steuerung, die betriebsmäßig mit der mindestens einen Verzögerungsleitung zur Steuerung davon verbunden ist, wobei die Steuerung dazu konfiguriert ist, die Verzögerungszeit der mindestens einen Verzögerungsleitung zu steuern.
System nach Anspruch 2, wobei jedes der Kompensationsfilter dazu konfiguriert ist, seine Impulsantwort auf Grundlage eines Referenzsignals und eines Fehlersignals adaptiv anzupassen, wobei das Referenzsignal ein in dieses Kompensationsfilter eingegebenes Signal ist und das Fehlersignal die Differenz von einem Normsignal und einem von diesem Kompensationsfilter ausgegebenen Signal ist; und die Steuerung dazu konfiguriert ist, die mindestens eine Verzögerungsleitung auf Grundlage des entsprechenden Referenzsignals und des Fehlersignals zu steuern.
System nach einem der Ansprüche 1-3, wobei die Steuerung dazu konfiguriert ist, die Verzögerungszeit der mindestens einen Verzögerungsleitung auf Grundlage einer absoluten Hauptspitze der Impulsantwort des entsprechenden Kompensationsfilters anzupassen.
System nach Anspruch 4, wobei die Steuerung zum Anpassen der Verzögerungszeit dazu konfiguriert ist, in einem Zeitbereich und über ein volles Frequenzband, bezogen auf jeweilige Filtereingangssignale, eine Suche nach der absoluten Hauptspitze der Impulsantworten durchzuführen.
System nach Anspruch 4, wobei die Steuerung zum Anpassen der Verzögerungszeit dazu konfiguriert ist, eine Maximierung der Energie der entsprechenden Impulsantwort durchzuführen.
System nach Anspruch 2, wobei in dem im Allgemeinen mehrkanaligen akustischen Echokompensator nur das Kompensationsfilter, das einem akustischen Pfad entspricht, dessen Impulsantwort sich im Laufe der Zeit dynamisch ändert, betriebsmäßig mit der mindestens einen zu steuernden Verzögerungsleitung in Reihe geschaltet ist.
System nach einem der Ansprüche 1-7, wobei die Steuerung dazu konfiguriert ist, die mindestens eine Verzögerungsleitung nur dann zu steuern, wenn die zu kompensierende Verzögerungszeit einen vorbestimmten Schwellenwert überschreitet.
System nach einem der Ansprüche 1-7, wobei die Steuerung dazu konfiguriert ist, die mindestens eine Verzögerungsleitung nur dann zu steuern, wenn die Verzögerung durch einen elektrischen Signalübertragungspfad verursacht wird.
System nach einem der Ansprüche 1-9, wobei die mindestens eine Verzögerungsleitung mindestens eines von stromaufwärts und stromabwärts des entsprechenden Kompensationsfilters verbunden ist.
System nach einem der Ansprüche 1-10, wobei mindestens eine von der externen Vorrichtungen und der Set-Top-Box mehr als einen Signalkanal beinhaltet.
Audiowiedergabeverfahren, umfassend: Übertragen eines Audiosignals, das einen ersten Audioinhalt darstellt, über eine erste Eingangsleitung; Übertragen eines Audiosignals, das einen zweiten Audioinhalt darstellt, über eine zweite Eingangsleitung; Empfangen des Audiosignals, das den ersten Audioinhalt darstellt, durch eine erste Audiowiedergabevorrichtung, die mit der ersten Eingangsleitung verbunden ist, und Wiedergeben des Audiosignals, das den ersten Audioinhalt darstellt, über einen ersten Lautsprecher oder eine erste Gruppe von Lautsprechern der ersten Audiowiedergabevorrichtung; Empfangen des Audiosignals, das den zweiten Audioinhalt darstellt, durch eine zweite Audiovorrichtung, die mit der zweiten Eingangsleitung verbunden ist, Wiedergeben des Audiosignals, das den zweiten Audioinhalt darstellt, über einen zweiten Lautsprecher oder eine zweite Gruppe von Lautsprechern und Aufnehmen von Ton, der von dem ersten Lautsprecher oder der ersten Gruppe von Lautsprechern und dem zweiten Lautsprecher oder der zweiten Gruppe von Lautsprechern stammt, über mindestens ein Mikrofon oder eine Gruppe von Mikrofonen der zweiten Audiovorrichtung, um mindestens ein Mikrofonsignal zu erzeugen; und im Allgemeinen mehrkanalige Echokompensation auf Grundlage des mindestens einen Mikrofonsignals und der beiden Audiosignale, die den ersten Audioinhalt und den zweiten Audioinhalt darstellen, wobei die im Allgemeinen mehrkanalige akustische Echokompensation Kompensationsfilterung, um die Impulsantworten von akustischen Pfaden zwischen jeder Eingangsleitung und dem mindestens einen Mikrofon oder der Gruppe von Mikrofonen zu modellieren und Anpassen der Impulsantworten der Kompensationsfilterung umfasst.
Verfahren nach Anspruch 12, wobei die im Allgemeinen mehrkanalige akustische Echokompensation ferner Folgendes umfasst: Verzögern von mindestens einem kompensationsgefilterten Signal oder mindestens einem zu kompensationsfilternden Signal mit mindestens einer Verzögerungsleitung; und Steuern einer Verzögerungszeit der mindestens einen Verzögerungsleitung.
Verfahren nach Anspruch 13, wobei jede Kompensationsfilterung adaptives Anpassen ihrer Impulsantwort auf Grundlage eines Referenzsignals und eines Fehlersignals beinhaltet, wobei das Referenzsignal ein in diese Kompensationsfilterung eingegebenes Signal ist und das Fehlersignal die Differenz von einem Normsignal und einem von dieser Kompensationsfilterung ausgegebenen Signal ist, wobei das Verfahren ferner Folgendes umfasst: Steuern der Verzögerungszeit auf Grundlage des entsprechenden Referenzsignals und des Fehlersignals.
Verfahren nach einem der Ansprüche 12-14, ferner umfassend zum Anpassen der Verzögerungszeit Anpassen von Impulsantworten der Kompensationsfilterung auf Grundlage einer absoluten Hauptspitze der entsprechenden Impulsantwort.
Verfahren nach Anspruch 15, ferner umfassend Durchführen einer Suche nach der absoluten Hauptspitze der Impulsantworten in einem Zeitbereich und über ein volles Frequenzband, bezogen auf jeweilige Filtereingangssignale.
Verfahren nach Anspruch 15, ferner umfassend zum Anpassen der Verzögerungszeit Durchführen einer Maximierung der Energie der entsprechenden Impulsantwort.
Verfahren nach Anspruch 13, wobei bei der im Allgemeinen mehrkanaligen akustischen Echokompensation eine Verzögerung nur dann durchgeführt wird, wenn die entsprechende Kompensationsfilterung einen akustischen Pfad betrifft, dessen Impulsantwort sich im Laufe der Zeit dynamisch ändert.
Verfahren nach einem der Ansprüche 12-18, wobei die mindestens eine Verzögerung nur dann gesteuert wird, wenn die zu kompensierende Verzögerungszeit einen vorbestimmten Schwellenwert überschreitet.
Verfahren nach einem der Ansprüche 12-18, wobei die Steuerung dazu konfiguriert ist, die mindestens eine Verzögerungsleitung nur dann zu steuern, wenn die Verzögerung durch einen elektrischen Signalübertragungspfad verursacht wird.
Verfahren nach einem der Ansprüche 12-20, wobei die mindestens eine Verzögerung vor oder nach der entsprechenden Kompensationsfilterung verbunden ist.
Verfahren nach einem der Ansprüche 1-21, wobei mindestens eine von der externen Vorrichtung und der Set-Top-Box mehr als einen Signalkanal beinhaltet.
Computerprogrammprodukt, umfassend Anweisungen, die, wenn das Programm von einem Computer ausgeführt wird, den Computer veranlassen, das Verfahren nach einem der Ansprüche 12-22 auszuführen.