HK1160281B

HK1160281B - Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal

Info

Publication number: HK1160281B
Application number: HK12100386.8A
Authority: HK
Inventors: Tom Backstrom; Stefan Bayer; Ralf Geiger; Max Neuendorf; Sascha Disch
Original assignee: 弗劳恩霍夫应用研究促进协会
Priority date: 2009-01-21
Filing date: 2010-01-11
Publication date: 2021-03-12

Claims

Ein Verfahren für zeitverzerrte Codierung eines Eingangsaudiosignals, wobei das Verfahren folgende Schritte aufweist:
Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem transformierten Bereich beschreiben, das folgenden Schritt aufweist:
Bestimmen eines oder mehrerer Modellparameter (140) eines Transformationsbereichsvariationsmodells, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten zeitlichen Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter darstellt, unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;

wobei erste Transformationsbereichsinformationen, die einen ersten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein erstes Zeitintervall für eine Mehrzahl von unterschiedlichen Werten einer Transformationsvariable beschreiben, und zweite Transformationsbereichsinformationen, die einen zweiten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein zweites Zeitintervall für die unterschiedlichen Werte der Transformationsvariable beschreiben, als die tatsächlichen Transformationsbereichsparameter erhalten werden;

wobei eine zeitliche Variation zwischen den ersten Transformationsbereichsinformationen und den zweiten Transformationsbereichsinformationen für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable (k) ausgewertet wird, um Informationen über die zeitliche Variation zu erhalten,

wobei eine lokale Variation der Transformationsbereichsinformationen über der Transformationsvariable für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable geschätzt wird, um Informationen über die lokale Variation zu erhalten;

wobei die Informationen über die zeitliche Variation und die Informationen über die lokale Variation kombiniert werden, um einen Tonhöhenvariationsmodellparameter zu erhalten;

wobei der Tonhöhenvariationsmodellparameter unter Verwendung eines Transformationsbereichsvariationsmodells erhalten wird, das den Tonhöhenvariationsmodellparameter aufweist und eine Komprimierung oder Ausdehnung der Transformationsbereichsdarstellung des Audiosignals in Bezug auf die Transformationsvariable (k) darstellt, unter der Annahme einer glatten Tonhöhenvariation des Audiosignals; und

wobei der Tonhöhenvariationsmodellparameter bestimmt wird, so dass das parametrisierte Transformationsbereichsvariationsmodell an den ersten Satz von Transformationsbereichsparametern und den zweiten Satz von Transformationsbereichsparametern angepasst ist;

wobei der Tonhöhenvariationsparameter eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt; und

Durchführen einer zeitverzerrten Signalabtastung des Eingangsaudiosignals unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung.
Ein Verfahren für zeitverzerrtes Codieren eines Eingangsaudiosignals, wobei das Verfahren folgende Schritte aufweist:
Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem Transformationsbereich beschreiben, das folgenden Schritt aufweist: Bestimmen eines oder mehrerer Modellparameter eines Transformationsbereichsvariationsmodells, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern (140) beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten zeitlichen Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter darstellt, unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;

wobei Autokovarianzinformationen, die als Transformationsbereichsparameter verwendet werden, die eine Autokovarianz des Audiosignals für ein einzelnes Autokovarianzfenster aber für unterschiedliche Autokovarianzverzögerungswerte beschreiben, erhalten werden;

wobei gewichtete Differenzen zwischen Paaren von Autokovarianzwerten für eine Mehrzahl von unterschiedlichen Paaren von Autokovarianzverzögerungswerten (- k, k) ausgewertet werden,

wobei das Gewicht in Abhängigkeit von einer Differenz (2k) der Verzögerungswerte der jeweiligen Paare von Verzögerungswerten und in Abhängigkeit von einer Variation (q' _- _k) der Autokovarianzwerte über der Verzögerung gewählt wird,

wobei unterschiedliche gewichtete Differenzwerte summenkombiniert werden, um einen Kombinationswert zu erhalten; und

wobei der eine oder die mehreren Modellparameter (140), die einen Tonhöhenvariationsmodellparameter umfassen, der eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt, auf der Basis des Kombinationswerts erhalten werden; und

Durchführen einer zeitverzerrten Signalabtastung des Eingangsaudiosignals unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung.
Ein Computerprogramm zum Durchführen des Verfahrens gemäß Anspruch 1 oder Anspruch 2, wenn das Computerprogramm in einem Computer läuft.
Ein zeitverzerrter Audiocodierer für zeitverzerrte Codierung eines Eingangsaudiosignals, wobei der zeitverzerrte Audiocodierer folgende Merkmale aufweist:
eine Vorrichtung (100) zum Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter (120) einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem Transformationsbereich beschreiben, wobei die Vorrichtung folgende Merkmale aufweist: einen Parameterbestimmer (130), der dazu konfiguriert ist, einen oder mehrere Modellparameter (140) eines Transformationsbereichsvariationsmodells (130a; 130c) zu bestimmen, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern (140) beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter darstellt, unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;

wobei die Vorrichtung (100) dazu konfiguriert ist, als die tatsächlichen Transformationsbereichsparameter erste Transformationsbereichsinformationen (R(k,h)), die einen ersten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein erstes Zeitintervall für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable (k) beschreiben, und zweite Transformationsbereichsinformationen (R(k,h+1)) zu erhalten, die einen zweiten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein zweites Zeitintervall für die unterschiedlichen Werte der Transformationsvariable (k) beschreiben;

wobei der Parameterbestimmer (130) dazu konfiguriert ist, für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable (k) eine zeitliche Variation zwischen den ersten Transformationsbereichsinformationen und den zweiten Transformationsbereichsinformationen auszuwerten, um Informationen über die zeitliche Variation zu erhalten,

eine lokale Variation der Transformationsbereichsinformationen über der Transformationsvariable für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable zu schätzen, um Informationen über die lokale Variation zu erhalten und

die Informationen über die zeitliche Variation und die Informationen über die lokale Variation zu kombinieren, um einen Tonhöhenvariationsmodellparameter (140) zu erhalten;

wobei der Parameterbestimmer (130) dazu konfiguriert ist, den Tonhöhenvariationsmodellparameter unter Verwendung eines Transformationsbereichsvariationsmodells zu erhalten, das den Tonhöhenvariationsmodellparameter aufweist und eine Komprimierung oder Ausdehnung der Transformationsbereichsdarstellung des Audiosignals in Bezug auf die Transformationsvariable (k) darstellt, unter der Annahme einer glatten Tonhöhenvariation des Audiosignals;

wobei der Parameterbestimmer dazu konfiguriert ist, den Tonhöhenvariationsmodellparameter zu bestimmen, so dass das parametrisierte Transformationsbereichsvariationsmodell an den ersten Satz von Transformationsbereichsparametern und den zweiten Satz von Transformationsbereichsparametern angepasst ist;

wobei der Tonhöhenvariationsparameter eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt; und

einen Zeitverzerrtes-Signal-Prozessor, der dazu konfiguriert ist, unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung eine zeitverzerrte Signalabtastung des Eingangsaudiosignals durchzuführen.
Ein zeitverzerrter Audiocodierer für zeitverzerrtes Codieren eines Eingangsaudiosignals, wobei der zeitverzerrte Audiocodierer folgende Merkmale aufweist:
eine Vorrichtung (100) zum Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter (120) einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem Transformationsbereich beschreiben, wobei die Vorrichtung folgende Merkmale aufweist: einen Parameterbestimmer (130), der dazu konfiguriert ist, einen oder mehrere Modellparameter (140) eines Transformationsbereichsvariationsmodells (130a; 130c) zu bestimmen, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern (140) beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;

wobei die Vorrichtung (100) dazu konfiguriert ist, Autokovarianzinformationen als Transformationsbereichsparameter (Q(k,t)=q_k, Q(-k,t)=q-_k) zu erhalten, die eine Autokovarinaz des Audiosignals für ein einzelnes Autokovarianzfenster aber für unterschiedliche Autokovarianzverzögerungswerte beschreiben,

für eine Mehrzahl von unterschiedlichen Paaren von Autokovarianzverzögerungswerten (-k, k) gewichtete Differenzen (k² (q_k- q_-k)) zwischen den Paaren von Autokovarianzwerten auszuwerten,

wobei das Gewicht in Abhängigkeit von einer Differenz (2k) der Verzögerungswerte der jeweiligen Paare von Verzögerungswerten und in Abhängigkeit von einer Variation (q' _- _k) der Autokovarianzwerte über der Verzögerung gewählt wird,

unterschiedliche Gewichte der Differenzwerte zu summenkombinieren, um einen Kombinationswert zu erhalten und

den einen oder die mehreren Modellparameter (140), die einen Tonhöhenvariationsmodellparameter umfassen, der eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt, auf der Basis des Kombinationswerts zu erhalten; und

einen Zeitverzerrtes-Signal-Prozessor, der dazu konfiguriert ist, eine zeitverzerrte Signalabtastung des Eingangsaudiosignals unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung durchzuführen.