[go: up one dir, main page]

HK1160281B - Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal - Google Patents

Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal

Info

Publication number
HK1160281B
HK1160281B HK12100386.8A HK12100386A HK1160281B HK 1160281 B HK1160281 B HK 1160281B HK 12100386 A HK12100386 A HK 12100386A HK 1160281 B HK1160281 B HK 1160281B
Authority
HK
Hong Kong
Prior art keywords
variation
transform
domain
audio signal
model
Prior art date
Application number
HK12100386.8A
Other languages
English (en)
French (fr)
Chinese (zh)
Other versions
HK1160281A (en
Inventor
Tom Backstrom
Stefan Bayer
Ralf Geiger
Max Neuendorf
Sascha Disch
Original Assignee
弗劳恩霍夫应用研究促进协会
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗劳恩霍夫应用研究促进协会 filed Critical 弗劳恩霍夫应用研究促进协会
Publication of HK1160281A publication Critical patent/HK1160281A/xx
Publication of HK1160281B publication Critical patent/HK1160281B/en

Links

Claims (5)

  1. Ein Verfahren für zeitverzerrte Codierung eines Eingangsaudiosignals, wobei das Verfahren folgende Schritte aufweist:
    Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem transformierten Bereich beschreiben, das folgenden Schritt aufweist:
    Bestimmen eines oder mehrerer Modellparameter (140) eines Transformationsbereichsvariationsmodells, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten zeitlichen Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter darstellt, unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;
    wobei erste Transformationsbereichsinformationen, die einen ersten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein erstes Zeitintervall für eine Mehrzahl von unterschiedlichen Werten einer Transformationsvariable beschreiben, und zweite Transformationsbereichsinformationen, die einen zweiten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein zweites Zeitintervall für die unterschiedlichen Werte der Transformationsvariable beschreiben, als die tatsächlichen Transformationsbereichsparameter erhalten werden;
    wobei eine zeitliche Variation zwischen den ersten Transformationsbereichsinformationen und den zweiten Transformationsbereichsinformationen für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable (k) ausgewertet wird, um Informationen über die zeitliche Variation zu erhalten,
    wobei eine lokale Variation der Transformationsbereichsinformationen über der Transformationsvariable für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable geschätzt wird, um Informationen über die lokale Variation zu erhalten;
    wobei die Informationen über die zeitliche Variation und die Informationen über die lokale Variation kombiniert werden, um einen Tonhöhenvariationsmodellparameter zu erhalten;
    wobei der Tonhöhenvariationsmodellparameter unter Verwendung eines Transformationsbereichsvariationsmodells erhalten wird, das den Tonhöhenvariationsmodellparameter aufweist und eine Komprimierung oder Ausdehnung der Transformationsbereichsdarstellung des Audiosignals in Bezug auf die Transformationsvariable (k) darstellt, unter der Annahme einer glatten Tonhöhenvariation des Audiosignals; und
    wobei der Tonhöhenvariationsmodellparameter bestimmt wird, so dass das parametrisierte Transformationsbereichsvariationsmodell an den ersten Satz von Transformationsbereichsparametern und den zweiten Satz von Transformationsbereichsparametern angepasst ist;
    wobei der Tonhöhenvariationsparameter eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt; und
    Durchführen einer zeitverzerrten Signalabtastung des Eingangsaudiosignals unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung.
  2. Ein Verfahren für zeitverzerrtes Codieren eines Eingangsaudiosignals, wobei das Verfahren folgende Schritte aufweist:
    Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem Transformationsbereich beschreiben, das folgenden Schritt aufweist: Bestimmen eines oder mehrerer Modellparameter eines Transformationsbereichsvariationsmodells, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern (140) beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten zeitlichen Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter darstellt, unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;
    wobei Autokovarianzinformationen, die als Transformationsbereichsparameter verwendet werden, die eine Autokovarianz des Audiosignals für ein einzelnes Autokovarianzfenster aber für unterschiedliche Autokovarianzverzögerungswerte beschreiben, erhalten werden;
    wobei gewichtete Differenzen zwischen Paaren von Autokovarianzwerten für eine Mehrzahl von unterschiedlichen Paaren von Autokovarianzverzögerungswerten (- k, k) ausgewertet werden,
    wobei das Gewicht in Abhängigkeit von einer Differenz (2k) der Verzögerungswerte der jeweiligen Paare von Verzögerungswerten und in Abhängigkeit von einer Variation (q' - k) der Autokovarianzwerte über der Verzögerung gewählt wird,
    wobei unterschiedliche gewichtete Differenzwerte summenkombiniert werden, um einen Kombinationswert zu erhalten; und
    wobei der eine oder die mehreren Modellparameter (140), die einen Tonhöhenvariationsmodellparameter umfassen, der eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt, auf der Basis des Kombinationswerts erhalten werden; und
    Durchführen einer zeitverzerrten Signalabtastung des Eingangsaudiosignals unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung.
  3. Ein Computerprogramm zum Durchführen des Verfahrens gemäß Anspruch 1 oder Anspruch 2, wenn das Computerprogramm in einem Computer läuft.
  4. Ein zeitverzerrter Audiocodierer für zeitverzerrte Codierung eines Eingangsaudiosignals, wobei der zeitverzerrte Audiocodierer folgende Merkmale aufweist:
    eine Vorrichtung (100) zum Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter (120) einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem Transformationsbereich beschreiben, wobei die Vorrichtung folgende Merkmale aufweist: einen Parameterbestimmer (130), der dazu konfiguriert ist, einen oder mehrere Modellparameter (140) eines Transformationsbereichsvariationsmodells (130a; 130c) zu bestimmen, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern (140) beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter darstellt, unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;
    wobei die Vorrichtung (100) dazu konfiguriert ist, als die tatsächlichen Transformationsbereichsparameter erste Transformationsbereichsinformationen (R(k,h)), die einen ersten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein erstes Zeitintervall für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable (k) beschreiben, und zweite Transformationsbereichsinformationen (R(k,h+1)) zu erhalten, die einen zweiten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein zweites Zeitintervall für die unterschiedlichen Werte der Transformationsvariable (k) beschreiben;
    wobei der Parameterbestimmer (130) dazu konfiguriert ist, für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable (k) eine zeitliche Variation zwischen den ersten Transformationsbereichsinformationen und den zweiten Transformationsbereichsinformationen auszuwerten, um Informationen über die zeitliche Variation zu erhalten,
    eine lokale Variation der Transformationsbereichsinformationen über der Transformationsvariable für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable zu schätzen, um Informationen über die lokale Variation zu erhalten und
    die Informationen über die zeitliche Variation und die Informationen über die lokale Variation zu kombinieren, um einen Tonhöhenvariationsmodellparameter (140) zu erhalten;
    wobei der Parameterbestimmer (130) dazu konfiguriert ist, den Tonhöhenvariationsmodellparameter unter Verwendung eines Transformationsbereichsvariationsmodells zu erhalten, das den Tonhöhenvariationsmodellparameter aufweist und eine Komprimierung oder Ausdehnung der Transformationsbereichsdarstellung des Audiosignals in Bezug auf die Transformationsvariable (k) darstellt, unter der Annahme einer glatten Tonhöhenvariation des Audiosignals;
    wobei der Parameterbestimmer dazu konfiguriert ist, den Tonhöhenvariationsmodellparameter zu bestimmen, so dass das parametrisierte Transformationsbereichsvariationsmodell an den ersten Satz von Transformationsbereichsparametern und den zweiten Satz von Transformationsbereichsparametern angepasst ist;
    wobei der Tonhöhenvariationsparameter eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt; und
    einen Zeitverzerrtes-Signal-Prozessor, der dazu konfiguriert ist, unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung eine zeitverzerrte Signalabtastung des Eingangsaudiosignals durchzuführen.
  5. Ein zeitverzerrter Audiocodierer für zeitverzerrtes Codieren eines Eingangsaudiosignals, wobei der zeitverzerrte Audiocodierer folgende Merkmale aufweist:
    eine Vorrichtung (100) zum Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter (120) einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem Transformationsbereich beschreiben, wobei die Vorrichtung folgende Merkmale aufweist: einen Parameterbestimmer (130), der dazu konfiguriert ist, einen oder mehrere Modellparameter (140) eines Transformationsbereichsvariationsmodells (130a; 130c) zu bestimmen, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern (140) beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;
    wobei die Vorrichtung (100) dazu konfiguriert ist, Autokovarianzinformationen als Transformationsbereichsparameter (Q(k,t)=qk, Q(-k,t)=q-k) zu erhalten, die eine Autokovarinaz des Audiosignals für ein einzelnes Autokovarianzfenster aber für unterschiedliche Autokovarianzverzögerungswerte beschreiben,
    für eine Mehrzahl von unterschiedlichen Paaren von Autokovarianzverzögerungswerten (-k, k) gewichtete Differenzen (k2 (qk- q-k)) zwischen den Paaren von Autokovarianzwerten auszuwerten,
    wobei das Gewicht in Abhängigkeit von einer Differenz (2k) der Verzögerungswerte der jeweiligen Paare von Verzögerungswerten und in Abhängigkeit von einer Variation (q' - k) der Autokovarianzwerte über der Verzögerung gewählt wird,
    unterschiedliche Gewichte der Differenzwerte zu summenkombinieren, um einen Kombinationswert zu erhalten und
    den einen oder die mehreren Modellparameter (140), die einen Tonhöhenvariationsmodellparameter umfassen, der eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt, auf der Basis des Kombinationswerts zu erhalten; und
    einen Zeitverzerrtes-Signal-Prozessor, der dazu konfiguriert ist, eine zeitverzerrte Signalabtastung des Eingangsaudiosignals unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung durchzuführen.
HK12100386.8A 2009-01-21 2010-01-11 Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal HK1160281B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US20090146063P 2009-01-21
EP20090005486 2009-04-17

Publications (2)

Publication Number Publication Date
HK1160281A HK1160281A (en) 2012-08-10
HK1160281B true HK1160281B (en) 2021-03-12

Family

ID=

Similar Documents

Publication Publication Date Title
EP2380165B1 (de) Vorrichtung, Verfahren und Computerprogramm zum Erhalt eines Parameters, der eine Variation einer Signaleigenschaft eines Signals beschreibt
EP2178082B1 (de) Verfahren zur verarbeitung eines zyklischen signals, verfahren zur umsetzung eines zyklischen signals, einrichtung zur verarbeitung eines zyklischen signals und verfahren zur analyse eines zyklischen signals
Goh et al. Kalman-filtering speech enhancement method based on a voiced-unvoiced speech model
Le Roux et al. Explicit consistency constraints for STFT spectrograms and their application to phase reconstruction.
Nakatani et al. Robust and accurate fundamental frequency estimation based on dominant harmonic components
Islam et al. Supervised single channel speech enhancement based on stationary wavelet transforms and non-negative matrix factorization with concatenated framing process and subband smooth ratio mask
Chen et al. Noise-robust pitch detection method using wavelet transform with aliasing compensation
McAulay Maximum likelihood spectral estimation and its application to narrow-band speech coding
Srivastava Fundamentals of linear prediction
Le et al. Harmonic enhancement using learnable comb filter for light-weight full-band speech enhancement model
Chang et al. Pitch estimation of speech signal based on adaptive lattice notch filter
HK1160281B (en) Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
Kauppinen et al. Improved noise reduction in audio signals using spectral resolution enhancement with time-domain signal extrapolation
JP2005099405A (ja) 雑音除去方法、雑音除去装置およびプログラム
Kaewtip et al. A pitch-based spectral enhancement technique for robust speech processing.
Islam et al. Speech enhancement in adverse environments based on non-stationary noise-driven spectral subtraction and snr-dependent phase compensation
Shao et al. Clean speech reconstruction from noisy mel-frequency cepstral coefficients using a sinusoidal model
Bedoui et al. On the Use of Spectrogram Inversion for Speech Enhancement
JP2004012884A (ja) 音声認識装置
Funaki On evaluation of the f0 estimation based on time-varying complex speech analysis.
Shimamura Pitch synchronous addition and extension for linear predictive analysis of noisy speech
Lei et al. Wavelet-based speech enhancement using time-adapted noise estimation
Funaki et al. Low Computational Robust F0 Estimation of Speech Based on TV-CAR Analysis
Farrokhi Single Channel Speech Enhancement in Severe Noise Conditions
Kang et al. Selective-LPC based representation of STRAIGHT spectrum and its applications in spectral smoothing.