HK1160281B - Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal - Google Patents
Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signalInfo
- Publication number
- HK1160281B HK1160281B HK12100386.8A HK12100386A HK1160281B HK 1160281 B HK1160281 B HK 1160281B HK 12100386 A HK12100386 A HK 12100386A HK 1160281 B HK1160281 B HK 1160281B
- Authority
- HK
- Hong Kong
- Prior art keywords
- variation
- transform
- domain
- audio signal
- model
- Prior art date
Links
Claims (5)
- Ein Verfahren für zeitverzerrte Codierung eines Eingangsaudiosignals, wobei das Verfahren folgende Schritte aufweist:Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem transformierten Bereich beschreiben, das folgenden Schritt aufweist:Bestimmen eines oder mehrerer Modellparameter (140) eines Transformationsbereichsvariationsmodells, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten zeitlichen Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter darstellt, unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;wobei erste Transformationsbereichsinformationen, die einen ersten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein erstes Zeitintervall für eine Mehrzahl von unterschiedlichen Werten einer Transformationsvariable beschreiben, und zweite Transformationsbereichsinformationen, die einen zweiten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein zweites Zeitintervall für die unterschiedlichen Werte der Transformationsvariable beschreiben, als die tatsächlichen Transformationsbereichsparameter erhalten werden;wobei eine zeitliche Variation zwischen den ersten Transformationsbereichsinformationen und den zweiten Transformationsbereichsinformationen für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable (k) ausgewertet wird, um Informationen über die zeitliche Variation zu erhalten,wobei eine lokale Variation der Transformationsbereichsinformationen über der Transformationsvariable für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable geschätzt wird, um Informationen über die lokale Variation zu erhalten;wobei die Informationen über die zeitliche Variation und die Informationen über die lokale Variation kombiniert werden, um einen Tonhöhenvariationsmodellparameter zu erhalten;wobei der Tonhöhenvariationsmodellparameter unter Verwendung eines Transformationsbereichsvariationsmodells erhalten wird, das den Tonhöhenvariationsmodellparameter aufweist und eine Komprimierung oder Ausdehnung der Transformationsbereichsdarstellung des Audiosignals in Bezug auf die Transformationsvariable (k) darstellt, unter der Annahme einer glatten Tonhöhenvariation des Audiosignals; undwobei der Tonhöhenvariationsmodellparameter bestimmt wird, so dass das parametrisierte Transformationsbereichsvariationsmodell an den ersten Satz von Transformationsbereichsparametern und den zweiten Satz von Transformationsbereichsparametern angepasst ist;wobei der Tonhöhenvariationsparameter eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt; undDurchführen einer zeitverzerrten Signalabtastung des Eingangsaudiosignals unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung.
- Ein Verfahren für zeitverzerrtes Codieren eines Eingangsaudiosignals, wobei das Verfahren folgende Schritte aufweist:Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem Transformationsbereich beschreiben, das folgenden Schritt aufweist: Bestimmen eines oder mehrerer Modellparameter eines Transformationsbereichsvariationsmodells, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern (140) beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten zeitlichen Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter darstellt, unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;wobei Autokovarianzinformationen, die als Transformationsbereichsparameter verwendet werden, die eine Autokovarianz des Audiosignals für ein einzelnes Autokovarianzfenster aber für unterschiedliche Autokovarianzverzögerungswerte beschreiben, erhalten werden;wobei gewichtete Differenzen zwischen Paaren von Autokovarianzwerten für eine Mehrzahl von unterschiedlichen Paaren von Autokovarianzverzögerungswerten (- k, k) ausgewertet werden,wobei das Gewicht in Abhängigkeit von einer Differenz (2k) der Verzögerungswerte der jeweiligen Paare von Verzögerungswerten und in Abhängigkeit von einer Variation (q' - k) der Autokovarianzwerte über der Verzögerung gewählt wird,wobei unterschiedliche gewichtete Differenzwerte summenkombiniert werden, um einen Kombinationswert zu erhalten; undwobei der eine oder die mehreren Modellparameter (140), die einen Tonhöhenvariationsmodellparameter umfassen, der eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt, auf der Basis des Kombinationswerts erhalten werden; undDurchführen einer zeitverzerrten Signalabtastung des Eingangsaudiosignals unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung.
- Ein Computerprogramm zum Durchführen des Verfahrens gemäß Anspruch 1 oder Anspruch 2, wenn das Computerprogramm in einem Computer läuft.
- Ein zeitverzerrter Audiocodierer für zeitverzerrte Codierung eines Eingangsaudiosignals, wobei der zeitverzerrte Audiocodierer folgende Merkmale aufweist:eine Vorrichtung (100) zum Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter (120) einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem Transformationsbereich beschreiben, wobei die Vorrichtung folgende Merkmale aufweist: einen Parameterbestimmer (130), der dazu konfiguriert ist, einen oder mehrere Modellparameter (140) eines Transformationsbereichsvariationsmodells (130a; 130c) zu bestimmen, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern (140) beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter darstellt, unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;wobei die Vorrichtung (100) dazu konfiguriert ist, als die tatsächlichen Transformationsbereichsparameter erste Transformationsbereichsinformationen (R(k,h)), die einen ersten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein erstes Zeitintervall für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable (k) beschreiben, und zweite Transformationsbereichsinformationen (R(k,h+1)) zu erhalten, die einen zweiten Satz von Transformationsbereichsparametern aufweisen und das Audiosignal für ein zweites Zeitintervall für die unterschiedlichen Werte der Transformationsvariable (k) beschreiben;wobei der Parameterbestimmer (130) dazu konfiguriert ist, für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable (k) eine zeitliche Variation zwischen den ersten Transformationsbereichsinformationen und den zweiten Transformationsbereichsinformationen auszuwerten, um Informationen über die zeitliche Variation zu erhalten,eine lokale Variation der Transformationsbereichsinformationen über der Transformationsvariable für eine Mehrzahl von unterschiedlichen Werten der Transformationsvariable zu schätzen, um Informationen über die lokale Variation zu erhalten unddie Informationen über die zeitliche Variation und die Informationen über die lokale Variation zu kombinieren, um einen Tonhöhenvariationsmodellparameter (140) zu erhalten;wobei der Parameterbestimmer (130) dazu konfiguriert ist, den Tonhöhenvariationsmodellparameter unter Verwendung eines Transformationsbereichsvariationsmodells zu erhalten, das den Tonhöhenvariationsmodellparameter aufweist und eine Komprimierung oder Ausdehnung der Transformationsbereichsdarstellung des Audiosignals in Bezug auf die Transformationsvariable (k) darstellt, unter der Annahme einer glatten Tonhöhenvariation des Audiosignals;wobei der Parameterbestimmer dazu konfiguriert ist, den Tonhöhenvariationsmodellparameter zu bestimmen, so dass das parametrisierte Transformationsbereichsvariationsmodell an den ersten Satz von Transformationsbereichsparametern und den zweiten Satz von Transformationsbereichsparametern angepasst ist;wobei der Tonhöhenvariationsparameter eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt; undeinen Zeitverzerrtes-Signal-Prozessor, der dazu konfiguriert ist, unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung eine zeitverzerrte Signalabtastung des Eingangsaudiosignals durchzuführen.
- Ein zeitverzerrter Audiocodierer für zeitverzerrtes Codieren eines Eingangsaudiosignals, wobei der zeitverzerrte Audiocodierer folgende Merkmale aufweist:eine Vorrichtung (100) zum Erhalten eines Parameters, der eine zeitliche Variation einer Signalcharakteristik eines Audiosignals auf der Basis tatsächlicher Transformationsbereichsparameter (120) einer Transformationsbereichsdarstellung des Audiosignals beschreibt, die das Audiosignal in einem Transformationsbereich beschreiben, wobei die Vorrichtung folgende Merkmale aufweist: einen Parameterbestimmer (130), der dazu konfiguriert ist, einen oder mehrere Modellparameter (140) eines Transformationsbereichsvariationsmodells (130a; 130c) zu bestimmen, wobei das Variationsmodell eine Entwicklung von Transformationsbereichsparametern in Abhängigkeit von dem einen oder den mehreren Modellparametern (140) beschreibt, so dass ein Modellfehler, der eine Abweichung zwischen einer modellierten Entwicklung der Transformationsbereichsparameter und einer Entwicklung der tatsächlichen Transformationsbereichsparameter unter einen vorbestimmten Schwellenwert gebracht oder minimiert wird;wobei die Vorrichtung (100) dazu konfiguriert ist, Autokovarianzinformationen als Transformationsbereichsparameter (Q(k,t)=qk, Q(-k,t)=q-k) zu erhalten, die eine Autokovarinaz des Audiosignals für ein einzelnes Autokovarianzfenster aber für unterschiedliche Autokovarianzverzögerungswerte beschreiben,für eine Mehrzahl von unterschiedlichen Paaren von Autokovarianzverzögerungswerten (-k, k) gewichtete Differenzen (k2 (qk- q-k)) zwischen den Paaren von Autokovarianzwerten auszuwerten,wobei das Gewicht in Abhängigkeit von einer Differenz (2k) der Verzögerungswerte der jeweiligen Paare von Verzögerungswerten und in Abhängigkeit von einer Variation (q' - k) der Autokovarianzwerte über der Verzögerung gewählt wird,unterschiedliche Gewichte der Differenzwerte zu summenkombinieren, um einen Kombinationswert zu erhalten undden einen oder die mehreren Modellparameter (140), die einen Tonhöhenvariationsmodellparameter umfassen, der eine zeitliche Tonhöhenvariation des Eingangsaudiosignals beschreibt, auf der Basis des Kombinationswerts zu erhalten; undeinen Zeitverzerrtes-Signal-Prozessor, der dazu konfiguriert ist, eine zeitverzerrte Signalabtastung des Eingangsaudiosignals unter Verwendung des Tonhöhenvariationsparameters für eine Einstellung der Zeitverzerrung durchzuführen.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US20090146063P | 2009-01-21 | ||
| EP20090005486 | 2009-04-17 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| HK1160281A HK1160281A (en) | 2012-08-10 |
| HK1160281B true HK1160281B (en) | 2021-03-12 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP2380165B1 (de) | Vorrichtung, Verfahren und Computerprogramm zum Erhalt eines Parameters, der eine Variation einer Signaleigenschaft eines Signals beschreibt | |
| EP2178082B1 (de) | Verfahren zur verarbeitung eines zyklischen signals, verfahren zur umsetzung eines zyklischen signals, einrichtung zur verarbeitung eines zyklischen signals und verfahren zur analyse eines zyklischen signals | |
| Goh et al. | Kalman-filtering speech enhancement method based on a voiced-unvoiced speech model | |
| Le Roux et al. | Explicit consistency constraints for STFT spectrograms and their application to phase reconstruction. | |
| Nakatani et al. | Robust and accurate fundamental frequency estimation based on dominant harmonic components | |
| Islam et al. | Supervised single channel speech enhancement based on stationary wavelet transforms and non-negative matrix factorization with concatenated framing process and subband smooth ratio mask | |
| Chen et al. | Noise-robust pitch detection method using wavelet transform with aliasing compensation | |
| McAulay | Maximum likelihood spectral estimation and its application to narrow-band speech coding | |
| Srivastava | Fundamentals of linear prediction | |
| Le et al. | Harmonic enhancement using learnable comb filter for light-weight full-band speech enhancement model | |
| Chang et al. | Pitch estimation of speech signal based on adaptive lattice notch filter | |
| HK1160281B (en) | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal | |
| Kauppinen et al. | Improved noise reduction in audio signals using spectral resolution enhancement with time-domain signal extrapolation | |
| JP2005099405A (ja) | 雑音除去方法、雑音除去装置およびプログラム | |
| Kaewtip et al. | A pitch-based spectral enhancement technique for robust speech processing. | |
| Islam et al. | Speech enhancement in adverse environments based on non-stationary noise-driven spectral subtraction and snr-dependent phase compensation | |
| Shao et al. | Clean speech reconstruction from noisy mel-frequency cepstral coefficients using a sinusoidal model | |
| Bedoui et al. | On the Use of Spectrogram Inversion for Speech Enhancement | |
| JP2004012884A (ja) | 音声認識装置 | |
| Funaki | On evaluation of the f0 estimation based on time-varying complex speech analysis. | |
| Shimamura | Pitch synchronous addition and extension for linear predictive analysis of noisy speech | |
| Lei et al. | Wavelet-based speech enhancement using time-adapted noise estimation | |
| Funaki et al. | Low Computational Robust F0 Estimation of Speech Based on TV-CAR Analysis | |
| Farrokhi | Single Channel Speech Enhancement in Severe Noise Conditions | |
| Kang et al. | Selective-LPC based representation of STRAIGHT spectrum and its applications in spectral smoothing. |