[go: up one dir, main page]

HK1160281B - Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal - Google Patents

Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal

Info

Publication number
HK1160281B
HK1160281B HK12100386.8A HK12100386A HK1160281B HK 1160281 B HK1160281 B HK 1160281B HK 12100386 A HK12100386 A HK 12100386A HK 1160281 B HK1160281 B HK 1160281B
Authority
HK
Hong Kong
Prior art keywords
variation
transform
domain
audio signal
model
Prior art date
Application number
HK12100386.8A
Other languages
German (de)
English (en)
Chinese (zh)
Other versions
HK1160281A (en
Inventor
Tom Backstrom
Stefan Bayer
Ralf Geiger
Max Neuendorf
Sascha Disch
Original Assignee
弗劳恩霍夫应用研究促进协会
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗劳恩霍夫应用研究促进协会 filed Critical 弗劳恩霍夫应用研究促进协会
Publication of HK1160281A publication Critical patent/HK1160281A/xx
Publication of HK1160281B publication Critical patent/HK1160281B/en

Links

Claims (5)

  1. Procédé de codage à distorsion dans le temps d'un signal audio d'entrée, le procédé comprenant le fait de:
    obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine transformé, comprenant le fait de:
    déterminer un ou plusieurs paramètres (140) d'un modèle de variation dans le domaine de la transformée, le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle, de sorte qu'une erreur de modèle représentant un écart entre une évolution temporelle modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;
    dans lequel des premières informations dans le domaine de la transformée comprenant un premier ensemble de paramètres dans le domaine de la transformée et décrivant le signal audio pendant un premier intervalle de temps pour une pluralité de valeurs différentes d'une variable de transformée et des deuxièmes informations dans le domaine de la transformée comprenant un deuxième ensemble de paramètres dans le domaine de la transformée et décrivant le signal audio pendant un deuxième intervalle de temps pour les différentes valeurs de la variable de transformée sont obtenues comme paramètres réels dans le domaine de la transformée;
    dans lequel une variation temporelle entre les premières informations dans le domaine de la transformée et les deuxièmes informations dans le domaine de la transformée est évaluée pour une pluralité de valeurs différentes de la variable de transformée (k), pour obtenir les informations de variation temporelle,
    dans lequel une variation locale des informations dans le domaine de la transformée sur la variable de transformée est estimée pour une pluralité de valeurs différentes de la variable de transformée, pour obtenir les informations de variation locale;
    dans lequel les informations de variation temporelle et les informations de variation locale sont combinées, pour obtenir un paramètre de modèle de variation de hauteur de son;
    dans lequel le paramètre de modèle de variation de hauteur de son est obtenu à l'aide d'un modèle de variation dans le domaine de la transformée comprenant le paramètre de modèle de variation de hauteur de son et représentant une compression ou une expansion de la représentation dans le domaine de la transformée du signal audio par rapport à la variable de transformée (k) en supposant une variation douce de hauteur de son du signal audio; et
    dans lequel le paramètre de modèle de variation de hauteur de son est déterminé de sorte que le modèle de variation dans le domaine de la transformée paramétré soit adapté au premier ensemble de paramètres dans le domaine de la transformée et au deuxième ensemble de paramètres dans le domaine de la transformée;
    dans lequel le paramètre de variation de hauteur de son décrit une variation de hauteur de son temporelle du signal audio d'entrée; et
    effectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur de son pour un ajustement de la distorsion dans le temps.
  2. Procédé de codage à distorsion dans le temps d'un signal audio d'entrée, le procédé comprenant le fait de:
    obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine transformé, comprenant le fait de:
    déterminer un ou plusieurs paramètres d'un modèle de variation dans le domaine de la transformée, le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle (140), de sorte qu'une erreur de modèle représentant un écart entre une évolution temporelle modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;
    dans lequel est obtenue une information d'auto-covariance utilisée comme paramètres dans le domaine de la transformée décrivant une auto-covariance du signal audio pour une seule fenêtre d'auto-covariance, mais pour différentes valeurs de décalage d'auto-covariance;
    dans lequel les différences pondérées entre paires de valeurs d'auto-covariance sont évaluées pour une pluralité de paires différentes de valeurs de décalage d'auto-covariance (-k, k),
    dans lequel le poids est choisi en fonction d'une différence (2k) des valeurs de décalage des paires respectives de valeurs de décalage, et en fonction d'une variation (q' -k ) des valeurs d'auto-covariance sur le décalage,
    dans lequel différentes valeurs de différence pondérées sont combinées en somme, pour obtenir une valeur de combinaison; et
    dans lequel les un ou plusieurs paramètres de modèle (140), y compris un paramètre de modèle de variation de hauteur de son décrivant une variation de hauteur de son temporelle du signal audio d'entrée, sont obtenues sur base de la valeur de combinaison; et
    effectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur pour un ajustement de la distorsion dans le temps.
  3. Programme d'ordinateur pour réaliser le procédé selon la revendication 1 ou la revendication 2 lorsque le programme d'ordinateur est exécuté sur un ordinateur.
  4. Codeur audio à distorsion dans le temps pour coder à distorsion dans le temps un signal audio d'entrée, le codeur audio à distorsion dans le temps comprenant:
    un appareil (100) destiné à obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée (120) d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine de la transformée, l'appareil comprenant: un déterminateur de paramètres (130) configuré pour déterminer un ou plusieurs paramètres (140) d'un modèle de variation dans le domaine de la transformée (130a; 130c), le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle (140), de sorte qu'une erreur de modèle représentant un écart entre une évolution modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;
    dans lequel l'appareil (100) est configuré pour obtenir, comme paramètres réels dans le domaine de la transformée, des premières informations dans le domaine de la transformée (R(k, h)) qui comprennent un premier ensemble de paramètres dans le domaine de la transformée et décrivent le signal audio pendant un premier intervalle de temps pour une pluralité de valeurs différentes de la variable de transformée (k), et des deuxièmes informations dans le domaine de la transformée (R(k, h + 1)) qui comprennent un deuxième ensemble de paramètres dans le domaine de la transformée et décrivent le signal audio pendant un deuxième intervalle de temps pour les différentes valeurs de la variable de transformée (k);
    dans lequel le déterminateur de paramètres (130) est configuré pour évaluer, pour une pluralité de valeurs différentes de la variable de transformée (k), une variation temporelle entre les premières informations dans le domaine de la transformée et les deuxièmes informations dans le domaine de la transformée, pour obtenir des informations de variation temporelle,
    pour estimer une variation locale des informations dans le domaine de la transformée sur la variable de transformée pour une pluralité de valeurs différentes de la variable de transformée, pour obtenir une information de variation locale, et
    pour combiner les informations de variation temporelle et les informations de variation locale, pour obtenir un paramètre de modèle de variation de hauteur de son (140);
    dans lequel le déterminateur de paramètres (130) est configuré pour obtenir le paramètre de modèle de variation de hauteur de son à l'aide d'un modèle de variation dans le domaine de la transformée comprenant le paramètre de modèle de variation de hauteur de son et représentant une compression ou une expansion de la représentation dans le domaine de la transformée du signal audio par rapport à la variable de transformée (k) en supposant une variation douce de hauteur de son du signal audio;
    dans lequel le déterminateur de paramètre est configuré pour déterminer le paramètre de modèle de variation de hauteur de son de sorte que le modèle de variation dans le domaine de la transformée paramétré soit adapté au premier ensemble de paramètres dans le domaine de la transformée et au deuxième ensemble de paramètres dans le domaine de la transformée;
    dans lequel le paramètre de variation de hauteur de son décrit une variation de hauteur de son temporelle du signal audio d'entrée; et
    un processeur de signal à distorsion dans le temps configuré pour effectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur de son pour un ajustement de la distorsion dans le temps.
  5. Codeur audio à distorsion dans le temps pour coder à distorsion dans le temps un signal audio d'entrée, le codeur audio à distorsion dans le temps comprenant:
    un appareil (100) destiné à obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée (120) d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine de la transformée, l'appareil comprenant: un déterminateur de paramètres (130) configuré pour déterminer un ou plusieurs paramètres d'un modèle de variation dans le domaine de la transformée (130a; 130c), le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle (140), de sorte qu'une erreur de modèle représentant un écart entre une évolution modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;
    dans lequel l'appareil (100) est configuré pour obtenir des informations d'auto-covariance comme paramètres dans le domaine de la transformée (Q(k,t)=qk, Q(-k,t)=q-k ) décrivant une auto-covariance du signal audio pour une seule fenêtre d'auto-covariance, mais pour différentes valeurs de décalage d'auto-covariance,
    pour évaluer, pour une pluralité de paires différentes de valeurs de décalage d'auto-covariance (-k, k), les différences pondérées (k2 (qk - qk )) entre les paires de valeurs d'auto-covariance,
    dans lequel le poids est choisi en fonction d'une différence (2k) des valeurs de décalage des paires respectives de valeurs de décalage, et en fonction d'une variation (q' -k ) des valeurs d'auto-covariance sur le décalage,
    pour combiner en somme différentes valeurs de différence pondérées, pour obtenir une valeur de combinaison, et
    pour obtenir les un ou plusieurs paramètres de modèle (140), y compris un paramètre de modèle de variation de hauteur de son décrivant une variation temporelle de hauteur de son du signal audio d'entrée, sur base de la valeur de combinaison; et
    un processeur de signal à distorsion dans le temps configuré pour effectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur de son pour un ajustement de la distorsion dans le temps.
HK12100386.8A 2009-01-21 2010-01-11 Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal HK1160281B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US20090146063P 2009-01-21
EP20090005486 2009-04-17

Publications (2)

Publication Number Publication Date
HK1160281A HK1160281A (en) 2012-08-10
HK1160281B true HK1160281B (en) 2021-03-12

Family

ID=

Similar Documents

Publication Publication Date Title
EP2380165B1 (fr) Appareil, procédé et programme informatique pour obtenir un paramètre décrivant une variation de caractéristique de signal
EP2178082B1 (fr) Procédé de traitement de signal cyclique, procédé de conversion de signal cyclique, dispositif de traitement de signal cyclique et procédé d'analyse de signal cyclique
Goh et al. Kalman-filtering speech enhancement method based on a voiced-unvoiced speech model
Le Roux et al. Explicit consistency constraints for STFT spectrograms and their application to phase reconstruction.
Nakatani et al. Robust and accurate fundamental frequency estimation based on dominant harmonic components
Islam et al. Supervised single channel speech enhancement based on stationary wavelet transforms and non-negative matrix factorization with concatenated framing process and subband smooth ratio mask
Chen et al. Noise-robust pitch detection method using wavelet transform with aliasing compensation
McAulay Maximum likelihood spectral estimation and its application to narrow-band speech coding
Srivastava Fundamentals of linear prediction
Le et al. Harmonic enhancement using learnable comb filter for light-weight full-band speech enhancement model
Chang et al. Pitch estimation of speech signal based on adaptive lattice notch filter
HK1160281B (en) Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
Kauppinen et al. Improved noise reduction in audio signals using spectral resolution enhancement with time-domain signal extrapolation
JP2005099405A (ja) 雑音除去方法、雑音除去装置およびプログラム
Kaewtip et al. A pitch-based spectral enhancement technique for robust speech processing.
Islam et al. Speech enhancement in adverse environments based on non-stationary noise-driven spectral subtraction and snr-dependent phase compensation
Shao et al. Clean speech reconstruction from noisy mel-frequency cepstral coefficients using a sinusoidal model
Bedoui et al. On the Use of Spectrogram Inversion for Speech Enhancement
JP2004012884A (ja) 音声認識装置
Funaki On evaluation of the f0 estimation based on time-varying complex speech analysis.
Shimamura Pitch synchronous addition and extension for linear predictive analysis of noisy speech
Lei et al. Wavelet-based speech enhancement using time-adapted noise estimation
Funaki et al. Low Computational Robust F0 Estimation of Speech Based on TV-CAR Analysis
Farrokhi Single Channel Speech Enhancement in Severe Noise Conditions
Kang et al. Selective-LPC based representation of STRAIGHT spectrum and its applications in spectral smoothing.