HK1160281B - Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal - Google Patents
Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signalInfo
- Publication number
- HK1160281B HK1160281B HK12100386.8A HK12100386A HK1160281B HK 1160281 B HK1160281 B HK 1160281B HK 12100386 A HK12100386 A HK 12100386A HK 1160281 B HK1160281 B HK 1160281B
- Authority
- HK
- Hong Kong
- Prior art keywords
- variation
- transform
- domain
- audio signal
- model
- Prior art date
Links
Claims (5)
- Procédé de codage à distorsion dans le temps d'un signal audio d'entrée, le procédé comprenant le fait de:obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine transformé, comprenant le fait de:déterminer un ou plusieurs paramètres (140) d'un modèle de variation dans le domaine de la transformée, le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle, de sorte qu'une erreur de modèle représentant un écart entre une évolution temporelle modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;dans lequel des premières informations dans le domaine de la transformée comprenant un premier ensemble de paramètres dans le domaine de la transformée et décrivant le signal audio pendant un premier intervalle de temps pour une pluralité de valeurs différentes d'une variable de transformée et des deuxièmes informations dans le domaine de la transformée comprenant un deuxième ensemble de paramètres dans le domaine de la transformée et décrivant le signal audio pendant un deuxième intervalle de temps pour les différentes valeurs de la variable de transformée sont obtenues comme paramètres réels dans le domaine de la transformée;dans lequel une variation temporelle entre les premières informations dans le domaine de la transformée et les deuxièmes informations dans le domaine de la transformée est évaluée pour une pluralité de valeurs différentes de la variable de transformée (k), pour obtenir les informations de variation temporelle,dans lequel une variation locale des informations dans le domaine de la transformée sur la variable de transformée est estimée pour une pluralité de valeurs différentes de la variable de transformée, pour obtenir les informations de variation locale;dans lequel les informations de variation temporelle et les informations de variation locale sont combinées, pour obtenir un paramètre de modèle de variation de hauteur de son;dans lequel le paramètre de modèle de variation de hauteur de son est obtenu à l'aide d'un modèle de variation dans le domaine de la transformée comprenant le paramètre de modèle de variation de hauteur de son et représentant une compression ou une expansion de la représentation dans le domaine de la transformée du signal audio par rapport à la variable de transformée (k) en supposant une variation douce de hauteur de son du signal audio; etdans lequel le paramètre de modèle de variation de hauteur de son est déterminé de sorte que le modèle de variation dans le domaine de la transformée paramétré soit adapté au premier ensemble de paramètres dans le domaine de la transformée et au deuxième ensemble de paramètres dans le domaine de la transformée;dans lequel le paramètre de variation de hauteur de son décrit une variation de hauteur de son temporelle du signal audio d'entrée; eteffectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur de son pour un ajustement de la distorsion dans le temps.
- Procédé de codage à distorsion dans le temps d'un signal audio d'entrée, le procédé comprenant le fait de:obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine transformé, comprenant le fait de:déterminer un ou plusieurs paramètres d'un modèle de variation dans le domaine de la transformée, le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle (140), de sorte qu'une erreur de modèle représentant un écart entre une évolution temporelle modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;dans lequel est obtenue une information d'auto-covariance utilisée comme paramètres dans le domaine de la transformée décrivant une auto-covariance du signal audio pour une seule fenêtre d'auto-covariance, mais pour différentes valeurs de décalage d'auto-covariance;dans lequel les différences pondérées entre paires de valeurs d'auto-covariance sont évaluées pour une pluralité de paires différentes de valeurs de décalage d'auto-covariance (-k, k),dans lequel le poids est choisi en fonction d'une différence (2k) des valeurs de décalage des paires respectives de valeurs de décalage, et en fonction d'une variation (q' -k ) des valeurs d'auto-covariance sur le décalage,dans lequel différentes valeurs de différence pondérées sont combinées en somme, pour obtenir une valeur de combinaison; etdans lequel les un ou plusieurs paramètres de modèle (140), y compris un paramètre de modèle de variation de hauteur de son décrivant une variation de hauteur de son temporelle du signal audio d'entrée, sont obtenues sur base de la valeur de combinaison; eteffectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur pour un ajustement de la distorsion dans le temps.
- Programme d'ordinateur pour réaliser le procédé selon la revendication 1 ou la revendication 2 lorsque le programme d'ordinateur est exécuté sur un ordinateur.
- Codeur audio à distorsion dans le temps pour coder à distorsion dans le temps un signal audio d'entrée, le codeur audio à distorsion dans le temps comprenant:un appareil (100) destiné à obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée (120) d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine de la transformée, l'appareil comprenant: un déterminateur de paramètres (130) configuré pour déterminer un ou plusieurs paramètres (140) d'un modèle de variation dans le domaine de la transformée (130a; 130c), le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle (140), de sorte qu'une erreur de modèle représentant un écart entre une évolution modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;dans lequel l'appareil (100) est configuré pour obtenir, comme paramètres réels dans le domaine de la transformée, des premières informations dans le domaine de la transformée (R(k, h)) qui comprennent un premier ensemble de paramètres dans le domaine de la transformée et décrivent le signal audio pendant un premier intervalle de temps pour une pluralité de valeurs différentes de la variable de transformée (k), et des deuxièmes informations dans le domaine de la transformée (R(k, h + 1)) qui comprennent un deuxième ensemble de paramètres dans le domaine de la transformée et décrivent le signal audio pendant un deuxième intervalle de temps pour les différentes valeurs de la variable de transformée (k);dans lequel le déterminateur de paramètres (130) est configuré pour évaluer, pour une pluralité de valeurs différentes de la variable de transformée (k), une variation temporelle entre les premières informations dans le domaine de la transformée et les deuxièmes informations dans le domaine de la transformée, pour obtenir des informations de variation temporelle,pour estimer une variation locale des informations dans le domaine de la transformée sur la variable de transformée pour une pluralité de valeurs différentes de la variable de transformée, pour obtenir une information de variation locale, etpour combiner les informations de variation temporelle et les informations de variation locale, pour obtenir un paramètre de modèle de variation de hauteur de son (140);dans lequel le déterminateur de paramètres (130) est configuré pour obtenir le paramètre de modèle de variation de hauteur de son à l'aide d'un modèle de variation dans le domaine de la transformée comprenant le paramètre de modèle de variation de hauteur de son et représentant une compression ou une expansion de la représentation dans le domaine de la transformée du signal audio par rapport à la variable de transformée (k) en supposant une variation douce de hauteur de son du signal audio;dans lequel le déterminateur de paramètre est configuré pour déterminer le paramètre de modèle de variation de hauteur de son de sorte que le modèle de variation dans le domaine de la transformée paramétré soit adapté au premier ensemble de paramètres dans le domaine de la transformée et au deuxième ensemble de paramètres dans le domaine de la transformée;dans lequel le paramètre de variation de hauteur de son décrit une variation de hauteur de son temporelle du signal audio d'entrée; etun processeur de signal à distorsion dans le temps configuré pour effectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur de son pour un ajustement de la distorsion dans le temps.
- Codeur audio à distorsion dans le temps pour coder à distorsion dans le temps un signal audio d'entrée, le codeur audio à distorsion dans le temps comprenant:un appareil (100) destiné à obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée (120) d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine de la transformée, l'appareil comprenant: un déterminateur de paramètres (130) configuré pour déterminer un ou plusieurs paramètres d'un modèle de variation dans le domaine de la transformée (130a; 130c), le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle (140), de sorte qu'une erreur de modèle représentant un écart entre une évolution modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;dans lequel l'appareil (100) est configuré pour obtenir des informations d'auto-covariance comme paramètres dans le domaine de la transformée (Q(k,t)=qk, Q(-k,t)=q-k ) décrivant une auto-covariance du signal audio pour une seule fenêtre d'auto-covariance, mais pour différentes valeurs de décalage d'auto-covariance,pour évaluer, pour une pluralité de paires différentes de valeurs de décalage d'auto-covariance (-k, k), les différences pondérées (k2 (qk - qk )) entre les paires de valeurs d'auto-covariance,dans lequel le poids est choisi en fonction d'une différence (2k) des valeurs de décalage des paires respectives de valeurs de décalage, et en fonction d'une variation (q' -k ) des valeurs d'auto-covariance sur le décalage,pour combiner en somme différentes valeurs de différence pondérées, pour obtenir une valeur de combinaison, etpour obtenir les un ou plusieurs paramètres de modèle (140), y compris un paramètre de modèle de variation de hauteur de son décrivant une variation temporelle de hauteur de son du signal audio d'entrée, sur base de la valeur de combinaison; etun processeur de signal à distorsion dans le temps configuré pour effectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur de son pour un ajustement de la distorsion dans le temps.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US20090146063P | 2009-01-21 | ||
| EP20090005486 | 2009-04-17 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| HK1160281A HK1160281A (en) | 2012-08-10 |
| HK1160281B true HK1160281B (en) | 2021-03-12 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP2380165B1 (fr) | Appareil, procédé et programme informatique pour obtenir un paramètre décrivant une variation de caractéristique de signal | |
| EP2178082B1 (fr) | Procédé de traitement de signal cyclique, procédé de conversion de signal cyclique, dispositif de traitement de signal cyclique et procédé d'analyse de signal cyclique | |
| Goh et al. | Kalman-filtering speech enhancement method based on a voiced-unvoiced speech model | |
| Le Roux et al. | Explicit consistency constraints for STFT spectrograms and their application to phase reconstruction. | |
| Nakatani et al. | Robust and accurate fundamental frequency estimation based on dominant harmonic components | |
| Islam et al. | Supervised single channel speech enhancement based on stationary wavelet transforms and non-negative matrix factorization with concatenated framing process and subband smooth ratio mask | |
| Chen et al. | Noise-robust pitch detection method using wavelet transform with aliasing compensation | |
| McAulay | Maximum likelihood spectral estimation and its application to narrow-band speech coding | |
| Srivastava | Fundamentals of linear prediction | |
| Le et al. | Harmonic enhancement using learnable comb filter for light-weight full-band speech enhancement model | |
| Chang et al. | Pitch estimation of speech signal based on adaptive lattice notch filter | |
| HK1160281B (en) | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal | |
| Kauppinen et al. | Improved noise reduction in audio signals using spectral resolution enhancement with time-domain signal extrapolation | |
| JP2005099405A (ja) | 雑音除去方法、雑音除去装置およびプログラム | |
| Kaewtip et al. | A pitch-based spectral enhancement technique for robust speech processing. | |
| Islam et al. | Speech enhancement in adverse environments based on non-stationary noise-driven spectral subtraction and snr-dependent phase compensation | |
| Shao et al. | Clean speech reconstruction from noisy mel-frequency cepstral coefficients using a sinusoidal model | |
| Bedoui et al. | On the Use of Spectrogram Inversion for Speech Enhancement | |
| JP2004012884A (ja) | 音声認識装置 | |
| Funaki | On evaluation of the f0 estimation based on time-varying complex speech analysis. | |
| Shimamura | Pitch synchronous addition and extension for linear predictive analysis of noisy speech | |
| Lei et al. | Wavelet-based speech enhancement using time-adapted noise estimation | |
| Funaki et al. | Low Computational Robust F0 Estimation of Speech Based on TV-CAR Analysis | |
| Farrokhi | Single Channel Speech Enhancement in Severe Noise Conditions | |
| Kang et al. | Selective-LPC based representation of STRAIGHT spectrum and its applications in spectral smoothing. |