HK1160281B

HK1160281B - Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal

Info

Publication number: HK1160281B
Application number: HK12100386.8A
Authority: HK
Inventors: Tom Backstrom; Stefan Bayer; Ralf Geiger; Max Neuendorf; Sascha Disch
Original assignee: 弗劳恩霍夫应用研究促进协会
Priority date: 2009-01-21
Filing date: 2010-01-11
Publication date: 2021-03-12

Claims

Procédé de codage à distorsion dans le temps d'un signal audio d'entrée, le procédé comprenant le fait de:
obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine transformé, comprenant le fait de:
déterminer un ou plusieurs paramètres (140) d'un modèle de variation dans le domaine de la transformée, le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle, de sorte qu'une erreur de modèle représentant un écart entre une évolution temporelle modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;

dans lequel des premières informations dans le domaine de la transformée comprenant un premier ensemble de paramètres dans le domaine de la transformée et décrivant le signal audio pendant un premier intervalle de temps pour une pluralité de valeurs différentes d'une variable de transformée et des deuxièmes informations dans le domaine de la transformée comprenant un deuxième ensemble de paramètres dans le domaine de la transformée et décrivant le signal audio pendant un deuxième intervalle de temps pour les différentes valeurs de la variable de transformée sont obtenues comme paramètres réels dans le domaine de la transformée;

dans lequel une variation temporelle entre les premières informations dans le domaine de la transformée et les deuxièmes informations dans le domaine de la transformée est évaluée pour une pluralité de valeurs différentes de la variable de transformée (k), pour obtenir les informations de variation temporelle,

dans lequel une variation locale des informations dans le domaine de la transformée sur la variable de transformée est estimée pour une pluralité de valeurs différentes de la variable de transformée, pour obtenir les informations de variation locale;

dans lequel les informations de variation temporelle et les informations de variation locale sont combinées, pour obtenir un paramètre de modèle de variation de hauteur de son;

dans lequel le paramètre de modèle de variation de hauteur de son est obtenu à l'aide d'un modèle de variation dans le domaine de la transformée comprenant le paramètre de modèle de variation de hauteur de son et représentant une compression ou une expansion de la représentation dans le domaine de la transformée du signal audio par rapport à la variable de transformée (k) en supposant une variation douce de hauteur de son du signal audio; et

dans lequel le paramètre de modèle de variation de hauteur de son est déterminé de sorte que le modèle de variation dans le domaine de la transformée paramétré soit adapté au premier ensemble de paramètres dans le domaine de la transformée et au deuxième ensemble de paramètres dans le domaine de la transformée;

dans lequel le paramètre de variation de hauteur de son décrit une variation de hauteur de son temporelle du signal audio d'entrée; et

effectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur de son pour un ajustement de la distorsion dans le temps.
Procédé de codage à distorsion dans le temps d'un signal audio d'entrée, le procédé comprenant le fait de:
obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine transformé, comprenant le fait de:
déterminer un ou plusieurs paramètres d'un modèle de variation dans le domaine de la transformée, le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle (140), de sorte qu'une erreur de modèle représentant un écart entre une évolution temporelle modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;

dans lequel est obtenue une information d'auto-covariance utilisée comme paramètres dans le domaine de la transformée décrivant une auto-covariance du signal audio pour une seule fenêtre d'auto-covariance, mais pour différentes valeurs de décalage d'auto-covariance;

dans lequel les différences pondérées entre paires de valeurs d'auto-covariance sont évaluées pour une pluralité de paires différentes de valeurs de décalage d'auto-covariance (-k, k),

dans lequel le poids est choisi en fonction d'une différence (2k) des valeurs de décalage des paires respectives de valeurs de décalage, et en fonction d'une variation (q' _-k) des valeurs d'auto-covariance sur le décalage,

dans lequel différentes valeurs de différence pondérées sont combinées en somme, pour obtenir une valeur de combinaison; et

dans lequel les un ou plusieurs paramètres de modèle (140), y compris un paramètre de modèle de variation de hauteur de son décrivant une variation de hauteur de son temporelle du signal audio d'entrée, sont obtenues sur base de la valeur de combinaison; et

effectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur pour un ajustement de la distorsion dans le temps.
Programme d'ordinateur pour réaliser le procédé selon la revendication 1 ou la revendication 2 lorsque le programme d'ordinateur est exécuté sur un ordinateur.
Codeur audio à distorsion dans le temps pour coder à distorsion dans le temps un signal audio d'entrée, le codeur audio à distorsion dans le temps comprenant:
un appareil (100) destiné à obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée (120) d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine de la transformée, l'appareil comprenant: un déterminateur de paramètres (130) configuré pour déterminer un ou plusieurs paramètres (140) d'un modèle de variation dans le domaine de la transformée (130a; 130c), le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle (140), de sorte qu'une erreur de modèle représentant un écart entre une évolution modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;

dans lequel l'appareil (100) est configuré pour obtenir, comme paramètres réels dans le domaine de la transformée, des premières informations dans le domaine de la transformée (R(k, h)) qui comprennent un premier ensemble de paramètres dans le domaine de la transformée et décrivent le signal audio pendant un premier intervalle de temps pour une pluralité de valeurs différentes de la variable de transformée (k), et des deuxièmes informations dans le domaine de la transformée (R(k, h + 1)) qui comprennent un deuxième ensemble de paramètres dans le domaine de la transformée et décrivent le signal audio pendant un deuxième intervalle de temps pour les différentes valeurs de la variable de transformée (k);

dans lequel le déterminateur de paramètres (130) est configuré pour évaluer, pour une pluralité de valeurs différentes de la variable de transformée (k), une variation temporelle entre les premières informations dans le domaine de la transformée et les deuxièmes informations dans le domaine de la transformée, pour obtenir des informations de variation temporelle,

pour estimer une variation locale des informations dans le domaine de la transformée sur la variable de transformée pour une pluralité de valeurs différentes de la variable de transformée, pour obtenir une information de variation locale, et

pour combiner les informations de variation temporelle et les informations de variation locale, pour obtenir un paramètre de modèle de variation de hauteur de son (140);

dans lequel le déterminateur de paramètres (130) est configuré pour obtenir le paramètre de modèle de variation de hauteur de son à l'aide d'un modèle de variation dans le domaine de la transformée comprenant le paramètre de modèle de variation de hauteur de son et représentant une compression ou une expansion de la représentation dans le domaine de la transformée du signal audio par rapport à la variable de transformée (k) en supposant une variation douce de hauteur de son du signal audio;

dans lequel le déterminateur de paramètre est configuré pour déterminer le paramètre de modèle de variation de hauteur de son de sorte que le modèle de variation dans le domaine de la transformée paramétré soit adapté au premier ensemble de paramètres dans le domaine de la transformée et au deuxième ensemble de paramètres dans le domaine de la transformée;

dans lequel le paramètre de variation de hauteur de son décrit une variation de hauteur de son temporelle du signal audio d'entrée; et

un processeur de signal à distorsion dans le temps configuré pour effectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur de son pour un ajustement de la distorsion dans le temps.
Codeur audio à distorsion dans le temps pour coder à distorsion dans le temps un signal audio d'entrée, le codeur audio à distorsion dans le temps comprenant:
un appareil (100) destiné à obtenir un paramètre décrivant une variation temporelle d'une caractéristique d'un signal audio sur base de paramètres réels dans le domaine de la transformée (120) d'une représentation dans le domaine de la transformée du signal audio décrivant le signal audio dans un domaine de la transformée, l'appareil comprenant: un déterminateur de paramètres (130) configuré pour déterminer un ou plusieurs paramètres d'un modèle de variation dans le domaine de la transformée (130a; 130c), le modèle de variation décrivant une évolution des paramètres dans le domaine de la transformée en fonction des un ou plusieurs paramètres de modèle (140), de sorte qu'une erreur de modèle représentant un écart entre une évolution modélisée des paramètres dans le domaine de la transformée et une évolution des paramètres réels dans le domaine de la transformée soit ramenée au-dessous d'une valeur de seuil prédéterminée ou minimisée;

dans lequel l'appareil (100) est configuré pour obtenir des informations d'auto-covariance comme paramètres dans le domaine de la transformée (Q(k,t)=q_k, Q(-k,t)=q-_k ) décrivant une auto-covariance du signal audio pour une seule fenêtre d'auto-covariance, mais pour différentes valeurs de décalage d'auto-covariance,

pour évaluer, pour une pluralité de paires différentes de valeurs de décalage d'auto-covariance (-k, k), les différences pondérées (k² (q_k - q_k )) entre les paires de valeurs d'auto-covariance,

dans lequel le poids est choisi en fonction d'une différence (2k) des valeurs de décalage des paires respectives de valeurs de décalage, et en fonction d'une variation (q' _-k) des valeurs d'auto-covariance sur le décalage,

pour combiner en somme différentes valeurs de différence pondérées, pour obtenir une valeur de combinaison, et

pour obtenir les un ou plusieurs paramètres de modèle (140), y compris un paramètre de modèle de variation de hauteur de son décrivant une variation temporelle de hauteur de son du signal audio d'entrée, sur base de la valeur de combinaison; et

un processeur de signal à distorsion dans le temps configuré pour effectuer un échantillonnage de signal à distorsion dans le temps du signal audio d'entrée à l'aide du paramètre de variation de hauteur de son pour un ajustement de la distorsion dans le temps.