BRPI1005165B1

BRPI1005165B1 - Aparelho e método para obter um parâmetro que descreve uma variação de uma característica de sinal de um sinal de áudio

Info

Publication number: BRPI1005165B1
Application number: BRPI1005165-1A
Authority: BR
Inventors: Tom Bãckstrõm; Stefan Bayer; Max Neuendorf; Sascha Disch; Ralf Geiger
Original assignee: Fraunhofer-Gesellschaft Zur Fõrderung Der Angewandten Forschung E. V.
Priority date: 2009-01-21
Filing date: 2010-01-11
Publication date: 2021-07-27
Also published as: CN102334157B; MY160539A; CA2750037C; AU2010206229A1; JP2012515939A; AU2010206229B2; TW201108201A; CN102334157A; US8571876B2; CA2750037A1; MX2011007762A; PT2380165T; US20110313777A1; EP2380165B1; EP2211335A1; RU2543308C2; EP2380165A1; BRPI1005165A2; ZA201105338B; KR101307079B1

Abstract

aparelho, método e programa de computador para obter um parâmetro que descreve uma variação de uma característica de sinal de um sinal. um aparelho para obter um parâmetro que descreve uma variação de uma característica de um sinal com base nos parâmetros de domínio de transformação real que descrevem o sinal de áudio no domínio de transformação compreende um determinador de parâmetro. o de terminador de parâmetro é configurado para determinar um ou mais parâmetros de modelo de um modelo de variação de domínio de transformação que descreve uma evolução dos parâmetros de domínio de transformação dependendo de um ou mais parâmetros de modelo que representam uma característica de sinal, de maneira que um erro de modelo, que representa um desvio entre uma evolução temporal modelada dos parâmetros de domínio de transformação e uma evolução dos parâmetros de domínio de transformação real, seja trazido abaixo de um valor de limiar predeterminado ou minimizado.

Description

HISTÓRICO DA INVENÇÃO

[0001] As configurações, de acordo com a invenção, referem-se a um aparelho e um método para obter um parâmetro que descreve uma variação de uma característica de sinal de um sinal com base nos parâmetros de domínio de transformação real que descrevem o sinal de áudio em um domínio de transformação.

[0002] As configurações preferidas, de acordo com a invenção, referem-se a um aparelho e um método para obter um parâmetro que descreve uma variação temporal de uma característica de sinal de um sinal de áudio com base nos parâmetros de domínio de transformação real que descrevem o sinal de áudio em um domínio de transformação. As configurações adicionais, de acordo com a invenção, referem-se à estimativa de variação de sinal.

[0003] Uma vez que o escopo principal da atual invenção é a análise de variações temporais de sinais de áudio, o mesmo método pode ser facilmente adaptado a qualquer sinal digital e variações que esses sinais apresentam em qualquer de seus eixos. Esses sinais e variações incluem, por exemplo, variações espaciais e temporais nas características, como intensidade e contraste de imagens e filmes, modulações (variações) nas características, como amplitude e frequência de sinais de radar e rádio e variações nas propriedades, como heterogeneidade de sinais de eletrocardiograma.

[0004] A seguir, uma breve descrição em relação ao tfconceito de estimativa de variação de sinal será dada. 0 processamento de sinal clássico geralmente se inicia com a presunção de sinais fixos localmente e para muitas aplicações, essa é uma presunção razoável. Entretanto, para reivindicar que 5 sinais, como a fala e de áudio, são localmente fixos, estende-se a realidade além dos niveis aceitáveis em alguns casos. Os sinais cujas características mudam rapidamente introduzem distorções aos resultados de análises que são dificeis de conter por abordagens clássicas e, portanto, precisam de metodologia especial sob medida 10 para sinais que variam rapidamente.

Por exemplo, a codificação de um sinal de fala com uma transformação com base no codificador pode ser considerada. Aqui, o sinal de entrada é analisado em janelas, cujos conteúdos são transformados ao dominio espectral. Quando o 15 sinal é um sinal harmônico cuja frequência fundamental se altera rapidamente, as localizações de picos espectrais, correspondentes à harmonia, mudam conforme o tempo. Se, por exemplo, a extensão de janela de análise for relativamente longa em comparação à alteração na frequência fundamental, os picos espectrais são 20 estendidos a caixas de frequência próximas. Em outras palavras, a representação espectral se torna espalhada. Essa distorção pode ser especialmente grave em frequências superiores, onde a localização de picos espectrais se move mais rapidamente quando a frequência fundamental muda.

Enquanto existem métodos para compensação dealterações na frequência fundamental, como as transformada discreta de cosseno modificada por distorção de tempo (TW MDCT) (vide referências [8] e [3]), a estimativa de variação de ângulo permanece um desafio.

No passado, a variação de ângulo foi estimada ao medir o ângulo e simplesmente tendo a derivada de tempo. Entretanto, uma vez que a estimativa de ângulo é uma tarefa 5 difícil e geralmente ambígua, a variação de ângulo estima onde está repleto de erros. A estimativa de ângulo sofre, entre outros, de dois tipos de erros comuns (vide, por exemplo, a referência Mb [2]). Primeiramente, quando a harmonia tiver mais energia do que ofundamental, os estimadores são geralmente levados a acreditar que 10 a harmonia é realmente o fundamental, por meio de que a saída é um múltiplo da real frequência. Esses erros podem ser observados como descontinuidades no caminho do ângulo e produzem um erro imenso em termos de derivada de tempo. Segundamente, a maioria dos métodos de estimativa de ângulo basicamente conta com a seleção de pico 15 no(s) domínio(s) de autocorrelação (ou similar) por alguns heurísticos. Especialmente no caso de sinais que variam, esses picos são amplos (planos no topo), pelos quais um pequeno erro na estimativa de autocorrelação pode mover a localização do pico estimado de maneira significativa. A estimativa de ângulo é, 20 portanto, uma estimativa instável.

Conforme indicado acima, a abordagem geral no processamento de sinal é presumir que o sinal é constante em curtos intervalos de tempo e estimar as propriedades nesses intervalos. Se, então, o sinal estiver realmente variando no 25 tempo, presume-se que a evolução de tempo do sinal é suficientemente lenta, de maneira que a presunção da parada em um curto intervalo e tempo é suficientemente precisa e a análise em curtos intervalos não produzirá distorção significativa. , i

Face ao exposto, é desejável prover um conceito para obter um parâmetro que descreve uma variação temporal de uma característica de sinal com robustez melhorada.

SUMÁRIO DA INVENÇÃO

Uma configuração, de acordo com a invenção criaum aparelho para obter um parâmetro que descreve uma variação temporal de uma característica de sinal de um sinal de áudio com base nos parâmetros de domínio de transformação real que descrevem o sinal de áudio em um dominio de transformação. 0 aparelho 10 compreende um determinador de parâmetro configurado para determinar um ou mais parâmetros de modelo de um modelo de variação de dominio de transformação que descreve uma evolução temporal dos parâmetros de dominio de transformação dependendo de um ou mais parâmetros de modelo que representam uma característica 15 de sinal, de maneira que um erro de modelo, representação de um desvio entre uma evolução temporal modelada dos parâmetros de dominio de transformação e uma evolução temporal dos parâmetros de dominio de transformação real, seja trazido abaixo de um valor de limiar predeterminado, ou seja, minimizado.

Essa configuração tem base na descoberta quevariações temporais tipicas de um sinal de áudio resultam em uma evolução temporal característica no dominio de transformação, que pode ser bem descrito utilizando somente um número limitado de parâmetros de modelo. Ao passo em que essa particularidade é 25 verdadeira para sinais de voz, onde a evolução temporal característica é determinada pela anatomia tipica dos organismos de fala humanos, a presunção detém uma vasta gama de sinais deáudio e outros, como sinais de música tipicos.

Além disso, a evolução temporal tipicamente suave de uma característica de sinal (como, por exemplo, um ângulo, um invólucro, uma tonalidade, um ruido e assim por diante) pode ser considerada pelo modelo de variação de dominio de transformação.

Da mesma forma, o uso de um modelo de variação de dominio de transformação parametrizado também pode servir para reforçar (ou para considerar) a suavidade da característica de sinal estimada. Portanto, descontinuidades da característica de sinal estimada, ou sua derivada, podem ser evitadas. Ao escolher o modelo de variação 10 de dominio de transformação da mesma forma, quaisquer restrições típicas podem ser impostas na modelo de variação da das características de sinal, como, por exemplo, uma taxa limitada de variação, uma variação limitada de valores e assim por diante. Também, ao escolher ô modelo de variação de dominio de 15 transformação adequadamente, os efeitos de harmonia podem ser considerados, de maneira que, por exemplo, uma segurança melhorada possa ser obtida ao modelar simultaneamente uma evolução temporal de uma frequência fundamental e sua harmonia.

Adicionalmente, ao utilizar uma modelagem de 20 variação no dominio de transformação, o efeito das distorções do pode ser restrito. Enquanto alguns tipos de distorção (por exemplo, um atraso de sinal dependente da frequência) resultariam em uma modificação grave de uma forma de onda de sinal, essa distorção pode ter um impacto limitado na representação de dominio 25 de transformação de um sinal. Como é naturalmente desejável também estimar precisamente as características de sinal na presença de distorções, o uso do dominio de transformação mostrou-se uma escolha muito boa.

Para resumir o exposto acima, o uso de um modelo de variação de dominio de transformação, os parâmetros do qual são adaptados para trazer o modelo de variação de dominio de transformação parametrizado (ou sua saida) em concordância com uma 5 evolução temporal real dos parâmetros de dominio de transformação real que descrevem um sinal de áudio de entrada, permite que as características de sinal de um sinal de áudio típico possam ser determinadas com boa precisão e segurança.

Em uma configuração preferida, o aparelho pode 10 ser configurado para obter, como parâmetros de dominio de transformação real, um primeiro conjunto de parâmetros de dominio de transformação que descreve um primeiro intervalo de tempo do sinal de áudio no dominio de transformação para um conjunto predeterminado de valores de uma variável de transformação (também 15 designada aqui como "variável de transformação") . Semelhantemente, o aparelho pode ser configurado para obter um segundo conjunto de parâmetros de dominio de transformação que descreve um segundo intervalo de tempo do sinal de áudio no dominio de transformação para o conjunto predeterminado de valores da variável de 20 transformação. Nesse caso, o determinador de parâmetro pode ser configurado para obter um parâmetro de modelo de variação de frequência (ou ângulo) utilizando um modelo de variação de dominio de transformação parametrizado compreendendo um parâmetro de variação por frequência (ou variação por ângulo) e que representa 25 uma compressão ou expansão da representação de dominio de transformação do sinal de áudio em relação à variável de transformação presumindo uma variação de frequência suave do sinalde áudio. O determinador de parâmetro pode ser configurado para determinar o parâmetro de variação de frequência de maneira que o modelo de variação de dominio de transformação parametrizado seja adaptado ao primeiro conjunto de parâmetros de dominio de transformação e ao segundo conjunto de parâmetros de dominio de 5 transformação. Ao utilizar essa abordagem, pode ser feito um uso muito eficiente das informações disponíveis no dominio de transformação. Descobriu-se que uma representação de dominio de transformação de um sinal de áudio (por exemplo, uma representação de dominio de autocorrelação, uma representação de dominio de 10 autocovariância, uma representação de dominio de transformação Fourier, uma representação de dominio de transformação de cosseno discreta e assim por diante) é suavemente expandida ou comprimida com a frequência ou ângulo fundamental variando. Ao modelar essa compressão ou expansão suave da representação de dominio de 15 transformação, o conteúdo completo de informações da representação de dominio de transformação pode ser explorado, uma vez que diversas amostras da representação de dominio de transformação (para diferentes valores da variável de transformação) podem ser combinadas.

Em uma configuração preferida, o aparelho podeser configurado para obter, como parâmetros de dominio de transformação real, parâmetros de domínio de transformação que descrevem o sinal de áudio no domínio de transformação como uma função de uma variável de transformação. O domínio de 25 transformação pode ser escolhido de maneira que uma transposição de frequência do sinal de áudio resulte em pelo menos uma troca de frequência da representação de domínio de transformação do sinal prolongamento da representação de dominio de transformação em relação à variável de transformação, ou em uma compressão da representação de dominio de transformação em relação à variável de transformação. 0 determinador de parâmetro pode ser configurado 5 para obter um parâmetro de modelo de variação por frequência (ou parâmetro de modelo de variação por ângulo) com base em uma variação temporal dos parâmetros de dominio de transformação real correspondentes (por exemplo, associados ao mesmo valor da variável de transformação) levando em consideração uma dependência 10 da representação de dominio de transformação do sinal de áudio davariável de transformação. Utilizando essa abordagem, as informações sobre uma variação temporal dos parâmetros de dominiode transformação real correspondentes (por exemplo, parâmetros de dominio de transformação para retardo de autocorrelação idêntico, 15 retardo de autocovariância ou caixa de frequência de transformaçãopor Fourier) podem ser avaliados separadamente para as informações em relação a uma dependência da representação de dominio de transformação da variável de transformação. Subsequentemente, as informações calculadas separadamente podem ser combinadas.Portanto, uma maneira particularmente eficiente está disponível para estimar a expansão ou compressão da representação de domínio de transformação, por exemplo, ao comparar diversos pares dos parâmetros de domínio de transformação e levando em consideração um declive local estimado da variação dependente de parâmetro detransformação da representação de dominio de transformação. Em outras palavras, a inclinação local da representação de domínio de transformação, dependendo do parâmetro de transformação, e a alteração temporal da representação de domínio de transformação (por exemplo, através das janelas subsequentes) podem ser combinadas para estimar uma magnitude da compressão ou expansão temporal da representação de dominio de transformação, que no retorno é uma medida de uma variação de frequência ou variação de 5 ângulo temporal.

Configurações preferidas adicionais também são definidas nas reivindicações dependentes.

Uma outra configuração, de acordo com a invenção cria um método para obter um parâmetro que descreve uma variação 10 temporal de uma característica de sinal de um sinal de áudio com base nos parâmetros de dominio de transformação real que descrevem o sinal de áudio em um dominio de transformação.

Ainda uma outra configuração cria um programa de computador para obter um parâmetro que descreve uma variação 15 temporal de uma característica de sinal de um sinal de áudio.

BREVE DESCRIÇÃO DOS DESENHOS

A Figura la apresenta um diagrama em blocos esquemático de um aparelho para obter um parâmetro que descreve uma variação temporal de uma característica de sinal de um sinal 20 de áudio;

A Figura 1b apresenta um fluxograma de um método para obter um parâmetro que descreve uma variação temporal de uma característica de sinal de um sinal de áudio;

A Figura 2 apresenta um fluxograma de um método 25 para obter um parâmetro que descreve uma evolução temporal de um invólucro de sinal, de acordo com uma configuração da invenção;

A Figura 3a apresenta um fluxograma de um método para obter um parâmetro que descreve uma variação temporal de um ângulo, de acordo com uma configuração da invenção;

A Figura 3b apresenta um fluxograma simplificado do método para obter um parâmetro que descreve a evolução temporal do ângulo;

A Figura 4 apresenta um fluxograma de um métodomelhorado para obter um parâmetro que descreve uma variação temporal de um ângulo, de acordo com uma configuração da invenção;

A Figura 5 apresenta um fluxograma de um método para obter um parâmetro que descreve uma variação temporal de uma 10 característica de sinal de um sinal de áudio em um domínio de autocovariância;

A Figura 6 apresenta um diagrama em blocos esquemático de um codificador de sinal de áudio, de acordo com a configuração da invenção; e

A Figura 7 apresenta um fluxograma de um métodogeral para obter um parâmetro que descreve uma variação de um sinal.

DESCRIÇÃO DETALHADA DA CONFIGURAÇÃO

A seguir, o conceito de Modelagem de variaçãoserá descrito no geral para facilitar o entendimento da presente invenção. Subsequentemente, uma configuração genérica, de acordo com a invenção, será descrita tendo como referência as Figuras la e lb. Subsequentemente, configurações mais específicas serão descritas tendo como referência as Figuras 2 a 5. Finalmente, aaplicação do conceito inventivo para uma codificação de sinal de áudio será descrita tendo como referência a Figura 6 e será dado um resumo tendo como referência a Figura 7.Para evitar confusão, a terminologia será utilizada como segue:• com o termo "variação", referimo-nos a um conjunto geral de funções que descrevem a alteração nas características no tempo, e«a derivada (parcial) d / õx é utilizada como umaentidade definida matematicamente de maneira precisa.

Em outras palavras, "variação" se refere às características de sinal (em um nivel abstrato), enquanto "derivada" é utilizada sempre que a definição matemática õ/õx for 10 utilizada, por exemplo, como k (retardo de autocorrelação/retardo de autocovariância) ou t (tempo) derivadas de autocorrelação/covariância.

Quaisquer outras medidas de alteração serão explicadas em palavras, tipicamente, sem utilizar o termo 15 "variação".

Adicionalmente, as configurações, de acordo com a invenção, serão subsequentemente descritas para uma estimativa de variação temporal dos sinais de áudio. Entretanto, a presente invenção não se restringe somente aos sinais de áudio e somente àsvariações temporais. Preferencialmente, as configurações, de acordo com a invenção, podem ser aplicadas para estimar variações gerais de sinais, mesmo que a invenção seja, no momento, utilizada principalmente para estimar as variações temporais dos sinais de áudio.

Modelagem de variação

Visão geral sobre Modelagem de variaçãoFalando no geral, as configurações, de acordo coma invenção utilizam modelos de variação para a análise de um sinal 12765de áudio de entrada. Portanto, a modelo de variação é utilizada para prover um método para estimar a variação.

Presunções para a Modelagem de variação

A seguir, algumas diferenças entre umacaracterística convencional de estimativa de sinal e o conceito aplicado nas configurações, de acordo com a presente invenção, serão discutidas.

Enquanto métodos tradicionais presumem que as características do sinal (por exemplo, um sinal de áudio) são 10 constantes (ou fixas) em curtas janelas de tempo, essa é uma das abordagens primárias da invenção atual para presumir que a taxa de alteração (normalizada.) (por exemplo, de uma característica de sinal, (como um ângulo ou um invólucro) ) é constante em uma curta janela de tempo. Portanto, enquanto métodos tradicionais podem 15 tratar de sinais fixos assim como, dentro de um nivel modesto de distorção, sinais que mudam lentamente, algumas configurações, de acordo com a presente invenção, podem tratar de sinais fixos, sinais que mudam linearmente (ou sinais que mudam exponencialmente), assim como, com um nivel modesto de distorção, 20 esses sinais que mudam de maneira não linear onde a taxa de alteração não linear é lenta.

Conforme observado acima, essa é uma das abordagens primárias da presente invenção para presumir que a taxa de alteração (normalizada) é constante em uma janela curta, mas o 25 método e conceito apresentados podem ser facilmente estendidos a um caso mais geral. Por exemplo, a taxa de mudança normalizada, a variação, pode ser modelada por qualquer função, e enquanto õ parâmetros do que o número de pontos de dados, os parâmetros de modelo podem ser solucionados de maneira não ambígua.

Nas configurações preferidas, o modelo de variação pode, por exemplo, descrever uma mudança suave de uma 5 característica de sinal. Por exemplo, o modelo pode ter base na presunção que uma característica de sinal (ou sua taxa de mudança normalizada) segue uma versão escalada de uma função elementar, ou uma combinação escalada de funções elementares (onde as funções elementares compreendem:

loga(x); sinh x; cosh x; tanh x; coth x; arsinh x; arcosh x; artanh x; arcoth x; sin x; cos x; tan x; cot x; see x; esc x; aresin x; arecos x; arctan x; arccot x). Em algumas configurações, prefere-se que a função que descreve a evolução temporal da característica de sinal ou da taxa de mudança normalizada seja 15 constante e suave durante a variação de interesse.

Aplicabilidade em diferentes domínios

Um dos campos primários da aplicação do conceito de acordo com a presente invenção é a análise das características de sinal onde . a magnitude de mudança, a variação, tem mais 20 informações do que a magnitude dessa característica. Por exemplo, em termos de ângulo, isso significa que as configurações, de acordo com a invenção, referem-se a aplicações em que é mais interessante a mudança no ângulo, do que a magnitude de ângulo.

Se, entretanto, em uma aplicação, é mais 25 interessante a magnitude de uma característica de sinal do que sua taxa de mudança, pode ser ainda benéfico a partir do conceito, de acordo com a presente invenção. Por exemplo, se uma primeirainformação sobre as características de sinal estiver disponível, Jcomo a variação válida para a taxa de mudança, então o variação de sinal pode ser utilizado como informações adicionais a fim de obter contornos de tempo precisos e robustos da característica de sinal. Por exemplo, em termos de ângulo, é possivel estimar oângulo pelos métodos convencionais, estrutura por estrutura, e utilizar a variação de ângulo para eliminar erros de estimativa, atípicos, saltos de oitavas e assistência para fazer do contorno do ângulo um caminho contínuo ao invés de pontos isolados no centro de cada janela de análise. Em outras palavras, é possívelcombinar o parâmetro de modelo, parametrizando o modelo de variação de domínio de transformação, e descrevendo a variação de uma característica de sinal, com um ou mais valores discretos que descrevem um valor instantâneo de uma característica de sinal.

Ademais, em uma configuração, de acordo com ainvenção, uma abordagem primária é modelar a magnitude de mudança normalizada, uma vez que a magnitude das características de sinal é, então, explicitamente cancelada a partir dos cálculos. No geral, essa abordagem faz com que as fórmulas matemáticas sejam mais tratáveis. Entretanto, as configurações, de acordo com ainvenção, não se restringem a utilizar medidas de variação normalizadas, pois não há motivo próprio por que deveria se restringir aos conceitos para medidas de variação normalizadas.

Modelo de variação matemática

A seguir, um modelo de variação matemática será 25 descrito que pode ser aplicado em algumas configurações, de acordo com a invenção. Entretanto, outros modelos de variação também são naturalmente utilizáveis.

Considerar um sinal com uma propriedade como um ângulo, que varia sobre o tempo e denote-o por

. A mudança no Õ , 'angulo como sua derivada

e a fim de cancelar o efeito damagnitude do ângulo, normalizamos a alteração com

e definimos

Chamamos essa medida c(t) a variação de ângulonormalizada, ou simplesmente variação de ângulo, uma vez que uma medida não normalizada da variação de ângulo é inexpressiva no presente exemplo.

A extensão do periodo

de um sinal éinversamente proporcional ao ângulo,

, assim sendo, podemos ter prontamente

Ao presumir que a variação de ângulo é constante em um intervalo curto de t, c(t) = c, a equação diferencial parcial da Equação 1 pode ser facilmente solucionada, sendo assim 15 obtemos

onde po e To significam, respectivamente, o ângulo e extensão de periodo no tempo t = 0.

Enquanto T(t) é a extensão de periodo no tempo t, 20 percebemos que qualquer característica temporal segue a mesma fórmula. Em particular, para o retardo k de autocorrelação R(k,t) no momento t, as características temporais no domínio k seguem essa fórmula. Em outras palavras, uma característica da autocorrelação que aparece no retardo ko no t = 0 será trocada 5 como uma função de t como

Na Equação 2, consideramos somente variações que podem ser presumidas constantes em um intervalo curto. Entretanto, se desejado, podemos utilizar modelos de ordem maiores ao permitir 10 que a variação siga alguma forma funcional em um curto intervalo temporal. Polinônimos são, nesse caso, de interesse especial, uma vez que a equação diferencial resultante pode ser prontamente solucionada. Por exemplo, se definirmos a variação para seguir a forma polinômica

Observe que agora, a constantes po que aparece na Equação 2 foi assimilada no exponencial sem perder a generalidade, afim de deixar a representação mais clara.Essa forma demonstra como o modelo de variaçãopode ser prontamente estendido a casos mais complicados.

Entretanto, a menos que declarado de outra forma, nesse documento, consideraremos somente o primeiro caso de sequência (variação constante), para reter entendimento e acessibilidade. Aqueles familiarizados com a técnica podem prontamente estender os métodos 5 a casos de sequências maiores.

A mesma abordagem utilizada aqui para a Modelagem de variação de ângulo pode ser utilizada sem modificação também a outras medidas para as quais a derivada normalizada é um dominio bem garantido. Por exemplo, o invólucro temporal de um sinal, que 10 corresponde à energia instantânea do sinal da transformação de Hilbert, é como uma medida. Geralmente, a magnitude do invólucro temporal é de menor importância do que o valor relativo, que é a variação temporal do invólucro. Na codificação de áudio, a Modelagem do invólucro temporal é útil para diminuir a 15 disseminação de ruído temporal e é normalmente atingida por um método conhecido como Formação de Ruído Temporal (TNS), onde o invólucro temporal é modelado por um modelo de previsão linear no dominio de frequência (vide, por exemplo, referência [4]). A atualinvenção provê uma alternativa à TNS para modelar e estimar o 20 invólucro temporal.

Se denotamos o invólucro temporal por a(t), então, a variação de invólucro (normalizada) h(t) é

e, de maneira correspondente, a solução daequação diferencial parcial é

Observe que a fórmula acima implica que no dominio logarítmico, a amplitude é um polinómio simples. Isso é conveniente, uma vez que as amplitudes são geralmente expressas sobre a escala de decibéis (dB).

Configuração genérica de um aparelho para obterum parâmetro que descreva uma variação temporal de uma característica de sinal

A Figura 1 apresenta um diagrama em blocos esquemático de um aparelho para obter um parâmetro que descreve 10 uma variação temporal de uma característica de sinal de um sinal de áudio com base nos parâmetros de domínio de transformação real (por exemplo, valores de autocorrelação, valores de autocovariância, Coeficientes de Fourier e assim por diante) que descrevem o sinal de áudio em um domínio de transformação. 0 15 aparelho apresentado na Figura la é designado em sua integridade com 100. O aparelho 100 é configurado para obter (por exemplo, receber ou computar) parâmetros de domínio de transformação real 120 que descrevem o sinal de áudio em um domínio de transformação. Também, o aparelho 100 é configurado para prover um ou mais 2.0 parâmetros de modelo 140 de um modelo de variação de domínio de transformação que descrevem uma evolução temporal dos parâmetros de domínio de transformação dependendo de um ou mais parâmetros de modelo. O aparelho 100 compreende um transformador opcional 110 configurado para prover os parâmetros de domínio de transformação 25 real 120 com base em uma representação de domínio de tempo 118 dosinal de áudio, de maneira que os parâmetros de domínio de transformação real 120 descrevam o sinal de áudio em um dominio de transformação. Entretanto, o aparelho 100 pode seralternativamente configurado para receber os parâmetros de dominio de transformação real 120 de uma fonte externa de parâmetros de 5 dominio de transformação.

O aparelho 100 compreende ainda um determinador de parâmetro 130, onde o determinador de parâmetro 130 é configurado para determinar um ou mais parâmetros de modelo do modelo de variação de dominio de transformação, de maneira que um 10 erro de modelo, que representa um desvio entre uma evolução temporal modelada dos parâmetros de dominio de transformação e uma evolução temporal real dos parâmetros de dominio de transformação real, é trazido abaixo de um valor de limiar predeterminado ou minimizado. Portanto, o modelo de variação de domínio de 15 transformação, que descreve uma evolução temporal dos parâmetros de dominio de transformação dependendo de um ou mais parâmetros de modelo que representam uma característica de sinal, é adaptado (ou ajustado) ao sinal de áudio, representado pelos parâmetros de domínio de transformação real. Assim, atinge-se efetivamente uma 20 variação modelada dos parâmetros de domínio de transformação de sinal de áudio descritos, implícita ou explicitamente, pelo modelo de variação de domínio dé transformação, aproxima (dentro de uma variação de tolerância predeterminada) a variação real dos parâmetros de domínio de transformação.

Muitos conceitos de implementação diferentes sãodisponíveis para o determinador de parâmetro. Por exemplo, o determinador de parâmetro pode compreender, por exemplo, armazenado nele (ou em um carregador de dados externo) as equações I.de cálculo de parâmetro de modelo de variação 130a que descrevem um mapeamento dos parâmetros de dominio de transformação nos parâmetros de modelo de variação. Nesse caso, o determinador de parâmetro 130 também pode compreender um calculador de parâmetro 5 de modelo de variação 130b (por exemplo, um computador programável ou um processador de sinal ou um fpga) , que pode ser configurado, por exemplo, hardware ou software, para avaliar as equações de cálculo de parâmetro de modelo de variação 130a. Por exemplo, o calculador de parâmetro de modelo de variação 130b pode ser 10 configurado para receber uma pluralidade de parâmetros de domíniode transformação real que descrevem os sinais de áudio em um domínio de transformação e para computar, utilizando as equações de cálculo de parâmetro de modelo de variação 130a, um ou mais parâmetros de modelo 140. As equações de cálculo de parâmetro demodelo de variação 130a podem, por exemplo, descrever de forma explícita um mapeamento dos parâmetros de domínio de transformação real 120 em um ou mais parâmetros de modelo 140.

De maneira alternativa, o determinador de parâmetro 130 pode, por exemplo, realizar uma otimizaçãoiterativa. Para esse fim, o determinador de parâmetro 130 pode conter uma representação 130c do modelo de variação de domínio de tempo, que permite, por exemplo, para uma computação de um- - . - - !conjunto subsequente de parâmetros de domínio de transformação estimados com base em um conjunto anterior de parâmetros dedominio de transformação real (que representam o sinal de áudio), levando em consideração um parâmetro de modelo que descreve a evolução temporal presumida. Nesse caso, o determinador de parâmetro 130 também pode compreender um otimizador de parâmetro de modelo 130d, onde o otimizador de parâmetro de modelo 130d podeser configurado para modificar um ou mais parâmetros de modelo do modelo de variação de dominio de tempo 130c, até que o conjunto de parâmetros de dominio de transformação estimados obtidos pelo 5 modelo de variação de dominio de tempo parametrizado 130c, utilizando um conjunto anterior de parâmetros de dominio detransformação real, esteja em concordância suficientemente boa (por exemplo, dentro de um limiar de diferença predeterminado) com os parâmetros de dominio de transformação real atuais.

Entretanto, há naturalmente numerosos outrosmétodos para determinar um ou mais parâmetros de modelo 140 com base nos parâmetros de dominio de transformação real, pois hádiferentes fórmulas matemáticas da solução para o problema geral para determinar parâmetros de modelo de maneira que o resultado da 15 modelagem aproxime os parâmetros de dominio de transformação real (e/ou sua evolução temporal).Tendo em vista a discussão acima, a funcionalidade do aparelho 100 pode ser explicada tendo como referência a Figura lb, que apresenta um fluxograma de um método150 para obter o parâmetro 140 que descreve uma variação temporalde uma característica de sinal de um sinal de áudio. O método 150 compreende uma etapa opcional 160 de computar os parâmetros de dominio de transformação real 120 que descrevem sinal de áudio em um dominio de transformação. O método 150 também compreende umaetapa 170 para determinar um ou mais parâmetros de modelo 140 de um modelo de variação de dominio de transformação que descreve uma evolução temporal dos parâmetros de dominio de transformaçãodependendo de um ou mais parâmetros de modelo que representam uma característica de sinal, de maneira que um erro de modelo, que representa um desvio entre uma evolução temporal modelada e os parâmetros de domínio de transformação real, é trazido abaixo deum valor de limiar predeterminado ou minimizado.

A seguir, algumas configurações, de acordo com a invenção, serão descritas em mais detalhes, a fim de explicar em mais detalhes o conceito inventivo.

Estimativa de variação no dominio de autocorrelação

No contexto atual, a autocorrelação do sinal xn é definida como

onde presumimos que xn somente não é zero na variação [1,N]. Observe que a estimativa converge ao valor real quando N for infinito. Ademais, geralmente, alguma forma de janelamento pode ser aplicada a xn antes da estimativa da autocorrelação, a fim de reforçar a presunção que é zero for a da variação [l,N] .

Estimativa de variação no domínio de autocorrelação - Variação de ângulo

Em uma configuração, nosso objetivo é estimar avariação de sinal, que é, no caso de variação de ângulo, estimar quanto à autocorrelação se prolonga ou reduz como uma função de tempo. Em outras palavras, nosso objetivo é determinar a derivada de tempo do retardo de autocorrelação k, que é

Visando a clareza, utilizaremos agora uma forma invés de k(t) e presumir que adependência de testá implicita.Da Equação 4,obtemos

Um problema convencional, que é superado emtalgurnas configurações , de acordo com a invenção, é que a derivadade tempo de k não está disponível e a estimativa direta é difícil.

Entretanto, reconhece-se que a norma de cadeia de derivadas podeser utilizada para obter

Descobriu-se que utilizando uma estimativa de c,podemos, então, a primeira sequência de séries de Taylor, modelar a autocorrelação no momento t2 utilizando a autocorrelação no momento e a derivada de tempo

Em uma aplicação prática, a derivada

pode õkse estimada, por exemplo, pela segunda estimativa de sequência

Essa estimativa é preferida sobre a primeira diferença de sequência R(k + 1) - R(k), uma vez que a segunda estimativa de sequência não suporta a partir da meia troca de fase de amostra como a primeira estimativa de sequência. Para precisão melhorada ou eficiência computacional, estimativas alternativas podem ser utilizadas, como segmentos janelados da derivada da função sinc.Utilizando o critério de erro do quadrado médio mínimo, obtemos o problema de otimização

Também possuem as mesmas derivações quando a variação de ângulo for estimada a partir de janelas de autocovariância consecutivas em vez da autocorrelação. Entretanto, comparando a autocorrelação, a autocovariância contém informações adicionais, o uso das quais é descrito na seção intitulada "Modelagem no domínio de autocovariância".Estimativa de variação no domínio de autocorrelação - Invólucro temporal

Conforme será descrito a seguir, uma evolução temporal do invólucro também pode ser estimada no domínio de autocorrelação.A seguir, uma breve visão geral da determinaçãoda variação de invólucro temporal será dada, tendo como referência a Figura 2. Subsequentemente, um possível algoritmo, de acordo com uma configuração da invenção, será descrito em detalhes.

A Figura 2 apresenta um fluxograma de um métodopara obter um parâmetro que descreve uma variação temporal de uminvólucro do sinal de áudio. 0 método apresentado na Figura 2 é designado em sua integridade com 200. O método 200 compreende determinar 210 valores de energia em curto tempo para umapluralidade de intervalos de tempo consecutivos. Determinar os valores de energia em curto tempo pode, por exemplo, compreender 10 determinar valores de autocorrelação em um retardo comumpredeterminado (por exemplo, retardo 0) para uma pluralidade deconsecutivas (que se sobrepõe temporalmente ou não se sobrepõe temporalmente) janelas de autocorrelação, para obter os valores de energia em curto tempo. Uma etapa 220 compreende determinar 15 adicionalmente parâmetros de modelo adequados. Por exemplo, a etapa 220 pode compreender determinar coeficientes polinômicos deuma função polinômica de tempo, de maneira que a função polinômicaaproxime uma evolução temporal dos valores de energia em curtotempo. A seguir, um algoritmo de exemplo para determinar os 20 coeficientes polinômicos será descrito. Por exemplo, a etapa 220pode compreender uma etapa 220a para configurar uma matriz (por exemplo, designada com V) compreendendo sequências de forças devalores de tempo associados aos intervalos de tempo consecutivos (intervalos de tempo começando ou sendo centralizados, porexemplo, nos momentos to, ti, t2 e assim por diante) . A etapa 220 também pode compreender a etapa 220b para configurar um vetor principal (por exemplo, designado com r), as entradas do qualdescrevem os valores de energia em curto tempo para os intervalos de tempo consecutivos.

Além disso, a etapa 220 pode compreender uma etapa 220c de solução de um sistema linear de equações (por exemplo, da forma r Vh) definidas pela matriz (por exemplo, 5 designada com V) e pelo vetor principal (por exemplo, designado com r), para obter como uma solução os coeficientes polinômiços (por exemplo, descritos pelo vetor h).A seguir, detalhes adicionais em relação a esse procedimento serão explicados.No dominio de autocorrelação, modelagem doinvólucro temporal é simples. Podemos provar prontamente que a autocorrelação no retardo zero corresponde à média da amplitude de quadrado. Ademais, a autocorrelação em todos os outros retardos é escalada pela média da amplitude de quadrado. Em outras palavras, 15 as mesmas informações estão disponíveis em todo e qualquer retardo, com isso é suficiente considerar a autocorrelação somente no retardo zero.

Uma vez que o primeiro modelo de sequência da variação de invólucro é trivial, um modelo de sequência maior é 20 utilizado em uma configuração preferida. Isso também serve como um exemplo de como proceder como modelos de sequência maiores, também no caso de estimativa de variação de ângulo.

Considerar um modelo polinômico de sequência Mth para a variação de invólucro, de acordo com a Equação 5. Então, 25 teremos M + 1 desconhecidos e, então, prefere-se utilizar pelo menos equações M + 1 para uma solução. Em outras palavras, prefere-se utilizar pelo menos M + 1 janelas de autocorrelaçãoconsecutivas (designadas, por exemplo, pelo momento central da janela de autocorrelação ou momento inicial da janela de autocorrelação th, R(k,th), h e [0,N] e N M) . Então, o valor de a (t) (que descreve, por exemplo, uma força média em curto periodo ou amplitude média em curto período, por exemplo, em umaescalonagem linear ou não linear) em momentos diferentes N + 1 t =th (ou para N + 1 diferentes intervalos de tempo de sobreposiçãoou sem sobreposição) é obtida, que é a

Uma vez que a (t) é um polinómio (maisprecisamente: é aproximado por um polinómio), esse é o problemaclássico de solução dos coeficientes de um polinómio, para o qual diversos métodos existem na literatura.Uma alternativa básica para solução é utilizaruma matriz de Vandermonde, como segue.

A matriz de Vandermonde V é, por exemplo,definida como

e pode ser computada, por exemplo, na etapa 220a.Um vetor principal r e um vetor de solução h podem ser definidoscomo

O vetor principal pode, por exemplo, ser computado na etapa 220b.Então,

.

Uma vez que th' s são distintos e se M = N, então, 5 V 3 inverso existe e obtemos

por exemplo, na etapa 220c.

Se M > N, então a paseudoinversão resulta na resposta. Entretanto, se N e M forem extensos, então, métodos mais refinados conhecido na técnica podem ser empregados para solução 10 eficiente.

Estimativa de variação no domínio de autocorrelação - Análise de inclinação

Enquanto a estimativa acima mede variação, há uma etapa em que a presunção fixa localmente não é superada em algumas 15 configurações. A saber, a estimativa da autocorrelação por meios convencionais (por exemplo, utilizando uma janela deautocorrelação de extensão finita) faz a presunção de que o sinal deveria ser localmente fixo. A seguir, será apresentado que a variação de sinal não introduz inclinação à estimativa, de maneira 20 que o método possa ser considerado como suficientemente preciso.

Para analisar a inclinação da autocorrelação, presume-se que a variação de ângulo é constante nesse intervalo de tempo. Ademais, presume-se que no tOr teremos um sinal x(t) com extensão de período

, então, em um segundo ponto tj há a 25 extensão de período

. A extensão de período média no intervalo [torti] é

Observe que a última parte de expressão acima éuma função de "sino, hiperbólica", que denotaremos por

Então, para uma janela de extensão

temos

Por analogia entre T e k, essa expressão também quantifica quanto uma estimativa de autocorrelação é prolongada devido â variação de sinal. Entretanto, se o janelamento for aplicado antes da estimativa de autocorrelação, a inclinação 10 devido à variação de sinal é reduzida, uma vez que a estimativa, então se concentra ao redor do ponto médio da janela de análise.

Ao estimar c a partir de duas estruturas de autocorrelação de inclinação consecutivas, os valores de k para cada estrutura são inclinados e seguem as fórmulas

onde e t2 são pontos médios de cada uma dasestruturas.0 parâmetro c pode ser solucionado ao definir = 0 e a distância entre as janelas Δt^ = t2 -, sendo assim

onde observamos que em todos os casos de Δt .cancelaram-se entre si. Em outras palavras, mesmo que a variação de sinal incline a estimativa de autocorrelação, a estimativa de 5 variação extraída de duas autocorrelações não é inclinada.

Entretanto, enquanto a variação de sinal não inclina a estimativa de variação, erros de estimativa devido às janelas de análise abertamente curtas não podem ser evitados. A estimativa da autocorrelação a partir de uma janela de análise 10 curta é passivel de erros, uma vez que depende da localização da janela de análise em relação à fase do sinal. Janelas de análisemaiores reduzem esse tipo de erros de estimativa, mas para reter a presunção da variação constante localmente, deve ser solicitado um compromisso. Uma escolha geralmente aceita na técnica é ter uma 15 extensão de janela de análise pelo menos duas vezes a menor extensão de periodo esperada. Todavia, as janelas de análise menores podem ser utilizadas se um erro aumentado for aceitável.Em termos de variação de invólucro temporal, os

A seguir, uma possível aplicação da presente invenção para a estimativa de uma variação de ângulo será descrita. Primeiramente, será delineado o conceito geral, tendo como referência a Figura 3, que apresenta um fluxograma de um método 300 para obter um parâmetro que descreve uma variação 5 temporal de um ângulo de um sinal de áudio, de acordo com uma configuração da invenção. Subsequentemente, serão dados os detalhes da implementação do referido método 300.0 método 300 apresentado na Figura 3 compreende, como uma primeira etapa opcional, realizar 310 um pré- 10 processamento de sinal de áudio de um sinal de áudio de entrada. O pré-processamento de áudio pode compreender, por exemplo, um pré- processamento que facilita uma extração das características do sinal de áudio desejadas, por exemplo, ao reduzir quaisquer componentes perigosos do sinal. Por exemplo, a modelagem de 15 estrutura de formant descrita abaixo pode ser aplicada como uma etapa de pré-processamento de sinal de áudio 310.

O método 300 também compreende uma etapa 320 para determinar um primeiro conjunto de valores de autocorrelação R(k,t1) de um sinal de áudio xn para um primeiro momento ou 20 intervalo de tempo t1; e para uma pluralidade de diferentes valores de retardo de autocorrelação k. Para uma definição dos valores de autocorrelação, é feita referência à descrição abaixo.

O método 300 também compreende uma etapa 322 para determinar um segundo conjunto de valores de autocorrelação 25 R(k,t2) do sinal de áudio xn para um segundo momento ou intervalode tempo t2 e para uma pluralidade de diferentes valores de retardo de autocorrelação k. Da mesma forma, as etapas 320 e 322do método 300 podem prover pares de valores de autocorrelação cada par de valores de autocorrelação compreendendo dois valores (resultados) de autocorrelação associados a diferentes intervalos de tempo do sinal de áudio, mas o mesmo valor de retardo de autocorrelação k. 0 método 300 também compreende uma etapa 330para determinar uma derivada parcial da autocorrelação sobre o retardo de autocorrelação, por exemplo, para o primeiro intervalo de tempo iniciando em ou, para o segundo intervalo de tempo, iniciando em t?. De maneira alternativa, a derivada parcial sobre o retardo de autocorrelação também pode ser computada para um caso 10 diferente no momento ou intervalo de tempo recaindo ou se estendendo entre o momento t2 e momento t2.

Da mesma forma, a variação da autocorrelação R(k,t) sobre o retardo de autocorrelação pode ser determinada para uma pluralidade de diferentes valores de retardo de autocorrelação 15 k, por exemplo, para aqueles valores de retardo de autocorrelação para os quais o primeiro conjunto de valores de autocorrelação e segundo conjunto de valores de autocorrelação são determinados nas etapas 320, 322.

Naturalmente, não há sequência temporal fixa emrelação à execução das etapas 320, 322, 330, de maneira que as etapas podem ser executadas parcial ou completamente em paralelo ou em uma sequência diferente.

O método 300 também compreende uma etapa 340 para determinar um ou mais parâmetros de modelo de um modelo de 25 variação utilizando o primeiro conjunto de valores de autocorrelação, o segundo conjunto de valores de autocorrelação e ôa derivada da autocorrelação parcial

sobre o retardo de õk autocorrelação.

Ao determinar um ou mais parâmetros de modelo, uma variação temporal entre os valores de autocorrelação de um par de valores de autocorrelação (conforme descrito acima) pode serlevada em consideração. A diferença entre os dois valores de autocorrelação do par de valores de autocorrelação pode ser ponderada, por exemplo, dependendo da variação da autocorrelação dsobre o retardo

. Na ponderação da diferença entre dois dkvalores de autocorrelação de um par de valores de autocorrelação, 10 o valor de retardo de autocorrelação k (associado ao par devalores de autocorrelação) também pode ser considerado como um fator de ponderação. Da mesma forma, um termo de soma da forma

pode ser utilizado para a determinação de um ou mais parâmetros de modelo, onde o referido termo de soma pode ser 15 associado a um determinado valor de retardo de autocorrelação k e onde o termo de soma compreende um produto de uma diferença entre dois valores de autocorrelação de um par de valores de autocorrelação da forma

e um fator de ponderação dependente de retardo, 20 por exemplo, da forma

O fator de ponderação dependente de retardo de autocorrelação permite considerar o fato de que a autocorrelação éestendida mais intensivamente para autocorrelação maiores do que para os valores de retardo de autocorrelação pequenos, pois o fator de valor de retardo de autocorrelação k é incluido. Adicionalmente, a incorporação da variação do valor de autocorrelação sobre o retardo torna possivel 5 estimar a compressão ou expansão da função de autocorrelação com base nos pares locais de valores de autocorrelação (retardo de autocorrelação igual). Portanto, a expansão ou compressão dafunção de autocorrelação (sobre o retardo) pode ser estimada sem conduzir um escalonamento padrão e funcionalidade combinada.

Preferencialmente, os termos de soma indivíduas têm base nascontribuições locais (valor de retardo único k)

Todavia, para obter uma grande quantidade de informações a partir da função de autocorrelação, os termos de 15 soma associados a diferentes valores de retardo k podem ser combinados, onde os termos de soma individuais ainda são termos de soma de valor de retardo único.

Além disso, a normalização pode ser realizada aodeterminar os parâmetros de modelo do modelo de variação, onde o 20 fator de normalização pode, por exemplo, ter a forma

e pode, por exemplo, compreender uma soma de termos de valor de retardo de autocorrelação único.

Em outras palavras, a determinação de um ou mais parâmetros de modelo pode compreender uma comparação (por exemplo, 25 diferença de formação ou subtração) de valores de autocorrelação para diferentes intervalos de tempo e, para a computação da variação do valor de autocorrelação sobre o retardo (derivada deautocorrelação k) , uma comparação de valores de autocorrelação para um determinado intervalo de tempo comum, mas para diferentes valores de retardo de autocorrelação. Entretanto, uma comparação (ou subtração) de valores de autocorrelação para diferentes intervalos de tempo e para diferentes valores de retardo de autocorrelação, que precisaria de um esforço considerável, é evitada.

O método 300 pode compreender ainda, opcionalmente, uma etapa 350 para computar um contorno de parâmetro, como um contorno de ângulo temporal, com base em um ou mais parâmetros de modelo determinadas em uma etapa 340.

A seguir, uma implementação possivel do conceito descrito em relação à Figura 3a será explicada em detalhe.Como uma aplicação concreta da presente inovação, devemos demonstrar a seguir uma configuração de um método para estimar a variação de ângulo a partir de um sinal temporal no dominio de autocorrelação. O método (360), que é esquematicamente representado na Figura 3b, compreende (ou consiste em) as seguintes etapas:1. Estimar (320,322;370) a autocorrelação R(k,h)de xn para janela h e h+1 (por exemplo, janelada pela função dejanelamento wn.) da extensão

separada por

2. Estimar (330/374) derivada de autocorrelação kpara a janela (ou "estrutura") h, por exemplo por

3. Estimar (340/378) a variação de ângulo Q, entre janelas ou estruturas h e A+l utilizando (da Equação 8)

Se um contorno de ângulo (opcionalmentenormalizado) for desejado ao invés de somente a medida da variação de ângulo ch, uma etapa adicional deve ser adicionada:14. Deixar o ponto médio da janela ou estrutura hser tb, Então, o contorno do ângulo entre as janelas ou estruturash e h + l é

onde p(tti) é adquirido do par anterior de estruturas oü estimativas reais de magnitude do ângulo. Se não estiverem disponiveis as medidas da magnitude do ângulo, podemos 15 configurar p(0) a um valor dé início de escolha arbitrária, por exemplo, p(0) = 1, e calcular o contorno do ângulo iterativamente para todas as janelas consecutivas.

Diversas etapas de pré-processamento (310) conhecidas na técnica podem ser utilizadas para melhorar a 20 precisão da estimativa. Por exemplo, os sinais de fala têm uma frequência geralmente fundamental na variação de 80 a 400 Hz e sefor desejado estimar a alteração no ângulo, é benéfico filtrar por passa-faixa o sinal de entrada, por exemplo, na variação de 80 a 1000 Hz para reter a fundamental e alguns primeiros harmônicos, mas atenuar componentes de alta frequência que poderiam degradar a qualidade, especialmente das estimativas de derivada e, assim, 5 também a estimativa geral.Acima, o método é aplicado no dominio deautocorrelação, mas o método pode opcionalmente, mutatis mutandis, ser implementado em outros domínios, como o domínio deautocovariância. Semelhantemente, acima, o método é apresentado na 10 aplicação para estimar a variação de ângulo, mas a mesma abordagem pode ser utilizada para estimar variações em outras características do sinal, como a magnitude do invólucro temporal. Ademais, ó(s) parâmetro(s) de variação pode(m) ser estimado(s) apartir de mais que duas janela para maior precisão ou quando a 15 formulação de modelo de variação precisar de graus de liberdade adicionais. A forma geral do método apresentado é descrita na Figure 7.

Se estiverem disponíveis informações adicionais em relação às propriedades do sinal de entrada, podem ser 20 opcionalmente utilizados limiares para remover estimativas de variação inviáveis. Por exemplo, o ângulo (ou variação de ângulo)de um sinal de fala fáramente excede 15 oitavas/segundo, sendo assim qualquer estimativa que exceda esse valor ou tipicamente não é fala ou é um erro de estimativa e pode ser ignorado.

Semelhantemente, o erro de modelagem mínimo da Equação 7 pode ser utilizado opcionalmente como um indicador da qualidade da estimativa. Particularmente, é possível ajustar um limiar para oerro de modelagem, de maneira que uma estimativa com base em um modelo com erro de modelagem grande seja ignorada, uma vez que a mudança apresentada no modelo não é bem descrito pelo modelo, e a sua estimativa não é confiável.Estimativa de variação no dominio deautocorrelação - Modelagem de estrutura de formant

A seguir, será descrito um conceito para um pré- processamento de sinal de áudio, que pode ser utilizado para melhorar a estimativa das características (por exemplo, da variação de ângulo) do sinal de áudio.

No processamento de fala, a estrutura de formanté geralmente modelada por modelos de previsão linear (LP) (vide referência [6]) e suas derivadas, como previsão linear dedistorção (WLP) (vide referência [5] ) Ou resposta com minimavariância sem distorção (MVDR) (vide referência [9]). Além disso,enquanto a fala muda constantemente, o modelo de formant é geralmente interpolado no dominio de Par de Linha Espectral (LSP) (vide referência [7]) ou de maneira equivalente, no dominio de Par de Imitação Espectral (ISP) (vide referência [1]), para obter transições suaves entre janelas de análise.

Para a modelagem LP de formants, entretanto, avariação normalizada não é o interesse primário, uma vez que a normalização do modelo LP não traz vantagens relevantes em alguns casos. Especificamente, no processamento de fala, a localização de formants tem geralmente informações mais importante einteressantes do que a mudança em suas localizações. Portanto, enquanto é possivel formular modelos de variação normalizados também para formants, iremos nos focar no tópico mais interessantede cancelamento do efeito dos formants.

Em outras palavras, a inclusão de um modelo para as mudanças nos formants pode ser utilizada para melhorar a precisão da estimativa da variação de ângulo ou outras características. Que é, ao cancelar o efeito das mudanças na 5 estrutura de formant do sinal antes da estimativa da variação de ângulo, é possível reduzir a chance de que uma mudança na estrutura de formant seja interpretada como uma mudança no ângulo. Tanto a localização formant como o ângulo podem mudar para até cerca de 15 oitavas por segundo, o que significa que as mudanças 10 podem ser rápidas, elas variam em cerca da mesma variação e suas contribuições poderiam ser facilmente confundidas.

Para cancelar opcionalmente o efeito da estrutura de formant, nós primeiro estimamos um modelo LP para cada estrutura, removemos a estrutura de formant pela filtração eusamos os dados filtrados na estimativa de variação de ângulo. Para estimativa de variação de ângulo, é importante que aautocorrelação tenha um caráter de baixa passagem e é, portanto, útil para estimar o modelo LP a partir de um sinal filtrado poralta passagem, mas cancelar a estrutura de formant somente apartir do sinal original (ou seja, sem filtrar por alta passagem), sendo; assim, os dados filtrados terão um caráter de baixa passagem. Como é bem conhecido, o caráter de baixa passagem torna fácil estimar derivadas do sinal. O processo de filtração em si, pode ser realizado no domínio de tempo, domínio de autocorrelação 25 ou domínio de frequência, de acordo com as exigências computacionais da aplicação.

Especifícamente, o método de pré-processamentopara cancelar a estrutura de formant da autocorrelação pode ser declarado como1. Filtrar o sinal com um filtro de alta passagemfixo.2. Estimar modelos LP para cada estrutura do 5 sinal filtrado com alta passagem,3. Remover a contribuição da estrutura de formant ao filtrar o sinal original com o filtro LP.O filtro de alta passagem fixo na etapa 1, pode ser opcionalmente substituído por um filtro de adaptação de sinal, 10 como um modelo LP de sequência baixa estimado para cada estrutura, se for necessário um nivel maior de precisão. Se for utilizada a filtração de baixa passagem como uma etapa do pré-processamento em um outro estágio no algoritmo, essa etapa de filtração de alta passagem pode ser omitida, contanto que a filtração de baixa 15 passagem surja após o cancelamento de formant.O Método de estimativa LP na etapa 2 pode ser livremente escolhido de acordo com as necessidades da aplicação. Escolhas bem garantidas seriam, por exemplo, LP convencional (vide referência [6]), LP distorcido (vide referência [5]) e MVDR (vide 20 referência [9]). A sequência de modelo e método devem ser escolhidos de maneira que o modelo LP não modele a frequência fundamental, mas somente o invólucro espectral.Na etapa 3, a filtração do sinal com os filtros LP pode ser realizada seja de janela por janela ou no sinal 25 continuo original. No caso de filtração do sinal sem o janelamento (ou seja, filtração do sinal continuo), é útil aplicar métodos de interpolação conhecidos na técnica, como LSP ou ISP, para diminuir mudanças súbitas das características de sinal nas transições entre as janelas de análise.A seguir, o processo de remoção (ou redução) da estrutura de formant será brevemente resumido tendo como referência a Figura 4. 0 método 400, um fluxograma do qual é 5 apresentado na Figura 4, compreende uma etapa 410 de redução ou remoção de uma estrutura de formant de um sinal de áudio de1 entrada, para obter um sinal de áudio reduzido de estrutura deformant. 0 método 400 também compreende uma etapa 420 para determinar a parâmetro de variação de ângulo com base no sinal de 10 áudio reduzido de estrutura de formant. De modo geral, a etapa 410de redução ou remoção da estrutura de formant compreende uma sobetapa 410a para estimar parâmetros de um modelo de previsão linear do sinal de áudio de entrada com base uma versão filtrada com alta passagem ou versão filtrada por adaptação de sinal do 15 sinal de áudio de entrada. A etapa 410 também compreende uma sobetapa 410b para filtrar uma versão de banda larga do sinal de áudio de entrada com base nos parâmetros estimados, para obter o sinal de áudio reduzido de estrutura de formant, de maneira que o sinal de áudio reduzido de estrutura de formant compreenda um 20 caráter de baixa passagem.

Naturalmente, o método 400 pode ser modificado, conforme descrito acima, por exemplo, se o sinal de áudio de entrada já for filtrada por baixa passagem.

No geral, pode-se dizer que uma redução ou 25 remoção da estrutura formant do sinal de áudio de entrada pode ser utilizada como um pré-processamento de sinal de áudio em combinação com uma estimativa de diferentes parâmetros (porexemplo, variação de ângulo, variação de invólucro e assim por diante) e também em combinação com um processamento em diferentes domínios (por exemplo, domínio de autocorrelação, domínio de autocovariância, domínio de transformada de Fourier e assim por diante) .Modelagem no dominio de autocovariânciaModelagem no domínio de autocovariância: Introdução e visão geral

A seguir, será descrito como os parâmetros de modelo que representam uma variação temporal de um sinal de áudiopodem ser estimados em um domínio de autocovariância. Conforme mencionado acima, diferentes parâmetros de modelo, como um parâmetro de variação de ângulo de modelo ou um parâmetro de modelo de variação de invólucro, podem ser estimados.A autocovariância é definida como

onde x„ designa amostras do sinal de áudio deentrada. Observe que, na diferença para a autocorrelação, onde não presumimos que xn é somente diferente de zero no intervalo de análise. Isso é, xn não precisa ser janelado antes da análise. Como a autocorrelação, para um sinal fixo a autocovariânciaconverge para

Em comparação à autocorrelação, a autocovariância é um domínio muito semelhante, mas com algumas informações adicionais. Especificamente, como ocorre no dominio de autocorrelação, as informações de fase do sinal são descartadas, 25 na covariância são retidas. Ao olhar os sinais fixos, geralmente descobrimos que as informações de fase não são úteis, mas para sinais que variam rapidamente, podem ser muitos úteis. A diferença de base surgem do fato que pata um sinal fixo, o valor esperado é independente do tempo

mas para um sinal não fixo isso não importa.

Presumir no momento t (ou para um intervalo de tempo iniciando no momento t ou sendo centralizado no momento t) estimamos, para o sinal xn, a autocovariância Q(k,t). Então, podemos prontamente ver que se sustenta que E[O(k,t)\ = E[Q(-k,t + k] .

A seguir, adaptaremos uma notação onde as expectativas (descritas pelo operador E[..,]) são implicitas, sendo assim Q(k,t) = Q (- k,t+k). Semelhantemente, a relação Q(-k,t) = Q(k,t-k) pode ser sustentada.Ao aplicar a presunção da variação de invólucro 15 temporal localmente constante, temos

Utilizando essas relação, podemos agora formar uma primeira estimativa de Taylor de sequência para Q(k,t) 20 centralizada em t

Por exemplo, a primeira troca pode ser medida nas mesmas unidas que a do retardo de autocorrelação, de maneira que possa ocorrer o seguinte:

Agora, todos os termos aparecem no mesmo ponto notempo t (ou para o mesmo intervalo de tempo), então, podemos definir

Lembre-se que o nosso propósito era estimar a variação de invólucro h. Uma vez que a relação acima se mantém para todos k, podemos, por exemplo, minimizar o erro de modelagem 10 de quadrado

O minimo pode ser prontamente encontrado como

Agora, escolhemos utilizar erro de quadrado médio minimo (MMSE) como nosso critério de otimização, mas qualquer outro critério conhecido na técnica pode ser aplicado igualmentebem aqui e também em outras configurações. Da mesma forma, escolhemos considerar a- estimativa sobre todos os retardos entre k = -N e k-N , mas uma seleção de índices pode ser utilizada para o benefício da eficiência computacional e precisão, se fordesejado, e também em outras configurações.

Observe que em comparação' à autocorrelação, com aautocovariância não precisamos utilizar sucessivas janelas deanálise, mas podemos estimar a variação de invólucro temporal a partir de uma única janela. Uma abordagem similar pode ser facilmente desenvolvida para a estimativa da variação de ângulo de uma única janela de autocovariância.Além disso, observe que em comparação àestimativa de variação de ângulo, para a estimativa de invólucro não precisamos prefiltrar o sinal com um filtro de baixa passagem, uma vez que não são necessárias derivadas k da autocovariância.

Modelagem no dominio de autocovariância AplicaçãoComo outro exemplo da aplicação concreta doconceito da presente invenção, devemos demonstrar o método para estimar a variação de invólucro temporal de um sinal no dominio de autocovariância. O método compreende as (ou consiste nas) seguintes etapas:1. Estimar a autocovariância qk do sinal xn parauma janela de extensão Δtwin

2. Encontrar a variação de invólucro temporal hao calcular

Se for desejado um contorno de invólucro normalizado em vez de somente a medida de variação de invólucro h, uma etapa adicional deve ser adicionada opcionalmente:3. O contorno de invólucro é

onde ao é adquirido da estrutura anterior ou uma estimativa real da magnitude de invólucro. Se não estiverem disponíveis as medidas da magnitude de invólucro , ajustamos αα=l e calculamos o contorno do invólucro iterativamente para todas as 5 janelas consecutivas.

Se estiverem disponíveis informações adicionais em relação à propriedade do sinal de entrada, podem ser opcionalmente utilizados limiares para remover estimativas de variação inviáveis. Por exemplo, o erro de modelagem minima da 10 Equação 11 pode ser opcionalmente utilizado como um indicador da qualidade da estimativa. Particularmente, é possivel ajustar um limiar para o erro de modelagem, de maneira que uma estimativa com base em um modelo com erro de modelagem extenso possa ser ignorada, uma vez que a alteração apresentada no modelo não é bem 15 descrita pelo modelo e a estimativa em si não é confiável.

Para melhorar a precisão, opcionalmente é possivel primeiro cancelar a estrutura de formant do sinal de entrada (conforme explicado na seção intitulada "Estimativa de variação no dominio de autocorrelação - Modelagem de estrutura de 20 formant"} . Entretanto, observe que, em termos de sinais de fala, então, obtemos uma estimativa da forma de onda de pressão da glote ao invés do sinal de fala (forma de onda de pressão de fala) e o invólucro temporal modela, portanto, o invólucro da pressão da glote, que pode ou não ser uma consequência desejada, dependendo 25 da aplicação.

Modelagem no domínio de autocovariância - estimativa conjunta de ângulo e variação de invólucro estimada na seção anterior, também a variação de ângulo pode ser estimada diretamente a partir de uma única janela de autocovariância. Entretanto, nessa seção, demonstraremos o problema mais geral de como estimar conjuntamente o ângulo e 5 variação de invólucro a partir de uma única janela de autocovariância. Então será simples para qualquer técnico no assunto modificar o método para a estimativa da variação de ângulo, somente. Deve-se observar aqui que não é necessário utilizar qualquer janelamento no dominio de autocovariância. Por 10 exemplo, é suficiente computar os parâmetros de autocovariância conforme delineado na seção intitulada "Modelagem no dominio de autocovariância - Visão Geral". Todavia, a expressão "única janela de autocovariância" expressa que a estimativa de autocovariância de uma única parte fixa do sinal de áudio pode ser 15 utilizada para estimar a variação, ao contrário da autocorrelação, onde as estimativas de autocorrelação de pelo menos duas partes fixas do sinal de áudio devem ser utilizadas para estimar a variação. O uso de uma única janela de autocovariância é possível, desde que a autocovariância no retardo +k e -k expresse, 20 respectivamente, as etapas de autocovariância k para frente e para trás da uma determinada amostra. Em outras palavras, uma vez que as características de sinal que mudam com o tempo, a autocovariância para frente e para trás de uma amostra será diferente e essa diferença na autocovariância para frente e para 25 trás expressa a magnitude da mudança nas características de sinal.

Essa estimativa não é possivel no dominio de autocorrelação, uma vez que o dominio de autocorrelação é simétrico, isso é,autocorrelações para frente e para trás são idênticas.

Considere um sinal

onde a amplitude e variação de ângulo são modeladas pelos primeiros modelos de sequência, assim sendo

. A autocovariância Qx (k) of x (t) é, então,

onde Qf(k,t) é a autocovariância de f(b(t)).Utilizando as Equações 6, 10 e 13, obtemos aderivada de tempo de Qx(k,t) como

Entretanto, na equação acima contém um produto ch e é, portanto, uma função não linear de c e h. Para facilitar asolução eficiente de parâmetros, presumimos que \ch\ é pequeno, sendo assim, podemos aproximar

Como anteriormente, podemos definir qk=Qx(k,ty e formar aa primeira estimativa de Taylor de sequência

A diferença do quadrado entre o valor real qk e aestimativa de Taylor qk novamente servirão como nossa função de objetivo ao encontrar o c e h ideais (ou pelo menosaproximadamente ideais). Obtemos o problema de minimização

cuja solução pode ser prontamente obtida como(14)

onde

Embora as fórmulas pareçam ser complexas, a construção de A e u pode ser realizada utilizando somente operações para vetores de extensão 2N (retardo zero pode ser omitido) e a solução de c e h pode ser realizada utilizando a inversão da matriz 2 x 2 A. A complexidade computacional é, portanto, um modesto O(N) (ou seja, da sequência de N) .

A aplicação da estimativa conjunta de ângulo e variação de invólucro segue a mesma abordagem que a apresentada na seção intitulada "Modelagem no dominio de autocovariância Aplicação", utilizando a Equação 14 na etapa 2.Modelagem no dominio de autocovariância Conceitos adicionaisA seguir, diferentes abordagens de modelagem dodominio de autocovariância serão brevemente discutidas tendo comoreferência a Figura 5. A Figura 5 apresenta um diagrama em blocos esquemático de um método 500 para obter um parâmetro que descreve uma variação temporal da característica de sinal de um sinal de áudio, de acordo com uma configuração da invenção. O método 500, compreende, como uma etapa opcional 510, um pré-processamento de 5 sinal de áudio. O pré-processamento de sinal de áudio na etapa 510 pode, por exemplo, compreender uma filtração do sinal de áudio (por exemplo, uma filtração com baixa passagem) e/ou uma redução/remoção de estrutura de formant, conforme descrito acima. O método 500 pode compreender adicionalmente uma etapa 520 para 10 obter as primeiras informações de autocovariância que descrevem uma autocovariância do sinal de áudio para um primeiro intervalo de tempo e para uma pluralidade de diferentes valores de retardo de autocovariância k. O método 500 também pode compreender uma etapa 522 para obter segundas informações de autocovariância que 15 descrevem uma autocovariância do sinal de áudio para um segundo intervalo de tempo e para diferentes valores de retardo de autocovariância k. Além disso, o método 500 pode compreender uma etapa 530 para avaliar, para a pluralidade de diferentes valores de retardo de autocovariância k, uma diferença entre as primeiras 20 informações de autocovariância e as segundas informações de autocovariância, para obter uma informação de variação temporal.

Adicionalmente, o método 500 pode compreender uma etapa 540 para estimar uma variação "local" (ou seja, no ambiente de um respectivo valor de retardo) das informações deautocovariância sobre o retardo para uma pluralidade de diferentes valores de retardo, para obter uma "informação de variação de retardo local".

Também, o método 500 pode geralmente compreender uma etapa 550 para combinar as informações de variação temporal e as informações sobre a variação local q' das informações de autocovariância sobre o retardo (também designadas como "informações de variação de retardo local"), para obter o 5 parâmetro de modelo.

Ao combinar as informações de variação temporal e as informações sobre a variação local q' das informações de autocovariância sobre o retardo, as informações de variação temporal e/ou as informações sobre a variação local q' das 10 informações de autocovariância sobre o retardo podem ser escalonadas de acordo com o retardo de autocovariância correspondente k, por exemplo, proporcional ao retardo de autocovariância k ou a uma potência sua.De maneira alternativa, as etapas 520, 522 e 530podem ser substituídas pelas etapas 570, 580, assim como seráexplicado a seguir. Na etapa 570, informações de autocovariância que descrevem uma autocovariância do sinal de áudio para uma única janela de autocovariância, mas para diferentes valores de retardo k podem ser obtidas. Por exemplo, um valor de autocovariância

e informações de autocovariância

podem serobtidos.

Subsequentemente, diferenças ponderadas, porexemplo,

, entre valores deautocovariância associados a diferentes valores de retardo (por 25 exemplo, -kf +k) podem ser avaliadas para uma pluralidade dediferentes valores de retardo de autocovariância k na etapa 580.

As ponderações (por exemplo, 2k, k2} podem ser escolhidas dependendo de uma diferença dos valores de retardo dos respectivos valores de autocovariância subtraídos (por exemplo, a diferença no retardo entre os valores de autocovariância

Para resumir o que foi dito acima, há muitasmaneiras diferentes para obter um ou mais parâmetros de modelo desejados no domínio de autocovariância. Nas configurações preferidas, a única janela de autocovariância pode ser suficiente para estimar um ou mais parâmetros de modelo de variação temporal. Nesse caso, diferenças entre os valores de autocovariância que sãoassociadas a diferentes valores de retardo de autocovariânciapodem ser comparadas (por exemplo, subtraídas). De maneira alternativa, valores de autocovariância para diferentes intervalos de tempo, porém, com o mesmo valor de retardo de autocovariância podem ser comparados (por exemplo, subtraídos) para obter 15 informações de variação temporal. Em ambos os casos, a ponderação pode ser introduzida, o que leva em consideração a diferença da autocovariância ou o retardo de autocovariância, ao derivar o parâmetro de modelo.

Modelagem em outros domínios

Além da autocorrelação e autocovariância, oconceito aqui revelado pode ser também formulado, em outros domínio, como o espectro de Fourier. Ao aplicar o método nodomínio T, pode compreender as seguintes etapas:1. Transformar o sinal de tempo no domínio T.2. Calcular a(s) derivada(s) de tempo no domínioT , em uma forma em que os parâmetros de modelo de variação estejam presentes de forma explícita.3. Formar a aproximação de séries de Taylor do sinal no dominio T e minimizar isso para ajustar a evolução de tempo real, para obter os parâmetros de modelo de variação.4. (Opcional) Calcular o contorno de tempo da variação de sinal.5 Em uma aplicação prática, a aplicação do conceitoinventivo pode, por exemplo, compreender transformar o sinal para o dominio desejado e determinar os parâmetros de uma aproximação de séries de Taylor, de maneira que o modelo representado péla aproximação de séries de Taylor seja ajustado para ajustar a 10 evolução de tempo real da representação do dominio de transformação do sinal.

Em algumas configurações, o dominio de transformação também pode ser trivial, isso é, é possivel aplicar o modelo diretamente no dominio de tempo.

Conforme apresentado nas seções anteriores, o(s)modelo(s) de variação pode(m), por exemplo, ser(em) localmente constante(s), polinómio(s) ou ter outra(s) forma (s) funcional(is).

Conforme demonstrado nas seções anteriores, a aproximação de séries de Taylor pode ser aplicada seja através de 20 janelas consecutivas, dentro de uma janela, ou em uma combinação de dentro de janelas e através de janelas consecutivas.

A aproximação de séries de Taylor pode ter qualquer sequência, embora os primeiros modelos de sequência sejam geralmente atrativos, desde que os parâmetros possam ser obtidoscomo soluções a equações lineares. Ademais, também outros métodos de aproximação conhecidos na técnica podem ser usados.

De modo geral, a minimização do erro de quadradomédio (MMSE) é um critério de minimização útil, desde que os parâmetros possam ser obtidos como soluções às equações lineares. Outros critérios de minimização podem ser utilizados para melhor robustez ou quando os parâmetros estiverem mais bem interpretados em um outro dominio de minimização.

Aparelho para codificar um sinal de áudio

Como já foi mencionado acima, o conceito inventivo pode ser aplicado em um aparelho para codificar um sinal de áudio. Por exemplo, o conceito inventivo é particularmente útil sempre que uma informação sobre uma variação temporal de um sinal 10 de áudio for necessária em um codificador de áudio (ou um decodificador de áudio ou qualquer outro aparelho de processamento de áudio).

A Figura 6 apresenta um diagrama em blocos esquemático de um codificador de áudio, de acordo com uma 15 configuração da invenção. O codificador de áudio apresentado na Figura 6 é designado em sua integridade com 600. 0 codificador de áudio 600 é configurado para receber uma representação 606 de um sinal de áudio de entrada (por exemplo, uma representação de dominio de tempo de um sinal de áudio) , e para prover, em sua 20 base, uma representação codificada 630 do sinal de áudio de entrada. O codificador de áudio 600 compreende, opcionalmente, um primeiro . pré-processador de sinal de áudio 610 e, ainda opcionalmente, um segundo pré-processador de sinal de áudio 612. Também, o codificador de áudio 600 pode compreender um centro do 25 codificador de sinal de áudio 620, que pode ser configurado para receber a representação 606 do sinal de áudio de entrada, ou uma versão preprocessada sua, provida, por exemplo, pelo primeiro pré- processador de sinal de áudio 610. O centro do codificador de sinal de áudio 620 é adicionalmente configurado para receber um parâmetro 622 que descreve uma variação temporal de umacaracterística de sinal do sinal de áudio 606. Também, o centro do codificador de sinal de áudio 620 pode ser configurado para 5 codificar o sinal de áudio 606, ou sua respectiva versão preprocessada, de acordo com um algoritmo de codificação de sinal de áudio, levando em conta o parâmetro 622. Por exemplo, um algoritmo de codificação do centro do codificador de sinal de áudio 620 pode ser ajustado para seguir uma característica 10 variante (descrita pelo parâmetro 622) do sinal de áudio de entrada ou para compensar a característica variante do sinal de áudio de entrada.

Portanto, a codificação de sinal de áudio é realizada em uma maneira adaptativa por sinal, levando em 15 consideração uma variação temporal das características de sinal.0 centro do codificador de sinal de áudio 620 pode, por exemplo, ser otimizado para codificar sinais de áudio de música (por exemplo, utilizando um algoritmo de codificação de domínio de frequência). De maneira alternativa, o codificador de 20 sinal de áudio pode ser otimizado para codificar fala e pode, portanto, também ser considerado um centro de codificador de fala. Entretanto, o centro do codificador de sinal de áudio ou centro do codificador de fala também pode ser naturalmente configurado para seguir a denominada abordagem "híbrida", apresentando bom 25 desempenho tanto para codificar sinais de música e sinais de fala.

Por exemplo, o centro do codificador de sinal de áudio ou centro do codificador de fala 620 pode constituir (ou compreender) um centro do codificador de distorção por tempo, utilizando, portanto, o parâmetro 622, que descreve uma variação temporal de uma característica de sinal (por exemplo, ângulo) como um parâmetro de distorção.0 codificador de áudio 600 pode, portanto, 5 compreender um aparelho 100, conforme descrito em relação à Figura 1, cujo aparelho 100 é configurado para receber o sinal de áudio de entrada 606 ou uma versão sua preprocessada (provida pelo pré- processador de sinal de áudio opcional 612) e para prover, em sua base, as informações de parâmetro 622 que descrevem uma variação 10 temporal de uma característica de sinal (por exemplo, ângulo) do sinal de áudio 606.

Portanto, o codificador de áudio 606 pode ser configurado para fazer uso de qualquer conceito inventivo aqui descrito para obter o parâmetro 622 com base no sinal de áudio de 15 entrada 606.

Implementação em computador

Dependendo de determinadas necessidades de implementação, as configurações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser 20 realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controle possíveis de serem lidos eletronicamente armazenados em si, que cooperam (ou são capazes de cooperar) com um sistema de computador 25 programável de maneira que o respectivo método seja realizado.

Algumas configurações, de acordo com a invenção, compreendem um carregador de dados que tem sinais de controle possíveis de serem lidos eletronicamente, que são capazes de cooperar com um sistema de computador programável, de maneira que um dos métodos aqui descritos seja realizado.

De modo geral, as configurações da presente invenção podem ser implementadas como um programa de computador 5 com um código de programa, o código de programa sendo operado para realizar um dos métodos quando o produto de programa de computador for executado em um computador. 0 código de programa pode, por exemplo, ser armazenado em um carregador possível de ser lido da máquina.

Outras configurações compreendem o programa decomputador para realizar um dos métodos aqui descritos, armazenados em um carregador possivel de ser lido da máquina.

Em outras palavras, uma configuração do método inventivo é, portanto, um programa de computador que tem um código 15 de programa para realizar um dos métodos aqui descritos, quando o programa de computador for executado em um computador.

Uma configuração adicional dos métodos inventivos é, portanto, um carregador de dados (ou um meio de armazenamento digital ou um meio possível de ser lido por computador) 20 compreendendo, registrado em si, o programa de computador para realizar um dos métodos aqui descritos.

Uma configuração adicional do método inventivo é, portanto, uma corrente de dados ou uma sequência de sinais que representam o programa de computador para realizar um dos métodos 25 aqui descritos. A corrente de dados ou uma sequência de sinais pode, por exemplo, ser configurada para ser transferida por meio de uma conexão de comunicação de dados, por exemplo, por meio daInternet.

Uma configuração adicional compreende meios de processamento, por exemplo, um computador ou um dispositivo de lógica programável, configurados ou adaptados para realizar um dos métodos aqui descritos.Uma configuração adicional compreende umcomputador que tem instalado o programa de computador para realizar um dos métodos aqui descritos.

Em algumas configurações, um dispositivo de lógica programável (por exemplo uma matriz de portas de campo 10 programáveis) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos aqui descritos. Em algumas configurações, uma matriz de portas de campo programáveis pode cooperar com um microprocessador para realizar um dos métodos aqui descritos.Conclusão

A seguir, o conceito inventivo será brevemente resumido, tendo como referência a Figura 7, que apresenta um fluxograma de um método 7 00, de acordo com uma configuração da invenção. O método 700 compreende uma etapa 710 para calcular uma 20 representação de domínio de transformação de um sinal de entrada, por exemplo, um sinal de áudio de entrada. O método 700 compreende ainda uma etapa 730 para minimizar o erro de modelagem de um modelo que descreve um efeito da variação no domínio. A modelagem 720 do efeito de variação no domínio de transformação pode ser 25 realizada como parte do método 700, mas também pode ser realizada como uma etapa preparatória.

Entretanto, ao minimizar o erro de modelagem naetapa 730, tanto a representação de domínio de transformação do sinal de áudio de entrada como o modelo que descreve o efeito da variação podem ser levados em consideração. 0 modelo que descreve o efeito da variação pode ser utilizado em uma forma que descreve as estimativas de uma representação de dominio de transformação 5 subsequente como uma função explicita dos parâmetros de dominio de transformação real anteriores (ou o seguinte ou outro) ou em uma forma que descreve parâmetros de modelo de variação ideais (ou pelo menos suficientemente bons) como uma função explícita de uma pluralidade de parâmetros de domínio de transformação reais (de 10 uma representação de domínio de transformação do sinal de áudio de entrada).

A etapa 730 para minimizar o erro de modelagemresulta em um ou mais parâmetros de modelo que descrevem uma magnitude de variação.

A etapa opcional 740 para gerar o contornoresulta em uma descrição de um contorno da característica de sinal do sinal (de áudio) de entrada.

Para resumir, as configurações acima, de acordocom a presente invenção, trata de uma das questões maisfundamentais no processamento de sinal, a saber, quanto um sinal muda?configurações provêm um método (e um aparelho) para estimar a variação nas características de sinal, como uma alteração na 25 frequência fundamental ou invólucro temporal. Para alterações na frequência, é óbvio aos picos de oitavas, robustos a erros na autocorrelação (ou autocovariância) simples, no entanto eficientee não inclinada. Especificamente, as configurações de acordo com apresente invenção compreendem as seguintes características:

• A variação nas características de sinal (por exemplo, do sinal de áudio de entrada) é modelada. Em termos de 5 variação de ângulo ou invólucro temporal, o modelo especifica como a autocorrelação ou autocovariância (ou outra representação de domínio de transformação) altera durante o tempo.

• Enquanto as características de sinal não podem ser presumidas para serem constantes localmente, a variação 10 (que pode ser normalizada em algumas configurações) nascaracterísticas de sinal pode ser presumida constante ou seguir uma forma funcional.

• Ao modelar a alteração de sinal, sua variação (=a evolução de tempo das características de sinal) pode ser 15 modelada.

• O modelo de variação de sinal (por exemplo, na representação funcional explícita ou implícita) é ajustado a observações (por exemplo, parâmetros de domínio de transformação reais obtidos ao transformar o sinal de áudio de entrada) ao 20 minimizar o erro de modelagem, sendo assim os parâmetros de modelo quantificam a magnitude da variação.

• Em termos de estimativa de variação de ângulo, a variação é estimada diretamente a partir do sinal, sem uma etapa intermediária de estimativa de ângulo (por exemplo, uma 25 estimativa de um valor absoluto do ângulo).

• Ao modelar a variação no ângulo, o efeito davariação pode ser medido a partir de qualquer retardo daautocorrelação e não somente em diversas extensões de período, permitindo, assim, o uso de todos os dados disponiveis e obtendo, portanto, um alto nivel de robustez e estabilidade.

• Mesmo estimando a autocorrelação ouautocovariância a partir de um sinal não fixo introduz inclinação 5 a estimativas de autocorrelação e covariância , a estimativa de variação o presente trabalho ainda será não inclinada em algumas configurações.

• Quando as características reais do sinal forem solicitadas e não somente a variação nas características, o 10 método provê opcionalmente um contorno preciso e continuo que pode ser ajustado para estimar as características de sinal junto ao contorno.

• Na codificação de fala e de áudio, o método apresentado pode ser utilizado como entrada para o MDCT distorcido 15 por tempo, de maneira que quando alterações no ângulo forem conhecidas, seu efeito possa ser cancelado por distorção por tempo, antes de aplicar o MDCT. Isso reduzirá a ampliação de componentes de frequência e melhorará, portanto a compactação de energia.

• Ao estimar a partir da autocorrelação,consecutivas janelas de análise podem ser utilizadas para obter a alteração temporal. Ao estimar a partir da autocovariância, uma única janela é necessária para medir a alteração, mas janelas consecutivas podem ser utilizadas quando desejado.

• Estimar conjuntamente alterações tanto noângulo como no invólucro temporal corresponde â análise AM-FM do sinal.A seguir, algumas configurações, de acordo com a invenção, serão brevemente resumidas.De acordo com um aspecto, uma configuração, de acordo com a invenção, compreende um estimador de variação de sinal. 0 estimador de variação de sinal compreende uma modelagem 5 de variação de sinal em um dominio de transformação, uma modelagem da evolução de tempo do sinal no dominio de transformação, e uma minimização de erro de modelo em termos de ajustar ao sinal de entrada.De acordo com um aspecto da invenção, o estimador 10 de variação de sinal estima variação no dominio de autocorrelação.De acordo com outro aspecto, o estimador de variação de sinal estima a variação no ângulo.De acordo com um aspecto, a presente invenção cria um estimador de variação de ângulo, onde o modelo de variação 15 compreende:• Um modelo para trocar no retardo deautocorrelação.

• Uma estimativa de derivada de retardo deÔR autocorrelação

• Um modelo para relacionar (i.) a derivada detempo de retardo: de autocorrelação, (ii.) derivada de tempo de autocorrelação e (iii.) derivada de retardo de autocorrelação.

• Uma estimativa de séries de Taylor de autocorrelação.• uma estimativa do MMSE do ajuste de modelo,que produz o parâmetro de variação de ângulo(s).De acordo com um aspecto da invenção, de variação de ângulo pode ser utilizado, em combinação com a transformada discreta de cosseno modificada por distorção de tempo (TW-MDCT, vide referência [3] ) na codificação de fala e de áudio como entrada (ou para prover entrada) à transformada discreta decosseno modificada por distorção de tempo (TW-MDCT).De acordo com um aspecto da invenção, o estimadorde variação de sinal estima a variação no dominio de autocovariância.De acordo com um aspecto, o estimador de variaçãode sinal estima uma variação no invólucro temporal.De acordo com um aspecto, o estimador de variação de invólucro temporal compreende um modelo de variação, o modelo de variação compreendendo:

• Um modelo para o efeito da variação deinvólucro temporal sobre a autocovariância como função do retardo k.• Uma estimativa de séries de Taylor de autocovariância.

• Uma estimativa MMSE do ajuste do modelo, queproduz o(s) parâmetro(s) de variação de invólucro.De acordo com um aspecto, o efeito da estruturade formant é cancelado no estimador de variação de sinal,.De acordo com outro aspecto, a presente invençãocompreende o uso das estimativas da variação de sinal de algumascaracterísticas de um sinal como informações adicionais para encontrar estimativas precisas e robustas daquela característica.Para resumir, as configurações, de acordo com apresente invenção, usam modelos de variação para a análise de um sinal. Ao contrário, os métodos convencionais precisam de umaestimativa de variação de ângulo como entrada aos seus algoritmos,mas não provêm um método para estimar a variação.Referências[1] Y. Bistritz and S. Peller. Immittancespectral pairs (ISP) for speech encoding . In Proc. Acou Speech Signal Processing, ICASSP-93, Minneapolis, MN, USA, April 27-30 1993.[2] A. de Cheveigné and H. Kawahara. YIN, afundamental frequency estimator for speech and music. J Acoust SecAm, 111 (4) :1917-1930, April 2002.[3] B. Edler, S. Disch, R. Geiger, S. Bayer, U.Kramer, G. Fuchs, M. Neundorf, M. Multrus, G. Schuller und H.Popp. Audio processing using high-quality pitch correction. US 15 Patent application 61/042,314, 2008.[4] J. Herre and J.D. Johnston. Enhancing theperformance of perceptual audio coders by using temporal noise shaping (TNS) . In Proc AES Convention 101, Los Angeles, CA, USA, November 8-11 1996.[5] A. Hãrmã. Linear predictive coding withmodified filter structures. IEEE Trans. Speech Audio Process., 9 (8):769-777, November 2001.[6] J. Makhoul. Linear prediction: A tutorial review. Proc. IEEE, 63(4): 561-580, April 1975[7] K.K. Paliwal. Interpolation properties oflinear prediction parametric representations. In Proc Eurospeech '95, Madrid, Spain, September 18-21 1995.[8] L. Villemoes. Time warped modified transform coding of audio signals. International Patent PCT/EP2006/010246, Published 10.05.2007.[9] M. Wolfel and J. McDonough. Minimum variance distortionless response spectral estimation. IEEE Signal ProcessMag., 22(5):117-126, September 2005.

Claims

1. APARELHO, sendo o dito aparelho (100) para obter um parâmetro (140) que descreva uma variação de um sinal característico de um sinal de áudio com base nos parâmetros de domínio de transformação real (120), descrevendo o sinal de áudio em um domínio de transformação, caracterizado por compreender:um determinador de parâmetro (130) configurado para determinar um ou mais parâmetros de modelo de um modelo de variação de domínio por transformação (130a; 130c) descrevendo uma evolução dos parâmetros de domínio de transformação que dependem de um ou mais parâmetros de modelo (140) representando uma característica de sinal de áudio, de maneira que um erro de modelo, que representa um desvio entre uma evolução modelada dos parâmetros de domínio de transformação e uma evolução dos parâmetros de domínio de transformação real, seja trazido abaixo de um valor limiar pré-determinado ou minimizado;em que o aparelho (100) é configurado para obter, conforme os parâmetros de domínio de transformação real, a primeira informação de domínio de transformação (R(K,H)) descrevendo o sinal de áudio para um primeiro intervalo de tempo para uma pluralidade de valores diferentes da variável de transformação (K), e segunda informação de domínio de transformação (R(K,H+1)) descrevendo o sinal de áudio para um segundo intervalo de tempo para os valores diferentes da variável de transformação;em que o determinador de parâmetro (130) é configurado para avaliar, para uma pluralidade de valores diferentes da variável de transformação (K), uma variação temporal entre a primeira informação de domínio de transformação e a segunda informação de domínio de transformação, para obter as informações de variação temporal,para estimar uma variação local da informação de domínio de transformação sobre a variável de transformação para uma pluralidade de valores diferentes da variável de transformação, para obter uma informação de variação local, epara combinar as informações de variação temporal e as informações de variação local, para obter um parâmetro de modelo de variação de frequência;em que o determinador de parâmetro (130) é configurado para obter o parâmetro de modelo de variação de frequência utilizando um modelo compreendendo o parâmetro de modelo de variação de frequência e representando uma compressão ou expansão da representação de domínio de transformação do sinal de áudio em relação à variável de transformação (k), presumindo uma variação de frequência suave do sinal de áudio;em que o determinador de parâmetro é configurado para determinar o parâmetro de modelo de variação de frequência, de maneira que o modelo de variação de domínio por transformação parametrizado seja adaptado ao primeiro conjunto de parâmetros de domínio de transformação e ao segundo conjunto de parâmetros de domínio de transformação.

2. Aparelho (100), de acordo com a reivindicação 1, caracterizado por o aparelho (100) ser configurado para obter, como parâmetros de domínio de transformação real (120), um primeiro conjunto de parâmetros de domínio de transformação (R(K,H)) que descreve um primeiro intervalo de tempo do sinal de áudio no domínio de transformação para um conjunto predeterminado de valores de uma variável de transformação (K), e um segundo conjunto de parâmetros de domínio de transformação (R(K,H+1)) que descreve um segundo intervalo de tempo do sinal de áudio no domínio de transformação para o predeterminado conjunto de valores da variável de transformação (K).

3. Aparelho (100), de acordo com a reivindicação 1, caracterizado por o aparelho (100) ser configurado para obter, como parâmetros de domínio de transformação real (120), parâmetros de domínio de transformação que descrevem o sinal de áudio no domínio de transformação como uma função de uma variável de transformação (k),em que o domínio de transformação é escolhido de maneira que uma transposição de frequência do sinal de áudio resulte pelo menos em uma troca da representação de domínio de transformação do sinal de áudio em relação à variável de transformação ou em uma expansão da representação de domínio de transformação em relação à variável de transformação ou em uma compressão da representação de domínio de transformação em relação à variável de transformação;em que o determinador de parâmetro 130 é configurado para obter um parâmetro de modelo de variação de frequência (ch) com base em uma alteração temporal ( R(k,h +1) - R(k,h) ) dos parâmetros de domínio de transformação real correspondentes, levando em consideração uma dependência da representação de domínio de transformação do sinal de áudio de uma variável de transformação (K).

4. Aparelho (100), de acordo com uma das reivindicações de 1 a 3, caracterizado por o aparelho (100) ser configurado para obter, como parâmetros de domínio de transformação real, as primeiras informações de autocorrelação que descrevem uma autocorrelação do sinal de áudio para um primeiro intervalo de tempo para uma pluralidade de diferentes valores de retardo de autocorrelação (K), e segundas informações de autocorrelação que descrevem uma autocorrelação do sinal de áudio para um segundo intervalo de tempo para os diferentes valores de retardo de autocorrelação;em que o determinador de parâmetro 130 é configurado para avaliar, para uma pluralidade de diferentes valores de retardo de autocorrelação (K), uma variação temporal entra as primeiras informações de autocorrelação e as segundas informações de autocorrelação, para obter informações de variação temporal,para estimar uma variação local das informações de autocorrelação sobre um retardo para uma pluralidade de diferentes valores de retardo, para obter uma informação de variação de retardo local, epara combinar as informações de variação temporal e as informações de variação de retardo local, para obter o parâmetro de modelo.

5. Aparelho (100), de acordo com a reivindicação 4, caracterizado por o determinador de parâmetro ser configurado para computar um parâmetro de variação estimado c h utilizando a seguinte equação:

ondeK indica uma variável em execução que descreve diferentes valores de retardo de autocorrelação;H indica um primeiro intervalo de tempo;H+1 indica um segundo intervalo de tempo;

indica um número de valores de retardo de autocorrelação a ser avaliado;

indica uma autocorrelação do sinal de áudio ( xn ) para uma janela indicada pelo índice H

indica uma autocorrelação do sinal deáudio xn para uma janela indicada pelo índice H+1; ed ..

indica uma variação da autocorrelação d kR(k,h) sobre um retardo para uma janela indicada pelo índice H em um ambiente do retardo indicado por K.

6. Aparelho (100), de acordo com uma das reivindicações de 1 a 3, caracterizado por o aparelho ser configurado para obter, como parâmetros de domínio de transformação real, primeiras informações de autocovariância

que descrevem uma autocovariância do sinal de áudio para um primeiro intervalo de tempo para uma pluralidade de diferentes valores de retardo de autocorrelação (K) e segundas informações de autocovariância ( Q(-k,t) = Q(k,t-k) = q-k ) quedescrevem uma autocovariância do sinal de áudio para um segundo intervalo de tempo (T-K) para uma pluralidade de diferentes valores de retardo de autocorrelação; eem que o determinador de parâmetro é configurado para avaliar, para uma pluralidade de diferentes valores de retardo de autocovariância, uma variação ( qk - q-k ) entre as primeiras informações de autocovariância e as segundas informações de autocovariância, para obter informações de variação temporal,para estimar uma derivada local

das informações de autocovariância sobre o retardo para uma pluralidade de diferentes valores de retardo, para obter informações de variação de retardo local, epara combinar as informações de variação temporal e as informações de variação de retardo local, para obter o parâmetro de modelo (140).

7. Aparelho (100), de acordo com uma das reivindicações de 1 a 3, caracterizado por o aparelho (100) ser configurado para obter informações de autocovariância ( Q(k,t) = qk , Q(-k, t) = q-k ) que descrevem uma autocovariância do sinal de áudio para uma única janela de autocovariância, mas para diferentes valores de retardo de autocovariância,para avaliar, para uma pluralidade de diferentes pares de valores de retardo de autocovariância (-K,K), diferenças ponderadas ( k2(qk - q-k) ) entre os pares de valores de autocovariância,em que a ponderação é escolhida dependendo de uma diferença (2K) dos valores de retardo dos respectivos pares de valores de retardo, e dependendo de uma variação (q-k ) dos valores de autocovariância sobre o retardo,para utilizar a soma combinada de diferentes valores de diferença ponderados, para obter um valor de combinação, epara obter os parâmetros de modelo com base no valor de combinação.

8. Aparelho (100), de acordo com uma das reivindicações de 1 a 7, caracterizado por o aparelho (100) ser configurado para obter um parâmetro que descreve uma variação temporal de um invólucro do sinal de áudio,em que o determinador de parâmetro (130) é configurado para obter uma pluralidade de parâmetros de domínio de transformação ( R(0, th) ) que descrevem uma força de sinal do sinal de áudio para uma pluralidade de intervalos de tempo,em que o determinador de parâmetro é configurado para obter um parâmetro de modelo de variação de invólucro utilizando uma representação de um modelo de variação de domínio por transformação parametrizado que compreende um parâmetro de modelo de variação de invólucro e que representa um aumento temporal na força ou uma redução temporal na força da representação de domínio de transformação do sinal de áudio, presumindo uma variação de invólucro suave do sinal de áudio, eem que o determinador de parâmetro é configurado para determinar o parâmetro de modelo de variação de invólucro de maneira que o modelo de variação de domínio por transformação parametrizado seja adaptado aos parâmetros de domínio de transformação ( R(0, th) ).

9. Aparelho (100), de acordo com a reivindicação8, caracterizado por o determinador de parâmetro (130) ser configurado para obter uma pluralidade de parâmetros de autocorrelação ou parâmetros de autocovariância para um determinado retardo de autocorrelação ou retardo de autocovariância, eem que o determinador de parâmetro é configurado para determinar uma pluralidade de parâmetros polinômicos de um modelo de variação de invólucro polinômico.

10. Aparelho, de acordo com a reivindicação 1, caracterizado por o aparelho ser configurado para obter parâmetros de domínio de autocorrelação que descrevem o sinal de áudio em um domínio de autocorrelação, eem que o determinador de parâmetro (130) é configurado para determinar um ou mais parâmetros de modelo (140) de um modelo de variação de domínio de autocorrelação; ouem que o aparelho é configurado para obter parâmetros de domínio de autocovariância que descrevem o sinal de áudio em um domínio de autocovariância, eem que o determinador de parâmetro (130) é configurado para determinar um ou mais parâmetros de modelo de um modelo de variação de domínio de autocovariância.

11. Aparelho, de acordo com uma das reivindicações de 1 a 10, caracterizado por o modelo de variação de domínio por transformação descrever uma variação temporal de um ângulo do sinal de áudio, ouem que o modelo de variação de domínio por transformação descreve uma variação temporal de um invólucro do sinal de áudio, ouem que o modelo de variação de domínio por transformação descreve uma variação temporal simultânea de um ângulo e de um invólucro do sinal de áudio.

12. Aparelho (100), de acordo com uma das reivindicações de 1 a 11, em que o aparelho é caracterizado por compreender um redutor por estrutura FORMANT configurado para preprocessar um sinal de áudio de entrada, para obter um sinal de áudio reduzido por estrutura FORMANT; eem que o aparelho é configurado para obter o parâmetro de domínio de transformação real com base no sinal de áudio reduzido por estrutura FORMANT;em que o redutor por estrutura FORMANT é configurado para estimar parâmetros de um modelo de previsão linear do sinal de áudio de entrada com base em uma versão filtrada com alta frequência do sinal de áudio de entrada, epara filtrar uma versão em banda larga do sinal de áudio de entrada com base nos parâmetros estimados do modelo de previsão linear,para obter o sinal de áudio reduzido por estrutura FORMANT de maneira que o sinal de áudio reduzido por estrutura FORMANT compreenda uma característica de baixa frequência.

13. Aparelho, de acordo com uma das reivindicações de 1 a 12,caracterizado por o determinador de parâmetro ser configurado para adaptar o modelo de variação de domínio por transformação, que descreve uma evolução temporal dos parâmetros de domínio de transformação dependendo de um ou mais parâmetros de modelo que representem uma característica de sinal de áudio, ao sinal de áudio representado pelos parâmetros de domínio de transformação real.

14. Aparelho, de acordo com uma das reivindicações de 1 a 13,caracterizado por o determinador de parâmetro ser configurado para avaliar, para uma pluralidade de valores diferentes da variável de transformação (k), diferenças entre pares (R(k, h + 1), R(k, h)) de valores de domínio de transformação do primeiro conjunto de parâmetros de domínio de transformação e do segundo conjunto de parâmetros de domínio de transformação associados aos mesmos valores da variável de transformação, para obter as informações de variação temporal.

15. Aparelho, de acordo com uma das reivindicações de 1 a 14,caracterizado por o determinador de parâmetro ser configurado para utilizar todos os valores de domínio de transformação disponíveis (R(k, h + 1), R(k, h)), para qualquer valor da variável de transformação, para obter as informações de variação temporal.

16. Método para obter um parâmetro que descreve uma variação de uma característica de sinal de áudio para um sinal de áudio com base nos parâmetros de domínio de transformação real que descrevem um sinal de áudio em um domínio transformado, caracterizado por o método compreender:determinar um ou mais parâmetros de modelo de um modelo de variação de domínio por transformação que descreve uma evolução dos parâmetros de domínio de transformação dependendo de um ou mais parâmetros de modelo que representam uma característica de sinal de áudio, de maneira que um erro de modelo, que representa um desvio entre uma evolução temporal modelada dos parâmetros de domínio de transformação e uma evolução dos parâmetros de domínio de transformação real, seja trazido abaixo de um valor limiar predeterminado ou minimizado;em que a primeira informação de domínio de transformação que descreve o sinal de áudio para um primeiro intervalo de tempo para uma pluralidade de valores diferentes de uma variável de transformação, e a segunda informação de domínio de transformação que descreve o sinal de áudio para um segundo intervalo de tempo para que os valores diferentes da variável de transformação sejam obtidos como parâmetros de domínio de transformação real;em que uma variação temporal entre a primeira informação de domínio de transformação e a segunda informação de domínio de transformação seja avaliada para uma pluralidade de valores diferentes da variável de transformação (k), para obter informações de variação temporal,em que uma variação local da informação de domínio de transformação sobre a variável de transformação seja estimada para uma pluralidade de valores diferentes da variável de transformação, para obter uma informação de variação local;em que as informações de variação temporal e as informações de variação local são combinadas para obter um parâmetro de modelo de variação de frequência; em que o parâmetro de modelo de variação de frequência é obtido utilizando um modelo compreendendo o parâmetro de modelo de variação de frequência e representando uma compressão ou expansão da representação de domínio de transformação do sinal de áudio em relação à variável de transformação (k), presumindo uma variação de frequência suave do sinal de áudio; eem que o parâmetro de modelo de variação de frequência é determinado de maneira que o modelo de variação de domínio por transformação parametrizado seja adaptado ao primeiro conjunto de parâmetros de domínio de transformação e o segundo conjunto de parâmetros de domínio de transformação.

17. Aparelho (100) para obter um parâmetro (140) que descreve uma variação de uma característica de sinal de áudio de um sinal de áudio com base nos parâmetros de domínio de transformação real (120) que descrevem o sinal de áudio em um domínio de transformação, caracterizado por o aparelho compreender:um determinador de parâmetro (130) configurado para determinar um ou mais parâmetros de modelo de um modelo de variação de domínio por transformação (130a; 130c) que descreve uma evolução dos parâmetros de domínio de transformação dependendo de um ou mais parâmetros de modelo (140) que representam uma característica de sinal de áudio, de maneira que um modelo de erro, que representa um desvio entre uma evolução modelada dos parâmetros de domínio de transformação e uma evolução dos parâmetros de domínio de transformação real, seja trazido abaixo de um valor de limiar predeterminado ou minimizado;em que o aparelho (100) é configurado para obter informações de autocovariância ( Q(k, t) = qk , Q(-k,t) = q-k ) que descrevem uma autocovariância do sinal de áudio para uma única janela de autocovariância, mas para diferentes valores de retardo de autocovariância,para avaliar, para uma pluralidade de diferentes pares de valores de retardo de autocovariância (-K,K), diferenças ponderadas ( k2(qk - q-k) ) entre os pares de valores de autocovariância,em que a ponderação é escolhida dependendo de uma diferença (2K) dos valores de retardo dos respectivos pares de valores de retardo, e dependendo de uma variação (q-k ) dos valores de autocovariância sobre o retardo,para realizar a soma combinada de diferentes valores de diferença ponderados, para obter um valor de combinação, epara obter os parâmetros com base no valor de combinação.

18. Método para obter um parâmetro que descreve uma variação de uma característica de sinal de áudio para um sinal de áudio com base nos parâmetros de domínio de transformação real que descrevem o sinal de áudio em um domínio transformado, caracterizado por o método compreender:determinar um ou mais parâmetros de modelo de um modelo de variação de domínio por transformação que descreve uma evolução dos parâmetros de domínio de transformação dependendo de um ou mais parâmetros de modelo que representam uma característica de sinal de áudio, de maneira que um erro de modelo, que representa um desvio entre uma evolução temporal modelada dos parâmetros de domínio de transformação e uma evolução dos parâmetros de domínio de transformação real, seja trazido abaixo de um valor de limiar predeterminado ou minimizado;em que as informações de autocovariância que descrevem uma autocovariância do sinal de áudio para uma única janela de autocovariância, mas para diferentes valores de retardo de autocovariância, sejam obtidas;em que as diferenças ponderadas entre pares de valores de autocovariância seja avaliadas para uma pluralidade de diferentes pares de valores de retardo de autocovariância (-k, k),em que a ponderação é escolhida dependendo de uma diferença (2K) dos valores de retardo dos respectivos pares de valores de retardo e dependendo de uma variação (q-k) dos valores de autocovariância sobre o retardo,em que diferentes valores de diferença ponderados passam por soma combinada para obter um valor de combinação; eem que os parâmetros de modelo são obtidos com base no valor de combinação.

19. Aparelho (100) para obter um parâmetro (140) que descreve uma variação de uma característica de sinal de áudio de um sinal de áudio com base nos parâmetros de domínio de transformação real (120) que descrevem o sinal em um domínio de transformação, caracterizado por o aparelho compreender:um determinador de parâmetro (130) configurado para determinar um ou mais parâmetros de modelo de um modelo de variação de domínio por transformação (130a; 130c) que descreve uma evolução dos parâmetros de domínio de transformação dependendo de um ou mais parâmetros de modelo (140) que representam uma característica de sinal de áudio, de maneira que um erro de modelo, que representam um desvio entre uma evolução modelada dos parâmetros de domínio de transformação e uma evolução dos parâmetros de domínio de transformação real, seja trazido abaixo de um valor de limiar predeterminado ou minimizado;em que o aparelho (100) é configurado para obter um parâmetro que descreve uma variação temporal de um invólucro do sinal de áudio,em que o determinador de parâmetro (130) é configurado para obter uma pluralidade de parâmetros de domínio de transformação que descrevem uma força de sinal de áudio do sinal de áudio para uma pluralidade de intervalos de tempo,em que o determinador de parâmetro é configurado para obter um parâmetro de modelo de variação de invólucro utilizando uma representação de um modelo de variação de domínio por transformação parametrizado compreendendo um parâmetro de modelo de variação de invólucro e representando um aumento temporal na força ou uma redução temporal na força da representação de domínio de transformação do sinal de áudio, presumindo uma variação de invólucro suave do sinal de áudio, eem que o determinador de parâmetro é configurado para determinar o parâmetro de modelo de variação de invólucro, de maneira que o modelo de variação de domínio por transformação parametrizado seja adaptado aos parâmetros de domínio de transformação; eem que o determinador de parâmetro (130) é configurado para obter uma pluralidade de parâmetros de autocorrelação ou parâmetros de autocovariância para um determinado retardo de autocorrelação ou retardo de autocovariância, eem que o determinador de parâmetro é configurado para determinar uma pluralidade de parâmetros polinômicos de um modelo de variação de invólucro polinômico.

20. Método para obter um parâmetro que descreve uma variação de característica de sinal de áudio para um sinal de áudio com base nos parâmetros de domínio de transformação real que descreve o sinal de áudio em um domínio transformado, caracterizado por o método compreender:determinar um ou mais parâmetros de modelo de um modelo de variação de domínio por transformação que descreve uma evolução dos parâmetros de domínio de transformação dependendo de um ou mais parâmetros de modelo que representam uma característica de sinal de áudio, de maneira que um erro de modelo, que representa um desvio entre uma evolução temporal modelada dos parâmetros de domínio de transformação e uma evolução dos parâmetros de domínio de transformação real, seja trazido abaixo de um valor de limiar predeterminado ou minimizado;em que uma pluralidade de parâmetros de domínio de transformação que descrevem uma força de sinal de áudio do sinal de áudio de áudio para que uma pluralidade de intervalos de tempo seja obtida;em que um parâmetro de modelo de variação de invólucro é obtido utilizando uma representação de um modelo de variação de domínio por transformação parametrizado compreendendo um parâmetro de modelo de variação de invólucro e representando um aumento temporal na força ou uma redução temporal na força da representação de domínio de transformação do sinal de áudio, presumindo uma variação de invólucro suave do sinal de áudio,em que o parâmetro de modelo de variação de invólucro é determinado, de maneira que o modelo de variação de domínio por transformação parametrizado seja adaptado aos parâmetros de domínio de transformação,em que uma pluralidade de parâmetros de autocorrelação ou parâmetros de autocovariância sejam obtidos para um determinado retardo de autocorrelação ou retardo de autocovariância, eem que uma pluralidade de parâmetros polinômicos de um modelo de variação de invólucro polinômico seja determinada.

21. Aparelho (100) para obter um parâmetro (140) que descreve uma variação de uma característica de sinal de áudio de um sinal de áudio com base nos parâmetros de domínio de transformação real (120) que descrevem o sinal de áudio em um domínio de transformação, caracterizado por o aparelho compreender:um determinador de parâmetro (130) configuradopara determinar um ou mais parâmetros de modelo de um modelo de variação de domínio por transformação (130a; 130c) que descreve uma evolução dos parâmetros de domínio de transformação dependendo de um ou mais parâmetros de modelo (140) que representam uma característica de sinal de áudio, de maneira que um erro de modelo, que representa um desvio entre uma evolução modelada dos parâmetros de domínio de transformação e uma evolução dos parâmetros de domínio de transformação real, seja trazido abaixo de um valor de limiar predeterminado ou minimizado;em que o aparelho compreende um redutor por estrutura FORMANT configurado para preprocessar um sinal de áudio de entrada, para obter um sinal de áudio reduzido por estrutura FORMANT;em que o aparelho é configurado para obter o parâmetro de domínio de transformação real com base no sinal de áudio reduzido por estrutura FORMANT;em que o redutor por estrutura FORMANT é configurado para estimar parâmetros de um modelo de previsão linear do sinal de áudio de entrada com base em uma versão filtrada com alta frequência do sinal de áudio de entrada, epara filtrar uma versão em banda larga do sinal de áudio de entrada com base nos parâmetros estimados do modelo de previsão linear,para obter o sinal de áudio reduzido por estrutura FORMANT, de maneira que o sinal de áudio reduzido por estrutura FORMANT compreenda uma característica de baixa frequência.

22. Método para obter um parâmetro que descreve uma variação de uma característica de sinal para um sinal de áudio com base nos parâmetros de domínio de transformação real que descrevem o sinal de áudio em um domínio transformado, caracterizado por o método compreender:determinar um ou mais parâmetros de modelo de um modelo de variação de domínio por transformação que descreve uma evolução dos parâmetros de domínio de transformação dependendo de um ou mais parâmetros de modelo que representam uma característica de sinal de áudio, de maneira que um erro de modelo, que representa um desvio entre uma evolução temporal modelada dos parâmetros de domínio de transformação e uma evolução dos parâmetros de domínio de transformação real, seja trazido abaixo de um valor de limiar predeterminado ou minimizado;em que um sinal de áudio de entrada é pré- processado para obter um sinal de áudio reduzido por estrutura FORMANT;em que o parâmetro de domínio de transformação real é obtido com base no sinal de áudio reduzido por estrutura FORMANT;em que os parâmetros de um modelo de previsão linear do sinal de áudio de entrada são estimados com base em uma versão filtrada com alta frequência do sinal de áudio de entrada;em que uma versão em banda larga do sinal de áudio de entrada é filtrada com base nos parâmetros estimados do modelo de previsão linear,para obter o sinal de áudio reduzido por estrutura FORMANT, de maneira que o sinal de áudio reduzido por estrutura FORMANT compreenda uma característica de baixa frequência.

23. Codificador de áudio distorcido por tempo para a codificação distorcida por tempo de um sinal de áudio de entrada, caracterizado por o codificador de áudio distorcido por tempo compreender:um aparelho (100) para obter um parâmetro que descreve uma variação temporal de uma característica de sinal de um sinal de áudio, de acordo com uma das reivindicações de 1 a 15 ou reivindicação 17 ou reivindicação 19 ou reivindicação 21,em que o aparelho para obter um parâmetro é configurado para obter um parâmetro de variação de ângulo que descreve uma variação de ângulo temporal dos sinais de áudio de entrada; eum processador de sinal de áudio distorcido por tempo configurado para realizar uma amostragem de sinal de áudio distorcido por tempo do sinal de áudio de entrada utilizando o parâmetro de variação de ângulo para um ajuste da distorção por tempo.