[go: up one dir, main page]

BRPI0715206A2 - sistemas e mÉtodos para modificar uma janela com um quadro associado a um sinal de Áudio - Google Patents

sistemas e mÉtodos para modificar uma janela com um quadro associado a um sinal de Áudio Download PDF

Info

Publication number
BRPI0715206A2
BRPI0715206A2 BRPI0715206-0A BRPI0715206A BRPI0715206A2 BR PI0715206 A2 BRPI0715206 A2 BR PI0715206A2 BR PI0715206 A BRPI0715206 A BR PI0715206A BR PI0715206 A2 BRPI0715206 A2 BR PI0715206A2
Authority
BR
Brazil
Prior art keywords
frame
signal
mdct
region
zero fill
Prior art date
Application number
BRPI0715206-0A
Other languages
English (en)
Inventor
Venkatesh Krishnan
Ananthapadmanabhan A Kandhadai
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of BRPI0715206A2 publication Critical patent/BRPI0715206A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

SISTEMAS E MÉTODOS PARA MODIFICAR UMA JANELA COM UM QUADRO ASSOCIADO A UM SINAL DE ÁUDIO. É descrito um método para modificar uma janela com um quadro associado a um sinal de áudio. Um sinal é recebido. O sinal é particionado em uma pluralidade de quadros. É determinado se um quadro dentro da pluralidade de quadros está associado a um sinal sem fala. Uma função de janela de transformação discreta de co-seno modificada (MDCT) é aplicada ao quadro de modo a gerar uma primeira região de enchimento zero e uma segunda região de enchimento zero se tiver determinado que o quadro esta associado a um sinal sem fala. O quadro é codificado. A janela do decodificador é a mesma janela do codificador.

Description

"SISTEMAS E MÉTODOS PARA MODIFICAR UMA JANELA COM UM QUADRO ASSOCIADO A UM SINAL DE ÁUDIO"
REIVINDICAÇÃO DE PRIORIDADE DE ACORDO COM 35 U.S.C. § 119
0 presente pedido de patente reivindica prioridade para o pedido provisório No. 60/834 674, intitulado "Formação de Janelas para Reconstrução Perfeita em MDCT com Menos de 50% de Sobreposição de Quadros", depositado a 31 de julho de 2006 e cedido ao cessionário deste e por este expressamente aqui incorporado à guisa de referência.
CAMPO TÉCNICO
Os presentes sistemas e métodos referem-se de maneira geral à tecnologia de processamento da fala. Mais especificamente, os presentes sistemas e métodos referem-se à modificação de uma janela com um quadro associado a um sinal de áudio.
FUNDAMENTOS
A transmissão de voz por técnicas digitais tornou-se disseminada, sobretudo em rádio-aplicativos telefônicos digitais de longa distância, troca de mensagens de video com utilização de computadores, etc. Isto, por sua vez, tem criado interesse na determinação da menor quantidade de informações que pode ser enviada através de um canal com a manutenção simultânea da qualidade percebida da fala reconstruída. Dispositivos para compactar fala encontram uso em muitos campos das telecomunicações. Um exemplo de telecomunicação é o das comunicações sem fio. Outro exemplo é o das comunicações através de uma rede de computadores, tal como a Internet. O campo das comunicações tem muitas aplicações, que incluem, por exemplo, computadores, laptops, assistentes digitais pessoais (PDAs), telefones sem fio, pagers, loops locais sem fio, telefonia sem fio, como, por exemplo, sistema de comunicação celular e portátil (PCS), sistemas telefônicos, telefonia móvel de Protocolo Internet (IP) e sistemas de comunicação por satélite.
BREVE DESCRIÇÃO DOS DESENHOS
A Figura 1 mostra uma configuração de um sistema de comunicação sem fio.
A Figura 2 é um diagrama de blocos que mostra uma configuração de um ambiente de computação.
A Figura 3 é um diagrama de blocos que mostra uma configuração de um ambiente de transmissão de sinais.
A Figura 4A é um diagrama de fluxos que mostra uma configuração de um método para modificar uma janela com um quadro associado a um sinal de áudio;
A Figura 4B é um diagrama de blocos que mostra uma configuração de um codificador para modificar a janela com o quadro associado ao sinal de áudio e um decodificador;
A Figura 5 é um diagrama de fluxos que mostra uma configuração de um método para reconstruir um quadro codificado de um sinal de áudio;
A Figura 6 é um diagrama de blocos que mostra uma configuração de um codificador multimodal que se comunica com um decodificador multimodal;
A Figura 7 é um diagrama de fluxos que mostra um exemplo de um método de codificação de sinais de áudio;
A Figura 8 é um diagrama de blocos que mostra uma configuração de uma pluralidade de quadros depois de uma função de janela ter sido aplicada a cada quadro;
A Figura 9 é um diagrama de fluxos que mostra uma configuração de um método para aplicar uma função de janela a um quadro associado a um sinal sem fala; A Figura 10 é um diagrama de fluxos que mostra uma configuração de um método para reconstruir um quadro que foi modificado pela função de janela; e
A Figura 11 é um diagrama de blocos de determinados componentes em uma configuração de um dispositivo de comunicação/computação.
DESCRIÇÃO DETALHADA É descrito um método para modificar uma janela com um quadro associado a um sinal de áudio. Um sinal é recebido. 0 sinal é particionado em uma pluralidade de quadros. É determinado se um quadre dentro da pluralidade de quadros está associado a um sinal sem fala. Uma função de janela de transformação discreta de co-seno modificada (MDCT) é aplicada ao quadro de modo a gerar uma primeira região de enchimento zero e uma segunda região de enchimento zero se tiver sido determinado que o quadro está associado a um sinal sem fio. O quadro é codificado.
É adicionalmente descrito um equipamento para modificar uma janela com um quadro associado a um sinal de áudio. O equipamento inclui um processador e uma memória em comunicação eletrônica com o processador. Instruções são armazenadas na memória. As instruções são executáveis para: receber um sinal; particionar o sinal em uma pluralidade de quadros; determinar se um quadro dentro da pluralidade de quadros está associado a um sinal sem fala; aplicar uma função de janela de transformação discreta de co-seno modificada (MDCT) ao quadro de modo a gerar uma primeira região de enchimento zero e uma segunda região de enchimento zero se tiver sido determinado que o quadro está associado a um sinal sem fala; e codificar o quadro.
É adicionalmente descrito Um sistema que é configurado para modificar ma janela com um quadro associado a um sinal de áudio. O sistema inclui um dispositivo para processar e um sistema para receber um sinal. 0 sistema inclui adicionalmente um dispositivo para particionar o sinal em uma pluralidade de quadros e um dispositivo para determinar se um quadro dentro da pluralidade de quadros está associado a um sinal sem fala. 0 sistema inclui adicionalmente um dispositivo para aplicar uma função de janela de transformação discreta de co-seno modificada (MDCT) ao quadro de modo a gerar uma primeira região de enchimento zero e uma segunda região de enchimento zero se tiver sido determinado que o quadro está associado a um sinal sem fala e um dispositivo para codificar o quadro.
É adicionalmente descrito um meio legivel por computador configurado para armazenar um conjunto de informações. As instruções são executáveis para: receber um sinal; particionar o sinal em uma pluralidade de quadros; determinar se um quadro dentro da pluralidade de quadros está associado a um sinal sem fala; aplicar uma função de janela de transformação discreta de co-seno modificada (MDCT) ao quadro de modo a gerar uma primeira região de enchimento zero e uma segunda região de enchimento zero se tiver sido determinado que o quadro está associado a um sinal sem fala; e codificar o quadro.
É adicionalmente descrito um método para selecionar uma função de janela a ser utilizada no cálculo de uma transformação discreta de co-seno modificada (MDCT) de um quadro, É apresentado um algoritmo para selecionar uma função de janela a ser utilizada no cálculo de uma MDCT de um quadro. A função de janela selecionada é aplicada ao quadro. O quadro é codificado com um modo de codificação MDCT com base em restrições impostas ao modo de codificação MDCT por modos de codificação adicionais, em que as restrições compreendem o comprimento do quadro, o comprimento à frente e um retardo.
É adicionalmente descrito um método para reconstruir um quadro codificado de um sinal de áudio. Um pacote é recebido. 0 pacote é demonstrado de modo a se recuperar um quadro codificado. As amostras do quadro que são localizadas entre a primeira região de enchimento zero e uma primeira região são sintetizadas. Uma região de sobreposição de um primeiro comprimento é adicionada com o comprimento à frente de um quadro anterior. Um avanço do primeiro comprimento do quadro é armazenado. Um quadro reconstruído é transmitido.
Diversas configurações dos sistemas e métodos são agora descritas com referência às figuras, nas quais os mesmos números de referência indicam elementos idênticos ou funcionalmente semelhantes. Os aspectos dos presentes sistemas e métodos, geralmente descritos e mostrados nas presentes figuras, podem ser dispostos e projetados em uma ampla variedade de configurações diferentes. Assim, a descrição detalhada seguinte não pretende limitar o alcance dos sistemas e métodos reivindicados, mas representa meramente as configurações dos sistemas e métodos.
Muitos aspectos das configurações aqui reveladas podem ser implementados como software de computador, hardware eletrônico ou combinações de ambos. Para ilustrar claramente esta intercambialidade de hardware e software, diversos componentes serão descritos geralmente em termos de sua funcionalidade. Se tal funcionalidade é implementada como hardware ou software depende da aplicação específica e das restrições de desenho impostas ao sistema como um todo. Os versados na técnica podem implementar a funcionalidade descrita de maneiras variadas para cada aplicação específica, mas tais decisões de implementação não devem ser interpretadas como provocando um afastamento do alcance dos presentes sistemas e métodos.
No caso de a funcionalidade descrita ser implementada como software de computador, tal software pode incluir qualquer tipo de instrução de computador ou código executável por computador localizado dentro de um dispositivo de memória e/ou transmitido sob a forma de sinais eletrônicos através de um barramento de sistema ou rede. O software que implementa a funcionalidade associada aos componentes aqui descritos pode compreender uma única instrução, ou muitas instruções, e pode ser distribuído através de vários segmentos de código diferentes entre diferentes programas, e através de vários dispositivos de memória.
Conforme aqui utilizados, os termos "uma configuração", "configuração", "configurações", "a configuração", "as configurações", "uma ou mais configurações", "algumas configurações", "determinadas configurações", "uma configuração", "outra configuração" e semelhantes significam "uma ou mais (mas não necessariamente todas) configurações dos sistemas e métodos revelados", a menos que expressamente especificado de outro modo.
O termo "determinar" (e suas variantes gramaticais) é utilizado em um sentido extremamente amplo. O termo "determinar" abrange uma ampla variedade de ações e, portanto, "determinar" pode incluir calcular, computar, processar, derivar, investigar, procurar (como, por exemplo, procurar em uma tabela, um banco de dados ou outra estrutura de dados), verificar e semelhantes. Além disto, "determinar" pode incluir receber (receber informações, por exemplo), acessar (acessar dados em uma memória, por exemplo) e semelhantes. Além disto, "determinar" pode incluir resolver, selecionar, escolher, estabelecer e semelhantes.
A expressão "com base (com base(a)) em" não significa "com base (com base (a)) apenas em", a menos que expressamente especificado de outro modo. Em outras palavras, a expressão "com base (com base(a)) em" descreve tanto "com base (com base (a)) apenas em" quanto "com base (com base(a)) pelo menos em". Em geral, a expressão "sinal de áudio" pode ser utilizada para referir-se a um sinal que pode ser ouvido. Exemplos de sinal de áudio podem incluir a representação da fala humana, música instrumental e vocal, sons tonais, etc.
A Figura 1 mostra um sistema telefônico sem fio de acesso múltiplo por divisão de código (CDMA) 100, que pode incluir uma pluralidade de estações móveis 102, uma pluralidade de estações base 104, um controlador de estação base (BSC) 106 e um centro de comutação móvel (MSC) 108. O MSC 108 pode ser configurado para formar interface com uma rede telefônica pública comutada (PSTN) 110. O MSC 108 pode ser adicionalmente configurado para formar interface com o BSC 106. Pode haver mais de um BSC 106 no sistema 100. Cada estação base 104 pode incluir pelo menos um setor (não mostrado) , em que cada setor pode ter uma antena onidirecional ou uma antena apontada em uma direção especifica afastada em sentido radial das estações base 104. Alternativamente, cada setor pode incluir duas antenas para recepção de diversidade. Cada estação base 104 pode ser projetada para suportar uma pluralidade de atribuições de freqüência. A interseção de um setor e uma atribuição de freqüência pode ser referida como canal CDMA. As estações móveis 102 podem incluir telefones de sistema de comunicação celular ou portátil (PCS). Durante o funcionamento do sistema telefônico celular 100, as estações base 104 podem receber conjuntos de sinais de link reverso de conjuntos de estações móveis 102. As estações móveis 102 podem estar realizando chamadas telefônicas ou outras comunicações. Cada sinal de link reverso recebido por uma dada estação base 104 pode ser processado dentro da dessa estação base 104. Os dados resultantes podem ser emitidos para o BSC 106. O BSC 106 pode proporcionar alocação de recursos de chamada e funcionalidade de gerenciamento de mobilidade que incluem a orquestração de soft handoffs entre as estações base 104. 0 BSC 106 pode adicionalmente rotear os dados recebidos para o MSC 108, que provê serviços de roteamento adicionais para interface com a PSTN 110. De maneira semelhante, a PSTN 110 pode formar interface com o MSC 108, e o MSC 108 pode formar interface com o BSC 106, que por sua vez pode controlar as estações base 104 de modo a emitir conjuntos de sinais de link direto para conjuntos de estações móveis 102.
A Figura 2 mostra uma configuração de um ambiente de computação 200, que inclui um dispositivo de computação de origem 202, um dispositivo de computação receptor 204 e um dispositivo de computação móvel receptor 206. O dispositivo de computação de origem 202 pode comunicar-se com os dispositivos de computação receptores 204, 206 através de uma rede 210. A rede 210 pode ser um tipo de rede de computação que inclui, mas não se limita a, a Internet, uma rede de área local (LAN) , uma rede de área de campus (CAN) , uma rede de área metropolitana (MAN) , uma rede de área estendida (WAN) , uma rede em anel, uma rede em estrela, uma rede token ring, etc.
Em uma configuração, o dispositivo de computação de origem 202 pode codificar e emitir sinais de áudio 212 para os dispositivos de computação receptores 204, 206 através da rede 210. Os sinais de áudio 212 podem incluir sinais de fala, sinais de música, tons, sinais de ruido de fundo, etc. Conforme aqui utilizados, "sinais de fala" podem referir-se a sinais gerados por um sistema de fala humana, e "sinais sem fala" podem referir-se a sinais não gerados pelo sistema de fala humana (isto é, música, ruido de fundo, etc.) 0 dispositivo de computação de origem 202 pode ser um telefone móvel, um assistente digital pessoal (PDA), um computador laptop, um computador pessoal ou qualquer outro dispositivo de computação com um processador. O dispositivo de computação receptor 204 pode ser um computador pessoal, um telefone, etc. O dispositivo de computação móvel receptor 206 pode ser um telefone móvel, um PDA, um computador laptop ou qualquer outro dispositivo de computação móvel com um processador.
A Figura 3 mostra um ambiente de transmissão de sinais 300, que inclui um codificador 302, um decodificador 304 e um meio de transmissão. 0 codificador 302 pode ser implementado dentro de uma estação móvel 102 ou em um dispositivo de computação de origem 202. 0 decodificador 304 pode ser implementado em uma estação base 104, na estação móvel 102, em um dispositivo de computação receptor 204 ou em um dispositivo de computação móvel receptor 206. O codificador 302 pode codificar um sinal de áudio s (n) 310, formando um sinal de áudio codificado senc(n) 312. O sinal de áudio codificado 312 pode ser transmitido, através do meio de transmissão 306, ao decodificador 304. O meio de transmissão 306 pode facilitar a transmissão, pelo codificador 302, do sinal codificado 312 através de uma conexão cabeada entre o codificador 302 e o decodificador 304. O decodificador 304 pode decodificar o senc(n) 312,
s(n) 316.
gerando assim um sinal de áudio sintetizado
O termo "codificação" conforme aqui utilizado pode referir-se de maneira geral a métodos que abrangem tanto a codificação quanto a decodificação. Geralmente, os sistemas, métodos e equipamentos de codificação procuram reduzir ao minimo o número de bits transmitidos por meio do meio de transmissão 306 (isto é, reduzir ao minimo a largura de banda do senc(n) 312) mantendo ao mesmo tempo uma reprodução de sinais aceitável (isto é, s (n) 310 »
A/ \ ^ j ^
' ) . A composição do sinal de áudio codificado 312 pode variar de acordo com o modo de codificação de áudio especifica utilizado pelo codificador 302. Diversos modos de codificação são descritos a seguir. Os componentes do codificador 302 e do
decodificador 304 descritos a seguir podem ser implementados como hardware eletrônico, como software de computador ou combinações de ambos. Estes componentes são descritos a seguir em termos de sua funcionalidade. Se a funcionalidade é implementada como hardware ou software pode depender da aplicação especifica e das restrições de desenho impostas ao sistema como um todo. O meio de transmissão 306 pode representar muitos meios de transmissão diferentes, que incluem, mas não se limitam a, uma linha de comunicação baseada na terra, um link entre uma estação base e um satélite, uma comunicação sem fio entre um telefone celular e uma estação base, entre um telefone celular e um satélite ou comunicações entre dispositivos de computação. Cada parte de uma comunicação pode emitir dados
assim como receber dados. Cada parte pode utilizar um codificador 302 e um decodificador 304. Entretanto, o ambiente de transmissão de sinais 300 será descrito a seguir como incluindo o codificador 302 em uma extremidade do meio de transmissão 306 e o decodificador 304 na outra.
Em uma configuração o s (n) 310 pode incluir um
sinal de fala digital obtido durante uma conversa típica que inclui diferentes sons vocais e períodos de silêncio. O sinal de fala s(n) 310 pode ser particionado em quadros, e cada quadro pode ser adicionalmente particionado em sub- quadros. Estas fronteiras de quadros/sub-quadros escolhidas arbitrariamente podem ser utilizadas no caso de algum processamento de blocos ser executado. Operações descritas como sendo executadas em quadros podem ser adicionalmente executadas em sub-quadros, neste sentido; quadro e sub- quadro são aqui utilizados intercambiavelmente. Além disto, um ou mais quadros podem ser incluídos em uma janela que pode exemplificar a colocação e a temporização entre diversos quadros.
Em outra configuração, o s(n) 310 pode incluir um sinal sem fala, tal como um sinal de música. 0 sinal sem fala pode ser particionado em quadros. Um ou mais quadros podem ser incluídos em uma janela que pode exemplificar a colocação e a temporização entre diversos quadros. A seleção da janela pode depender das técnicas de codificação implementadas para codificar o sinal e das restrições de retardo que podem ser impostas ao sistema. Os presentes sistemas e métodos descrevem um método para selecionar uma conformação de janela utilizada na codificação e decodif icação de sinais sem fala com uma técnica de codificação baseada em transformação discreta de co-seno modificada (MDCT) e em transformação discreta de co-seno modificada inversa (IMDCT) em um sistema que é capaz de codificar sinais tanto de fala quanto sem fala. O sistema pode impor restrições à quantidade de retardo e avanço de quadro que pode ser utilizada pelo codificador com base em MDCT para permitir a geração de informações codificadas a uma taxa uniforme.
Em uma configuração, o codificador 302 um módulo
de formatação de janela 308, que pode formatar a janela, que inclui quadros associados a sinais sem fala. Os quadros incluídos na janela formatada podem ser codificados, e o decodificador pode reconstruir os quadros codificados pela implementação de um módulo de reconstrução de quadros 314. 0 módulo de reconstrução de quadros 314 pede sintetizar os quadros codificados de modo que os quadros se assemelhem aos quadros pré-codifiçados do sinal de fala 310.
A Figura 4 é um diagrama de fluxos que mostra uma configuração de um método 400 para modificar uma janela com um quadro associado a um sinal de áudio. O método 400 pode ser implementado pelo codificador 302. Em uma configuração, um sinal é recebido 402. 0 sinal pode ser um sinal de áudio, conforme descrito anteriormente. 0 sinal pode ser particionado 404 em uma pluralidade de quadros. Uma função de janela pode ser aplicada 408 de modo a gerar uma janela, e uma primeira região de enchimento zero e uma segunda região de enchimento zero podem ser geradas como uma parte da janela para calcular uma transformação discreta de co- seno modificada (MDCT) . Em outras palavras, o valor das partes inicial e final da janela pode ser zero. Sob um aspecto, o comprimento da primeira região de enchimento zero e o comprimento da segunda região de enchimento zero podem ser uma função das restrições de retardo do codificador 302.
A função de transformação discreta de co-seno modificada (MDCT) pode ser utilizada em vários padrões de codificação de áudio para transformar amostras de sinal de modulação de código de pulso (PCM), ou suas versões processadas, na sua representação no domínio da freqüência equivalente. A MDCT pode ser semelhante a uma Transformada de Co-seno Discreta (DCT) do tipo IV, com a propriedade adicional de quadros que sobrepõem uns aos outros. Em outras palavras, os quadros consecutivos de um sinal que são transformados pela MDCT podem sobrepor-se uns aos outros em 50%.
Além disso, para cada quadro de 2M amostras, a MDCT pode produzir M coeficientes de transformada. A MDCT pode ser um banco de filtros de reconstrução perfeita criticamente amostrada. De modo a se obter uma reconstrução perfeita, os coeficientes de MDCT X(k), para k = 0, 1,...M, obtido de um quadro de sinal x(n), para n=0,l,...2M, podem ser dados por
2M-\ n=0
onde
2
K (n) = wOOj-COS
V M
'(2/i + A/ + lX2* + lV
4 M
:2)
para k. = 0, 1,...,M, e w(n) é uma janela que pode satisfazer a condição de Princen-Bradley, que afirma: yv2(n) + w2(n + Μ) = 1
No decodificador, os M coeficientes codificados podem ser transformados de volta no domínio do tempo utilizando-se uma MDCT inversa (IMDCT) . Se para k = 0,12...M forem os coeficientes de MDCT recebidos, então o decodificador de IMDCT correspondente gera o sinal de áudio reconstruído primeiro tomando-se a IMDCT dos coeficientes recebidos de modo a se obterem 2M amostras de acordo com onde hk(n) é definido pela equação (2), em seguida sobrepondo-se a adicionando-se as primeiras M amostras do quadro atual às últimas M amostras da saida da IMDCT do quadro e às primeiras M amostras da saida da IMDCT do quadro seguinte. Assim, se os coeficientes de MDCT decodificados correspondentes ao quadro seguinte não estiverem disponíveis em um dado momento, apenas M amostras de áudio do quadro atual podem ser reconstruídas de maneira completa.
0 sistema de MDCT pode utilizar um avanço de M amostras. 0 sistema de MDCT pode incluir um codificador, que obtém a MDCT ou do sinal de áudio ou de versões filtradas dele utilizando uma janela predeterminada, e um decodificador, que inclui uma função de IMDCT que utiliza a mesma janela que o codificador utiliza. 0 sistema de MDCT pode incluir adicionalmente um módulo de sobreposição e adição. Por exemplo, a Figura 4B mostra um codificador de MDCT 401. Um sinal de áudio de entrada 403 é recebido por um pré-processador 405. O processador 405 implementa pré- processamento, filtragem de codificação preditiva linear (LPC) e outros tipos de filtragem. Um sinal de áudio processado 407 é produzido do pré-processador 405. Uma função de MDCT 409 é aplicada em 2M amostras de sinal que foram apropriadamente colocadas em janela. Em uma configuração, um quantizador 411, que quantifica e codifica M coeficientes 413 e os M coeficientes codificados são transmitidos a um decodificador de MDCT 429.
0 decodificador 429 recebe M coeficientes codificados 413. Uma IMDCT 415 é aplicada nos M coeficientes recebidos 413 utilizando-se a mesma janela utilizada no codificador 401. 2M valores de sinal 417 pode ser classificados como a seleção das primeiras M amostras, e as últimas M amostras 419 podem ser economizadas. As primeiras M amostras 423 e as últimas M amostras retardadas 419 podem ser somadas por um somador 425. As amostras somadas podem ser utilizadas para produzir M amostras reconstruídas 427 do sinal de áudio.
Tipicamente, em sistemas MDCT, 2M sinais podem ser derivados de M amostras de um quadro atual e M amostras de um quadro futuro. Entretanto, se apenas L amostras do quadro futuro estiverem disponíveis, pode ser selecionado uma janela que implementa L amostras do quadro futuro.
Em um sistema de comunicação de voz em tempo real que funciona através de uma rede comutada por circuito, o comprimento das amostras de previsão pode ser limitado pelo retardo de codificação permissível máximo. Pode-se supor que um comprimento de avanço de L está disponível. L pode ser menor que ou igual a M. Nesta condição, ainda pode ser desejável utilizar a MDCT, com a sobreposição entre quadros consecutivos que são L mostras, preservando-se ao mesmo tempo a propriedade de reconstrução perfeita.
Os presentes sistemas e métodos podem ser relevantes sobretudo para sistemas de comunicação bidirecionais em tempo real nos quais se espera que um codificador gere informações para transmissão a um intervalo regular, independentemente da escolha do modo de codificação. 0 sistema pode não ser capaz de tolerar flutuação de fase na geração de tais informações pelo codificador, ou tal flutuação de fase na geração de tais informações pode não ser desejada.
Em uma configuração, uma função de transformação discreta de co-seno modificada (MDCT) é aplicada 410 ao quadro. A aplicação da função de janela pode ser uma etapa no cálculo de uma MDCT do quadro. Em uma configuração, a função de MDCT processa 2M amostras de entrada de modo a gerar M coeficientes que podem ser em seguida quantificados e transmitidos.
Em uma configuração, o quadro pode ser codificado 412. Sob um aspecto, os coeficientes do quadro podem ser codificados 412. 0 quadro pode ser codificado utilizando-se diversos modos de codificação, que serão discutidos mais completamente a seguir. 0 quadro pode ser formatado 414 em um pacote, e o pacote pode ser transmitido 416. Em uma configuração, o pacote é transmitido 416 a um decodificador.
A Figura 5 é um diagrama de fluxos que mostra uma configuração de um método 500 para reconstruir um quadro codificado de um sinal de áudio. Em uma configuração, o método 500 pode ser implementado pelo decodif icador 304. Um pacote pode ser recebido 502. O pacote pode ser recebido 502 do codificador 302. 0 pacote pode ser desmontado 504 de modo a se recuperar um quadro. Em uma configuração, o quadro pode ser decodificado 506. O quadro pode ser reconstruído 508. Em um exemplo, o módulo de reconstrução de quadros 314 reconstrói o quadro de modo a remontar o quadro pré-codifiçado do sinal de áudio. O quadro reconstruído pode ser transmitido 510. O quadro transmitido pode ser combinado com quadros transmitidos adicionais de modo a se reproduzir o sinal de áudio. A Figura 6 é um diagrama de blocos que mostra uma
configuração de um codificador multimodal 602 que se comunica com um decodificador multimodal 604 através de um canal de comunicação 606. Um sistema que inclui o codificador multimodal 602 e o decodificador multimodal 604 pode ser um sistema de codificação que inclui vários esquemas de codificação diferentes para codificar diferentes tipos de sinal de áudio. 0 canal de comunicação 606 pode incluir uma interface de radiofreqüência (RF) . O codificador 602 pode incluir um decodificador afim (não mostrado). 0 codificador 602 e seu decodificador afim podem formar um primeiro codificador. O decodificador 604 pode incluir um codificador afim (não mostrado). O decodificador 604 e seu codificador afim podem formar um segundo codificador.
0 codificador 602 pode incluir um módulo de cálculo de parâmetros 618, um módulo de classificação de modos 622, uma pluralidade de modos de codificação 624, 626, 628 e um módulo de formatação de pacotes 630. O número de modos de codificação 624, 626, 628 é mostrado como N, que pode significar qualquer número de modos de codificação 624, 626, 628. Para simplificar, são mostrados três modos de codificação 624, 626, 628, com uma linha pontilhada indicando a existência de outros modos de codificação.
O decodificador 604 pode incluir um módulo de desmontador de pacotes 632, uma pluralidade de modos de decodificação 634, 636, 638, um módulo de reconstrução de quadros 640 e um pós-filtro 642. O número de modos de decodif icação 634, 636, 638. Para simplificar, são mostrados três modos de decodificação 634, 636, 638, com a linha pontilhada indicando a existência de outros modos de decodificação.
Um sinal de áudio, s(n) 610, pode ser enviado ao módulo de cálculo de parâmetros iniciais 618 e ao módulo de classificação de modos 622. O sinal 610 pode ser dividido em blocos de amostras, referidas como quadros. O valor η pode designar o número de quadro, ou o valor η pode designar um número de amostra em um quadro. Em uma configuração alternativa, um sinal de erro residual de predição linear (LP) pode ser utilizado no lugar do sinal de áudio 610. O sinal de erro residual LP pode ser utilizado por codificadores de fala, como, por exemplo, um codificador de predição linear excitado por código (CELP).
0 módulo de cálculo de parâmetros iniciais 618 pode derivar diversos parâmetros com base no quadro atual. Sob um aspecto, estes parâmetros incluem pelo menos um dos seguintes: coeficientes de filtro de codificação preditiva linear (LPC), coeficientes de par espectral de linha (LSP), funções de auto-correlação normalizadas (NACFs), retardamento de malha aberta, taxas de cruzamento zero, energias de banda e o sinal residual formando. Sob outro aspecto, o módulo de cálculo de parâmetros iniciais 618 pode pré-processar o sinal 610 filtrando o sinal 610, calculando a altura do som, etc.
O módulo de cálculo de parâmetros iniciais 618 pode ser acoplado ao módulo de classificação de modos 622. O módulo de classificação de modos 622 pode comutar dinamicamente entre os modos de codificação 624, 626, 628. O módulo de cálculo de parâmetros iniciais 618 pode fornecer parâmetros ao módulo de classificação de modos 622 referentes ao quadro atual. O módulo de classificação de modos 622 pode ser acoplado de modo a comutar dinamicamente entre os modos de codificação 624, 626, 628 em uma base de quadro por quadro de modo a se selecionar um modo de codificação 624, 626, 628 adequado para o quadro atual. O módulo de classificação de modos 622 pode selecionar um modo de codificação 624, 626, 628 especifico para o quadro atual pela comparação dos parâmetros com limite pré- definido e/ou valores de teto. Por exemplo, um quadro associado a um sinal sem fala pode ser codificado utilizando-se esquemas de codificação MDCT. Um esquema de codificação MDCT pode receber um quadro e aplicar um formato de janela de MDCT ao quadro. Um exemplo do formato de janela de MDCT especifico é descrito a seguir em relação à Figura 8.
0 módulo de classificação de modos 622 pode classificar um quadro de fala como fala ou fala inativa (como, por exemplo, silêncio, ruido de fundo ou pausas entre as palavras). Com base na periodicidade do quadro, o módulo de classificação de modos 622 pode classificar quadros de fala como um tipo especifico de fala, como, por exemplo, vocalizada, não vocalizada ou transitória.
A fala vocalizada pode incluir uma fala que apresenta um grau relativamente alto de periodicidade. Um período de diapasão pode ser um componente de um quadro de fala que pode ser utilizado para analisar e reconstruir o conteúdo do quadro. A fala não vocalizada pode incluir sons consonantais. Quadros de fala transitória podem incluir transições entre fala vocalizada e fala não vocalizada. Quadros que são classificados como fala nem vocalizada ou não vocalizada podem ser classificados como fala transitória.
A classificação dos quadros ou como fala ou como não fala pode permitir a utilização de diferentes modos de codificação 624, 626. 628 para codificar diferentes tipos de quadros, do que resulta um uso mais eficaz da largura de banda em um canal compartilhado, tal como o canal de comunicação 606.
O módulo de classificação de modos 622 pode selecionar um modo de codificação 624, 626, 628 para o quadro atual com base na classificação do quadro. Os diversos modos de codificação 624, 626, 628 podem ser acoplados em paralelo. Um ou mais dos modos de codificação 624, 626, 628 podem ser operacionais em qualquer dado momento. Em uma configuração, um modo de codificação 624, 626, 628 é selecionado de acordo com a classificação do quadro atual.
Os diferentes modos de codificação 624, 626, 628 podem funcionar de acordo com diferentes taxas de bits de codificação, diferentes esquemas de codificação ou diferentes combinações de taxa de bits de codificação e esquema de codificação. Os diferentes modos de codificação 624, 626, 628 podem adicionalmente aplicar uma função de janela diferente a um quadro. As diversas taxas de codificação utilizadas podem ser taxa total, meia taxa, um quarto de taxa e/ou um oitavo de taxa. Os diversos modos de codificação 624, 626, 628 utilizados podem ser codificação MDCT, codificação por predição linear excitada por código (CELP), codificação por períodos de diapasão de protótipo (PPP) (ou codificação por interpolação de formas de onda (WI) e/ou codificação por predição linear excitada por ruído (NELP) . Assim, por exemplo, um código de codificação específico 624, 626, 628 pode ser o esquema de codificação MDCT, outro modo de codificação pode ser a CELP de taxa total, outro modo de codificação 626, 628 pode ser a CELP de meia taxa, outro modo de codificação 624, 626, 628 pode ser a PPP de taxa total e outro modo de codificação 624, 626, 628 pode ser a NELP.
De acordo com um esquema de codificação MDCT que utiliza uma janela tradicional para codificar, emitir, receber e reconstruir no decodificador M amostras de um sinal de áudio, o esquema de codificação MDCT utiliza 2M amostras do sinal de entrada no codificador. Em outras palavras, além das M amostras do presente quadro do sinal de áudio, o codificador pode aguardar M amostras adicionais a serem coletadas antes que a codificação possa começar. Em um sistema de codificação multimodal, no qual o esquema de codificação MDCT co-existe com outros modos de codificação, como, por exemplo, a CELP, a utilização dos formatos de janela tradicionais para o cálculo de MDCT pode afetar o tamanho total do quadro e os comprimentos de avanço do sistema de codificação inteiro. Os presentes sistemas e métodos proporcionam o desenho e a seleção de formatos de janela para cálculos de MDCT para qualquer tamanho de quadro e comprimento de avanço, de modo que o esquema de codificação MDCT não apresenta restrições ao sistema de codificação multimodal.
De acordo com um modo de codificação CELP, um modelo de trato vocal preditivo linear pode ser excitado com uma versão quantificada do sinal residual LP. No modo de codificação CELP, o quadro atual pode ser quantificado. O modo de codificação CELP pode ser utilizado para codificar quadros classificados como fala transitória.
De acordo com um modo de codificação NELP, um sinal de ruido pseudo-aleatório filtrado pode ser utilizado para modelar o sinal residual LP. O modo de codificação NELP pode ser uma técnica relativamente simples que obtém uma taxa de bits baixa. O modo de codificação NELP pode ser utilizado para codificar quadros classificados como fala não vocalizada.
De acordo com um modo de codificação PPP, pode ser codificado um subconjunto dos períodos de diapasão dentro de cada quadro. Os períodos restantes do sinal de fala podem ser reconstruídos interpolando-se entre estes períodos de protótipo. Em uma implementação no domínio do tempo da codificação PPP, pode ser calculado um primeiro conjunto de parâmetros que descreve como modificar o período de protótipo anterior para aproximar-se do período de protótipo atual. Podem ser selecionados um ou mais vetores de código que, quando somados, se aproximam da diferença entre o período de protótipo atual e o período de protótipo anterior modificado. Um segundo conjunto de parâmetros descreve estes vetores de código selecionados. Em uma implementadas no domínio da freqüência da codificação PPP, um conjunto de parâmetros pode ser calculado para descrever os espectros de amplitude e fase do protótipo. De acordo com a implementação da codificação PPP, o decodificador 604 pode sintetizar um sinal de áudio de saída 616 reconstruindo um protótipo atual com base nos conjuntos de parâmetros que descrevem a amplitude e a fase. O sinal de fala pode ser interpolado através da região entre o período de protótipo reconstruído atual e um período de protótipo reconstruído anterior. O protótipo pode incluir uma parte do quadro atual que será interpolado de maneira linear com o protótipo de quadros anteriores que foram igualmente posicionados dentro do quadro de modo a se reconstruir o sinal de áudio 610 ou o sinal residual LP no decodificador 604 (isto é, um período de protótipo passado é utilizado como um preditor do período de protótipo atual).
A codificação do período de protótipo em vez do quadro inteiro pode reduzir a taxa de bits de codificação. Quadros classificados como fala vocalizada podem ser codificados com um modo de codificação PPP. Pela exploração da periodicidade da fala vocalizada, o modo de codificação PPP pode obter uma taxa de bits mais baixa que o modo de codificação CELP.
O modo de codificação selecionado 624, 626, 628 pode ser acoplado ao módulo de formatação de pacotes 630. O modo de codificação selecionado 624, 625, 628 pode codificar, ou quantificar, o quadro atual e fornecer os parâmetros de quadro quantificados 612 ao módulo de formatação de pacotes 630. Em uma configuração, os parâmetros de quadro quantificados são os coeficientes codificados produzidos a partir do esquema de codificação MDCT. 0 módulo de formatação de pacotes 630 pode montar os parâmetros de quadro quantificados 612 em forma de um pacote formatado 613. O módulo de formatação de pacotes 630 pode enviar o pacote formatado 613 a um receptor (não mostrado) através de um canal de comunicação 606. O receptor pode receber, demodular, e digitalizar o pacote formatado 613 e enviar o pacote 613 ao decodificador 604.
No decodificador 604, o módulo desmontador de pacotes 632 pode receber o pacote 613 do receptor. O módulo desmontador de pacotes 632 pode desempacotar o pacote 613 de modo a recuperar o quadro codificado. 0 módulo desmontador de pacotes 632 pode ser adicionalmente configurado para comutar dinamicamente entre os modos de decodif icação 634, 636, 638 em uma base de pacote por pacote. 0 número de modos de decodificação 634, 636, 638 pode ser o mesmo que o número dos modos de codificação 624, 626, 628. Cada modo de codificação numerado 624, 626, 628 pode ser associado a um respectivo modo de decodificação numerado de maneira semelhante 634, 636, 638 configurado para utilizar a mesma taxa de bits de codificação e o mesmo esquema de codificação;
Se o módulo desmontador de pacotes 632 detectar o pacote 613, o pacote 613 é desmontado e enviado ao modo de decodif icação pertinente 634, 636, 638. 0 modo de decodif icação pertinente 634, 636, 638 pode implementar as técnicas de decodificação MDCT, CELP, PPP, ou NELP com base no quadro dentro do pacote 613. Se o módulo desmontador de pacotes 632 não detectar um pacote, uma perda de pacote é declarada e um decodif icador de apagamento (não mostrado) pode executar processamento de apagamento de quadros. O arranjo paralelo de modos de decodificação 634, 636, 638 pode ser acoplado ao módulo de reconstrução de quadros 64 0. O módulo de reconstrução de quadros 640 pode reconstruir, ou sintetizar, o quadro, transmitindo um quadro sintetizado. 0 quadro sintetizado pode ser combinado com outros quadros sintetizados de modo a se produzir um sinal
s(n) 616
de áudio sintetizado, , que se parece com o sinal de
áudio de entrada, s(n) 610.
A Figura 7 é um diagrama de fluxos que mostra um exemplo de um método de codificação de sinais de áudio 700. Os parâmetros iniciais de um quadro atual podem ser calculados 702. Em uma configuração, o módulo de cálculo de parâmetros iniciais 618 calcula 702 os parâmetros. Para quadros sem fala, os parâmetros podem incluir um ou mais coeficientes de modo a indicar que o quadro é um quadro sem fala. Os quadros de fala podem incluir parâmetros de um ou mais dos seguintes: coeficiente de filtragem de codificação preditiva linear (LPC), coeficientes de pares espectrais de linha (LSPs), as funções de auto-correlação normalizada (NACFs), o retardamento de malha aberta, energias de banda, a taxa de cruzamento zero e o sinal residual formando. Os quadros sem fala podem incluir adicionalmente parâmetros tais como coeficientes de filtro de codificação preditiva linear (LPC).
0 quadro atual pode ser classificado 704 como um quadro de fala ou um quadro sem fala. Conforme mencionado anteriormente, um quadro de fala pode ser associado a um sinal de fala e um quadro sem fala pode ser associado a um sinal sem fala (isto é, um sinal de música) . Um modo de codificador/decodificador pode ser selecionado 710 com base na classificação de quadros feita nas etapas 702 e 704. Os diversos modos de codificador/decodificador podem ser conectados em paralelo, conforme mostrado na Figura 6. Os diferentes modos de codificador/decodificador funcionam de acordo com diferentes esquemas de codificação. Determinados modos podem ser mais eficazes nas partes de codificação do sinal de áudio s(n) 610 que apresentam determinadas propriedades.
Conforme explicado anteriormente, o esquema de
codificação MDCT pode ser escolhido para codificar quadros classificados como fala transitória. O modo PPP pode ser escolhido para codificar quadros classificados como fala vocalizada. O modo NELP pode ser escolhido para codificar quadros classificados como fala não vocalizada. A mesma técnica de codificação pode ser freqüentemente acionada a taxas de bits diferentes, com niveis variáveis de desempenho. Os diferentes modos de
codificador/decodificador da Figura 6 podem representar diferentes técnicas de codificação ou a mesma técnica de codificação funcionando a diferentes taxas de bits, ou combinações dos precedentes. 0 modo de codificador 710 selecionado pode aplicar uma função de janela apropriada ao quadro. Por exemplo, uma função de janela de MDCT especifica dos presentes sistemas e métodos pode ser aplicada se o modo de codificação selecionado for um esquema de codificação MDCT. Alternativamente, uma função de janela associada a um esquema de codificação CELP pode ser aplicada ao quadro se o modo de codificação selecionado for um esquema de codificação CELP. 0 modo de codificador selecionado pode codificar 712 o quadro atual e formatar 714 o quadro codificado em um pacote. O pacote pode ser transmitido 716 a um decodificador.
A Figura 8 é um diagrama de blocos que mostra uma configuração de uma pluralidade de quadros 802, 804, 806 depois que uma função de janela de MDCT especifica tiver sido a aplicada a cada quadro. Em uma configuração, um quadro anterior 802, um quadro atual 804 e um quadro futuro 806 podem, cada um, ser classificados como quadros sem fala. O comprimento 820 do quadro atual 804 pode ser representado por 2M. O comprimento do quadro anterior 802 e do quadro futuro 805 pode ser adicionalmente 2M. O quadro atual 804 pode incluir uma primeira região de enchimento zero 810 e uma segunda região de enchimento zero 818. Em outras palavras, os valores dos coeficientes das primeira e segunda regiões de enchimento zero 810, 818 podem ser zero.
Em uma configuração, o quadro atual 804 inclui adicionalmente um comprimento de sobreposição 812 e um comprimento de avanço 816. Os comprimentos de sobreposição e avanço 812, 816 podem ser representados como 1. O comprimento de sobreposição 812 pode sobrepor-se ao comprimento de avanço do quadro anterior 8 02. Em uma configuração, o valor 1 é menor que o valor M. Em outra configuração, o valor 1 é igual ao valor Μ. 0 quadro atual pode incluir adicionalmente um comprimento unitário 814 no qual cada valor do quadro neste comprimento 814 é unitário. Conforme mostrado, o quadro futuro 806 pode começar em um ponto 808 a meio caminho do quadro atual 804. Em outras palavras, o quadro futuro 806 pode começar a um comprimento M do quadro atual 804 . De maneira semelhante, o quadro anterior 802 pode terminar no ponto 808 a meio caminho do quadro atual 804. Sendo assim, existe uma sobreposição de 50% do quadro anterior 802 e do quadro futuro 806 ou do quadro atual 904.
A função de janela de MDCT especifica pode facilitar a reconstrução perfeita de um sinal de áudio em um decodificador se o módulo de quantizador/coeficiente de MDCT reconstruir fidedignamente o coeficiente de MDCT no decodificador. Em uma configuração, o módulo de quantizador/codificação de coeficientes de MDCT pode não reconstruir fidedignamente os coeficientes de MDCT no decodificador. Neste caso, a fidelidade de reconstrução do decodificador pode depender da capacidade do módulo quantizador/codificação de coeficientes de MDCT de reconstruir fidedignamente os coeficientes. A aplicação da janela de MDCT a um quadro atual pode proporcionar a reconstrução perfeita do quadro atual se for superposto em 50% tanto por um quadro anterior quanto por um quadro futuro. Além disto, a janela de MDCT pode proporcionar a reconstrução perfeita se uma condição de Princen-Bradley for satisfeita. Conforme mencionado anteriormente, a condição de Princen-Bradley pode ser expressa da seguinte maneira:
w2(n) + w2(n + M) = 1 (3)
onde w(n) pode representar a janela de MDCT mostrada na Figura 8. A condição expressa pela equação (3) pode implicar que um ponto em um quadro 802, 804, 806 adicionado a um ponto correspondente em um quadro 802, 804, 806 diferente proverá um valor de unidade. Por exemplo, um ponto do quadro anterior 802 no comprimento 808 a meio caminho adicionado a um ponto correspondente do quadro atual 8 04 no comprimento 8 08 a meio caminho produz um valor de unidade.
A Figura 9 é um diagrama de fluxos que mostra uma configuração de um método 900 para aplicar uma função de janela MDCT a um quadro associado a um sinal sem fala, tal como o quadro presente 804 descrito na Figura 8. O processo de aplicação da função de janela de MDCT pode ser uma etapa no cálculo de uma MDCT. Em outras palavras, uma MDCT de reconstrução perfeita pode não ser aplicada sem a utilização de uma janela que satisfaça as condições de uma sobreposição de 50% entre duas janelas consecutivas e a condição de Princen-Bradley explicada anteriormente. As funções de janela descritas no método 900 podem ser implementadas como uma parte da aplicação da função de MDCT a um quadro. Em um exemplo, M amostras do quadro presente 804 podem estar disponíveis assim como L amostras de previsão. L pode ser um valor arbitrário.
Uma primeira região de enchimento zero de (M-L)/2 amostras do quadro presente 804 pode ser gerada 902. Conforme explicado anteriormente, um enchimento zero pode implicar que os coeficientes das amostras na primeira região de enchimento zero 810 pode ser zero. Em uma configuração, pode ser apresentado 904 um comprimento de sobreposição de L amostras do quadro presente 804. O comprimento de sobreposição de L amostras do quadro presente pode superposto e adicionado 906 com o comprimento de avanço reconstruído do quadro anterior 802. A primeira região de enchimento zero e o comprimento de sobreposição dó quadro presente 804 podem sobrepor-se ao quadro anterior 802 em 50%. Em uma configuração, (M-L) amostras do quadro presente podem ser apresentadas 908. L amostras de previsão para o quadro presente podem ser adicionalmente apresentadas 910. As L amostras de previsão podem sobrepor- se ao quadro futuro 806. Uma segunda região de enchimento zero de (M-L) /2 amostras do quadro presente pode ser gerada. Em uma configuração, as L amostras de previsão e a segunda região de enchimento zero do quadro presente 804 podem sobrepor-se ao quadro futuro 806 em 50%. Um quadro que tenha aplicado o método 900 pode satisfazer a condição de Princen-Bradley, conforme descrito anteriormente.
A Figura 10 é um diagrama de fluxos que mostra uma configuração de um método 1000 para reconstruir um quadro que foi modificado pela função de janela de MDCT. Em uma configuração, o método 1000 é implementado pelo módulo de reconstrução de quadros 314. As amostras do quadro presente 804 podem ser sintetizadas 1002, começando no final de uma primeira região de enchimento zero 812 e terminando em uma (M-L) região 814. Uma região de sobreposição de L amostras do quadro presente 804 pode ser adicionada 1004 com um comprimento de avanço do quadro anterior 802. Em uma configuração, o avanço de L amostras 816 do quadro presente 804 pode ser armazenado 1006, começando no final da (M-L) região 814 e terminando no inicio de uma segunda região de enchimento zero 818. Em um exemplo, o avanço de L amostras 816 pode ser armazenado em um componente de memória do decodif icador 304. Em uma configuração, M amostras podem ser transmitidas 1008. As M amostras transmitidas podem ser combinadas com amostras adicionais para reconstruir o quadro presente 804.
A Figura 11 mostra diversos componentes que podem ser utilizados em um dispositivo de comunicação/computação 1108 de acordo com os sistemas e métodos aqui descritos. O dispositivo de comunicação/computação 1108 pode incluir um processador 1102, que controla o funcionamento do dispositivo 1108. O processador 1102 pode ser também referido como uma CPU. Uma memória 1104, que pode incluir tanto uma memória só de leitura (ROM) quanto uma memória de acesso aleatório (RAM), fornece instruções e dados ao processador 1102. Uma parte da memória 1104 pode incluir adicionalmente memória de acesso aleatório não volátil (NVRAM).
0 dispositivo 1108 pode incluir adicionalmente um alojamento 1122 que contém um transmissor 1110 e um receptor 1112 para permitir a transmissão e a recepção de dados entre o terminal de acesso 1108 e um local remoto. O transmissor 1110 e o receptor 1112 podem ser combinados em um transceptor 1120. Uma antena 1118 é anexada ao alojamento 1122 e eletricamente acoplada ao transceptor 1120. O transmissor 1118, o receptor 1112, o transceptor 1120 e a antena 1118 podem ser utilizados em uma configuração de dispositivo de comunicação 1108.
O dispositivo 1108 inclui adicionalmente um detector de sinais 1106 utilizado para detectar e quantificar o nivel de sinais recebidos pelo transceptor 1120. O detector de sinais 1106 detecta tais sinais como energia total, energia-piloto por chips de pseudo-ruido (PN), densidade espectral de potência e outros sinais.
Um alterador de estados 1114 do dispositivo de comunicação 1108 controla o estado do dispositivo de comunicação 1108 com base no estado atual e nos sinais adicionais recebidos pelo transceptor 1120 e detectados pelo detector de sinais 1100. O dispositivo 1108 é capaz de funcionar em qualquer um de vários estados. O dispositivo de comunicação/computação 1108
incluir adicionalmente um determinador de sistema 1124 utilizado para controlar o dispositivo 1108 e determinar qual provedor de serviços para o qual o dispositivo 1108 deve transferir quando se determinar que o sistema de provedor de serviços atual é inadequado.
Os diversos componentes do dispositivo de comunicação/computação 1108 são acoplados uns aos outros por um sistema de barramento 1126, que pode incluir uma linha de alimentação, um barramento de sinal de controle e um barramento de sinal de condição além de um barramento de dados. Entretanto, para o bem da concisão, os diversos barramentos são mostrados na Figura 11 como o sistema de barramento 1126. 0 dispositivo de comunicação/computação 1108 pode incluir adicionalmente um processador de sinais digitais (DSP) 1116 para utilização no processamento de sinais.
As informações e os sinais podem ser representados utilizando-se qualquer uma de diversas tecnologias e técnicas diferentes. Por exemplo, os dados, instruções, comandos, informações, sinais, bits, símbolos e chips referidos em toda a descrição acima podem ser representados por tensões, correntes, ondas
eletromagnéticas, campos ou partículas magnéticas, campos ou partículas ópticas ou qualquer combinação deles.
Os diversos blocos, módulos, circuitos lógicos e etapas de algoritmo ilustrativos descritos em conexão com as configurações aqui reveladas podem ser implementados como hardware eletrônico, software de comutador ou combinações de ambos. Para se ilustrar claramente esta intercambialidade de hardware e software, diversos componentes, blocos, circuitos e etapas ilustrativos foram descritos acima geralmente em termos de sua funcionalidade. Se tal funcionalidade é implementada como hardware ou software depende da aplicação específica e das restrições de desenho impostas ao sistema como um todo. Os versados na técnica podem implementar a funcionalidade descrita de maneiras variáveis para cada aplicação específica, mas tais decisões de implementação não devem ser interpretadas como provocando um afastamento do alcance da presente invenção.
Os diversos blocos, módulos e circuitos lógicos ilustrativos descritos em conexão com as configurações aqui reveladas podem ser implementados ou executados com um processador para fins gerais, um processador de sinais digitais (DSP), um circuito integrado específico de aplicação (ASIC), um arranjo de portas programável no campo (FPGA) ou outro dispositivo lógico programável, porta discreta ou lógica de transistor, componentes de hardware discretos ou qualquer combinação deles projetada para executar as funções aqui descritas. Um processador para fins gerais podem ser um microprocessador, mas alternativamente o processador pode ser qualquer processador, controlador, microcontrolador ou máquina de estado convencional. Um processador pode ser adicionalmente implementado como uma combinação de dispositivos de computação, como, por exemplo, uma combinação de DSP e microprocessador, uma pluralidade de microprocessadores, um ou mais microprocessadores em conjunto com um núcleo de DSP ou qualquer outra configuração que tal.
As etapas de método ou algoritmo descritas em conexão com as configurações aqui reveladas podem ser corporifiçadas diretamente em hardware, em um módulo de software executado por um processador ou em uma combinação dos dois. Um módulo de software pode residir em uma memória de acesso aleatório (RAM), uma memória flash, uma memória exclusiva de leitura (ROM), uma ROM eletricamente programável (EPROM), uma ROM programável eletricamente apagável (EEPROM), em registradores, disco rigido, disco removível, CD-ROM ou qualquer outra forma de meio de armazenamento conhecida na técnica. Um meio de armazenamento exemplar é acoplado ao processador de modo que o processador possa ler informações do, e gravar informações no, meio de armazenamento. Alternativamente, o meio de armazenamento pode ser integrante com o processador. 0 processador e o meio de armazenamento podem residir em um ASIC. 0 ASIC pode residir em um terminal de usuário. Alternativamente, o processador e o meio de armazenamento podem residir como componentes discretos em um terminal de usuário.
Os métodos aqui revelados compreendem uma ou mais etapas ou ações para obter o método descrito. As etapas e/ou ações de método podem ser intercambiadas umas com as outras sem que se abandone o alcance dos presentes sistemas e métodos. Em outras palavras, a menos que uma ordem específica de etapas e/ou ações seja especificada para funcionamento adequado da configuração, a ordem e/ou o uso de etapas e/ou ações especificas podem ser modificados sem que se abandone o alcance dos presentes sistemas e métodos. Os métodos aqui revelados podem ser implementados em hardware, software ou ambos. Exemplos de hardware e memória podem incluir RAM, ROM, EPROM, EEPROM, memória flash, disco óptico, registradores, disco rígido, disco removível, CD- ROM ou quaisquer outros tipos de hardware e memória.
Embora configurações e aplicações específicas dos pressentes sistemas e métodos tenham sido mostradas e descritas, deve ficar entendido que os sistemas e métodos não estão limitados à configuração e aos componentes precisos aqui revelados. Diversas modificações, alterações e variações, que serão evidentes aos versados na técnica, podem ser feitas na disposição, no funcionamento e nos detalhes dos métodos e sistemas aqui revelados sem que se abandonem o espírito e o alcance dos sistemas e métodos reivindicados.

Claims (22)

1. Método para modificar uma janela com um quadro associado a um sinal de áudio, o método compreendendo: receber um sinal; particionar o sinal em uma pluralidade de quadros; determinar se um quadro dentro da pluralidade de quadros está associado a um sinal sem fala; aplicar uma função de janela de transformação discreta de co-seno modificada (MDCT) ao quadro de modo a gerar uma primeira região de enchimento zero e uma segunda região de enchimento zero se tiver sido determinado que o quadro está associado a um sinal sem fala; e codificar o quadro.
2. Método, de acordo com a reivindicação 1, no qual o quadro é codificado utilizando-se um esquema com base em codificação MDCT.
3. Método, de acordo com a reivindicação 1, no qual o quadro compreende um comprimento de 2M, onde M representa um número de amostras no quadro.
4. Método, de acordo com a reivindicação 1, no qual a primeira região de enchimento zero é localizada no inicio do quadro.
5. Método, de acordo com a reivindicação 1, no qual a segunda região de enchimento zero é localizada no final do quadro.
6. Método, de acordo com a reivindicação 1, no qual a primeira região de enchimento zero e a segunda região de enchimento zero compreendem um comprimento de (M- L)/2, no qual L é um valor que é menor que ou igual a M e onde M é o número de amostras no quadro.
7. Método, de acordo com a reivindicação 1, compreendendo adicionalmente prover uma região de sobreposição presente de comprimento L.
8. Método, de acordo com a reivindicação 7, no qual a região de sobreposição de comprimento L se sobrepõe e é adicionada com amostras de previsão associadas a um quadro anterior.
9. Método, de acordo com a reivindicação 1, compreendendo adicionalmente prover uma região de previsão de comprimento L, no qual L é menor do que ou igual a M e onde M é o número de amostras no quadro.
10. Método, de acordo com a reivindicação 9, no qual a região de previsão de comprimento L se sobrepõe a uma região de sobreposição futura associada a um quadro futuro.
11. Método, de acordo com a reivindicação 1, no qual a primeira região de enchimento zero e a região de sobreposição presente se sobrepõem a um quadro anterior em 50%.
12. Método, de acordo com a reivindicação 1, no qual a segunda região de enchimento zero e a região de previsão se sobrepõem a um quadro futuro em 50%.
13. Método, de acordo com a reivindicação 1, no qual uma soma de cada amostra do quadro adicionada com uma amostra associada a partir de um quadro superposto é igual à unidade.
14. Equipamento para modificar uma janela com um quadro associado com um sinal de áudio compreendendo: um processador; memória em comunicação eletrônica com o processador; instruções armazenadas na memória, as instruções sendo executáveis para: receber um sinal; particionar o sinal em uma pluralidade de quadros; determinar se um quadro dentro da pluralidade de quadros está associado a um sinal sem fala; aplicar uma função de janela de transformação discreta de co-seno modificada (MDCT) ao quadro de modo a gerar uma primeira região de enchimento zero e uma segunda região de enchimento zero se tiver sido determinado que o quadro está associado a um sinal sem fala; e codificar o quadro.
15. Equipamento, de acordo com a reivindicação 14, no qual o quadro é codificado utilizando-se um esquema com base em codificação MDCT.
16. Equipamento, de acordo com a reivindicação 14, no qual o quadro compreende um comprimento de amostras igual a 2M, onde M representa o número de amostras no quadro.
17. Equipamento, de acordo com a reivindicação 14, no qual a primeira região de enchimento zero é localizada no inicio do quadro.
18. Equipamento, de acordo com a reivindicação 14, no qual a segunda região de enchimento zero é localizada no final do quadro.
19. Sistema que é configurado para modificar uma janela com um quadro associado a um sinal de áudio compreendendo: mecanismos para processar; mecanismos para receber um sinal; mecanismos para particionar o s.inal em uma pluralidade de quadros; mecanismos para determinar se um quadro dentro da pluralidade de quadros está associado a um sinal sem fala; mecanismos para aplicar uma função de janela de transformação discreta de co-seno modificada (MDCT) ao quadro de modo a gerar uma primeira região de enchimento zero e uma segunda região de enchimento zero se tiver sido determinado que o quadro está associado a um sinal sem fala; e mecanismos para codificar o quadro.
20. Meio legível por computador configurado para armazenar um conjunto de instruções executáveis para: receber um sinal; particionar o sinal em uma pluralidade de quadros; determinar se um quadro dentro da pluralidade de quadros está associado a um sinal sem fala; aplicar uma função de janela de transformação discreta de co-seno modificada (MDCT) ao quadro de modo a gerar uma primeira região de enchimento zero e uma segunda região de enchimento zero se tiver sido determinado que o quadro está associado a um sinal sem fala; e codificar o quadro.
21. Método para selecionar uma função de janela a ser utilizada ao calcular uma transformação discreta de co- seno modificada (MDCT) de um quadro, o método compreendendo: prover um algoritmo para selecionar uma função de janela a ser utilizada ao calcular uma MDCT de um quadro; aplicar a função de janela selecionada ao quadro; e codificar o quadro com um modo de codificação MDCT com base em restrições impostas ao modo de codificação MDCT por modos de codificação adicionais, no qual as restrições compreendem o comprimento do quadro, o comprimento de previsão e um retardo.
22. Método para reconstruir um quadro codificado de um sinal de áudio, o método compreendendo: receber um pacote; desmontar o pacote de modo a recuperar ura quadro codificado; sintetizar amostras do quadro que são localizadas entre uma primeira região de enchimento zero e uma primeira região; adicionar uma região de sobreposição de um primeiro comprimento com um comprimento de previsão de um quadro anterior; armazenar uma previsão do primeiro comprimento do quadro; e emitir um quadro reconstruído.
BRPI0715206-0A 2006-07-31 2007-07-31 sistemas e mÉtodos para modificar uma janela com um quadro associado a um sinal de Áudio BRPI0715206A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US83467406P 2006-07-31 2006-07-31
US60/834,674 2006-07-31
US11/674,745 US7987089B2 (en) 2006-07-31 2007-02-14 Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US11/674,745 2007-02-14
PCT/US2007/074898 WO2008016945A2 (en) 2006-07-31 2007-07-31 Systems and methods for modifying a window with a frame associated with an audio signal

Publications (1)

Publication Number Publication Date
BRPI0715206A2 true BRPI0715206A2 (pt) 2013-06-11

Family

ID=38792218

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0715206-0A BRPI0715206A2 (pt) 2006-07-31 2007-07-31 sistemas e mÉtodos para modificar uma janela com um quadro associado a um sinal de Áudio

Country Status (10)

Country Link
US (1) US7987089B2 (pt)
EP (1) EP2047463A2 (pt)
JP (1) JP4991854B2 (pt)
KR (1) KR101070207B1 (pt)
CN (1) CN101496098B (pt)
BR (1) BRPI0715206A2 (pt)
CA (1) CA2658560C (pt)
RU (1) RU2418323C2 (pt)
TW (1) TWI364951B (pt)
WO (1) WO2008016945A2 (pt)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
JP5097219B2 (ja) * 2007-03-02 2012-12-12 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 非因果性ポストフィルタ
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR100922897B1 (ko) * 2007-12-11 2009-10-20 한국전자통신연구원 Mdct 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법
KR101441896B1 (ko) * 2008-01-29 2014-09-23 삼성전자주식회사 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
WO2010003532A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
KR20100007738A (ko) * 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
US9384748B2 (en) 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
CN102930871B (zh) * 2009-03-11 2014-07-16 华为技术有限公司 一种线性预测分析方法、装置及系统
CN102067211B (zh) * 2009-03-11 2013-04-17 华为技术有限公司 一种线性预测分析方法、装置及系统
WO2010134759A2 (ko) * 2009-05-19 2010-11-25 한국전자통신연구원 Mdct-tcx 프레임과 celp 프레임 간 연동을 위한 윈도우 처리 장치 및 윈도우 처리 방법
PL2473995T3 (pl) * 2009-10-20 2015-06-30 Fraunhofer Ges Forschung Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem
EP2372704A1 (en) * 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor and method for processing a signal
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
CN103229235B (zh) * 2010-11-24 2015-12-09 Lg电子株式会社 语音信号编码方法和语音信号解码方法
WO2012086485A1 (ja) * 2010-12-20 2012-06-28 株式会社ニコン 音声制御装置および撮像装置
US9942593B2 (en) * 2011-02-10 2018-04-10 Intel Corporation Producing decoded audio at graphics engine of host processing platform
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
MX2013009344A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral.
EP2676265B1 (en) * 2011-02-14 2019-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using an aligned look-ahead portion
WO2012110447A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
CA2827277C (en) 2011-02-14 2016-08-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
WO2012110448A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
EP3239978B1 (en) 2011-02-14 2018-12-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of pulse positions of tracks of an audio signal
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
US9037456B2 (en) 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
CN103325373A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于传送和接收音频信号的方法和设备
KR20140075466A (ko) * 2012-12-11 2014-06-19 삼성전자주식회사 오디오 신호의 인코딩 및 디코딩 방법, 및 오디오 신호의 인코딩 및 디코딩 장치
SG11201506543WA (en) * 2013-02-20 2015-09-29 Fraunhofer Ges Forschung Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion
EP2981958B1 (en) 2013-04-05 2018-03-07 Dolby International AB Audio encoder and decoder
PL3011563T3 (pl) 2013-06-21 2020-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekodowanie audio z rekonstrukcją uszkodzonych lub nieodebranych ramek przy użyciu tcx ltp
EP2980797A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
EP2980791A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
TWI555510B (zh) * 2015-12-03 2016-11-01 財團法人工業技術研究院 非侵入式血醣量測裝置及使用其之量測方法
CN112735449B (zh) * 2020-12-30 2023-04-14 北京百瑞互联技术有限公司 优化频域噪声整形的音频编码方法及装置
US12112764B2 (en) * 2022-08-31 2024-10-08 Nuvoton Technology Corporation Delay estimation using frequency spectral descriptors

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5384891A (en) * 1988-09-28 1995-01-24 Hitachi, Ltd. Vector quantizing apparatus and speech analysis-synthesis system using the apparatus
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
FR2675969B1 (fr) * 1991-04-24 1994-02-11 France Telecom Procede et dispositif de codage-decodage d'un signal numerique.
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3531177B2 (ja) 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
US5704003A (en) * 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
EP0932141B1 (en) * 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
WO2000070769A1 (en) 1999-05-14 2000-11-23 Matsushita Electric Industrial Co., Ltd. Method and apparatus for expanding band of audio signal
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
US7461002B2 (en) * 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
EP1341160A1 (en) * 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
US7116745B2 (en) * 2002-04-17 2006-10-03 Intellon Corporation Block oriented digital communication system and method
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
GB0321093D0 (en) 2003-09-09 2003-10-08 Nokia Corp Multi-rate coding
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
WO2006046546A1 (ja) 2004-10-26 2006-05-04 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
KR100956525B1 (ko) * 2005-04-01 2010-05-07 퀄컴 인코포레이티드 스피치 신호의 스플릿 대역 인코딩을 위한 방법 및 장치

Also Published As

Publication number Publication date
TW200816718A (en) 2008-04-01
RU2009107161A (ru) 2010-09-10
KR101070207B1 (ko) 2011-10-06
JP2009545780A (ja) 2009-12-24
US20080027719A1 (en) 2008-01-31
TWI364951B (en) 2012-05-21
CA2658560C (en) 2014-07-22
KR20090035717A (ko) 2009-04-10
RU2418323C2 (ru) 2011-05-10
CN101496098A (zh) 2009-07-29
EP2047463A2 (en) 2009-04-15
WO2008016945A9 (en) 2008-05-29
WO2008016945A2 (en) 2008-02-07
JP4991854B2 (ja) 2012-08-01
US7987089B2 (en) 2011-07-26
CA2658560A1 (en) 2008-02-07
WO2008016945A3 (en) 2008-04-10
CN101496098B (zh) 2012-07-25

Similar Documents

Publication Publication Date Title
BRPI0715206A2 (pt) sistemas e mÉtodos para modificar uma janela com um quadro associado a um sinal de Áudio
TWI436349B (zh) 用於重建一被抹除語音訊框之系統與方法
US12322400B2 (en) Stereo parameters for stereo decoding
BRPI0715211A2 (pt) sistemas, mÉtodos e equipamentos para codificaÇço e decodificaÇço em banda larga de quadros ativos
BR112014017120B1 (pt) Sistemas, métodos aparelho, e mídia legível por computador para controle de limite de criticalidade
ES2276690T3 (es) Particion de espectro de frecuencia de una forma de onda prototipo.
JP5199281B2 (ja) 第1のビット・レートに関連する第1のパケットを、第2のビット・レートに関連する第2のパケットにディミング(dimming)するシステム及び方法
BR112018016247B1 (pt) Dispositivo, método de comunicação e memória legível por computador

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: G10L 19/20 (2013.01), G10L 19/02 (2013.01)

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06T Formal requirements before examination [chapter 6.20 patent gazette]
B06G Technical and formal requirements: other requirements [chapter 6.7 patent gazette]
B07A Technical examination (opinion): publication of technical examination (opinion) [chapter 7.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B12B Appeal: appeal against refusal