[go: up one dir, main page]

BRPI0815972B1 - método para recuperação de espectro em decodificação espectral de um sinal de áudio, método para uso em codificação espectral de um sinal de áudio, decodificador, e, codificador - Google Patents

método para recuperação de espectro em decodificação espectral de um sinal de áudio, método para uso em codificação espectral de um sinal de áudio, decodificador, e, codificador Download PDF

Info

Publication number
BRPI0815972B1
BRPI0815972B1 BRPI0815972A BRPI0815972A BRPI0815972B1 BR PI0815972 B1 BRPI0815972 B1 BR PI0815972B1 BR PI0815972 A BRPI0815972 A BR PI0815972A BR PI0815972 A BRPI0815972 A BR PI0815972A BR PI0815972 B1 BRPI0815972 B1 BR PI0815972B1
Authority
BR
Brazil
Prior art keywords
frequency
spectral
transition
transition frequency
audio signal
Prior art date
Application number
BRPI0815972A
Other languages
English (en)
Inventor
Taleb Anisse
Ullberg Gustaf
Briand Manuel
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40387561&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=BRPI0815972(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Publication of BRPI0815972A2 publication Critical patent/BRPI0815972A2/pt
Publication of BRPI0815972A8 publication Critical patent/BRPI0815972A8/pt
Publication of BRPI0815972B1 publication Critical patent/BRPI0815972B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

método para recuperação de espectro em decodificação espectral de um sinal de áudio, método para uso em codificação espectral de um sinal de áudio, decodificador, e, codificador método para recuperação de espectro em decodificação espectral de um sinal de áudio compreende a obtenção (210) (210) de um conjunto inicial de coeficientes espectrais, representando o sinal de áudio e determinação (212) de uma frequência de transição. a frequência de transição é adaptada a um conteúdo espectral do sinal de áudio. os furos espectrais no conjunto inicial de coeficientes espectrais abaixo da frequência de transição são preenchidos com ruídos (214) e o conjunto inicial de coeficientes espectrais é estendido em largura de banda (216) acima da frequência de transição. decodificadores e codificadores sendo dispostos para realização de parte ou de todo o método também são ilustrados.

Description

“MÉTODO PARA RECUPERAÇÃO DE ESPECTRO EM DECODIFICAÇÃO ESPECTRAL DE UM SINAL DE ÁUDIO, MÉTODO PARA USO EM CODIFICAÇÃO ESPECTRAL DE UM SINAL DE ÁUDIO, DECODIFICADOR, E, CODIFICADOR”
CAMPO TÉCNICO [001] A presente invenção se refere, em geral, a métodos e dispositivos para codificação e decodificação de sinais de áudio e, em particular, a métodos e dispositivos para preenchimento de espectro.
FUNDAMENTOS [002] Quando sinais de áudio devem ser armazenados e/ou transmitidos, uma abordagem padrão hoje é codificar os sinais de áudio em uma representação digital de acordo com esquemas diferentes. A fim de economizar na capacidade de armazenamento e/ou transmissão, é desejo geral reduzir o tamanho da representação digital necessária para permitir a reconstrução dos sinais de áudio com qualidade suficiente. A troca entre o tamanho do sinal codificado e qualidade do sinal depende da aplicação real.
[003] Codificadores de áudio baseados em transformação comprimem sinais de áudio pela quantificação dos coeficientes de transformação. Para permitir baixas taxas de bits, quantificadores poderiam concentrar os bits disponíveis nos coeficientes mais energéticos e perceptualmente relevantes e transmitir apenas aqueles, deixando furos espectrais de coeficientes não quantificados no espectro de frequências.
[004] A chamada tecnologia de SBR (Spectral Band Replication Réplica de Banda Espectral), veja, por exemplo, 3GPP TS 26.404 V6.0.0 (2004-09), Enhanced aacPlus general audio codec - encoder SBR part (Release 6), 2004 [1], fecha a folga entre o sinal de banda limitada de um codificador perceptual convencional e a largura de banda audível de, aproximadamente, 15 kHz. A idéia geral atrás da SBR é recriar os conteúdos de alta frequência que estão faltando de um sinal decodificado em uma
Petição 870190114564, de 08/11/2019, pág. 8/63 / 18 maneira perceptualmente precisa. As frequências acima de 15 kHz são menos importantes de um ponto de vista psicoacústico, mas também podem ser reconstruídas. Contudo, a SBR não pode ser usada como um codec autônomo. Ela sempre opera em conjunto com um codec de forma de onda convencional, um chamado codec de núcleo. O codec de núcleo é responsável pela transmissão da parte inferior do espectro original, enquanto o decodificador SBR, que é, principalmente, um pós-processo para o decodificador de forma de onda convencional, reconstrói a faixa de frequência não transmitida. Os valores espectrais da banda alta não são transmitidos diretamente, como em codecs convencionais. O sistema combinado oferece um ganho de codificação superior ao ganho do codec de núcleo sozinho.
[005] A metodologia de SBR conta com a definição de uma frequência de transição fixa entre baixas frequências, perceptualmente relevantes, codificadas, de banda baixa e frequências altas menos relevantes, não codificadas de banda alta. Contudo, na prática, essa frequência de transição conta com o conteúdo de áudio do sinal original. Em outras palavras, de um sinal para outro, a frequência de transição apropriada pode variar bastante. Esse é, por exemplo, o caso quando comparando o discurso limpo e sinais musicais de banda completa.
[006] Os furos espectrais do espectro decodificado podem ser divididos em duas espécies. A primeira é a de pequenos furos em frequências mais baixas devido ao efeito de mascaramento instantâneo, veja, por exemplo, J.D. Johnston, Estimation of Perceptual Entropy Using Noise Masking Criteria, Proc. ICASSP, pp. 2524-2527, Maio de 1988 [2]. A segunda é uma de furos maiores em altas frequências, resultantes da saturação pelo limite absoluto de audição e a adição de mascaramento [2]. A SBR se preocupa, principalmente, com a segunda espécie.
[007] Além disso, um codec de áudio típico, baseado nesse método, que objetiva o preenchimento do furo espectral, isto é, coeficientes não
Petição 870190114564, de 08/11/2019, pág. 9/63 / 18 codificados, para as frequências mais altas, isto é, a segunda espécie de furos espectrais, de preferência, será capaz de preencher os furos espectrais através de todo o espectro. Na verdade, mesmo se um codec de SBR for capaz de distribuir um sinal de áudio de largura de banda completa, as altas frequências reconstruídas não mascararão os artefatos importunos introduzidos pela codificação, isto é, quantificação, da banda baixa, isto é, as baixas frequências perceptualmente relevantes.
SUMÁRIO [008] Um objetivo geral da presente invenção é proporcionar métodos e dispositivos para permitir a supressão eficiente de artefatos perceptuais causados pelos furos espectrais através de um sinal de áudio de banda completa.
[009] Os objetivos acima são alcançados por métodos e dispositivos de acordo com as reivindicações de patente anexas. Em palavras gerais de acordo com um primeiro aspecto, um método para recuperação de espectro na decodificação espectral de um sinal de áudio compreende a obtenção de um conjunto inicial de coeficientes espectrais, representando o sinal de áudio e determinando uma frequência de transição. A frequência de transição é adaptada a um conteúdo espectral do sinal de áudio. Os furos espectrais no conjunto inicial de coeficientes espectrais abaixo da frequência de transição são ruídos cheios e o conjunto inicial de coeficientes espectrais é largura de banda estendida acima da frequência de transição.
[0010] De acordo com um segundo aspecto, um método para uso em codificação espectral de um sinal de áudio compreende a determinação de uma frequência de transição para um conjunto inicial de coeficientes espectrais, representando o sinal de áudio. A frequência de transição é adaptada a um conteúdo espectral do sinal de áudio. A frequência de transição define uma borda entre uma faixa de frequências, destinada a ser um objeto para preenchimento de ruído de furos espectrais e uma faixa de frequências,
Petição 870190114564, de 08/11/2019, pág. 10/63 / 18 destinada a ser um objeto para a extensão de largura de banda.
[0011] De acordo com um terceiro aspecto, um decodificador para decodificação espectral de um sinal de áudio compreende uma entrada para obtenção de um conjunto inicial de coeficientes espectrais, representando o sinal de áudio e conjunto de circuitos de determinação de transição disposto para determinação de uma frequência de transição. A frequência de transição é adaptada a um conteúdo espectral do sinal de áudio. A decodificação compreende um preenchedor de ruído para preenchimento de ruído de furos espectrais no conjunto inicial dos coeficientes espectrais abaixo da frequência de transição e um extensor de largura de banda disposto para largura de banda, estendendo o conjunto inicial de coeficientes espectrais acima da frequência de transição.
[0012] De acordo com um quarto aspecto, um codificador para codificação espectral de um sinal de áudio compreende o conjunto de circuitos de determinação de transição disposto para determinar uma frequência de transição para um conjunto inicial de coeficientes espectrais, representando o sinal de áudio. A frequência de transição é adaptada a um conteúdo espectral do sinal de áudio. A frequência de transição define uma borda entre uma faixa de frequências, destinada a ser um objeto para preenchimento de ruído de furos espectrais e uma faixa de frequências, destinada a ser um objeto para extensão de largura de banda.
[0013] A presente invenção tem um número de vantagens. Uma vantagem é que o uso da frequência de transição permite o uso de um preenchimento de espectro combinado, usando preenchimento de ruído e extensão de largura de banda. Além disso, a frequência de transição é definida adaptativamente, por exemplo, de acordo com o esquema de codificação usado, o que torna o preenchimento de espectro dependente, por exemplo, de resolução de frequência. Qualquer codec de fala e/ou de áudio usando esse método é capaz de distribuir uma alta qualidade, isto é, com artefatos
Petição 870190114564, de 08/11/2019, pág. 11/63 / 18 importunos reduzidos e sinal de áudio de largura de banda completa. O método é flexível no sentido de que pode ser combinado com qualquer espécie de representação de frequência (DCT, MDCTY, etc.) ou bancos de filtros, isto é, com qualquer codec (perceptual, paramétrico, etc.).
BREVE DESCRIÇÃO DOS DESENHOS [0014] A invenção, junto com outros objetivos e suas vantagens, pode ser mais bem compreendida fazendo-se referência à descrição seguinte, tomada junto com os desenhos anexos, em que:
A figura 1 é um diagrama em blocos esquemático e um sistema de codec;
A figura 2 é um diagrama em blocos esquemático de uma modalidade de um codificador de sinal de áudio de acordo com a presente invenção;
A figura 3 é uma ilustração esquemática de coeficientes espectrais, seus grupos e bandas de frequência;
A figura 4 é um diagrama em blocos esquemático de uma modalidade de um decodificador de sinal de áudio de acordo coma presente invenção;
As figuras 5A - C são ilustrações de modalidades de princípios para encontrar uma frequência de transição;
A figura 6 é um diagrama de fluxo das etapas de uma modalidade de um método de acordo com a presente invenção; e
A figura 7 é um fluxograma de uma etapa de uma modalidade de um método de manipulação de sinal de acordo com a presente invenção.
DESCRIÇÃO DETALHADA [0015] Por todos os desenhos, os mesmos números de referência são usados para elementos similares ou correspondentes.
[0016] Uma modalidade de um sistema geral de codec para sinais de áudio é ilustrada esquematicamente na figura 1. Uma fonte de áudio 10 dá
Petição 870190114564, de 08/11/2019, pág. 12/63 / 18 origem a um sinal de áudio 15. O sinal de áudio 15 é manipulado em um codificador 20, que produz um fluxo binário 25, compreendendo dados representando o sinal de áudio 15. O fluxo binário 25 pode ser transmitido como, por exemplo, no caso de comunicação multimídia por uma disposição de transmissão e/ou armazenamento 30. A disposição de transmissão e/ou armazenamento 30, opcionalmente, também pode compreender alguma capacidade de armazenamento. O fluxo binário 25 também só pode ser armazenado na disposição de transmissão e/ou armazenamento 30, exatamente introduzindo um retardo de tempo na utilização do furo passante. A disposição de transmissão e/ou armazenamento 30 é, assim, uma disposição introduzindo pelo menos um dentre um reposicionamento espacial ou retardo de tempo do fluxo binário 25. Quando sendo usado, o fluxo binário 25 é manipulado em um decodificador 40, que produz uma saída de áudio 35 dos dados compreendidos no fluxo binário. Tipicamente, a saída de áudio 35 parecerá o sinal de áudio original 15 bem como possível sob certas restrições. [0017] Aplicações em tempo real, o retardo de tempo entre a produção do sinal de áudio original 15 e, tipicamente, não é permitido que a saída de áudio 35 produzida exceda um certo tempo. Se os recursos de transmissão, ao mesmo tempo, forem limitados, a taxa de bits disponível também é, tipicamente, baixa. A fim de utilizar a taxa de bits disponível da melhor maneira possível, a codificação de áudio perceptual foi desenvolvida. A codificação de áudio perceptual, portanto, tem se tornado uma parte importante para muitos serviços de multimídia hoje. O princípio básico é converter o sinal de áudio em coeficientes espectrais em um domínio da frequência e usando um modelo perceptual para determinar um mascaramento dependente de frequência e tempo dos coeficientes espectrais.
[0018] A figura 2 ilustra uma modalidade de um codificador de áudio 20 de acordo com a presente invenção. Nesta modalidade particular, o codificador de áudio perceptual 20 é um codificador espectral baseado em um
Petição 870190114564, de 08/11/2019, pág. 13/63 / 18 transformador perceptual ou banco de filtro perceptual. Uma fonte de áudio 15 é recebida, compreendendo os quadros de sinais de áudio x[n].
[0019] Em um codificador espectral típico, um conversor 21 é disposto para converter o sinal de áudio de domínio de tempo 15 em um conjunto 24 de coeficientes espectrais Xb[n] de um domínio da frequência. Em um codificador de transformação típico, a conversão pode ser realizada, por exemplo, por uma Transformada de Fourier Discreta (DFT), a Transformada de Cosseno Discreta (DCT) ou a Transformada de Cosseno Discreta Modificada (MDCT). O conversor 21 pode, assim, tipicamente, ser constituído por um transformador espectral. Os detalhes do transformador real não são de importância particular para as idéias básicas da presente invenção e, portanto, não são aqui discutidos.
[0020] O conjunto 24 de coeficientes espectrais, isto é, uma representação de frequência do sinal de áudio de entrada é proporcionado a uma sessão de quantificação e codificação 28, onde os coeficientes espectrais são quantificados e codificados. Tipicamente, a codificação está operando para concentrar os bits disponíveis nos coeficientes mais energéticos e prceptualmente relevantes. Isso pode ser realizado usando, por exemplo, diferentes espécies de limites de mascaramento ou reduções de largura de banda. O resultado, tipicamente, será os furos espectrais de coeficientes não codificados no espectro de frequência. Em outras palavras, alguns dos coeficientes são deixados de propósito, uma vez que eles são, perceptualmente, menos importantes para não ocupar recursos de transmissão mais necessários para outras finalidades. Esses furos espectrais podem, então, através de diferentes estratégias de reconstrução ser corrigidos ou reconstruídos no lado do decodificador. Tipicamente, furos espectrais de duas espécies aparecem. A primeira espécie compreende furos espectrais individuais ou uns poucos vizinhos, que ocorrem em diferentes locais, principalmente na região de baixa frequência. O segundo tipo é um grupo
Petição 870190114564, de 08/11/2019, pág. 14/63 / 18 mais ou menos contínuo de furos espectrais na extremidade de alta frequência do espectro.
[0021] De acordo com a presente invenção, é favorável tratar essas duas espécies diferentes de furos espectrais de diferentes maneiras, a fim de obter um preenchimento de espectro tão eficiente quanto possível. Um parâmetro para determinar é, então, uma frequência de transição, em que diferentes abordagens de preenchimento se encontram, uma chamada frequência de transição. Uma vez que os furos espectrais diferem entre diferentes espécies de sinais de áudio, a escolha ótima de frequência de transição também difere. De acordo com a presente versão, a seqüência de transição é adaptada a um conteúdo espectral do sinal de áudio. Tipicamente, a frequência de transição é adaptada a um conteúdo espectral de um quadro presente do sinal de áudio, porém, a frequência de transição também pode depender de conteúdos de espectro de quadros anteriores do sinal de áudio e, se não houver sérias exigências de retardo, a frequência de transição também pode depender de conteúdos espectrais de quadros futuros do sinal de áudio. Essa adaptação pode ser realizada no lado do codificador através de um conjunto de circuitos de determinação de transição 60, tipicamente integrado com a seção de quantificação e codificação 28. Contudo, em modalidades alternativas, o conjunto de circuitos de determinação de transição 60 pode ser proporcionado como uma seção que opera separadamente, pelo que apenas um parâmetro representando a frequência de transição é proporcionado para as diferentes funcionalidades do codificador 20. A frequência de transição pode ser usada no lado do codificador, por exemplo, para fornecimento de uma codificação de envelope apropriada para os intervalos de frequência nos diferentes lados da frequência de transição.
[0022] A seção de quantificação e codificação 28 é ainda disposta para empacotamento dos coeficientes espectrais codificados junto com a informação e lado adicional em um fluxo de bits de acordo com o padrão de
Petição 870190114564, de 08/11/2019, pág. 15/63 / 18 transmissão ou armazenamento que será usado. Um fluxo binário 25, tendo dados representando o conjunto de coeficientes espectrais é, assim, transmitido da seção de quantificação e codificação 28. Uma vez que a frequência de transição é derivável diretamente do conteúdo espectral, a mesma derivação pode ser realizada em ambos os lados da interface de transmissão, isto é, no codificador e no decodificador. Isso significa que o valor da própria frequência de transição não que ser, necessariamente, transmitido entre a informação de lado adicional. Contudo, naturalmente, também é possível assim fazer, se houver capacidade de taxa de bits disponível.
[0023] Em uma modalidade particular, uma transformação de MCDT é usada. Após a ponderação realizada por um modelo psicoacústico, os coeficientes de MDCT são quantificados usando quantificação de vetor. Na quantificação de vetor, VQ, os coeficientes espectrais são divididos em pequenos grupos. Cada grupo de coeficiente pode ser visto como um vetor único e cada vetor é quantificado individualmente.
[0024] Por exemplo, devido às altas restrições na taxa de bits, o quantificador pode focalizar os bits disponíveis nos grupos mais energéticos e perceptualmente relevantes, resultando em que alguns grupos são ajustados para zero. Esses grupos formam furos espectrais no espectro quantificado. Isso é ilustrado na figura 3. Na presente modalidade, os grupos 70 compreendem o mesmo número de coeficientes espectrais 71, nesse caso quatro. Contudo, nos grupos de modalidades alternativas, tendo número diferente de coeficientes espectrais, também pode ser possível. Em uma modalidade particular, todos os grupos compreendem apenas um coeficiente espectral, cada um, isto é, o grupo, é o mesmo que o próprio coeficiente espectral. Os grupos quantificados 72 são ilustrados na figura através de retângulos não preenchidos, enquanto os grupos ajustados para zero 73 são ilustrados com retângulos pretos. Tipicamente, são apenas os grupos
Petição 870190114564, de 08/11/2019, pág. 16/63 / 18 codificados 72 que são transmitidos para qualquer usuário final.
[0025] Os grupos 70 de coeficientes são, por sua vez, divididos em diferentes bandas de frequências 74. Essa divisão é realizada, de preferência de acordo com algum critério psicoacústico. Grupos tendo propriedades psicoacústicas essencialmente similares podem, assim, ser tratados coletivamente. O número de elementos de cada banda de frequência 74, isto é, o número de grupos 70 associados com as bandas de frequência 74 podem, portanto, diferir. Se grandes porções de frequência têm propriedades similares, uma banda de frequência cobrindo dessas frequência pode ter uma grande faixa de frequência. Se essas propriedades psicoacústicas mudarem rápido através das frequências, isso, na verdade chama bandas de frequências de uma faixa de frequências menor. As rotinas para o preenchimento de espectro, de preferência, podem depender da banda de frequências a ser preenchida, conforme discutido em mais detalhes abaixo.
[0026] No estágio de decodificação, a operação inversa é obtida, basicamente. Na figura 4, uma modalidade de um decodificador de áudio 40 de acordo com a presente invenção, é ilustrado. Um fluxo binário 25 é recebido, o qual tem propriedades causadas pelo codificador descrito aqui acima. A desquantificação e a decodificação do fluxo binário 25 recebido, por exemplo, um fluxo de bits, são realizadas em um decodificador de coeficiente espectral 41. O decodificador de coeficiente espectral 41 é disposto para decodificação de coeficientes espectrais recuperados do fluxo binário nos coeficientes espectrais decodificados XQ[n] de um conjunto inicial de coeficientes espectrais 42, agrupados, possivelmente, em grupos de frequências XQb[n]. O conjunto inicial de coeficientes espectrais 42, de preferência, parece o conjunto de coeficientes espectrais proporcionados pelo conversor do lado do codificador, possivelmente após o pós-processamento, tal como, por exemplo, limites de mascaramento ou reduções de largura de banda.
Petição 870190114564, de 08/11/2019, pág. 17/63 / 18 [0027] Conforme discutido acima, a aplicação de limites de mascaramento ou reduções de bandas de frequências no codificador, tipicamente, resulta em que o conjunto de coeficientes espectrais 42 é incompleto naquele sentido que compreende, tipicamente, os chamados furos espectrais Os furos espectrais correspondem a coeficientes espectrais que não são recebidos no fluxo binário. Em outras palavras, os furos espectrais são elemento de sustentação não definidos ou não codificados XQ[n] ou coeficientes espectrais automaticamente ajustados para um valor predeterminado, tipicamente, zero, pelo decodificador de coeficiente espectral 41. Para evitar artefatos audíveis esses coeficientes têm que ser substituídos por estimativas (preenchidas) no decodificador.
[0028] Os furos espectrais, frequentemente, estão em dois tipos. Furos espectrais pequenos, tipicamente, estão nas baixas frequências e um ou poucos furos espectrais ocorrem nas altas frequências.
[0029] Para minimizar os artefatos no sinal de áudio decodificado, o decodificador preenche o espectro por meio da substituição dos furos espectrais no espectro com estimativas dos coeficientes. Essas estimativas podem estar baseadas em informação lateral transmitida pelo decodificador e/ou podem ser dependentes do próprio sinal. Exemplos dessa informação lateral útil poderiam ser o envelope de potência do espectro e da tonalidade, isto é, medição do espectro, dos coeficientes que faltam.
[0030] Dois métodos diferentes podem ser usados para preencher as diferentes espécies de furos espectrais. O preenchimento de ruído funciona bem para furos espectrais nas frequências mais baixas, enquanto a extensão de largura de banda é mais adequada em altas frequências. A presente invenção descreve um método para decidir onde o preenchimento de ruído e a extensão de largura de banda devem ser usados, respectivamente.
[0031] A presente invenção conta com a definição de uma frequência de transição entre partes baixas e altas relevantes do espectro. Com base nessa
Petição 870190114564, de 08/11/2019, pág. 18/63 / 18 informação, o algoritmo de codificação típico contando com um procedimento de preenchimento de ruído de alta qualidade será capaz de reduzir os artefatos que ocorrem para baixas taxas e também de regenerar um sinal de áudio de largura de banda completa, mesmo em baixas taxas e com um esquema de baixa complexidade, baseado em extensão de largura de banda. Isso será discutido em mais detalhes abaixo.
[0032] O conjunto inicial de coeficientes espectrais 42 do decodificador de coeficientes espectrais 40, compreendendo, tipicamente, uma certa quantidade de furos espectrais, é proporcionado para um conjunto de circuitos de determinação de transição 60. O conjunto de circuitos de determinação de transição 60 é disposto para determinação de uma frequência de transição ft.
[0033] O conjunto inicial de coeficientes espectrais 42 do decodificador 41 de coeficientes espectrais também é proporcionado para um preenchedor de espectro 43. O preenchedor de espectro 43 é disposto para preenchimento do espectro do conjunto inicial de coeficientes espectrais 42, dando origem a um conjunto completo 44 de coeficientes espectrais reconstruídos X’b [n]. O conjunto 44 de coeficientes espectrais reconstruídos tem, tipicamente, todos os coeficientes espectrais dentro de uma certa faixa de frequências definida.
[0034] O preenchedor de espectro 43, por sua vez, compreende um preencher de ruídos 50. O preenchedor de ruídos 50 é disposto para proporcionar um processo para preenchimento de ruído de furos espectrais, de preferência, na região de baixa frequência, isto é, abaixo da frequência de transição (ft). Um valor é assim atribuído aos coeficientes espectrais no conjunto inicial de coeficientes espectrais, abaixo da frequência de transição, que estão faltando, como um resultado de não serem incluídos no fluxo de bits codificado recebido. Com essa finalidade, uma saída 65 do conjunto de circuitos de determinação de transição 60 é conectada ao preenchedor de
Petição 870190114564, de 08/11/2019, pág. 19/63 / 18 ruídos 50, proporcionando informação associada com a frequência de transição (ft).
[0035] O preenchedor de espectro 43 também compreende um extensor de largura de banda 55, disposto para estender a largura de banda do conjunto inicial de coeficientes espectrais acima da frequência de transição, a fim de produzir o conjunto 44 de coeficientes espectrais reconstruídos. Portanto, a saída 65 no conjunto de circuitos de determinação de transição 60 também é conectada ao extensor de largura de banda 55.
[0036] Conforme mencionado acima, o resultado do preenchedor de espectro 43 é um conjunto completo 44 de coeficientes espectrais reconstruídos Xb’[n], tendo todos os coeficientes espectrais dentro de uma certa faixa de frequências definida.
[0037] O conjunto 44 de coeficientes espectrais reconstruídos é proporcionado para um conversor 45, conectado ao preenchedor de espectros 43. O conversor 45 é disposto para conversão do conjunto 44 de coeficientes espectrais de um domínio de frequência em um sinal de áudio 46 de um domínio de tempo. O conversor 45, na presente modalidade, é baseado em um transformador perceptual, correspondente à técnica de transformação usada no codificador 20 (figura 2). Em uma modalidade particular, o sinal foi proporcionado de volta no domínio de tempo com uma transformação inversa, por exemplo, MDCT - IMDCT inversa ou DFT - IDFT inversa, etc. Em outras modalidades, um banco de filtros inversos pode ser utilizado. Como no lado do codificador, a técnica do conversor 45 como tal é conhecida na técnica anterior e não será discutida mais uma vez. Um sinal de áudio final perceptualmente reconstruído 34 é proporcionado em uma saída 35 para o sinal de áudio, possivelmente em etapas de tratamento adicionais.
[0038] O codec deve decidir em que bandas de frequência usar o preenchimento de ruído e em que bandas de frequências usar a extensão de largura de banda. O preenchimento de ruído dá o melhor resultado quando a
Petição 870190114564, de 08/11/2019, pág. 20/63 / 18 maior parte dos grupos da banda de frequências a serem preenchidos são quantificados e haver apenas furos espectrais menores na banda. A extensão de largura de banda é preferível, quando uma grande parte do sinal nas altas frequências é deixada não quantificada.
[0039] Um método básico seria estabelecer uma frequência de transição fixa entre o preenchimento de ruído e a extensão de largura de banda. Os furos espectrais nas bandas ou grupos de frequência através daquela frequência são preenchidos pelo extensão de largura de banda.
[0040] Um problema com essa abordagem, porém, é que a frequência de transição ótima não é a mesma para todos os sinais de áudio. Alguns sinais têm a maior parte da energia concentrada nas baixas frequências e uma grande parte do sinal poderia ser submetida à extensão de largura de banda. Outros sinais têm sua energia dispersa mais uniformemente através do espectro e esses sinais podem se beneficiar do uso apenas do preenchedor de ruídos.
[0041] De acordo com uma modalidade de um método de acordo com a presente invenção, a frequência de transição é dependente, adaptativamente, de uma distribuição de furos espectrais no referido conjunto inicial de coeficientes espectrais. Uma rotina para encontrar uma frequência de transição adequada poderia ser seguir através de todas as bandas de frequência, começando na mais alta (BN), descendo até 1. Se não houver coeficientes quantificados na banda corrente, ela será preenchida por extensão de largura de banda. Se houver coeficientes codificados na banda, os furos dessa banda, bem como das bandas seguintes, são preenchidos usando preenchedor de ruído. Desse modo, uma frequência de transição é estabelecida no limite superior da primeira banda de frequência às vistas do lado de alta frequência que tenham coeficiente com a que tem nela um coeficiente quantificado. Isso é ilustrado na figura 5A. Os furos espectrais 77 na banda N, isto é, acima da frequência de transição ft são, assim, preenchidos com as abordagens de extensão de largura de banda. Os furos espectrais 76
Petição 870190114564, de 08/11/2019, pág. 21/63 / 18 abaixo da frequência de transição ft são, na verdade, preenchidos através do preenchimento de ruído.
[0042] Uma modalidade alternativa é ilustrada na Fig. 5B. Aqui, a definição da frequência de transição é baseada diretamente nos grupos 70, negligenciando a divisão de banda de frequência. Aqui, a extensão de largura de banda é usada para todos os grupos das frequências maiores abaixo do grupo imediatamente acima do primeiro grupo quantizado 78. Os furos espectrais 76 abaixo da frequência de transição tr, são ao invés disso, cheios por preenchimento de ruído.
[0043] Esses métodos são mais adaptativos ao sinal de áudio e ao quantificador, isto é, o esquema de codificação, mas podem experimentar problemas menores quando o sinal é quantificado, por exemplo, de acordo com a figura 5C. Aqui, uma grande parte das altas frequências do sinal é estabelecida em zero e a extensão de largura de banda, de preferência, será usada da banda B9 até a banda B12. Contudo, uma vez que há um único grupo quantificado, codificado 79 na banda de frequências B11, a extensão de largura de banda será completamente desativada abaixo desse grupo quantificado 79 e o preenchimento de ruído será usado em todas as bandas, subindo até esse grupo 79.
[0044] Para evitar também este problema, outra modalidade também é proposta, onde a frequência de transição ft é selecionada dependente de uma proporção de furos espectrais nas bandas de frequência. Como nas modalidades anteriores, o codec segue através das bandas de frequência, começando na mais alta descendo até um. Para cada banda de frequência, o número de coeficientes espectrais ou grupos codificados é contado. Se o número de coeficientes ou grupos quantificados dividido pelo número total de coeficientes ou grupos espectrais, isto é, a proporção de coeficientes espectrais codificados da banda de frequências excede um certo limite, os furos espectrais daquela banda de frequência e das bandas de frequência
Petição 870190114564, de 08/11/2019, pág. 22/63 / 18 seguintes são preenchidos com o preenchedor de ruído. Caso contrário a extensão da largura de banda é usada. Analogamente, pode-se monitorar a proporção de furos espectrais nas bandas de frequências. Em outras palavras, uma banda de frequências de transição deve ser encontrada, a qual é uma banda de frequência mais alta em que uma proporção de furos espectrais é menor do que um primeiro limite.
[0045] Há, também, critérios alternativos para selecionar a banda de frequências de transição. Uma possibilidade é deixar o limite depender da frequência. Dessa maneira, uma certa proporção de furos espectrais pode ser aceita nas partes de alta frequência, ainda usando as técnicas de expansão de largura de banda, mas não nas partes de baixa frequência. Qualquer pessoa habilitada na técnica percebe que os detalhes na seleção dos critérios apropriados podem ser variados de muitas maneiras, por exemplo, sendo dependente das propriedades relacionadas com o sinal ou outra informação.
[0046] Em uma modalidade, a frequência de transição é dependente, e de preferência igual, de um limite de frequência superior da banda de frequência de transição. Contudo, há também várias alternativas. Uma alternativa é buscar o coeficiente espectral ou grupo codificado de frequências mais altas e estabelecer a frequência de transição no lado de alta frequência daquele grupo.
[0047] O algoritmo da modalidade descrita acima também pode ser descrito com o pseudocódigo a seguir:
For currentBand = N to 1 ratio = numCodedCoeffinBand(currentBand) / numCoefflnBand(currentBand)
If ratio > threshold
Transition is between currentBand and currentBand + 1
Return
End if
Next
Transition is at the start of band 1
Petição 870190114564, de 08/11/2019, pág. 23/63 / 18 [0048] É preferido que a frequência de transição não varie demais entre quadros consecutivos. Mudanças muito grandes podem ser percebidas como perturbação. Portanto, em uma modalidade exemplificativa, a frequência de transição é ainda dependente de uma frequência de transição previamente usada. Por exemplo, será possível proibir a frequência de transição de mudar mais de uma quantidade absoluta ou relativa predeterminada dentro dos quadros consecutivos. Alternativamente, uma frequência de transição provisória poderia ser introduzida como um valor em um filtro junto com frequências de transição anteriores, dando uma frequência de transição modificada, tendo um comportamento de mudança mais amortecido. A frequência de transição, então, dependerá de mais de uma frequência de transição anterior.
[0049] Essas rotinas são realizadas, tipicamente, isto é, de preferência, na seção de quantificação e codificação do codificador, respectivamente.
[0050] A figura 6 é um fluxograma ilustrando etapas de uma modalidade de um método de acordo com a presente invenção. Um método para recuperação de espectros na decodificação espectral de um sinal de áudio começa na etapa 200. Na etapa 210, um conjunto inicial de coeficientes espectrais, representando o sinal de áudio, é obtido. Na etapa 212, uma frequência de transição é determinada. A frequência de transição é adaptada a um conteúdo espectral do sinal de áudio. O preenchimento de um ruído de furos espectrais no conjunto inicial de coeficientes espectrais abaixo da frequência de transição é realizado na etapa 214 e largura de banda estendendo-se do conjunto inicial de coeficientes espectrais acima da frequência de transição é realizada na etapa 216. O processo termina na etapa 249.
[0051] De modo análogo, a figura 7 é um fluxograma ilustrando uma etapa de uma modalidade de outro método de acordo com a presente invenção. Um método para uso na codificação espectral de um sinal de áudio começa na etapa 200. Na etapa 212, uma frequência de transição é
Petição 870190114564, de 08/11/2019, pág. 24/63 / 18 determinada. A frequência de transição para um conjunto inicial de coeficientes espectrais, representando o sinal de áudio, é adaptada a um conteúdo espectral do sinal de áudio. A frequência de transição definindo uma borda entre uma faixa de frequências, destinada a ser um objeto para o preenchimento de ruídos, e uma faixa de frequências destinada a ser um objeto para e extensão de largura de banda.
[0052] A presente invenção adquire o número de vantagens pela definição adaptativa da frequência de transição de acordo com um esquema de codificação usado. A frequência de transição adaptada permite o uso eficiente de um preenchimento de espectro combinado, usando preenchimento de ruído e extensão de largura de banda. Qualquer codec de fala e /ou áudio, usando esse método, é capaz de distribuir um sinal de áudio de largura de banda completa e de alta qualidade com artefatos importunos reduzidos. O método é flexível no sentido de que ele pode ser combinado com qualquer espécie de representação de frequência (DCT, MDCT, etc.) o banco de filtros, isto é, com qualquer codec (perceptual, paramétrico, etc).
[0053] As modalidades descritas acima devem ser compreendidas como uns poucos exemplos ilustrativos da presente invenção. Será compreendido por aqueles habilitados na técnica que várias modificações, combinações e mudanças podem ser feitas nas modalidades sem afastamento do escopo da presente invenção. Em particular, soluções de partes diferentes nas diferentes modalidades podem ser combinadas em outras configurações, onde tecnicamente possível. O escopo da presente invenção, porém, é definido pelas reivindicações anexas.
REFERÊNCIAS [1] 3GPP TS 26.404 V6.0.0 (2004-09), Enhanced aacPlus general audio codec - encoder SBR part (Release 6), 2004 [2] J. D. Johnston, Estimation of Perceptual Entropy Using Noise Masking Criteria, Proc. ICASSP, pp. 2524-2527, Maio de 1988

Claims (17)

  1. REIVINDICAÇÕES
    1. Método para recuperação de espectro em decodificação espectral de um sinal de áudio, caracterizado pelo fato de compreender as etapas de:
    obtenção (210) de um conjunto inicial (42) de coeficientes espectrais, representando o referido sinal de áudio;
    determinação (212) de uma frequência de transição (ft);
    preenchimento de ruído (214) de furos espectrais no referido conjunto inicial (42) de coeficientes espectrais abaixo da referida frequência de transição (ft); e extensão de largura de banda (216) do referido conjunto inicial (42) de coeficientes espectrais acima da frequência de transição (ft);
    a frequência de transição (ft) sendo adaptado a um conteúdo espectral do referido sinal de áudio;
    a frequência de transição (ft) sendo adaptativamente dependente de uma distribuição de furos espectrais no referido conjunto inicial (42) de coeficientes espectrais.
  2. 2. Método de acordo com a reivindicação 1, caracterizado pelo fato de a referida etapa de determinação da referida freqüência de transição (ft), por sua vez, compreender as etapas de:
    divisão dos coeficientes espectrais do conjunto inicial (42) de coeficientes espectrais em uma pluralidade de bandas de frequência (74); e seleção da frequência de transição (ft) dependente de uma proporção de furos espectrais nas bandas de frequência (74).
  3. 3. Método de acordo com a reivindicação 2, caracterizado pelo fato de as referidas bandas de frequência (74) terem uma largura de frequência constante.
  4. 4. Método de acordo com a reivindicação 2, caracterizado pelo fato de pelo menos duas das referidas bandas de frequência (74) terem
    Petição 870190114564, de 08/11/2019, pág. 26/63
    2 / 5 larguras de frequência (ft) diferentes.
  5. 5. Método de acordo com qualquer uma das reivindicações de 2 a 4, caracterizado pelo fato de a etapa de seleção da frequência de transição (ft) compreender:
    encontrar uma banda de frequências de transição, sendo uma banda de frequência mais alta em que a proporção é menor do que um primeiro limite.
  6. 6. Método de acordo com a reivindicação 5, caracterizado pelo fato de a etapa de seleção da referida frequência de transição (ft) compreender adicionalmente:
    ajuste da referida frequência de transição (ft) dependente de um limite de frequência superior da banda de frequência de transição.
  7. 7. Método de acordo com a reivindicação 5 ou 6, caracterizado pelo fato de a referida etapa de ajuste da frequência de transição (ft) ainda ser dependente de uma frequência de transição usada previamente.
  8. 8. Método de acordo com a reivindicação 7, caracterizado pelo fato de a etapa de ajuste da referida frequência de transição (ft) ainda ser dependente de mais de uma frequência de transição previamente usada.
  9. 9. Método de acordo com a reivindicação 7 ou 8, caracterizado pelo fato de a referida frequência de transição (ft) ser proibida de mudar mais de uma quantidade absoluta ou relativa predeterminada entre dois quadros consecutivos.
  10. 10. Método para uso em codificação espectral de um sinal de áudio, caracterizado pelo fato de compreender:
    determinação (212) de uma frequência de transição (ft) para um conjunto inicial (24; 42) de coeficientes espectrais representando o referido sinal de áudio;
    a referida frequência de transição (ft) definindo uma borda entre uma faixa de frequência, destinada a ser um objeto para preenchimento
    Petição 870190114564, de 08/11/2019, pág. 27/63
    3 / 5 de ruído de furos espectrais e uma faixa de frequências destinada a ser um objeto para extensão de largura de banda;
    a frequência de transição (ft) sendo adaptada a um conteúdo espectral do referido sinal de áudio;
    a referida frequência de transição (ft) sendo adaptativamente dependente de uma distribuição de furos espectrais no referido conjunto inicial (42) de coeficientes espectrais.
  11. 11. Decodificador (40) para decodificação espectral de um sinal de áudio, caracterizado pelo fato de compreender:
    entrada para obtenção de um conjunto inicial (42) de coeficientes espectrais representando o referido sinal de áudio;
    conjunto de circuitos de determinação de transição (60) disposto para determinação de uma frequência de transição (ft);
    um preenchedor de ruído (50) para preenchimento de ruído de furos espectrais no referido conjunto inicial (42) de coeficientes espectrais abaixo da referida frequência de transição (ft); e um extensor de largura de banda (55) disposto para extensão de largura de banda do referido conjunto inicial (42) de coeficientes espectrais acima da referida frequência de transição (ft);
    a frequência de transição (ft) sendo adaptada a um conteúdo espectral do referido sinal de áudio;
    o conjunto de circuitos de determinação de transição (60) sendo disposto para determinar, adaptativamente, a frequência de transição (ft) dependente de uma distribuição de furos espectrais no conjunto inicial (42) de coeficientes espectrais.
  12. 12. Decodificador de acordo com a reivindicação 11, caracterizado pelo fato de o conjunto de circuitos de determinação de transição (60) ser disposto ainda para dividir os coeficientes espectrais do conjunto inicial de coeficientes espectrais em uma pluralidade de bandas de
    Petição 870190114564, de 08/11/2019, pág. 28/63
    4 / 5 frequências (74) e para selecionar a frequência de transição (ft) dependente de uma proporção de furos espectrais nas bandas de frequências (74).
  13. 13. Decodificador de acordo com a reivindicação 12, caracterizado pelo fato de as referidas bandas de frequências (74) terem uma largura de frequência constante.
  14. 14. Decodificador de acordo com a reivindicação 12, caracterizado pelo fato de pelo menos duas das bandas de frequências (74) terem larguras de frequências diferentes.
  15. 15. Decodificador de acordo com qualquer uma das reivindicações de 12 a 14, caracterizado pelo fato de o conjunto de circuitos de determinação de transição (60) ser ainda disposto para encontrar uma banda de frequências de transição, sendo uma banda de frequências mais altas em que a proporção é menor do que um primeiro limite.
  16. 16. Decodificador de acordo com a reivindicação 15, caracterizado pelo fato de o conjunto de circuitos de determinação de transição (6) ser ainda disposto para estabelecer a frequência de transição (ft) dependente de um limite de frequência superior da banda de frequências de transição.
  17. 17. Codificador (20) para codificação espectral de um sinal de áudio, caracterizado pelo fato de compreender:
    conjunto de circuitos de determinação de transição (60) disposto para determinação de uma frequência de transição (ft) para um conjunto inicial (24) de coeficientes espectrais, representando o sinal de áudio;
    a frequência de transição (ft) definindo uma borda entre uma faixa de frequências, destinada a ser um objeto para preenchimento de ruído de furos espectrais e uma faixa de frequências, destinada a ser um objeto para extensão de largura de banda;
    a frequência de transição (ft) sendo adaptada a um conteúdo
    Petição 870190114564, de 08/11/2019, pág. 29/63
    5 / 5 espectral do sinal de áudio;
    o conjunto de circuitos de determinação de transição (60) sendo disposto para determinar, adaptativamente, a frequência de transição (ft) dependente de uma distribuição de furos espectrais no conjunto inicial (42) de coeficientes espectrais.
BRPI0815972A 2007-08-27 2008-08-26 método para recuperação de espectro em decodificação espectral de um sinal de áudio, método para uso em codificação espectral de um sinal de áudio, decodificador, e, codificador BRPI0815972B1 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US96813407P 2007-08-27 2007-08-27
PCT/SE2008/050969 WO2009029037A1 (en) 2007-08-27 2008-08-26 Adaptive transition frequency between noise fill and bandwidth extension

Publications (3)

Publication Number Publication Date
BRPI0815972A2 BRPI0815972A2 (pt) 2015-09-29
BRPI0815972A8 BRPI0815972A8 (pt) 2017-11-14
BRPI0815972B1 true BRPI0815972B1 (pt) 2020-02-04

Family

ID=40387561

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0815972A BRPI0815972B1 (pt) 2007-08-27 2008-08-26 método para recuperação de espectro em decodificação espectral de um sinal de áudio, método para uso em codificação espectral de um sinal de áudio, decodificador, e, codificador

Country Status (11)

Country Link
US (5) US9269372B2 (pt)
EP (2) EP2186086B1 (pt)
JP (2) JP5183741B2 (pt)
CN (1) CN101939782B (pt)
BR (1) BRPI0815972B1 (pt)
DK (1) DK2571024T3 (pt)
ES (2) ES2526333T3 (pt)
MX (1) MX2010001394A (pt)
PL (1) PL2186086T3 (pt)
PT (1) PT2571024E (pt)
WO (1) WO2009029037A1 (pt)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0815972B1 (pt) 2007-08-27 2020-02-04 Ericsson Telefon Ab L M método para recuperação de espectro em decodificação espectral de um sinal de áudio, método para uso em codificação espectral de um sinal de áudio, decodificador, e, codificador
CA2698031C (en) * 2007-08-27 2016-10-18 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for noise filling
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
ES3032014T3 (en) 2008-07-11 2025-07-14 Fraunhofer Ges Forschung Audio decoder
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
CN102822890A (zh) * 2010-03-30 2012-12-12 松下电器产业株式会社 音响装置
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9391579B2 (en) * 2010-09-10 2016-07-12 Dts, Inc. Dynamic compensation of audio signals for improved perceived spectral imbalances
US9008811B2 (en) 2010-09-17 2015-04-14 Xiph.org Foundation Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012053150A1 (ja) * 2010-10-18 2012-04-26 パナソニック株式会社 音声符号化装置および音声復号化装置
WO2012122299A1 (en) 2011-03-07 2012-09-13 Xiph. Org. Bit allocation and partitioning in gain-shape vector quantization for audio coding
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
US9015042B2 (en) * 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
DE102011106033A1 (de) 2011-06-30 2013-01-03 Zte Corporation Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels
US9349380B2 (en) * 2011-06-30 2016-05-24 Samsung Electronics Co., Ltd. Apparatus and method for generating bandwidth extension signal
JP5416173B2 (ja) * 2011-07-07 2014-02-12 中興通訊股▲ふん▼有限公司 周波数帯コピー方法、装置及びオーディオ復号化方法、システム
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
CN106409299B (zh) * 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9881616B2 (en) * 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
EP2897127B1 (en) * 2012-09-13 2017-11-08 LG Electronics Inc. Frame loss recovering method, and audio decoding method and device using same
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
CN103971693B (zh) * 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
RU2631988C2 (ru) * 2013-01-29 2017-09-29 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Заполнение шумом при аудиокодировании с перцепционным преобразованием
CN103971694B (zh) 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
KR102243688B1 (ko) 2013-04-05 2021-04-27 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
CN116741188A (zh) 2013-04-05 2023-09-12 杜比国际公司 立体声音频编码器和解码器
EP2830064A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
KR101852749B1 (ko) * 2013-10-31 2018-06-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 주파수 도메인에서의 시간적인 사전-형상화된 잡음의 삽입에 의한 오디오 대역폭 확장
MX2016008172A (es) 2013-12-27 2016-10-21 Sony Corp Metodo y aparato de decodificacion, y programa.
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
MX385728B (es) * 2016-03-07 2025-03-18 Fraunhofer Ges Forschung Método de ocultamiento híbrido: combinación de ocultamiento de pérdida paquete de dominio de frecuencia y tiempo en códecs de audio.
RU2719008C1 (ru) 2016-04-12 2020-04-16 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодер для кодирования аудиосигнала, способ для кодирования аудиосигнала и компьютерная программа, учитывающие детектируемую спектральную область пиков в верхнем частотном диапазоне
WO2018170626A1 (zh) 2017-03-18 2018-09-27 华为技术有限公司 一种连接恢复方法、接入和移动性管理功能实体及用户设备
EP3382704A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
US12315529B2 (en) * 2021-09-22 2025-05-27 Boe Technology Group Co., Ltd. Audio compensation with sound effect characteristic curve to adjust abnormal frequency points
WO2024050673A1 (zh) * 2022-09-05 2024-03-14 北京小米移动软件有限公司 一种音频信号频带扩展方法、装置、设备及存储介质

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583961A (en) * 1993-03-25 1996-12-10 British Telecommunications Public Limited Company Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands
US5664057A (en) * 1993-07-07 1997-09-02 Picturetel Corporation Fixed bit rate speech encoder/decoder
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
JP2004522198A (ja) * 2001-05-08 2004-07-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化方法
US6493668B1 (en) * 2001-06-15 2002-12-10 Yigal Brandman Speech feature extraction system
AU2002318813B2 (en) * 2001-07-13 2004-04-29 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
WO2003042979A2 (en) * 2001-11-14 2003-05-22 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
US7469206B2 (en) * 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
GB2388502A (en) * 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
JP2004134900A (ja) * 2002-10-09 2004-04-30 Matsushita Electric Ind Co Ltd 符号化信号復号化装置および復号化方法
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
DE602004029786D1 (de) * 2003-06-30 2010-12-09 Koninkl Philips Electronics Nv Verbesserung der qualität von dekodierten audio mittels hinzufügen von geräusch
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
JP2006087018A (ja) * 2004-09-17 2006-03-30 Matsushita Electric Ind Co Ltd 音響処理装置
KR20070065401A (ko) * 2004-09-23 2007-06-22 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 데이터를 처리하는 시스템 및 방법, 프로그램구성요소, 및 컴퓨터-판독가능 매체
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
DE602006002381D1 (de) * 2006-04-24 2008-10-02 Nero Ag Erweiterte vorrichtung zur kodierung digitaler audiodaten
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
BRPI0815972B1 (pt) * 2007-08-27 2020-02-04 Ericsson Telefon Ab L M método para recuperação de espectro em decodificação espectral de um sinal de áudio, método para uso em codificação espectral de um sinal de áudio, decodificador, e, codificador
JP5140730B2 (ja) * 2007-08-27 2013-02-13 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成
ES2619277T3 (es) * 2007-08-27 2017-06-26 Telefonaktiebolaget Lm Ericsson (Publ) Detector de transitorio y método para soportar la codificación de una señal de audio
CA2698031C (en) * 2007-08-27 2016-10-18 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for noise filling
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof

Also Published As

Publication number Publication date
US20170301358A1 (en) 2017-10-19
US9711154B2 (en) 2017-07-18
US10199049B2 (en) 2019-02-05
ES2403410T3 (es) 2013-05-17
US20190122680A1 (en) 2019-04-25
WO2009029037A1 (en) 2009-03-05
EP2186086A1 (en) 2010-05-19
EP2571024B1 (en) 2014-10-22
JP5458189B2 (ja) 2014-04-02
EP2186086A4 (en) 2012-01-25
JP5183741B2 (ja) 2013-04-17
US9269372B2 (en) 2016-02-23
CN101939782A (zh) 2011-01-05
CN101939782B (zh) 2012-12-05
BRPI0815972A2 (pt) 2015-09-29
US11990147B2 (en) 2024-05-21
US10878829B2 (en) 2020-12-29
EP2571024A1 (en) 2013-03-20
PT2571024E (pt) 2014-12-23
JP2010538318A (ja) 2010-12-09
EP2186086B1 (en) 2013-01-23
US20160086614A1 (en) 2016-03-24
ES2526333T3 (es) 2015-01-09
JP2013117730A (ja) 2013-06-13
PL2186086T3 (pl) 2013-07-31
DK2571024T3 (en) 2015-01-05
US20210110836A1 (en) 2021-04-15
HK1143239A1 (en) 2010-12-24
BRPI0815972A8 (pt) 2017-11-14
MX2010001394A (es) 2010-03-10
US20110264454A1 (en) 2011-10-27

Similar Documents

Publication Publication Date Title
BRPI0815972B1 (pt) método para recuperação de espectro em decodificação espectral de um sinal de áudio, método para uso em codificação espectral de um sinal de áudio, decodificador, e, codificador
US7546240B2 (en) Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US8370133B2 (en) Method and device for noise filling
US8296159B2 (en) Apparatus and a method for calculating a number of spectral envelopes
TWI492223B (zh) 音訊編碼器、音訊解碼器、用以編碼及解碼音訊信號之方法、音訊串流與電腦程式
CN111477245B (zh) 语音信号解码装置和方法、语音信号编码装置和方法
EP2272063B1 (en) Method and apparatus for selective signal coding based on core encoder performance
RU2752127C2 (ru) Усовершенствованный квантователь
BR112013033900B1 (pt) Método para gerar um sinal estendido de largura de banda para decodificação de áudio
US20120069898A1 (en) Methods and systems for adaptive time-frequency resolution in digital data coding
CN101853664A (zh) 一种信号去噪的方法和装置及音频解码系统
JP2011525636A (ja) 改善されたオーディオ符号化のマルチモード方式
RU2823174C2 (ru) Усовершенствованный квантователь
CN107924683A (zh) 正弦编码和解码的方法和装置
BR112020009104A2 (pt) aparelho codificador, método para realizar filtragem de modelagem de ruído temporal e dispositivo de armazenamento não transitório

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 19/02 , G10L 21/02

Ipc: G10L 21/038 (2013.01), G10L 19/028 (2013.01), G10L

B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 04/02/2020, OBSERVADAS AS CONDICOES LEGAIS.