[go: up one dir, main page]

MX2012010854A - Procesamiento de señales de audio durante reconstruccion de alta frecuencia. - Google Patents

Procesamiento de señales de audio durante reconstruccion de alta frecuencia.

Info

Publication number
MX2012010854A
MX2012010854A MX2012010854A MX2012010854A MX2012010854A MX 2012010854 A MX2012010854 A MX 2012010854A MX 2012010854 A MX2012010854 A MX 2012010854A MX 2012010854 A MX2012010854 A MX 2012010854A MX 2012010854 A MX2012010854 A MX 2012010854A
Authority
MX
Mexico
Prior art keywords
high frequency
subband signals
frequency subband
low frequency
energy
Prior art date
Application number
MX2012010854A
Other languages
English (en)
Inventor
Kristofer Kjoerling
Original Assignee
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44514661&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=MX2012010854(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby Int Ab filed Critical Dolby Int Ab
Publication of MX2012010854A publication Critical patent/MX2012010854A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

La solicitud se refiere a reconstrucción/regeneración de alta frecuencia (HFR = High Frequency Reconstruction/Regeneration) de señales de audio. En particular, la solicitud se refiere a un método y sistema para realizar HFR de señales de audio que tienen grandes variaciones en nivel de energía a través del intervalo de baja frecuencia que se utiliza para reconstruir las altas frecuencias de la señal de audio. Se describe un sistema configurado para generar una pluralidad de señales de sub-banda de alta frecuencia que cubren un intervalo de alta frecuencia a partir de una pluralidad de señales de sub-banda de baja frecuencia. El sistema comprende medios para recibir la pluralidad de señales de sub-banda de baja frecuencia, medios para recibir un conjunto de energías objetivo o diana, la energía objetivo cubre un intervalo objetivo diferente dentro del intervalo de alta frecuencia y es indicativa de la energía deseada de una o más señales de sub-banda de alta frecuencia que se encuentran dentro del intervalo objetivo; medios para generar la pluralidad de señales de sub-banda de alta frecuencia a partir de la pluralidad de señales de sub - banda de baja frecuencia y de una pluralidad de coeficientes de ganancia espectral asociados con la pluralidad de señales de sub-banda de baja frecuencia respectivamente; y medios para ajustar la energía de la pluralidad de señales de sub-banda de alta frecuencia utilizando el conjunto de energías objetivo.

Description

PROCESAMIENTO DE SEÑALES DE AUDIO DURANTE RECONSTRUCCIÓN DE ALTA FRECUENCIA CAMPO TÉCNICO La solicitud se refiere a Regeneración/ Reconstrucción de Alta Frecuencia (HFR = High Frequency Reconstruction/Regeneration) de señales de audio. En particular, la solicitud se refiere a un método y sistema para realizar HFR de señales de audio que tienen grandes variaciones en niveles de energía a través del intervalo de baja frecuencia, que se utiliza para reconstruir las altas frecuencias de la señal de audio.
ANTECEDENTES DE LA INVENCIÓN Las tecnologías HFR, tales como la tecnología de Replicación de Banda Espectral (SBR = Spectral Band Replication) , permiten mejorar significativamente la eficiencia de codificación de codees de audio perceptuales tradicionales. En combinación con Codificación de Audio Avanzada (ACC = Advanced Audio Coding) MPEG-4, HFR forma un codee de audio muy eficiente, que ya está en uso en sistema de Radio Satelital XM y Digital Radio Mondiale, y también estandardizado dentro del foro 3GPP, Foro DVD y otros. La combinación de AAC y SBR se denomina aacPlus. Es parte de la norma MPEG-4 en donde se refiere como Perfil AAC de Alta Eficiencia (HE-AAC = High Efficiency AAC Profile) . En general, la tecnología de HFR puede combinarse con cualquier codee de audio perceptual en una forma compatible en ambos sentidos, de esta manera ofreciendo la posibilidad en mejorar los sistemas de difusión ya establecidos como MPEG Capa-2 utilizados en el sistema Eureka DAB. Los métodos HFR también pueden combinarse con codees de habla para permitir habla de banda amplia a velocidades de bits ultra bajas.
La idea básica tras HFR es la observación que usualmente una fuerte correlación entre las características del intervalo de alta frecuencia de una señal y las características del intervalo de baja frecuencia de la misma señal están presentes. De esta manera, una buena aproximación para la representación del intervalo de alta frecuencia de alimentación original de una señal, puede lograrse por una transposición de señal desde el intervalo de baja frecuencia al intervalo de alta frecuencia.
Este concepto de transposición se estableció en WO 98/57436 que se incorpora por "referencia, como un método para recrear una banda de alta frecuencia a partir de una banda de menor frecuencia de una señal de audio. Un ahorro substancial en velocidad de bits, puede obtenerse al utilizar este concepto en codificación de audio y/o codificación de habla. A continuación, se hará referencia a codificación de audio, pero habrá de notarse que los métodos y sistemas descritos son igualmente aplicables a codificación de habla y codificación de audio y habla unificada (USAC = Unified Speech and Audio Coding) .
Reconstrucción de Alta Frecuencia puede realizarse en el dominio de tiempo o en el dominio de frecuencia, utilizando un banco de filtros o transformación de selección. El proceso usualmente involucra varias etapas, en donde las dos operaciones principales son primero crear una señal de excitación de alta frecuencia y subsecuentemente conformar la señal de excitación de alta frecuencia para aproximarse a la envolvente espectral del espectro de alta frecuencia original. La etapa de crear una señal de excitación de alta frecuencia puede por ejemplo basarse en modulación de banda lateral única (SSB = single sideband) en donde una sinusoide con frecuencia ?, se cartografía a una sinusoide con frecuencia ? + ?? en donde Am es un desplazamiento de frecuencia fijo. En otras palabras, la señal de alta frecuencia puede ser generada a partir de la señal de baja frecuencia por una operación de "copiado" de sub-bandas de baja frecuencia a sub-bandas de alta frecuencia. Un enfoque adicional a crear una señal de excitación de alta frecuencia puede involucrar transposición harmónica de sub-bandas de baja frecuencia. La transposición harmónica del orden T se diseña típicamente para cartografiar una sinusoide con frecuencia ? de la señal de baja frecuencia a una sinusoide con frecuencia ??, con G > 1, de la señal de alta frecuencia.
La tecnología HFR puede emplearse como parte de los sistemas de codificación fuente, en donde información de control surtida o variada para guiar el proceso HFR, se transmite desde un codificador a un descodificador junto con una representación de la señal de banda estrecha / baja frecuencia. Para sistemas en donde no puede transmitirse señal de control adicional, el proceso puede aplicarse en el lado de descodificador con datos de control convenientes estimados a partir de la información disponible en el lado del descodificador .
El ajuste de envolvente anteriormente mencionado de la señal de excitación de alta frecuencia se dirige a lograr una forma espectral que semeja la forma espectral de la banda alta original. A fin de hacerlo, la forma espectral de la señal de alta frecuencia debe ser modificada. Dicho en forma diferente, el ajuste que se aplica a la banda alta es una función de la envolvente espectral existente y la envolvente espectral objetivo pesada.
Para sistemas que operan en el dominio de frecuencia, por ejemplos sistemas HFR implementados en un banco de filtros pseudo-QMF, métodos de la técnica previa son sub óptimos en este extremo, ya que la creación de la señal de banda alta, mediante la combinación de varias contribuciones desde el intervalo de frecuencia fuente, introduce una envolvente espectral artificial en la banda alta para ser ajustada en envolvente. En otras palabras, la señal de alta frecuencia o banda alta generada de la señal de baja frecuencia durante el proceso HFR, típicamente exhibe una envolvente espectral artificial (que típicamente comprende discontinuidades espectrales) . Esto presenta dificultades para el ajustador de envolvente espectral, ya que el ajustador no solo debe tener la habilidad de aplicar la envolvente espectral deseada con el tiempo adecuado y la resolución de frecuencia, pero el ajustador también debe ser capaz de deshacer las características espectrales introducidas artificialmente por el generador de señal HFR. Esto presenta difíciles restricciones de diseño en el ajustador de envolvente. Como resultado, estas dificultades tienden a llevar a una pérdida percibida de energía de alta frecuencia, y discontinuidades audibles en la forma espectral en la señal de banda alta, particularmente para señales de tipo habla. En otras palabras, generadores de señales HFR convencionales tienden a introducir discontinuidades y variaciones de nivel en la señal de banda alta para señales que tienen grandes variaciones en nivel sobre el intervalo de banda baja, por ejemplo sibilantes. Cuando subsecuentemente el ajustador de envolvente se expone a esta señal de banda alta, el ajustador de envolvente no puede en forma razonable y consistente separar la discontinuidad recientemente introducida de cualquier característica espectral natural de la señal de banda baja.
El presente documento resume una solución del problema anteriormente mencionado, que resulta en una calidad de audio percibida incrementada. En particular, el presente documento describe una solución al problema de generar una señal de banda alta a partir de una señal de banda baja, en donde la envolvente espectral de la señal de banda alta se ajusta en forma efectiva para semejar envolvente espectral original en la banda alta sin introducir artefactos indeseables .
COMPENDIO DE LA INVENCIÓN El presente documento propone una etapa de corrección adicional como parte de la generación de señal de reconstrucción de alta frecuencia. Como resultado de la etapa de corrección adicional, la calidad de audio del componente de alta frecuencia o la señal de banda alta, se mejora. La etapa de corrección adicional puede aplicarse a todos los sistemas de codificación fuente que utilizan técnicas de reconstrucción de alta frecuencia, asi como a cualquier método o sistema de posterior procesamiento de un solo extremo que se dirige a volver a crear altas frecuencias de una señal de audio.
De acuerdo con un aspecto, se describe un sistema configurado para generar una pluralidad de señales de sub-banda de alta frecuencia que cubren un intervalo de alta frecuencia. El sistema puede ser configurado para generar la pluralidad de señales de sub-banda de alta frecuencia a partir de una pluralidad de señales de sub-banda de baja frecuencia. La pluralidad de señales de sub-banda de baja frecuencia pueden ser señales de sub-banda de una señal de audio de banda baja o banda estrecha, que puede ser determinado utilizando una transformada o banco de filtro de análisis. En particular, la pluralidad de señales de sub-banda de baja frecuencia puede determinarse a partir de una señal de dominio-tiempo de banda baja utilizando un banco de filtros de análisis de filtro espejo en cuadratura (QMF = Quadrature Mirror Filter) o una Transformada Fourier Rápida (FFT = Fast Fourier Transform) . La pluralidad de señales de sub-banda de alta frecuencia generada puede corresponder a una aproximación de las señales de sub-banda de alta frecuencia de una señal de audio original a partir de la cual la pluralidad de señales de sub-banda de baja frecuencia se ha derivado. En particular, la pluralidad de señales de sub-banda de baja frecuencia y la pluralidad de señales de sub-banda de alta frecuencia (re-) generadas pueden corresponder a las sub-bandas de un banco de filtros QMF y/o una transformada FFT.
El sistema puede comprender medios para recibir la pluralidad de señales de sub-banda de baja frecuencia. Como tal, el sistema puede colocarse corriente abajo del banco de filtros de análisis o transformación que genera la pluralidad de señales de sub-banda de baja frecuencia a partir de una señal de banda baja. La señal de banda baja puede ser una señal de audio que se ha descodificado en un descodificador núcleo desde una corriente de bits recibida. La corriente de bits puede almacenarse en un medio de almacenamiento, por ejemplo un disco compacto o un DVD, o la corriente de bits puede ser recibida en el descodificador sobre un medio de transmisión, por ejemplo un medio de transmisión de radio u óptico.
El sistema puede comprender medios para recibir un conjunto de energías objetivo, que también puede ser referido como energías de factor de escala. Cada energía objetivo puede cubrir un intervalo objetivo diferente, que también puede ser referido como una banda de factor de escala, dentro del intervalo de alta frecuencia. Típicamente, el conjunto de intervalos objetivo que corresponde al conjunto de energías objetivo, cubre el intervalo de alta frecuencia completo. Una energía objetivo del juego de energías objetivo usualmente es indicativa de la energía deseada de una o más señales de sub-banda de alta frecuencia dispuestas dentro del intervalo objetivo correspondiente. En particular, la energía objetivo puede corresponder a la energía deseada promedio de la una o más señales de sub-banda de alta frecuencia que se encuentran dentro del intervalo objetivo correspondiente. La energía objetivo de un intervalo objetivo típicamente se deriva de la energía de la señal de banda alta de la señal de audio original dentro del intervalo objetivo. En otras palabras, el conjunto de energías objetivo típicamente describe la envolvente espectral de la porción de banda alta de la señal de audio original .
El sistema puede comprender medios para generar la pluralidad de señales de sub-banda de alta frecuencia a partir de la pluralidad de señales de sub-banda de baja frecuencia. Para este propósito, los medios para generar la pluralidad de señales de sub-banda de alta frecuencia pueden ser configurados para realizar una transposición de copia de la pluralidad de señales de sub-banda de baja frecuencia y/o realizar una transposición harmónica de la pluralidad de señales de sub-banda de baja frecuencia.
Además, los medios para generar la pluralidad de señales de sub-banda de alta frecuencia pueden tomar en cuenta una pluralidad de coeficientes de ganancia espectral durante el proceso de generación de la pluralidad de señales de sub-banda de alta frecuencia. La pluralidad de coeficientes de ganancia espectral puede estar asociada con la pluralidad de señales de sub-banda de baja frecuencia, respectivamente. En otras palabras, cada señal de sub-banda de baja frecuencia de la pluralidad de señales de sub-banda de baja frecuencia puede tener un coeficiente de ganancia espectral correspondiente a partir de la pluralidad de coeficientes de ganancia espectral. Un coeficiente de ganancia espectral de la pluralidad de coeficientes de ganancia espectral puede aplicarse a la señal de sub-banda de baja frecuencia correspondiente.
La pluralidad de coeficientes de ganancia espectral puede asociarse con la energía de la pluralidad respectiva de señales de sub-banda de baja frecuencia. En particular, cada coeficiente de ganancia espectral puede ser asociado con la energía de su señal de sub-banda de baja frecuencia correspondiente. En una modalidad, un coeficiente de ganancia espectral se determina, con base en la energía de la señal de sub-banda de baja frecuencia correspondiente. Para este propósito, una curva dependiente de frecuencia puede ser determinada con base en la pluralidad de valores de energía de la pluralidad de señales de sub-banda de baja frecuencia. En este caso, un método para determinar la pluralidad de coeficientes de ganancia puede basarse en la curva de dependencia de frecuencia que se determina a partir de una representación (por ejemplo logarítmica) de las energías de la pluralidad de señales de sub-banda de baja frecuencia.
En otras palabras, la pluralidad de coeficientes de ganancia espectral puede derivarse de una curva dependiente de frecuencia ajustada a la energía de la pluralidad de señales de sub-banda de baja frecuencia. En particular, la curva dependiente de frecuencia puede ser un polinomio de un grado/orden previamente determinado. En forma alterna o además, la curva dependiente de frecuencia puede comprender diferentes segmentos de curva, en donde los segmentos de curva diferentes se adaptan a la energía de la pluralidad de señales de sub-banda de baja frecuencia a diferentes intervalos de frecuencia. Los diferentes segmentos de curva pueden ser diferentes polinomios de un orden predeterminado. En una modalidad, los segmentos diferentes de curva son polinomios de orden cero tal que los segmentos de curva representan los valores de energía promedio de la energía de la pluralidad de señales de sub-banda de baja frecuencia dentro del intervalo de frecuencia correspondiente. En una modalidad adicional, la curva dependiente de frecuencia se adapta a la energía de la pluralidad de señales de sub-banda de baja frecuencia, al realizar una operación de filtrado promedio en movimiento sobre los diferentes intervalos de frecuencia .
En una modalidad, un coeficiente de ganancia de la pluralidad de coeficientes de ganancia se deriva de la diferencia de la energía promedio de la pluralidad de señales de sub-banda de baja frecuencia y de un valor correspondiente de la curva dependiente de frecuencia. El valor correspondiente de la curva dependiente de frecuencia puede ser un valor de la curva a una frecuencia que se encuentra dentro del intervalo de frecuencia de la señal de sub-banda de baja frecuencia a la cual corresponde el coeficiente de ganancia .
Típicamente, la energía de la pluralidad de señales de sub-banda de baja frecuencia se determina en una cierta cuadrícula de tiempo, por ejemplo en una base cuadro por cuadro, es decir la energía de una señal de sub-banda de baja frecuencia dentro de un intervalo de tiempo definido por la cuadrícula de tiempo corresponde a la energía promedio de las muestras de la señal de sub-banda de baja frecuencia dentro del intervalo de tiempo, por ejemplo dentro de un cuadro. Como tal, una pluralidad diferente de coeficientes de ganancia espectral puede determinarse en la cuadrícula de tiempo selecta, por ejemplo una pluralidad diferente de coeficientes de ganancia espectral puede determinarse por cada cuadro de la señal de audio. En una modalidad, la pluralidad de coeficientes de ganancia espectral puede determinarse en una base muestra por muestra, por ejemplo al determinar la energía de la pluralidad de sub-bandas de baja frecuencia utilizando una ventana flotante a través de las muestras de cada señal de sub-banda de baja frecuencia. Habrá de notarse que el sistema puede comprender medios para determinar la pluralidad de coeficientes de ganancia espectral a partir de una pluralidad de señales de sub-banda de baja frecuencia. Estos medios pueden ser configurados para realizar o desempeñar los métodos anteriormente mencionados para determinar la pluralidad de coeficientes de ganancia espectral .
Los medios para generar la pluralidad de señales de sub-banda de alta frecuencia pueden configurarse para amplificar la pluralidad de señales de sub-banda de baja frecuencia utilizando la pluralidad respectiva de coeficientes de ganancia espectral. Aun cuando se hace referencia a "amplificar" o "amplificación" a continuación, la operación de "amplificación" puede reemplazarse por otras operaciones tales como una operación de "multiplicación", una operación de "reajuste de escala" o una operación de "ajuste". La amplificación puede realizarse al multiplicar una muestra de una señal de sub-banda de baja frecuencia con un coeficiente de ganancia espectral correspondiente. En particular, los medios para generar la pluralidad de señales de sub-banda de alta frecuencia pueden configurarse para determinar una muestra de una señal de sub-banda de alta frecuencia en un instante de tiempo determinado, a partir de muestras de una señal de sub-banda de baja frecuencia en el instante de tiempo determinado y en al menos un instante de tiempo precedente. Además, las muestras de la señal de sub-banda de baja frecuencia pueden ser amplificadas por el coeficiente de ganancia espectral respectivo de la pluralidad de coeficientes de ganancia espectral. En una modalidad, los medios para generar la pluralidad de señales de sub-banda de alta frecuencia se configuran para generar la pluralidad de señales de sub-banda de alta frecuencia a partir de la pluralidad de señales de sub-banda de baja frecuencia, de acuerdo con el algoritmo de "copiado" especificado en MPEG-4 SBR. La pluralidad de señales de sub-banda de baja frecuencia empleados en este algoritmo de "copiado" se ha amplificado utilizando la pluralidad de coeficientes de ganancia espectral en donde la operación de "amplificación" puede haber sido realizada como se estableció anteriormente.
El sistema puede comprender medios para ajustar la energía de la pluralidad de señales de sub-banda de alta frecuencia utilizando el conjunto de energías diana u objetivo. Esta operación típicamente es referida como un ajuste de envolvente espectral. El ajuste de envolvente espectral puede realizarse al ajustar la energía de la pluralidad de señales de sub-banda de alta frecuencia tal que la energía promedio de la pluralidad de señales de sub-banda de alta frecuencia se encuentra dentro de un intervalo objetivo, corresponde con la energía objetivo respectiva. Esto puede lograrse al determinar un valor de ajuste envolvente a partir de los valores de energía de la pluralidad de señales de sub-banda de alta frecuencia que se encuentran dentro de un intervalo objetivo y la energía objetivo correspondiente. En particular, el valor de ajuste de envolvente puede ser determinado a partir de una proporción de la energía objetivo y los valores de energía de la pluralidad de señales de sub-banda de alta frecuencia que se encuentran dentro de un intervalo objetivo correspondiente. Éste valor de ajuste de envolvente puede emplearse para ajustar la energía de la pluralidad de señales de sub-banda de alta frecuencia.
En una modalidad, los medios para ajustar la energía comprenden medios para limitar el ajuste de la energía de las señales de sub-banda de alta frecuencia que se encuentran dentro de un intervalo limitador. Típicamente, el intervalo limitador cubre más de un intervalo objetivo. Los medios para limitar usualmente se emplean para evitar una amplificación de interferencia o ruido indeseable dentro de ciertas señales de sub-banda de alta frecuencia. Por ejemplo, los medios para limitar pueden ser configurados para determinar un valor de ajuste de envolvente promedio de los valores de ajuste de envolvente que corresponden a los intervalos objetivo cubiertos por o que se encuentran dentro del intervalo limitador. Aún más, los medios para limitar pueden configurarse para limitar el ajuste de la energía de las señales de sub-banda de alta frecuencia que se encuentran dentro del intervalo limitador a un valor que es proporcional al valor de ajuste de envolvente promedio.
En forma alterna o además, los medios para ajuste de la energía de la pluralidad de señales de sub-banda de alta frecuencia pueden comprender medios para asegurar que las señales de sub-banda de alta frecuencia ajustadas que se encuentran dentro del intervalo objetivo particular tengan la misma energía. Éstos últimos medios son a menudo referidos como medios de "interpolación". En otras palabras, los medios de "interpolación" aseguran que la energía de cada una de las señales de sub-banda de alta frecuencia que se encuentran dentro del intervalo objetivo particular corresponden a la energía objetivo. Los medios de "interpolación" pueden ser implementados al ajustar cada señal de sub-banda de alta frecuencia dentro del intervalo objetivo particular separadamente de manera tal que la energía de la señal de sub -banda de alta frecuencia ajustada corresponda con la energía objetivo asociada con el intervalo objetivo particular. Esto puede ser logrado al determinar un valor de ajuste de envolvente diferente por cada señal de sub-banda de alta frecuencia dentro del intervalo objetivo particular. Un valor de ajuste de envolvente diferente puede ser determinado con base en la energía de la señal de sub-banda de alta frecuencia particular y la energía objetivo correspondiente al intervalo objetivo particular. En una modalidad, el valor de ajuste de envolvente para una señal de sub-banda de alta frecuencia particular se determina con base en la proporción de la energía objetivo y la energía de la señal de sub-banda de alta frecuencia particular.
El sistema además puede comprender medios para recibir datos de control. Los datos de control pueden ser indicativos de si se aplica la pluralidad de coeficientes de ganancia espectral para generar la pluralidad de señales de sub-banda de alta frecuencia. En otras palabras, los datos de control pueden ser indicativos de si el ajuste de ganancia adicional de las señales de sub-banda de baja frecuencia se va a realizar o no. En forma alterna o además, los datos de control pueden ser indicativos de un método que se utiliza para determinar la pluralidad de coeficientes de ganancia espectral. A manera de ejemplo, los datos de control pueden ser indicativos del orden predeterminado del polinomio que se va utilizar para determinar la curva dependiente de frecuencia adaptada o ajustada a las energías de la pluralidad de las señales de sub-banda de baja frecuencia. Los datos de control típicamente se reciben de un codificador correspondiente que analiza la señal de audio original e informa al descodificador correspondiente o sistema HFR de como descodificar la corriente de bits.
De acuerdo con otro aspecto, se describe un descodificador de audio configurado para descodificar una corriente de bits que comprende una señal de audio de baja frecuencia que comprende un conjunto de energías objetivo que describe la envolvente espectral de una señal de audio de alta frecuencia. En otras palabras, se describe un descodificador de audio configurado para descodificar una corriente de bits representativa de una señal de audio de baja frecuencia y representativa de un conjunto de energías objetivo que describen la envolvente espectral de una señal de audio de alta frecuencia. El descodificador de audio puede comprender un descodificador núcleo y/o unidad de transformación, configurada para determinar una pluralidad de señales de sub-banda de baja frecuencia asociadas con la señal de audio de baja frecuencia de la corriente de bits. En forma alterna o además, el descodificador de audio puede comprender una unidad de generación de alta frecuencia de acuerdo con el sistema establecido en el presente documento, en donde el sistema puede ser configurado para determinar una pluralidad de señales de sub-banda de alta frecuencia de la pluralidad de señales de sub-banda de baja frecuencia y el conjunto de energías objetivo. En forma alterna o además, el descodificador puede comprender una fusión y/o unidad de transformación inversa configurada para generar una señal de audio de la pluralidad de señales de sub-banda de baja frecuencia y la pluralidad de señales de sub-banda de alta frecuencia. La unidad de transformación inversa y fusión puede comprender un banco de filtros de síntesis o transformada, por ejemplo banco de filtros QMF inverso o FFT inversa.
De acuerdo con un aspecto adicional, se describe un codificador configurado para generar datos de control de una señal de audio. El codificador de audio puede comprender medios para analizar la forma espectral de la señal de audio y determinar un grado de discontinuidades de envolvente espectral introducidas cuando se regenera un componente de alta frecuencia de la señal de audio a partir de un componente de baja frecuencia de la señal de audio. Como tal, el codificador puede comprender ciertos elementos de un descodificador correspondiente. En particular, el codificador puede comprender un sistema HFR como se establece en el presente documento. Esto permitirá que el codificador determine el grado de discontinuidades en la envolvente espectral que puede introducirse al componente de alta frecuencia de la señal de audio en el lado del descodificador . En forma alterna o además, el codificador puede comprender medios para generar datos de control para controlar la regeneración del componente de alta frecuencia con base en el grado de discontinuidades. En particular, los datos de control pueden corresponder a los datos de control que se reciben por el descodificador correspondiente o el sistema HFR. Los datos de control pueden ser indicativos de si se utiliza la pluralidad de coeficientes de ganancia espectral durante el proceso HFR y/o que orden polinomial predeterminado utilizar a fin de determinar la pluralidad de coeficientes de ganancia espectral. A fin de determinar esta información, puede determinarse una proporción de las partes selectas del intervalo de baja frecuencia, es decir el intervalo de frecuencia cubierto por la pluralidad de señales de sub-banda de baja frecuencia. Esta información de proporción puede determinarse por ejemplo al estudiar las más bajas frecuencias de la baja banda, y las más altas frecuencias de la baja banda para estimar la variación espectral de la señal de baja banda que en el codificador subsecuentemente se utilizarán para reconstrucción de alta frecuencia. Una alta proporción puede indicar un grado de discontinuidad incrementado. Los datos de control también pueden ser determinados utilizando detectores de tipo señal. A manera de ejemplo, la detección de las señales de habla puede indicar un grado de discontinuidad incrementado. Por otra parte, la detección de sinusoides prominentes en la señal de audio original puede llevar a datos de control que indican que la pluralidad de coeficientes de ganancia espectral no deberá ser utilizada durante el proceso HFR.
De acuerdo con otro aspecto, se describe un método para generar una pluralidad de señales de sub-banda de alta frecuencia que cubre un intervalo de alta frecuencia a partir de una pluralidad de señales de sub-banda de baja frecuencia. El método puede comprender las etapas de recibir la pluralidad de señales de sub-banda de baja frecuencia y/o recibir un conjunto de energías objetivo. Cada energía objetivo puede cubrir un intervalo objetivo diferente dentro del intervalo de alta frecuencia. Además, cada energía objetivo puede ser indicativa de la energía deseada de una o más señales de sub-banda de alta frecuencia que se encuentran dentro del intervalo objetivo. El método puede comprender la etapa de generar la pluralidad de señales de sub-banda de alta frecuencia a partir de la pluralidad de señales de sub-banda de baja frecuencia y de una pluralidad de coeficientes de ganancia espectral asociados con la pluralidad de señales de sub-banda de baja frecuencia, respectivamente. En forma alterna o además, el método puede comprender la etapa de ajusfar la energía de la pluralidad de señales de sub-banda de alta frecuencia utilizando el conjunto de energías objetivo. La etapa de ajusfar la energía puede comprender la etapa de limitar el ajuste de la energía de las señales de sub-banda de alta frecuencia que se encuentran dentro del intervalo limitador. Típicamente, el intervalo limitador cubre más de un intervalo objetivo.
De acuerdo con un aspecto adicional, se describe un método para descodificar una corriente de bits representativa de o que comprende una señal de audio de baja frecuencia y un conjunto de energías objetivo que describe la envolvente espectral de una señal de audio de alta frecuencia correspondiente. Típicamente, las señales de audio de baja frecuencia y alta frecuencia corresponden a un componente de baja frecuencia y alta frecuencia de la misma señal de audio original. El método puede comprender la etapa de determinar una pluralidad de señales de sub-banda de baja frecuencia asociadas con la señal de audio de baja frecuencia de la corriente de bits. En forma alterna o además, el método puede comprender la etapa de determinar una pluralidad de señales de sub-banda de alta frecuencia a partir de la pluralidad de señales de sub-banda de baja frecuencia y el conjunto de energías objetivo. Esta etapa típicamente se realiza de acuerdo con los métodos HFR establecidos en el presente documento. Subsecuentemente, el método puede comprender la etapa de generar una señal de audio a partir de la pluralidad de señales de sub-banda de baja frecuencia y la pluralidad de señales de sub-banda de alta frecuencia.
De acuerdo con otro aspecto, se describe un método para generar datos de control a partir de una señal de audio. El método puede comprender la etapa de analizar la forma espectral de la señal de audio a- fin de determinar un grado de discontinuidades introducidas cuando se vuelve a generar un componente de alta frecuencia de la señal de audio a partir de un componente de baja frecuencia de la señal de audio. Además, el método puede comprender la etapa de generar datos de control para controlar la regeneración del componente de alta frecuencia con base en el grado de discontinuidades .
De acuerdo con un aspecto adicional, se describe un programa o soporte lógico. El programa o soporte lógico puede ser adaptado para ejecución en un procesador y para realizar las etapas de método establecidas en el presente documento, cuando se lleva a cabo en un dispositivo de cómputo.
De acuerdo con otro aspecto, se describe un medio de almacenamiento. El medio de almacenamiento puede comprender un programa de soporte lógico adaptado para ejecutar en un procesador y para realizar las etapas de método establecidas en el presente documento cuando se llevan a cabo en un dispositivo de cómputo.
De acuerdo con un aspecto adicional, se describe un producto de programa de computadora. El programa de computadora puede comprender instrucciones ejecutables para realizar las etapas de método establecidas en el presente documento cuando se ejecutan en una computadora.
Habrá de notarse gue los métodos y sistemas que incluyen sus modalidades preferidas como se establece en la presente solicitud de patente, pueden emplearse autónomos o en combinación con los otros métodos y sistemas descritos en este documento. Además, todos los aspectos de los métodos y sistemas establecidos en la presente solicitud de patente pueden combinarse en forma arbitraria. En particular, las características de las reivindicaciones pueden combinarse entre si en una forma arbitraria.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La invención se explica a continuación mediante ejemplos ilustrativos con referencia a los dibujos acompañantes, en donde La Figura la ilustra el espectro absoluto de una señal de banda alta ejemplar antes del ajuste de envolvente espectral ; La Figura Ib ilustra una relación ejemplar entre cuadros de tiempo de datos de audio y bordes de tiempo envolvente en las envolvente espectrales; La Figura le ilustra el espectro absoluto de una señal de banda alta ejemplar antes de ajuste de envolvente espectral y las bandas de factor de escala correspondientes, bandas limitadoras y parches de alta frecuencia (HF = High Freguency) ; La Figura 2 ilustra una modalidad de un sistema HFR en donde el proceso de copiado se complementa con una etapa de ajuste de ganancia adicional; La Figura 3 ilustra una aproximación de la envolvente espectral tosca o burda de una señal de banda baja ej emplar; La Figura 4 ilustra una modalidad de un ajustador de ganancia adicional que opera en datos de control opcionales, las muestras de sub-bandas QMF y enviar de salida una curva de ganancia; La Figura 5 ilustra una modalidad más detallada del ajustador de ganancia adicional de la Figura 4; La Figura 6 ilustra una modalidad de un sistema HFR con una señal de banda estrecha como alimentación y una señal de banda amplia como salida; La Figura 7 ilustra una modalidad de un sistema HFR incorporado en el módulo SBR de un descodificador de audio; La Figura 8 ilustra una modalidad del módulo de reconstrucción de alta frecuencia de un descodificador de audio ejemplar; La Figura 9 ilustra una modalidad de un codificador ejemplar; La Figura 10a ilustra el espectrograma de un segmento vocal ejemplar que se ha descodificado utilizando un descodificador convencional; La Figura 10b ilustra el espectrograma del segmento vocal de la Figura 10a, que se ha descodificado utilizando un descodificador aplicando el procesamiento de ajuste de ganancia adicional; y La Figura 10c ilustra el espectrograma del segmento vocal de la Figura 10a para la señal no codificada original.
DESCRIPCIÓN DE MODALIDADES PREFERIDAS Las modalidades descritas a continuación son solamente ilustrativas de los principios de la presente invención "PROCESAMIENTO DE SEÑALES DE AUDIO DURANTE RECONSTRUCCIÓN DE ALTA FRECUENCIA". Se entiende que modificaciones y variaciones de los arreglos y detalles aquí descritos, serán aparentes para otros con destreza en la especialidad. Es la intención por lo tanto estar limitado sólo por el alcance de las reivindicaciones de patente pendientes y no por los detalles específicos presentados a manera de descripción y explicación de las presentes modalidades .
Como se estableció anteriormente, descodificadores de audio utilizando técnicas HFR típicamente comprenden una unidad HFR para generar una señal de audio de alta frecuencia y una unidad de ajuste de envolvente espectral subsecuente, para ajustar la envolvente espectral de la señal de audio de alta frecuencia. Cuando se ajusta la envolvente espectral de la señal de audio, esto se realiza típicamente mediante una implementacion de banco de filtros, o mediante un filtrado de dominio de tiempo. El ajuste ya puede esforzarse por hacer una corrección de la envolvente espectral absoluta o puede realizarse mediante filtrado que también corrige las características de fase. De cualquier forma, el ajuste típicamente es una combinación de dos etapas, la eliminación de la envolvente espectral actual y la aplicación de la envolvente espectral objetivo.
Es importante notar que los métodos y sistemas establecidos en el presente documento no están solamente dirigidos a la eliminación de la envolvente espectral de la señal de audio. Los métodos y sistemas se esfuerzan por hacer una corrección espectral conveniente de la envolvente espectral de la señal de banda baja como parte de la etapa de regeneración de alta frecuencia, a fin de no introducir discontinuidades de envolvente espectral del espectro de alta frecuencia creadas al combinar diferentes segmentos de la banda baja, es decir la señal de baja frecuencia, desplazados o transpuestos a intervalos de frecuencia diferentes de la banda alta, es decir la señal de alta frecuencia.
En la Figura la, se exhibe un espectro de dibujo estilizado 100, 110 de la salida de una unidad HFR antes de pasar al ajustador de envolvente. En el panel superior, un método de copiado (con dos parches) se emplea para generar una señal de banda alta 105 de la señal de banda baja 101, por ejemplo el método de copiado utilizado en la replicación de banda espectral MPEG-4 (SBR = Spectral Band Replication) que se establece en "ISO/IEC 14496-3 Information Technology -Coding of audio-visual objects -Part 3: Audio" y que se incorpora aquí por referencia. El método de copiado traduce partes de las frecuencias menores 101 a frecuencias superiores 105. En el panel inferior, un método de transposición armónica (con dos parches) se utiliza para generar la señal de banda alta 115 de la señal de banda baja 111, por ejemplo el método de transposición armónica de MPEG-D USAC que se describe en "MPEG-D USAC: ISO/IEC 23003-3 -Unified Speech and Audio Coding" y que se incorpora aquí por referencia .
En la etapa de ajuste de envolvente subsecuente, se aplica una envolvente espectral objetivo sobre los componentes de alta frecuencia 105, 115. Como puede verse del espectro 105, 115 que va al ajustador de envolvente, pueden observarse discontinuidades (en forma notable en los bordes del parche) en la forma espectral de la señal de excitación de banda alta 105, 115, es decir de la señal de banda alta que entra al ajustador de envolvente. Estas discontinuidades se originan del hecho de que varias contribuciones de las bajas frecuencias 101, 111 se emplean a fin de generar la banda alta 105, 115. Como puede verse, la forma espectral de la señal de banda alta 105, 115 se relaciona a la forma espectral de la señal de banda baja 101, 111. Consecuentemente, formas espectrales particulares de la señal de banda baja 101, 111, por ejemplo una forma de gradiente ilustrada en la Figura la pueden llevar a discontinuidades en el espectro total 100, 110.
Además del espectro 100, 110, la Figura la ilustra bandas de frecuencia ejemplares 130 de los datos de envolvente espectral que representan la envolvente espectral objetivo. Estas bandas de frecuencia 130 son referidas como bandas de factor de escala o intervalos objetivo. Típicamente, un valor de energía objetivo, es decir una energía de factor de escala se especifica por cada intervalo objetivo, es decir banda de factor escala. En otras palabras, las bandas de factor de escala definen la resolución de frecuencia efectiva de la envolvente espectral objetivo ya que típicamente sólo hay un valor de energía objetivo individual o sencillo por intervalo objetivo. Utilizando los factores de escala o energías objetivo especificados para las bandas de factor escala, el ajustador de envolvente subsecuente se esfuerza para ajusfar la señal de banda alta de manera tal que la energía de la señal de banda alta dentro de las bandas de factor de escala es igual a la energía de los datos de envolvente espectral recibidos, es decir la energía objetivo para las . bandas de factor de escala respectivas .
En la Figura le, se proporciona una descripción más detallada utilizando una señal de audio ejemplar. En el trazo del espectro de una señal de audio del mundo real 121 que va al ajustador envolvente se ilustra, así como la señal original correspondiente 120. En este ejemplo particular, el intervalo SBR, es decir el intervalo de la señal de alta frecuencia, empieza en 6.4 kHz y consiste de tres replicaciones diferentes del intervalo de frecuencia de banda baja. El intervalo de frecuencia, de las diferentes replicaciones se indican por "parche 1", "parche 2" y "parche 3". Es claro del espectrograma que los parches introducen discontinuidades en la envolvente espectral alrededor de 6.4 kHz, 7.4 kHz, y 10.8 kHz. En el presente ejemplo, estas frecuencias corresponden a bordes de parche.
La Figura le además ilustra las bandas de factor de escala 130 asi como las bandas limitadoras 135 de las cuales la función se establecerá con más detalle a continuación. En la modalidad ilustrada, el ajustador de envolvente de MPEG-4 SBR se utiliza. Este ajustador de envolvente opera utilizando un banco de filtros QMF. Los aspectos principales de la operación de este ajustador de envolvente son: • para calcular la energía promedio a través de la banda de factor de escala 130 de la señal de alimentación al ajustador de envolvente, es decir la señal que sale de la unidad HFR; en otras palabras, la energía promedio de la señal de banda alta regenerada, se calcula dentro de cada intervalo objetivo/banda de factor de escala 130; • para determinar un valor de ganancia, también referido como valor de ajuste de envolvente, por cada banda de factor de escala 130, en donde el valor de ajuste de envolvente es la raíz cuadrada de la proporción de energía entre la energía objetivo (es decir el objetivo de energía recibido de un codificador) y la energía promedio de la señal de banda alta regenerada 121 dentro de la banda de factor de escala respectivo 130; para aplicar el valor de ajuste de envolvente respectivo a la banda de frecuencia de la señal de banda alta regenerada 121, en donde la banda de frecuencia corresponde a la banda de factor de escala respectivo 130.
Además, el ajustador de envolvente puede comprender etapas y variaciones adicionales en particular: • una funcionalidad limitadora, que limita el valor de ajuste de envolvente máximo permitido que se aplique sobre una cierta banda de frecuencia, es decir sobre una banda limitadora 135. El valor de ajuste de envolvente permitido máximo es una función de los valores de ajuste de envolvente determinados para las diferentes bandas de factor de escala 130 que caen dentro de una banda limitadora 135. En particular, el valor de ajuste de envolvente máximo permitido es una función del promedio de los valores de ajuste de envolvente determinados para las diferentes bandas de factor de escala 130 que caen dentro de una banda limitadora 135. A manera de ejemplo, el valor de ajuste de envolvente máximo permitido puede ser el valor promedio de los valores de ajuste de envolvente relevantes multiplicado por un factor limitador (tal como 1.5). La funcionalidad limitadora típicamente se aplica a fin de limitar la introducción de ruido o interferencia en la señal de banda alta regenerada 121. Esto es particularmente relevante para señales de audio que comprenden sinusoides prominentes, es decir señales de audio que tienen un espectro con picos distintos a ciertas frecuencias. Sin el uso de la funcionalidad limitadora, se determinarán valores de ajuste de envolvente significantes para las bandas de factor de escala 130 para las cuales la señal de audio original comprende estos picos distintos. Como resultado, el espectro de la banda de factor de escala completo 130 (y no sólo el pico distinto) se ajustará, de esta manera introduciendo ruido o interferencia. · una funcionalidad de interpolación, que permite que los valores de ajuste de envolvente sean calculados por cada sub-banda QMF individual dentro de una banda de factor de escala, en lugar de calcular un valor de ajuste de envolvente sencillo para toda la banda de factor de escala. Ya que las bandas de factor de escala típicamente comprenden más de una sub-banda QMF, un valor de ajuste de envolvente puede calcularse como la proporción de la energía de una sub-banda QMF particular dentro de la banda de factor de escala y la energía objetivo que se recibe del codificador, en lugar de calcular la proporción de la energía promedio de todas las sub-bandas QMF dentro de la banda de factor de escala y la energía objetivo que se recibe del codificador. Como tal, un valor de ajuste de envolvente diferente puede ser determinado por cada sub-banda QMF dentro de una banda de factor de escala. Habrá de notarse que el valor de energía objetivo recibido para una banda de factor de escala típicamente corresponde a la energía promedio de este intervalo de frecuencia dentro de la señal original. Depende de la operación de descodificador como aplicar la energía objetivo promedio recibida a la banda de frecuencia correspondiente de la señal de banda alta regenerada. Esto puede realizarse al aplicar un valor de ajuste de envolvente total a las sub-bandas QMF dentro de una banda de factor de escala de la señal de banda alta regenerada o al aplicar un valor de ajuste de envolvente individual a cada sub-banda QMF. Este último enfoque puede considerarse como si la información de envolvente recibida (es decir una energía objetivo por banda de factor escala) se "interpoló" a través de las sub-bandas QMF dentro de una banda de factor de escala, a fin de proporcionar una resolución de frecuencia superior. Por lo tanto, el enfoque se refiere como "interpolación" en MPEG-4 SBR.
Regresando a la Figura le puede verse que el ajustador de envolvente deberá aplicar valores de ajuste de envolvente elevados a fin de ajustar el espectro 121 de la señal que va al ajustador de envolvente con el espectro 120 de la señal original. También puede verse que debido a las discontinuidades, grandes variaciones de valores de ajuste de envolvente ocurren dentro de las bandas limitadoras 135. Como resultado de estas grandes variaciones, los valores de ajuste de envolvente que corresponden a los mínimos locales del espectro regenerado 121 estarán limitados por la funcionalidad limitadora del ajustador de envolvente. Como resultado, las discontinuidades dentro del espectro regenerado 121 permanecerán, incluso después de realizar la operación de ajuste de envolvente. Por otra parte, si no se emplea funcionalidad limitadora, puede introducirse interferencia indeseable como se estableció anteriormente.
Por lo tanto, ocurre un problema para la regeneración de una señal de banda alta para cualquier señal que -tiene grandes variaciones en nivel sobre el intervalo de banda baja. Este problema se debe a las discontinuidades que se introducen durante la regeneración de alta frecuencia de la banda alta. Cuando se expone subsecuentemente el ajustador de envolvente a esta señal regenerada, no puede separarse en forma razonable y consistente la discontinuidad recientemente introducida de cualquier característica espectral de "mundo real" de la señal de banda baja. Los efectos de este problema son dobles. Primero, las formas espectrales se introducen en la señal de banda alta que el ajustador de envolvente no puede compensar. Consecuentemente, la salida tiene la forma espectral errónea. En segundo, se percibe un efecto de inestabilidad, debido al hecho de que este efecto va y viene como una función de las características espectrales de banda baja.
El presente documento atiende el problema anteriormente mencionado al describir un método y sistema que proporcionan una señal de banda alta HFR en la entrada del ajustador de envolvente que no exhibe discontinuidades espectrales. Para este propósito, se propone el retirar o reducir la envolvente espectral de la señal de banda baja cuando se realiza regeneración de alta frecuencia. Al hacer esto, se evita introducir cualesquiera discontinuidades espectrales en la señal de banda alta antes de realizar el ajuste de envolvente. Como resultado, el ajustador de envolvente no tendrá que manejar estas discontinuidades espectrales. En particular, puede emplearse un ajustador de envolvente convencional, en donde la funcionalidad limitadora del ajustador de envolvente se utiliza para evitar la introducción de ruido o interferencia en la señal de banda alta regenerada. En otras palabras, el método y sistema descritos pueden emplearse para regenerar una señal de banda alta HFR que tiene pocas o ningunas discontinuidades espectrales y un bajo nivel de ruido o interferencia.
Habrá de notarse que la resolución en tiempo del ajustador de envolvente puede ser diferente de la resolución en tiempo del procesamiento propuesto de la envolvente espectral durante la generación de señal de banda alta. Como se indicó anteriormente, el procesamiento de la envolvente espectral durante la regeneración de señal de banda alta, se pretende que modifique la envolvente espectral de la señal de banda baja, a fin de aliviar el procesamiento dentro del ajustador de envolvente subsecuente. Este procesamiento, es decir la modificación de la envolvente espectral de la señal de banda baja, puede realizarse por ejemplo una vez por cuadro de audio, en donde el ajustador de envolvente puede ajusfar la envolvente espectral sobre varios intervalos de tiempo, es decir utilizando varias envolventes espectrales recibidas. Esto se establece en la Figura Ib, en donde la cuadricula de tiempo 150 de los datos de envolvente espectral se ilustra en el panel superior, y la cuadricula de tiempo 155 para el procesamiento de la envolvente espectral de la señal de banda baja durante la regeneración de señal de banda alta, se ilustra en el panel inferior. Como puede verse en el ejemplo de la Figura Ib, los bordes de tiempo de los datos de envolvente espectral varían con el tiempo, mientras que el procesamiento de la envolvente espectral de la señal de banda baja opera en una cuadrícula de tiempo fija. También puede verse que varios ciclos de ajuste de envolvente (representados por bordes de tiempo 150) pueden realizarse durante un ciclo de procesamiento de la envolvente espectral de la señal de banda baja. En el ejemplo ilustrado, el procesamiento de la envolvente espectral de la señal de banda baja opera en una base cuadro por cuadro, lo que significa que una pluralidad diferente de coeficientes de ganancia espectral se determina por cada cuadro de la señal. Habrá de notarse que el procesamiento de la señal de banda baja puede operar en cualquier cuadricula de tiempo y que la cuadricula de tiempo de este procesamiento no tiene que coincidir con la cuadrícula de tiempo de los datos de envolvente espectral.
En la Figura 2, se ilustra un sistema HFR basado en banco de filtros 200. El sistema HFR 200 opera utilizando un banco de filtros pseudo QMF y el sistema 200 puede emplearse para producir la señal de banda alta y banda baja 100 ilustrada en el panel superior de la Figura la. Sin embargo, se ha agregado una etapa adicional de ajuste de ganancia como parte del proceso de Generación de Alta Frecuencia, que en el ejemplo ilustrado es un proceso de copiado. La señal de alimentación de baja frecuencia se analiza por una QMF de sub-banda 32 201, a fin de generar una pluralidad de señales de sub-banda de baja frecuencia. Algunas o todas las señales de sub-banda de baja frecuencia se parchan en ubicaciones de frecuencia superior de acuerdo con un algoritmo de generación de alta frecuencia (HF = High Frequency) . Adicionalmente, la pluralidad de sub-bandas de baja frecuencia se alimenta directamente al banco de filtros de síntesis 202. El banco de filtros de síntesis anteriormente mencionado 202 es una QMF inversa de 64 sub-bandas 202. Para la implementación particular ilustrada en la Figura 2, el uso de un banco de filtros de análisis QMF de 32 sub-bandas 201 y el uso de un banco de filtros de síntesis QMF de 64 sub-bandas 202 producirá una velocidad de muestreado de salida de la señal de salida del doble de la velocidad de muestreado de entrada de la señal de alimentación. Habrá de notarse sin embargo que los sistemas establecidos en el presente documento no se limitan a sistemas con diferentes velocidades de muestreado de entrada y salida. Una multitud de diferentes relaciones de velocidad de muestreado puede preverse por aquellos con destreza en la técnica.
Como se estableció en la Figura 2, las sub-bandas de las frecuencias inferiores son cartografiadas en sub-bandas de superiores frecuencias. Una etapa de ajuste de ganancia 204 se introduce como parte de este proceso de copiado. La señal de alta frecuencia creada, es decir la pluralidad generada de señales de sub-banda de alta frecuencia, se alimenta al ajustador de envolvente 203 (posiblemente que comprende una funcionalidad de interpolación y/o limitadora) , antes de combinación con la pluralidad de señales de sub-banda de baja frecuencia en el banco de filtros de síntesis 202. Al utilizar este sistema HFR 200, y en particular al utilizar una etapa de ajuste de ganancia 204, la introducción de las discontinuidades de envolvente espectral como se ilustra en la Figura 1 puede evitarse. Para este propósito, la etapa de ajuste de ganancia 204 modifica la envolvente espectral de la señal de banda baja, es decir la envolvente espectral de la pluralidad de señales de sub-banda de baja frecuencia, tal que la señal de banda baja modificada puede utilizarse para generar una señal de banda alta, es decir una pluralidad de señales de sub-banda de baja frecuencia, que no exhiben discontinuidades, en forma notable discontinuidades en los bordes de parche. Con referencia a la Figura le, la etapa de ajuste de ganancia adicional 204 asegura que la envolvente espectral 101, 111 de la señal de banda baja se modifique de modo tal que no hay o haya limitadas discontinuidades en la señal de banda alta generada 105, 115.
La modificación de la envolvente espectral de la señal de banda baja puede lograrse al aplicar una curva de ganancia a la envolvente espectral de la señal de banda baja. Esta curva de ganancia puede ser determinada por una unidad para determinación de curva de ganancia 400 ilustrada en la Figura 4. El módulo 400 toma como alimentación los datos QMF 402 correspondientes al intervalo de frecuencia de la señal de banda baja utilizados para recrear la señal de banda alta. En otras palabras, la pluralidad de señales de sub-banda de baja frecuencia se alimenta a la unidad de determinación de curva de ganancia 400. Como ya se indicó, sólo un subconjunto de las sub-bandas QMF disponibles de la señal de banda baja puede utilizarse para generar la señal de banda alta, es decir sólo un subconjunto de las sub-bandas QMF disponibles puede alimentarse a la unidad para determinación de curva de ganancia 400. Además, el módulo 400 puede recibir datos de control opcionales 404, por ejemplo datos de control enviados desde un codificador correspondiente. El módulo 400 enviará de salida una curva de ganancia 403 que se va a aplicar durante el proceso de regeneración de alta frecuencia. En una modalidad, la curva de ganancia 403 se aplica a las sub-bandas QMF de la señal de banda baja, que se emplean para generar la señal de banda alta, es decir la curva de ganancia 403 puede emplearse dentro del proceso de copiado del proceso HFR .
Los datos de control opcional 404 pueden comprender información de la resolución de la envolvente espectral tosca, que se va a estimar en el módulo 400, y/o información de la conveniencia de aplicar el proceso de ajuste de ganancia. Como tales, los datos de control 404 pueden controlar la cantidad de procesamiento adicional involucrado durante el proceso de ajuste de ganancia. Los datos de control 404 también pueden activar una derivación del procesamiento de ajuste de ganancia -adicional, si ocurren señales que no llevan a estimación de envolvente espectral gruesa o tosca, por ejemplo señales que comprenden sinusoides sencillas .
En la · Figura 5 una vista más detallada del módulo 400 en la Figura 4 se perfila. Los datos QMF 402 de la señal de banda baja se alimentan a la unidad de estimación de envolvente 501 que estima la envolvente espectral, por ejemplo en una escala de energía logarítmica. La envolvente espectral subsecuentemente se alimenta al módulo 502 que estima la envolvente espectral gruesa de la envolvente espectral de alta resolución (frecuencia) que se recibe de la unidad de estimación de envolvente 501. En una modalidad, esto se realiza al ajustar un polinomio de bajo orden a los datos de envolvente espectral, es decir un polinomio de un orden en el intervalo por ejemplo de 1, 2, 3, ó 4. La envolvente espectral gruesa también puede ser determinada al realizar una operación de promedio móvil de la envolvente espectral de alta resolución sobre el eje de frecuencia. La determinación de una envolvente espectral gruesa 301 de una señal de banda baja se visualiza en la Figura 3. Puede verse que el espectro absoluto 302 de la señal de banda baja, es decir la energía de las bandas QMF 302, se aproxima por una envolvente espectral gruesa 301, es decir por una curva dependiente de frecuencia ajustada a la envolvente espectral de la pluralidad de señales de sub-banda de baja frecuencia. Además, se muestra que sólo 20 señales de sub-banda QMF se emplean para generar las señales de banda alta, es decir sólo una parte de las 32 señales de sub-banda QMF se emplean dentro del proceso HFR.
El método empleado para determinar la envolvente espectral gruesa de la envolvente espectral de alta resolución y en particular el orden del polinomio que se adapta o se ajusta a la envolvente espectral de alta resolución, puede controlarse por los datos de control opcional 404. El orden del polinomio puede ser una función del tamaño del intervalo de frecuencia 302 de la señal de banda baja, para la cual se va a determinar una envolvente espectral gruesa 301 y/o puede ser una función de otros parámetros relevantes para la forma espectral gruesa total del intervalo de frecuencia relevante 302 de la señal de banda baja. El ajuste de polinomio calcula un polinomio que aproxima los datos en un sentido de error de mínimos cuadrados. A continuación se establece una modalidad preferida, mediante código atlab: function GainVec = calculateGainVec (Lo Env) %% function GainVec = calculateGainVec (LowEnv) % Entrada: Energía de envolvente de banda baja en dB % Salida: vector de ganancia para aplicar a la banda baja % antes de la generación de HF-% La función realiza un ajuste polinomial de bajo orden de la % envolvente espectral de banda baja, como una representación % de la pendiente espectral total de banda baja.
% La pendiente total de acuerdo con esto subsecuentemente se % traduce en un vector de ganancia que puede ser aplicado % antes de generación de HF para retirar la pendiente total % (o forma espectral gruesa) .
% % Esto evita que la generación de HF introduce % discontinuidades en la forma espectral, que sean "confusas" % para el ajuste de envolvente subsecuente y proceso % limitador. La "confusión" ocurre cuando el ajustador de % envolvente y limitador requiere encargarse de una gran % discontinuidad, y de esta manera un gran valor de ganancia.
% Es muy difícil ajustar y tener una operación adecuada de % estos módulos si van encargarse tanto de variaciones % "naturales" en la banda alta como las variaciones % "artificiales" introducidas por el proceso de generación de % HF. polyOrder hite = 3; x_lowBand = 1 : length (LowEnv) ; p=polyfit (x_lowBand, LowEnv, polyOrderWhite) ; lowBandEnvSlope = zeros ( size (x_lowBand) ) ; for k=polyOrderWhite : -1 : 0 tmp = (x_lowBand. Ak) . *p (polyOrderWhite - k + 1) ; lowBandEnvSlope = lowBandEnvSlope + tmp; end GainVec = 10. ? ( (mean (LowEnv) - lowBandEnvSlope) ./20) ; En el código anterior, la alimentación es la envolvente espectral (LowEnv) de la señal de banda baja que se obtiene al promediar muestras de sub-banda QMF en una base por sub-bandas sobre un intervalo de tiempo correspondiente al cuadro de datos de tiempo actual que se opera por el ajustador de envolvente subsecuente. Como se indicó anteriormente, el procesamiento para ajuste de ganancia de la señal de banda baja puede realizarse en diversas otras cuadriculas de tiempo. En el ejemplo anterior, la envolvente espectral absoluta estimada se expresa en un dominio logarítmico. Un polinomio de bajo orden, en el ejemplo anterior un polinomio de orden 3, se ajusta a los datos. Dado el polinomio, una curva de ganancia (GainVec) se calcula a partir de la diferencia en energía promedio de la señal de banda baja y la curva ( lowBandEnvSlope ) ) que se obtiene del polinomio ajustado a los datos. En el ejemplo anterior, la operación de determinar la curva de ganancia se realiza en el dominio logarítmico.
Se realiza el cálculo de curva de ganancia por la unidad de cálculo de curva de ganancia 503. Como se indicó anteriormente, la curva de ganancia puede ser determinada a partir de la energía promedio de la parte de la señal de banda baja empleada para regenerar la señal de banda alta, y de la envolvente espectral de la parte de la señal de banda baja empleada para regenerar la señal de banda alta. En particular, la curva de ganancia puede ser determinada a partir de la diferencia de la energía promedio y la envolvente espectral gruesa, representada por ejemplo por un polinomio. Es decir, el polinomio calculado puede emplearse para determinar una curva de ganancia que comprende un valor de ganancia separado, también referido como coeficiente de ganancia espectral, por cada sub-banda QMF relevante de la señal de banda baja. Esta curva de ganancia que comprende los valores de ganancia, se emplea subsecuentemente en el proceso HFR.
Como un ejemplo, un proceso de generación de HFR de acuerdo con MPEG-4 SBR se describe a continuación. La señal generada HF puede ser derivada por la siguiente fórmula (ver documento MPEG-4 Parte 3 (ISO/IEC 14496-3), sub-parte 4, sección 4.6.18.6.2, que se incorpora referencia) : XH<? + = XLO» (P>1 + 1^) + bwArray (g(k)) a0 (p) - XLmr (p, 1 - 1+ lJirAdJ) + [bwArrayM*))]3 *, (P) ' + en donde p es el índice de sub-banda de la señal de banda baja, es decir p identifica una de la pluralidad de señales de sub-banda de baja frecuencia. La fórmula de generación de HF anterior puede ser reemplazada por la siguiente fórmula que realiza un ajuste de ganancia y generación de HF combinados: ( + )= preGain(p) · (X^Í + y)) + bwArray(g(£))-a0(/>) ·?^(^/-1 + tm.Mj) + [bwArray(g(*)ff· a, (p) X¡X)W(p,l ~ 2 + / en donde la curva de ganancia se refiere como preGain (p) .
Mayores detalles del proceso de copiado, por ejemplo respecto a la relación entre p y Je, se especifican en el documento anteriormente mencionado MPEG-4, Parte 3. En la fórmula anterior, XLou(p,l) indica una muestra en la instancia de tiempo 1 de la señal de sub-banda de baja frecuencia que tiene un índice de sub-banda p. Esta muestra en combinación con muestras precedentes, se emplea para generar una muestra de la señal de sub-banda de alta frecuencia XHigh (k, 1) que tiene un índice de sub-banda k.
Habrá de notarse que el aspecto de ajuste de ganancia puede emplearse en cualquier banco de filtros con base en el sistema de reconstrucción de alta frecuencia. Esto se ilustra en la Figura 6, en donde la presente invención es parte de una unidad HFR 601 autónoma, que opera en una señal de banda estrecha o banda baja 602 y envía de salida una señal de banda amplia o banda alta 604. El módulo 601 puede recibir datos de control adicional 603 como alimentación, en donde los datos de control 603 pueden especificar, entre otras cosas, la cantidad de procesamiento empleado para el ajuste de ganancia descrito, así como por ejemplo información de la envolvente espectral objetivo de la señal de banda alta. Sin embargo, estos parámetros son sólo ejemplos de datos de control opcionales 603. En una modalidad, también puede derivarse información relevante de la señal de banda estrecha 602 que se alimenta al módulo 601 o por otros medios. Es decir, los datos de control 603 pueden ser determinados dentro del módulo 601 con' base en la información disponible en el módulo 601. Habrá de notarse que la unidad HFR 601 autónoma pueda recibir la pluralidad de señales de sub-banda de baja frecuencia y puede enviar de salida la pluralidad de señales de sub-banda de alta frecuencia, es decir los bancos de filtros para síntesis/análisis o transformadas pueden colocarse fuera de la unidad HFR 601.
Como ya se indicó anteriormente, puede ser benéfico el señalar la activación de procesamiento de ajuste de ganancia en la corriente de bits desde un codificador a un descodificador . Para ciertos tipos de señal, por ejemplo una sola sinusoide, el procesamiento de ajuste de ganancia puede no ser relevante y por lo tanto benéfico para permitir que el sistema codificador/descodificador desactive el procesamiento adicional a fin de no introducir un comportamiento indeseado para estas señales de caso limite. Para este propósito, el codificador puede ser configurado para analizar las señales de audio y generar datos de control que activan y desactivan el procesamiento de ajuste de ganancia en el descodificador .
En la Figura 7, la etapa de ajuste de ganancia propuesta se incluye en una unidad de reconstrucción de alta frecuencia 703 que es parte de un códec de audio. Un ejemplo de esta unidad HFR 703 es la herramienta de Replicación de Banda Espectral MPEG-4 empleada como parte del códec AAC de MPEG-D de Alta Eficiencia o el Códec de Audio y Habla Unificado (USAC = Unified Speech and Audio Codee) . En esta modalidad, una corriente de bits 704 se recibe en un descodificador de audio 700. La corriente de bits 704 se desmultiplexa en el desmultiplexor 701. La parte relevante SBR de la corriente de bits 708 se alimenta al módulo SBR o la unidad HFR 703, y la corriente de bits relevante de descodificador núcleo 707, por ejemplo datos AAC o datos de descodificador núcleo USAC se envían al módulo codificador núcleo 702. Además, la señal de banda baja o banda estrecha 706 se pasa desde el descodificador núcleo 702 a la unidad HFR 703. La presente invención se incorpora como parte del proceso SBR en la unidad HFR 703, por ejemplo de acuerdo con el sistema establecido en la Figura 2. La unidad HFR 703 envía de salida una señal de banda amplia o banda alta 705 utilizando el procesamiento establecido en el presente documento .
En la Figura 8, una modalidad del módulo de reconstrucción de alta frecuencia 703 se perfila con más detalle. La Figura 8 ilustra que la generación de señal de alta frecuencia (HF = High Frequency) puede ser derivada de diferentes módulos de generación de HF en diferentes instancias en tiempo. La generación de HF puede basarse ya sea en un retransmisor o reemisor de copia basado en QMF 803, o la generación de HF puede basarse en un retransmisor armónico basado en FFT 804. Para ambos módulos de generación de señal de HF, la señal de banda baja se procesa 801, 802 como parte de la generación de HF a fin de determinar una curva de ganancia que se utiliza en el proceso de copiado 803 o de transposición armónica 804. Las salidas de los dos retransmisores se alimentan selectivamente en el ajustador de envolvente 805. La decisión de qué señal de retransmisor utilizar es controlada por la corriente de bits 704 o 708. Habrá de notarse que, debido a la naturaleza de copia del retransmisor basado en QMF, la forma de la envolvente espectral de la señal de banda baja se mantiene más claramente que cuando se utiliza un retransmisor armónico. Esto típicamente resultará en discontinuidades más diferentes de la envolvente espectral de la señal de banda alta cuando se utiliza retransmisores de copiado. Esto se ilustra en los paneles superior e inferior de la Figura la. Consecuentemente, puede ser suficiente sólo el incorporar el ajuste de ganancia para el método de copiado basado en QMF realizado en el módulo 803. Sin embargo, el aplicar el ajuste de ganancia para la transposición armónica realizada en el módulo 804 puede ser benéfico por igual.
En la Figura 9, se perfila un módulo descodificador correspondiente. El codificador 901 puede configurarse para analizar la señal de alimentación particular 903 y determinar la cantidad del procesamiento de ajuste de ganancia que es adecuada para el tipo particular de señal de alimentación 903. En particular, el codificador 901 puede determinar el grado de discontinuidad en la señal de sub-banda de alta frecuencia que será provocada por la unidad HFR 703 en el descodificador . Para este propósito, el codificador 901 puede comprender una unidad HFR 703, o al menos partes relevantes de la unidad HFR 703. Con base en el análisis de la señal de alimentación 903, datos de control 905 pueden generarse para el descodificador correspondiente. La información 905, que se refiere al ajuste de ganancia a realizar en el descodificador, se combina en el multiplexor 902 con una corriente de bits de audio 906, de esta manera formando la corriente de bits completa 904 que se transmite al descodificador correspondiente.
En la Figura 10, los espectros de salida de una señal del mundo real, se exhiben. En la Figura 10a, se ilustra la salida de un descodificador MPEG USAC que descodifica una corriente de bits mono de 12 kbps. La sección de la señal de mundo real es una parte vocal de una grabación a cappella. La abscisa corresponde al eje de tiempo, mientras que la ordenada corresponde al eje de frecuencia. Comparar el espectrograma de la Figura 10a con la Figura 10c que exhibe el espectrograma correspondiente de la señal original, es claro que hay orificios (ver números de referencia 1001, 1002) que aparecen en el espectro para las partes fricativas del segmento vocal. En la Figura 10b se ilustra el espectrograma de la salida del descodificador MPEG USAC incluyendo la presente invención. Puede verse en el espectrograma que los orificios en el espectro han desaparecido (ver números de referencia 1003, 1004 correspondientes a los números de referencia 1001, 1002) .
La complejidad del algoritmo para ajuste de ganancia propuesto se calculó como MOPS ponderados, en donde funciones como POW/DIV/TRIG se ponderan como 25 operaciones, y todas las otras operaciones se ponderan como una operación. Dadas estas consideraciones, la complejidad calculada representa aproximadamente 0.1 WMOPS y uso de RAM/ROM insignificante. En otras palabras, el procesamiento para ajuste de ganancia propuesto requiere bajo procesamiento y capacidad de memoria.
En el presente documento, se han descrito un método y sistema para generar una señal de banda alta a partir de una señal de banda baja. El método y sistema se adaptan para generar una señal de banda alta con pocas o ningunas discontinuidades espectrales, de esta manera mejorando el desempeño perceptual de los métodos y sistemas de reconstrucción de alta frecuencia. El método y sistema pueden incorporar esto fácilmente en sistemas de codificación/descodificación de audio existentes. En particular, el método y sistema pueden incorporarse sin necesidad por modificar el procesamiento de ajuste de envolvente de sistemas de codificación/descodificación de audio existentes. En forma notable, esto aplica a la funcionalidad de interpolación y limitadora del procesamiento de ajuste de envolvente que puede realizar sus tareas pretendidas. Como tal, el método y sistema descritos pueden emplearse para regenerar señales de banda alta que tienen pocas o ningunas discontinuidades espectrales y un bajo nivel de ruido. Además, el uso de datos de control se ha descrito, en donde los datos de control pueden emplearse para adaptar los parámetros del método y sistema descritos (y complejidad computacional) al tipo de señal de audio.
Los métodos y sistemas descritos en el presente documento pueden ser implementados como soporte lógico, soporte lógico inalterable y/o equipo físico. Ciertos componentes por ejemplo pueden ser implementados como soporte lógico que se ejecuta en un procesador o microprocesador de señal digital. Otros componentes pueden por ejemplo ser implementados como equipo físico y/o circuitos integrados específicos de aplicación. Las señales que se encuentran en los métodos y sistemas descritos pueden almacenarse en medios tales como memoria de acceso aleatorio o memoria de almacenamiento óptico. Pueden ser transferidos por redes, tales como redes de radio, redes de satélite, redes inalámbricas o redes cableadas, por ejemplo Internet. Dispositivos típicos que utilizan los métodos y sistemas descritos en el presente documento, son dispositivos electrónicos portátiles u otro equipo de consumidor que se utilizan para almacenar y/o procesar señales de audio. Los métodos y sistemas también pueden emplearse en sistemas de computadora, por ejemplo servidores de red de Internet, que almacenan y proporcionan señales de audio, por ejemplo señales musicales, para descarga.

Claims (22)

REIVINDICACIONES
1. Un sistema, configurado para generar una pluralidad de señales de sub-banda de alta frecuencia que cubren un intervalo de alta frecuencia de una pluralidad de señales de sub-banda de baja frecuencia, el sistema se caracteriza porque comprende: - medios para recibir la pluralidad de señales de sub-banda de baja frecuencia; medios para recibir un conjunto de energías objetivó, cada energía objetivo cubre un intervalo objetivo diferente dentro del intervalo de alta frecuencia y es indicativa de la energía deseada de una o más señales de sub-banda de alta frecuencia que se encuentran dentro del intervalo objetivo; -medios para generar la pluralidad de señales de sub-banda de alta frecuencia a partir de la pluralidad de señales de sub-banda de baja frecuencia y de una pluralidad de coeficientes de ganancia espectral asociada con la pluralidad de señales de sub-banda de baja frecuencia, respectivamente; y - medios para ajusfar la energía de la pluralidad de señales de sub-banda de alta frecuencia utilizando el conjunto de energías objetivo.
2. El sistema de conformidad con la reivindicación 1, caracterizado porque los medios para ajusfar la energía comprenden medios para limitar el ajuste de energía de las señales de sub-banda de alta frecuencia que se encuentran dentro de un intervalo limitador; y en donde el intervalo limitador cubre más de un intervalo objetivo.
3. El sistema de conformidad con cualquiera de las reivindicaciones previas, caracterizado porque la pluralidad de coeficientes de ganancia espectral se asocia con la energía de la pluralidad respectiva de señales de sub-banda de baja frecuencia.
4. El sistema de conformidad con la reivindicación 3, caracterizado porque la pluralidad de coeficientes de ganancia espectral se deriva de una curva dependiente de frecuencia ajustada a la energía de la pluralidad de las señales de sub-banda de baja frecuencia.
5. El sistema de conformidad con la reivindicación 4, caracterizado porque la curva dependiente de frecuencia es un polinomio de un orden predeterminado.
6. El sistema de conformidad con las reivindicaciones 4 o 5, caracterizado porque un coeficiente de ganancia espectral de la pluralidad de coeficientes de ganancia espectral se deriva de la diferencia de la energía promedio de la pluralidad de señales de sub-banda de baja frecuencia y un valor correspondiente de la curva dependiente de frecuencia.
7. El sistema de conformidad con cualquier reivindicación previa, caracterizado porque los medios para generar la pluralidad de señales de sub-banda de alta frecuencia se configuran para amplificar la pluralidad de señales de sub-banda de baja frecuencia utilizando la pluralidad respectiva de coeficientes de ganancia espectral.
8. El sistema de conformidad con cualquier reivindicación previa, caracterizado porque los medios para generar la pluralidad de señales de sub-banda de alta frecuencia se configuran para realizar una transposición de copia de la pluralidad de señales de sub-banda de baja frecuencia; y/o realizar una transposición armónica de la pluralidad de señales de sub-banda de baja frecuencia.
9. El sistema de conformidad con la reivindicación 8, caracterizado porque los medios para generar la pluralidad de señales de sub-banda de alta frecuencia se configuran para multiplicar las muestras de una señal de sub-banda de baja frecuencia con el coeficiente de ganancia espectral respectivo de la pluralidad de coeficientes de ganancia espectral, de esta manera produciendo muestras modificadas; y determinar una muestra de una señal de sub-banda de alta frecuencia correspondiente en un instante de tiempo particular a partir de muestras modificadas de la señal de sub-banda de baja frecuencia en el instante de tiempo particular y al menos en un instante de tiempo precedente.
10. El sistema de conformidad con la reivindicación 9, caracterizado porque la muestra de la señal de sub-banda de alta frecuencia correspondiente en el instante de tiempo particular se determina a partir de las muestras modificadas de la señal de sub-banda de baja frecuencia utilizando el algoritmo de copia de MPEG-4 SBR.
11. El sistema de conformidad con cualquier reivindicación precedente, caracterizado porque los medios para ajustar la energía de la pluralidad de señales de sub-banda de alta frecuencia además comprenden medios para asegurar que las señales de sub-banda de alta frecuencia ajustadas se encuentren dentro de un intervalo objetivo particular que tiene la misma energía.
12. El sistema de conformidad con cualquier reivindicación previa, caracterizado porque la pluralidad de señales de sub-banda de baja frecuencia y la pluralidad de señales de sub-banda de alta frecuencia corresponden a sub-bandas de un banco de filtros QMF; y/o una FFT .
13. El sistema de conformidad con cualquier reivindicación previa, caracterizado porque además comprende medios para recibir datos de control indicativos de si se, aplica la pluralidad de coeficientes de ganancia espectral para generar la pluralidad de señales de sub-banda de alta frecuencia; y/o un método para determinar la pluralidad de coeficientes de ganancia espectral.
14. El sistema de conformidad con la reivindicación 13 de nuevo con referencia a la reivindicación 5, caracterizado porque los datos de control son indicativos del orden predeterminado del polinomio.
15. Un descodificador de audio configurado para descodificar una corriente de bits representativa de una señal de audio de baja frecuencia y un conjunto de energías objetivo que describe la envolvente espectral de una señal de audio de alta frecuencia correspondiente, el descodificador de audio comprende: una unidad de transformación y descodificador núcleo configurada para determinar una pluralidad de señales de sub-banda de baja frecuencia asociadas con la señal de audio de baja frecuencia de la corriente de bits; una unidad de generación de alta frecuencia de acuerdo con el sistema de conformidad con cualquiera de las reivindicaciones 1 a 14, configurada para determinar una pluralidad de señales de sub-banda de alta frecuencia a partir de la pluralidad de señales de sub-banda de baja frecuencia y el conjunto de energías objetivo; y una unidad de transformación inversa y fusión configurada para generar una señal de audio a partir de la pluralidad de señales de sub-banda de baja frecuencia y la pluralidad de señales de sub-banda de alta frecuencia.
16. Un codificador configurado para generar datos de control a partir de una señal de audio, el codificador de audio se caracteriza porque comprende: medios para analizar la forma espectral de la señal de audio y para determinar un grado de discontinuidades de envolvente espectral introducidas cuando se regenera un componente de alta frecuencia de la señal de audio a partir de un componente de baja frecuencia de la señal de audio; en donde los medios incluyen un sistema de reconstrucción de alta frecuencia relacionado a un lado descodificador para permitir que el codificador determine el grado de discontinuidades de envolvente espectral que pueden introducirse al componente de alta frecuencia de la señal de audio en el lado descodificador; y - medios para generar datos de control, para controlar la regeneración del componente de alta frecuencia con base en el grado de discontinuidades.
17. Un método para generar una pluralidad de señales de sub-banda de alta frecuencia que cubren un intervalo de alta frecuencia a partir de una pluralidad de señales de sub-banda de baja frecuencia, el método se caracteriza porque comprende: - recibir la pluralidad de señales de sub-banda de baja frecuencia; - recibir un conjunto de energías objetivo, cada energía objetivo cubre un intervalo objetivo diferente dentro del intervalo de alta frecuencia y es indicativa de la energía deseada de una o más señales de sub-banda de alta frecuencia que se encuentran dentro del intervalo objetivo; - generar la pluralidad de señales de sub-banda de alta frecuencia a partir de la pluralidad de señales de sub-banda de baja frecuencia y de una pluralidad de coeficientes de ganancia espectral asociados con la pluralidad de señales de sub-banda de baja frecuencia, respectivamente; y - ajustar la energía de la pluralidad de señales de sub-banda de alta frecuencia utilizando el conjunto de energías objetivo.
18. Un método para descodificar una corriente de bits representativa de una señal de audio de baja frecuencia y un conjunto de energías objetivo que describen la envolvente espectral de una señal de audio de alta frecuencia correspondiente, el método se caracteriza porque comprende: -determinar una pluralidad de señales de sub-banda de baja frecuencia asociadas con la señal de audio de baja frecuencia de la corriente de bits; - determinar una pluralidad de señales de sub-banda de alta frecuencia a partir de la pluralidad de señales de sub-banda de baja frecuencia y el conjunto de energías objetivo de acuerdo con el método establecido en la reivindicación 17; y - generar una señal de audio a partir de la pluralidad de señales de sub-banda de baja frecuencia y la pluralidad de señales de sub-banda de alta frecuencia.
19. Un método para generar datos de control a partir de una señal de audio, el método se caracteriza porque comprende: - analizar la forma espectral de la señal de audio para determinar un grado de discontinuidades de envolvente espectral introducidas cuando se regenera un componente de alta frecuencia de la señal de audio a partir de un componente de baja frecuencia de la señal de audio; en donde el análisis incluye determinar en un lado de codificador por un sistema de reconstrucción de alta frecuencia relacionado a un lado del descodificador, el grado de discontinuidades de envolvente espectral que pueden introducirse al componente de alta frecuencia de la señal de audio en el lado descodificador ; y - generar datos de control para controlar la regeneración del componente de alta frecuencia con base en el grado de discontinuidades.
20. Un programa o soporte lógico adaptado para ejecutar en un procesador y para realizar las etapas de método de conformidad con cualquiera de las reivindicaciones 17 a 19 cuando se lleva a cabo en un dispositivo de cómputo.
21. Un medio de almacenamiento que comprende un programa o soporte lógico adaptado para ejecución en un procesador y para realizar las etapas de método de conformidad con cualquiera de las reivindicaciones 17 a 19 cuando se llevan a cabo en un dispositivo de cómputo.
22. Un producto de programa de computadora que comprende instrucciones ejecutables para realizar el método de conformidad con cualquiera de las reivindicaciones 17 a 19 cuando se ejecuta en una computadora. RESUMEN DE LA INVENCIÓN La solicitud se refiere a reconstrucción/regeneración de alta frecuencia (HFR = High Frequency Reconstruction/Regeneration) de señales de audio. En particular, la solicitud se refiere a un método y sistema para realizar HFR de señales de audio que tienen grandes variaciones en nivel de energía a través del intervalo de baja frecuencia que se utiliza para reconstruir las altas frecuencias de la señal de audio. Se describe un sistema configurado para generar una pluralidad de señales de sub-banda de alta frecuencia que cubren un intervalo de alta frecuencia a partir de una pluralidad de señales de sub-banda de baja frecuencia. El sistema comprende medios para recibir la pluralidad de señales de sub-banda de baja frecuencia, medios para recibir un conjunto de energías objetivo o diana, la energía objetivo cubre un intervalo objetivo diferente dentro del intervalo de alta frecuencia y es indicativa de la energía deseada de una o más señales de sub-banda de alta frecuencia que se encuentran dentro del intervalo objetivo; medios para generar la pluralidad de señales de sub-banda de alta frecuencia a partir de la pluralidad de señales de sub -banda de baja frecuencia y de una pluralidad de coeficientes de ganancia espectral asociados con la pluralidad de señales de sub-banda de baja frecuencia respectivamente; y medios para ajusfar la energía de la pluralidad de señales de sub-banda de alta frecuencia utilizando el conjunto de energías obj etivo .
MX2012010854A 2010-07-19 2011-07-14 Procesamiento de señales de audio durante reconstruccion de alta frecuencia. MX2012010854A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US36551810P 2010-07-19 2010-07-19
US38672510P 2010-09-27 2010-09-27
PCT/EP2011/062068 WO2012010494A1 (en) 2010-07-19 2011-07-14 Processing of audio signals during high frequency reconstruction

Publications (1)

Publication Number Publication Date
MX2012010854A true MX2012010854A (es) 2012-10-15

Family

ID=44514661

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2012010854A MX2012010854A (es) 2010-07-19 2011-07-14 Procesamiento de señales de audio durante reconstruccion de alta frecuencia.

Country Status (19)

Country Link
US (6) US9117459B2 (es)
EP (11) EP3544009B1 (es)
JP (11) JP5753893B2 (es)
KR (12) KR20240023667A (es)
CN (2) CN104575517B (es)
AU (11) AU2011281735B2 (es)
BR (2) BR112012024360B1 (es)
CA (11) CA3209829C (es)
CL (1) CL2012002699A1 (es)
DK (2) DK2765572T3 (es)
ES (10) ES2801324T3 (es)
HK (2) HK1249653B (es)
MX (1) MX2012010854A (es)
MY (2) MY154277A (es)
NO (1) NO2765572T3 (es)
PL (10) PL3291230T3 (es)
RU (3) RU2530254C2 (es)
SG (3) SG10202107800UA (es)
WO (1) WO2012010494A1 (es)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CA3209829C (en) 2010-07-19 2024-05-21 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
KR102070432B1 (ko) * 2012-03-21 2020-03-02 삼성전자주식회사 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치
US9173041B2 (en) * 2012-05-31 2015-10-27 Purdue Research Foundation Enhancing perception of frequency-lowered speech
CN104704855B (zh) * 2012-10-15 2016-08-24 杜比国际公司 用于减小基于换位器的虚拟低音系统中的延迟的系统及方法
KR102243688B1 (ko) 2013-04-05 2021-04-27 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
PT3008726T (pt) 2013-06-10 2017-11-24 Fraunhofer Ges Forschung Aparelho e método de codificação, processamento e descodificação de envelope de sinal de áudio por modelação da representação de soma cumulativa empregando codificação e quantização de distribuição
ES2635026T3 (es) 2013-06-10 2017-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento de codificación, procesamiento y decodificación de envolvente de señal de audio por división de la envolvente de la señal de audio utilizando cuantización y codificación de distribución
PT3010018T (pt) * 2013-06-11 2020-11-13 Fraunhofer Ges Forschung Dispositivo e método para extensão de largura de banda para sinais acústicos
KR20170124590A (ko) * 2013-06-21 2017-11-10 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 에너지 조정 모듈을 갖는 대역폭 확장 모듈을 구비한 오디오 디코더
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
SG11201605015XA (en) 2013-12-27 2016-08-30 Sony Corp Decoding device, method, and program
US20150194157A1 (en) * 2014-01-06 2015-07-09 Nvidia Corporation System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals
CN106409303B (zh) 2014-04-29 2019-09-20 华为技术有限公司 处理信号的方法及设备
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
TWI771266B (zh) * 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI901542B (zh) * 2017-03-23 2025-10-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
CN112767915A (zh) * 2017-03-29 2021-05-07 谷歌有限责任公司 将文本转换为语音的系统及其存储介质
WO2019023488A1 (en) * 2017-07-28 2019-01-31 Dolby Laboratories Licensing Corporation METHOD AND SYSTEM FOR PROVIDING MULTIMEDIA CONTENT TO A CUSTOMER
JP7596146B2 (ja) 2017-12-19 2024-12-09 ドルビー・インターナショナル・アーベー 音声音響統合復号および符号化の改良のための方法、機器、およびシステム
TWI895201B (zh) 2018-01-26 2025-08-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
WO2019145955A1 (en) 2018-01-26 2019-08-01 Hadasit Medical Research Services & Development Limited Non-metallic magnetic resonance contrast agent
US11523238B2 (en) * 2018-04-04 2022-12-06 Harman International Industries, Incorporated Dynamic audio upmixer parameters for simulating natural spatial variations
CN118800273A (zh) 2018-04-25 2024-10-18 杜比国际公司 高频音频重建技术的集成
IL313348B2 (en) 2018-04-25 2025-08-01 Dolby Int Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
JP2023127914A (ja) 2022-03-02 2023-09-14 矢崎総業株式会社 車載接続システム及び車載システム設計方法
CN117079657B (zh) * 2023-10-16 2024-01-26 中国铁塔股份有限公司 压限处理方法、装置、电子设备及可读存储介质

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0208712B1 (en) 1984-12-20 1993-04-07 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
DE3912605B4 (de) 1989-04-17 2008-09-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6385573B1 (en) 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
CN1264382C (zh) 1999-12-24 2006-07-12 皇家菲利浦电子有限公司 多通道音频信号处理装置和方法
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE0004818D0 (sv) 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP2004010415A (ja) 2002-06-06 2004-01-15 Kawasaki Refract Co Ltd マグクロ質吹き付け補修材
BRPI0311601B8 (pt) * 2002-07-19 2018-02-14 Matsushita Electric Industrial Co Ltd "aparelho e método decodificador de áudio"
JP4313993B2 (ja) 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
WO2004027368A1 (en) * 2002-09-19 2004-04-01 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
CN100559467C (zh) * 2002-11-29 2009-11-11 皇家飞利浦电子股份有限公司 音频编码
KR100524065B1 (ko) 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
JP2005040749A (ja) 2003-07-25 2005-02-17 Toyo Ink Mfg Co Ltd 紫外線硬化型塗料組成物の硬化方法
CN100507485C (zh) * 2003-10-23 2009-07-01 松下电器产业株式会社 频谱编码装置和频谱解码装置
CN1875402B (zh) * 2003-10-30 2012-03-21 皇家飞利浦电子股份有限公司 音频信号编码或解码
CN1930914B (zh) 2004-03-04 2012-06-27 艾格瑞系统有限公司 对多声道音频信号进行编码和合成的方法和装置
DE602004010188T2 (de) * 2004-03-12 2008-09-11 Nokia Corp. Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
WO2006003813A1 (ja) 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置
JP5089394B2 (ja) 2005-09-30 2012-12-05 パナソニック株式会社 音声符号化装置および音声符号化方法
US20080071550A1 (en) * 2006-09-18 2008-03-20 Samsung Electronics Co., Ltd. Method and apparatus to encode and decode audio signal by using bandwidth extension technique
ES2996584T3 (en) 2006-10-25 2025-02-12 Fraunhofer Ges Forschung Method for audio signal processing
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
US8189812B2 (en) * 2007-03-01 2012-05-29 Microsoft Corporation Bass boost filtering techniques
KR101355376B1 (ko) * 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
CN101790756B (zh) * 2007-08-27 2012-09-05 爱立信电话股份有限公司 瞬态检测器以及用于支持音频信号的编码的方法
JP5098530B2 (ja) * 2007-09-12 2012-12-12 富士通株式会社 復号化装置、復号化方法および復号化プログラム
ATE477572T1 (de) * 2007-10-01 2010-08-15 Harman Becker Automotive Sys Effiziente audiosignalverarbeitung im subbandbereich, verfahren, vorrichtung und dazugehöriges computerprogramm
JP2011504249A (ja) * 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
CN101458930B (zh) 2007-12-12 2011-09-14 华为技术有限公司 带宽扩展中激励信号的生成及信号重建方法和装置
EP2229677B1 (en) * 2007-12-18 2015-09-16 LG Electronics Inc. A method and an apparatus for processing an audio signal
EP2077551B1 (en) 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
WO2010003557A1 (en) * 2008-07-11 2010-01-14 Frauenhofer- Gesellschaft Zur Förderung Der Angewandten Forschung E. V. Apparatus and method for generating a bandwidth extended signal
EP2320416B1 (en) * 2008-08-08 2014-03-05 Panasonic Corporation Spectral smoothing device, encoding device, decoding device, communication terminal device, base station device, and spectral smoothing method
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
PL3598445T3 (pl) * 2009-01-16 2021-12-27 Dolby International Ab Transpozycja harmonicznych rozszerzona o iloczyn wektorowy
EP2211339B1 (en) * 2009-01-23 2017-05-31 Oticon A/s Listening system
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
JP4945586B2 (ja) * 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
TWI591625B (zh) * 2009-05-27 2017-07-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
ES2989851T3 (es) * 2009-10-21 2024-11-27 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
AU2010310041B2 (en) * 2009-10-21 2013-08-15 Dolby International Ab Apparatus and method for generating a high frequency audio signal using adaptive oversampling
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
CA3209829C (en) 2010-07-19 2024-05-21 Dolby International Ab Processing of audio signals during high frequency reconstruction

Also Published As

Publication number Publication date
KR20210118205A (ko) 2021-09-29
KR20170130627A (ko) 2017-11-28
RU2530254C2 (ru) 2014-10-10
CA3027803A1 (en) 2012-01-26
AU2024205275B2 (en) 2024-10-31
CA3234274C (en) 2024-10-22
JP6845962B2 (ja) 2021-03-24
US9117459B2 (en) 2015-08-25
JP6523234B2 (ja) 2019-05-29
PL2596497T3 (pl) 2014-10-31
JP2013531265A (ja) 2013-08-01
NO2765572T3 (es) 2018-01-27
JP2023162400A (ja) 2023-11-08
EP4016527B1 (en) 2023-02-22
PL3288032T3 (pl) 2019-08-30
BR112012024360B1 (pt) 2020-11-03
JP2019144584A (ja) 2019-08-29
US20210366494A1 (en) 2021-11-25
CN103155033B (zh) 2014-10-22
EP3285258A1 (en) 2018-02-21
KR102026677B1 (ko) 2019-09-30
PL3285258T3 (pl) 2019-05-31
ES2712304T3 (es) 2019-05-10
EP3723089A1 (en) 2020-10-14
CA3087957A1 (en) 2012-01-26
EP2596497A1 (en) 2013-05-29
CA3027803C (en) 2020-04-07
ES2807248T3 (es) 2021-02-22
AU2024205275A1 (en) 2024-08-22
SG10202107800UA (en) 2021-09-29
RU2018120544A (ru) 2019-12-04
AU2014203424A1 (en) 2014-07-10
RU2659487C2 (ru) 2018-07-02
CA3203400A1 (en) 2012-01-26
RU2012141098A (ru) 2014-05-10
US20180144753A1 (en) 2018-05-24
AU2024205260A1 (en) 2024-08-22
PL3544009T3 (pl) 2020-10-19
JP2017062483A (ja) 2017-03-30
SG10201505469SA (en) 2015-08-28
CA2792011A1 (en) 2012-01-26
KR101964180B1 (ko) 2019-04-01
KR102095385B1 (ko) 2020-03-31
US20150317986A1 (en) 2015-11-05
WO2012010494A1 (en) 2012-01-26
AU2011281735B2 (en) 2014-07-24
KR20120123720A (ko) 2012-11-09
CA2792011C (en) 2016-04-26
AU2022215250A1 (en) 2022-09-01
AU2016202767A1 (en) 2016-05-19
RU2758466C2 (ru) 2021-10-28
JP6727374B2 (ja) 2020-07-22
EP4210051B1 (en) 2026-01-14
CA3239820A1 (en) 2012-01-26
KR102159194B1 (ko) 2020-09-23
JP7114791B2 (ja) 2022-08-08
KR102304093B1 (ko) 2021-09-23
JP7345694B2 (ja) 2023-09-15
CA3072785A1 (en) 2012-01-26
EP3544009A1 (en) 2019-09-25
EP4210051A1 (en) 2023-07-12
ES2727460T3 (es) 2019-10-16
CL2012002699A1 (es) 2012-12-14
ES2908348T3 (es) 2022-04-28
ES2484795T3 (es) 2014-08-12
EP2596497B1 (en) 2014-05-28
CA3209829C (en) 2024-05-21
ES2644974T3 (es) 2017-12-01
US20170178665A1 (en) 2017-06-22
ES2801324T3 (es) 2021-01-11
JP2021092811A (ja) 2021-06-17
JP2024096944A (ja) 2024-07-17
AU2014203424B2 (en) 2016-02-11
CA3146617A1 (en) 2012-01-26
DK2765572T3 (da) 2017-11-06
EP2765572B1 (en) 2017-08-30
US9911431B2 (en) 2018-03-06
AU2021277643A1 (en) 2021-12-23
KR20190034361A (ko) 2019-04-01
US9640184B2 (en) 2017-05-02
KR20220123333A (ko) 2022-09-06
JP6035356B2 (ja) 2016-11-30
EP3723089B1 (en) 2022-01-19
HK1199973A1 (en) 2015-07-24
ES2798144T3 (es) 2020-12-09
JP2022141919A (ja) 2022-09-29
EP3291230A1 (en) 2018-03-07
KR20180108871A (ko) 2018-10-04
EP3544007A1 (en) 2019-09-25
HK1249798B (en) 2020-04-24
KR101478506B1 (ko) 2015-01-06
CN104575517A (zh) 2015-04-29
KR20200035175A (ko) 2020-04-01
JP2020170186A (ja) 2020-10-15
EP3285258B1 (en) 2018-12-19
BR112012024360A2 (pt) 2016-05-24
CA3234274A1 (en) 2012-01-26
CA3072785C (en) 2020-09-01
EP3544008A1 (en) 2019-09-25
AU2023202541B2 (en) 2024-06-06
CA3087957C (en) 2022-03-22
EP4016527A1 (en) 2022-06-22
US20190221220A1 (en) 2019-07-18
PL4016527T3 (pl) 2023-05-22
AU2023202541A1 (en) 2023-05-11
KR20190112824A (ko) 2019-10-07
PL3723089T3 (pl) 2022-04-25
EP3288032A1 (en) 2018-02-28
KR20170020555A (ko) 2017-02-22
AU2016202767B2 (en) 2018-05-17
US11031019B2 (en) 2021-06-08
AU2018214048A1 (en) 2018-08-23
ES2727300T3 (es) 2019-10-15
JP7228737B2 (ja) 2023-02-24
DK2596497T3 (da) 2014-07-21
HK1249653B (en) 2020-01-03
KR20200110478A (ko) 2020-09-23
KR101907017B1 (ko) 2018-12-05
EP2765572A1 (en) 2014-08-13
JP5753893B2 (ja) 2015-07-22
EP3288032B1 (en) 2019-04-17
RU2014127177A (ru) 2016-02-10
AU2021277643B2 (en) 2022-05-12
EP3544009B1 (en) 2020-05-27
JP6993523B2 (ja) 2022-01-13
JP2015111277A (ja) 2015-06-18
US11568880B2 (en) 2023-01-31
EP3544008B1 (en) 2020-05-20
KR102632248B1 (ko) 2024-02-02
CA3203400C (en) 2023-09-26
JP7797563B2 (ja) 2026-01-13
US20120328124A1 (en) 2012-12-27
KR101709095B1 (ko) 2017-03-08
CA3163657C (en) 2023-08-15
CA3163657A1 (en) 2012-01-26
CA2920930A1 (en) 2012-01-26
US10283122B2 (en) 2019-05-07
AU2018214048B2 (en) 2020-07-30
SG183501A1 (en) 2012-09-27
AU2020233759A1 (en) 2020-10-08
MY177748A (en) 2020-09-23
CA3209829A1 (en) 2012-01-26
RU2018120544A3 (es) 2021-08-17
CN103155033A (zh) 2013-06-12
PL3291230T3 (pl) 2019-08-30
CA3146617C (en) 2022-08-02
EP3291230B1 (en) 2019-04-17
PL3544007T3 (pl) 2020-11-02
PL2765572T3 (pl) 2018-01-31
AU2025200567A1 (en) 2025-02-20
CN104575517B (zh) 2018-06-01
EP3544007B1 (en) 2020-06-17
AU2011281735A1 (en) 2012-09-13
AU2024205260B2 (en) 2024-10-31
KR101803849B1 (ko) 2017-12-04
PL3544008T3 (pl) 2020-08-24
KR20240023667A (ko) 2024-02-22
JP7477700B2 (ja) 2024-05-01
ES2942867T3 (es) 2023-06-07
JP2023053242A (ja) 2023-04-12
CA2920930C (en) 2019-01-29
JP2022031889A (ja) 2022-02-22
AU2020233759B2 (en) 2021-09-16
AU2022215250B2 (en) 2023-02-02
BR122019024695B1 (pt) 2024-02-20
KR102438565B1 (ko) 2022-08-30
KR20130127552A (ko) 2013-11-22
MY154277A (en) 2015-05-29

Similar Documents

Publication Publication Date Title
AU2024205260B2 (en) Processing of audio signals during high frequency reconstruction
RU2826366C1 (ru) Система и способ для генерирования ряда сигналов высокочастотных поддиапазонов

Legal Events

Date Code Title Description
FG Grant or registration