[go: up one dir, main page]

MX2012010415A - Aparato y metodo para procesar una señal de audio de entrada utilizando bancos de filtro en cascada. - Google Patents

Aparato y metodo para procesar una señal de audio de entrada utilizando bancos de filtro en cascada.

Info

Publication number
MX2012010415A
MX2012010415A MX2012010415A MX2012010415A MX2012010415A MX 2012010415 A MX2012010415 A MX 2012010415A MX 2012010415 A MX2012010415 A MX 2012010415A MX 2012010415 A MX2012010415 A MX 2012010415A MX 2012010415 A MX2012010415 A MX 2012010415A
Authority
MX
Mexico
Prior art keywords
filter bank
subband
bank
synthesis
signal
Prior art date
Application number
MX2012010415A
Other languages
English (en)
Inventor
Sascha Disch
Lars Villemoes
Frederik Nagel
Per Ekstrand
Stephan Wilde
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of MX2012010415A publication Critical patent/MX2012010415A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Auxiliary Devices For Music (AREA)
  • Networks Using Active Elements (AREA)

Abstract

Un aparato para procesar una señal de audio de entrada (2300) se basa en una cascada de bancos de filtros, cascada que comprende un banco de filtros de síntesis (2304) para sintetizar una señal de audio intermedia (2306) a partir de la señal de audio de entrada (2300), donde la señal de audio de entrada está representada por una pluralidad de señales de primera subbanda (2303) generadas por un banco de filtros de análisis (2302), donde el número de canales de bancos de filtros del banco de filtros de síntesis (2304) es menor que un número de canales del banco de filtros de análisis (2302). El aparato comprende además un banco de filtros de análisis adicional (2307) para generar una pluralidad de señales de segunda subbanda (2308) de la señal de audio intermedia (2306), donde el banco de filtros adicional tiene un número de canales que difiere del número de canales del banco de filtros de síntesis (2304), por lo que la frecuencia de muestreo de una señal de subbanda de la pluralidad de señales de segunda subbanda (2308) es diferente de la frecuencia de muestreo de una primera señal de subbanda de la pluralidad de señales de primera subbanda (2303).

Description

APARATO Y MÉTODO PARA PROCESAR UNA SEÑAL DE AUDIO DE ENTRADA UTILIZANDO BANCOS DE FILTRO EN CASCADA CAMPO TÉCNICO La presente invención se relaciona con sistemas de codificación de fuentes de audio .que hacen uso de un método de transposición armónica para la reconstrucción de alta frecuencia (HFR), y con procesadores de efectos digitales, por ej. los llamados excitadores, donde la generación de distorsión armónica agrega nitidez a la señal procesada y con los estiradores de tiempo, donde se prolonga la duración de una señal manteniendo a la vez el contenido espectral del original.
ANTECEDENTES DE LA INVENCIÓN En PCT WO 98/57436 se estableció el concepto de transposición como método para recrear una banda de alta frecuencia a partir de una banda de frecuencia más baja de una señal de audio. Se puede obtener un ahorro sustancial de la velocidad de transmisión de bits utilizando este concepto en la codificación de audio. En un sistema de codificación de audio basado en HFR, se procesa una señal de bajo ancho de banda mediante un codificador de forma de onda del núcleo y se regeneran las frecuencias más altas utilizando transposición e información complementaria adicional de muy baja velocidad de transmisión de bits que describe la forma espectral objetivo del lado del decodificador. En el caso de las bajas velocidades de transmisión de bits, donde el ancho de banda de la señal del núcleo codificada es angosto, se hace cada vez más importante recrear una banda alta con características perceptivas agradables. La transposición armónica definida en PCT WO 98/57436 da muy buen resultado en el caso del material musical complejo en una situación de baja frecuencia de cruce. El principio de una transposición armónica es que se mapea una sinusoide con frecuencia ? contra una sinusoide con frecuencia ?? donde G > 1 es un número entero que define el orden de transposición. Por el contrario, un método de HFR basado de modulación de banda lateral única (SSB) mapea una sinusoide con frecuencia ? contra una sinusoide con frecuencia ¿y + A¿y donde ?? es un desplazamiento de frecuencia fijo. Dada una señal del núcleo con bajo ancho de banda, se puede producir una anomalía de sonido, de campanilleo disonante como resultado de la transposición SSB.
Para obtener la mejor calidad de audio posible, los métodos de HFR de alta calidad armónica del estado actual de la técnica emplean complejos bancos de filtro modulados, por ej. una Transformada de Fourier a corto plazo (STFT), con resolución de alta frecuencia y un alto grado de sobremuestreo para alcanzar la calidad de audio requerida. La resolución fina es necesaria para evitar la distorsión perjudicial intermodulación que surge del procesamiento no lineal de sumas de sinusoides. Con una resolución de frecuencia suficientemente alta, es decir subbandas estrechas, los métodos de gran calidad apuntan a contar con el máximo de una sinusoide en cada subbanda. Es necesario un alto grado de sobremuestreo en el tiempo para evitar la distorsión del tipo alias y es necesario un cierto grado de sobremuestreo en la frecuencia para evitar los ecos previos correspondientes a señales transitorias. La desventaja obvia es que la complejidad informática se puede incrementar.
La transposición armónica basada en bloques de subbandas es otro método de HFR utilizado para suprimir los productos de intermodulación, en cuyo caso se emplea un banco de filtros con una resolución de frecuencia más gruesa y un menor grado de sobremuestreo, por ej. un banco de QMF multicanal. En este método, un bloque de tiempo de muestras de subbanda complejas es procesado por un modificador de fases común, en tanto que la superposición de varias muestras modificadas forma una muestra de subbanda de salida. Esto tiene el claro efecto de suprimir los productos de la intermodulación que de lo contrario aparecerían cuando la señal de subbanda de entrada consiste en varias sinusoides. La transposición basada en el procesamiento de subbandas basado en bloques presenta una complejidad informática mucho más baja que los transpondedores de gran calidad y obtiene casi la misma calidad con respecto a muchas señales. Sin embargo, La complejidad es aun mucho más elevada que en el caso de los métodos de HFR basados en SSB triviales, puesto que se necesita una pluralidad de bancos de filtro de análisis, cada uno de los cuales procesa señales de diferentes órdenes de transposición T, en una aplicación típica de HFR para sintetizar el ancho de bando propuesto. Además, una estrategia común consiste en adaptar la velocidad de muestreado de las señales de entrada para ajustarse a los bancos de filtro de análisis de un tamaño constante, pese a que los bancos de filtros procesan señales de diferentes órdenes de transposición. También es habitual aplicar filtros de paso de banda a las señales de entrada a fin de obtener señales de salida, procesadas desde diferentes órdenes de transposición, con densidades espectrales de potencia no traslapada.
El almacenamiento o transmisión de señales de audio con frecuencia está sujeto a estrictas restricciones de velocidad de transmisión de bits. En el pasado, era imprescindible que los codificadores redujeran drásticamente el ancho de banda del audio transmitido cuando sólo se disponía de una velocidad de transmisión de bits muy baja. Los codees de audio modernos hoy en día pueden codificar señales de banda ancha utilizando métodos de extensión de ancho de banda (BWE) [1-12]. Estos algoritmos se basan en una representación perimétrica del contenido de alta frecuencia (HF) que se genera desde la parte de baja frecuencia (LF) de la señal decodificada por medio de la transposición a la región espectral de HF ("patching") y la aplicación de un post procesamiento impulsado por los parámetros. La parte de LF es codificada con cualquier codificador de audio o voz. Por ejemplo, los métodos de extensión de ancho de banda descriptos en [1-4] se basan en el método de modulación de banda lateral única (SSB), con frecuencia denominado asimismo método de "copiado" para generar múltiples patches de HF. Últimamente, se ha presentado un nuevo algoritmo que emplea un banco de vocodificadores de fase [15-17] para la generación de diferentes patches [13] (ver la Fig. 20). Se ha desarrollado este método para evitar la aspereza auditiva que con frecuencia se observa en las señales sometidas a una extensión de ancho de banda de SSB. Sin embargo, dado que el algoritmo de BWE se ejecuta del lado del decodificador de una cadena de codees, la complejidad informática constituye un problema grave. Los métodos del estado actual de la técnica, especialmente le HBE basada en vocodificadores de fase, se realizan a expensas de una complejidad informática muy incrementada en comparación con los métodos basados en SSB.
Como se esbozara anteriormente, los esquemas existentes de extensión de ancho de banda aplican un método de patching en un bloque de señales dado por vez, ya sea el patching basado en SSB [1-4] o el patching basado en vocodificadores de HBE [15-17]. Además, los codificadores de audio modernos [19-20] ofrecen la posibilidad de conmutar el método de patching en forma global basándose en bloques de tiempo entre esquemas de patching alternativos.
El patching de copiado SSB introduce aspereza perjudicial en la señal de audio, aunque es sencillo desde el punto de vista informático y conserva la envolvente temporal de los transitorios. Más aun, la complejidad informática se incrementa significativamente con respecto al sencillísimo método de copiado SSB.
SÍNTESIS DE LA INVENCIÓN En lo que respecta a una reducción de la complejidad, son de particular importancia las velocidades de muestreo. Esto se debe al hecho de que una alta frecuencia de muestreo se traduce en una alta complejidad y una baja frecuencia de muestreo generalmente representa una baja complejidad debido al número reducido de operaciones necesarias. Por otro lado, sin embargo, la situación en aplicaciones de extensión de ancho de banda es particularmente tal que la velocidad de muestreo de la señal de salida del codificador del núcleo sea por lo general tan baja que esta frecuencia de muestreo sea demasiado baja para una señal de ancho de banda total. Dicho de otro modo, cuando la frecuencia de muestreo de la señal de salida del decodificador es, por ejemplo, 2 o 2,5 veces la frecuencia máxima del codificador de la señal de salida del codificador del núcleo, luego una extensión de ancho de banda de, por ejemplo un factor de 2 significa que es necesaria una operación de aumento del número de muestras para que la frecuencia de muestreo de la señal de ancho de banda extendido sea tan alta que el muestreo pueda "cubrir" los componentes de alta frecuencia generados adicionalmente.
Además, los bancos de filtro tales como bancos de filtros de análisis y bancos de filtros de síntesis están a cargo de una considerable cantidad de operaciones de procesamiento. Por ende, el tamaño de los bancos de filtros, de decir si un banco de filtro es un banco de filtro de 32 canales, un banco de filtro de 64 canales o incluso un banco de filtros con un alto número de canales, incluye significativamente en la complejidad del algoritmo de procesamiento de audio. En general, se puede decir un gran número de canales de bancos de filtros requiere más operaciones de procesamiento y, por lo tanto, una mayor complejidad que un pequeño número de canales de banco de filtro. Teniendo en cuenta esto, las aplicaciones de extensión de ancho de banda, como así también en otras aplicaciones de procesamiento de audio en que hay que abordar diferentes velocidades de muestreo, como por ejemplo en aplicaciones de tipo vocodificador o cualquier otra aplicación de efectos de audio, existe una interdependencia específica entre complejidad y frecuencia de muestreo o ancho de banda de audio, lo que significa que las operaciones de aumento de número de muestras o filtrado en subbandas pueden aumentar drásticamente la complejidad sin influir específicamente en la calidad del audio en el buen sentido cuando se eligen herramientas o algoritmos equivocados para las operaciones específicas.
Un objetivo de la presente invención consiste en proponer un concepto de procesamiento de audio mejorado, que por un lado permite el procesamiento con baja complejidad y, por el otro, una buena calidad de audio.
Este objetivo se alcanza mediante un aparato para procesar una señal de audio de entrada de acuerdo con la reivindicación 1 o 18, un método para procesar una señal de audio de entrada de acuerdo con la reivindicación 20 o 21 , o un programa de computación de acuerdo con la reivindicación 22.
Las realizaciones de la presente invención se basan en una colocación específica en cascada de bancos de filtros de análisis y/o síntesis para obtener un remuestreo de baja complejidad sin sacrificar la calidad del audio. En una realización, un aparato para procesar una señal de audio de entrada comprende un banco de filtros de síntesis para sintetizar una señal de audio intermedia a partir de la señal de audio de entrada, donde la señal de audio de entrada está representada por una pluralidad de señales de primera subbanda generadas por un banco de filtros de análisis colocado en la dirección de procesamiento antes del banco de filtro de síntesis, donde el número de canales de bancos de filtros del banco de filtros de síntesis es menor que el número de canales del banco de filtros de análisis. La señal intermedia es procesada además por un banco de filtro de análisis adicional para generar una pluralidad de señales de segunda subbanda de la señal de audio intermedia, donde el banco de filtros adicional tiene un número de canales que difiere del número de canales del banco de filtros de síntesis por lo que la frecuencia de muestreo de una señal de subbanda de la pluralidad de señales de subbanda es diferente de la frecuencia de muestreo de una primera señal de subbanda de la pluralidad de señales de primera subbanda generadas por el banco de filtros de análisis.
La cascada de un banco de filtros de síntesis y un banco de filtros adicional conectado subsiguientemente produce una conversión de la frecuencia de muestreo y, además, una modulación de la porción de ancho de banda de la señal de entrada de audio original que ha sido ingresada en el banco de filtros de síntesis en una banda base. Esta señal intermedia en el tiempo, que ahora ha sido extraída de la señal de audio de entrada original que puede ser, por ejemplo, la señal de salida de un decodificador del núcleo de un esquema de extensión de ancho de banda, ahora está representada preferentemente en forma de señal de muestreo crítico modulada según la banda base y se ha descubierto que esta representación, es decir que la señal de salida remuestreada, al ser procesada por un banco de filtros de análisis adicional para obtener una representación de subbandas de las demás operaciones de procesamiento que pueden o no tener lugar y, por ejemplo, pueden ser operaciones de procesamiento relacionadas con la extensión del ancho de banda tales como operaciones de subbanda no lineal seguidas por el procesamiento de reconstrucción de alta frecuencia y por una combinación de las subbandas en el banco de filtros de síntesis final.
La presente solicitud da a conocer diferentes aspectos de los aparatos, métodos o programas de computación para el procesamiento de señales de audio en el contexto de la extensión del ancho de banda y en el contexto de otras aplicaciones de audio que no están relacionadas con la extensión del ancho de banda. Las características de los aspectos individuales descriptos y reivindicados a continuación se pueden combinar parcial o totalmente, aunque también se las puede emplear por separado, puesto que los aspectos individuales ya dan lugar a ventajas con respecto a la calidad perceptual, la complejidad informática y los recursos de procesador/memoria cuando se las implementa en un sistema de computación o microprocesador.
Las realizaciones presentan un método para reducir la complejidad informática de un método de HFR basado en bloques de subbandas por medio de un filtrado eficiente y conversión de la frecuencia de muestreo de las señales de entrada a las etapas de análisis de los bancos de filtro de HFR. Más aun, se puede demostrar que los filtros de paso de banda aplicados a las señales de entrada son obsoletos en un transpondedor basado en bloques de subbandas.
Las presentes realizaciones contribuyen a reducir la complejidad informática de la transposición armónica basada en bloques de subbandas mediante la implementación eficiente de varios órdenes de transposición basada en bloques de subbandas en el marco de un solo par de bancos de filtros de análisis y síntesis. Dependiendo del compromiso entre calidad perceptual y complejidad informática, sólo se puede ejecutar una subserie de órdenes o todos los órdenes de transposición de manera conjunta dentro de un par de bancos de filtros. Más aun, hay un esquema de transposición combinada donde sólo se calculan directamente ciertos órdenes de transposición, en tanto que el resto del ancho de banda se llena con replicacion de órdenes de transposición disponibles, es decir calculados anteriormente (por ej. 2o orden) y/o el ancho de banda codificado por el núcleo. En este caso el patching se puede llevar a cabo utilizando toda combinación imaginable de rangos de origen para la replicación.
Además, las realizaciones ofrecen un método para mejorar tanto los métodos de HFR armónica de gran calidad como los métodos de HFR armónica basada en bloques de subbandas por medio del alineamiento espectral de las herramientas de HFR. En particular, se obtiene una eficiencia mejorada alineando los bordes espectrales de las señales generadas por HFR con los bordes espectrales del ajuste de envolvente de la tabla de frecuencias. Asimismo, los bordes espectrales de la herramienta limitadora se alinean por el mismo principio con los bordes espectrales de las señales generadas por HFR.
Otras realizaciones están configuradas para mejorar la calidad perceptual de los transitorios y al mismo tiempo reducir la complejidad informática, por ejemplo, mediante la aplicación de un esquema de patching que aplica un patching mixto que consiste en el patching armónico y el patching de copiado.
En las realizaciones específicas, los bancos de filtros individuales de la estructura de bancos de filtros en cascada son bancos de filtros espejo en cuadratura (QMF), todos los cuales se basan en un filtro prototipo de paso bajo o modulados en ventanas utilizando una serie de frecuencias de modulación que definen las frecuencias centrales de los canales de los bancos de filtros. De preferencia, todas las funciones de ventana o filtros prototipo tienen dependencia mutua de tal manera que los filtros de los bancos de filtros con diferentes tamaños (canales de los bancos de filtros) también dependen uno de otro.
Preferentemente, el banco de filtros de mayor tamaño de una estructura de bancos de filtros en cascada que comprende, en algunas realizaciones, un primer banco de filtro de análisis, un banco de filtros conectado inmediatamente, otro banco de filtros de análisis y, en algún estado posterior del procesamiento, un banco de filtros de síntesis final, tiene una respuesta a la función de ventana o filtros prototipo con un cierto número de coeficientes de función de ventana o filtros prototipo. Los bancos de filtros de menor tamaño son, en todos los casos, una versión submuestreada de esta función de ventana, lo que significa que las funciones de ventana de los demás bancos de filtros son versiones submuestreadas de la función de ventana "grande". Por ejemplo, si un banco de filtros tiene la mitad del tamaño de un banco de filtros grande, luego la función de ventana tiene la mitad del número de coeficientes y los coeficientes de los bancos de filtros de menor tamaño se derivan por submuestreo. En esta situación, el submuestreo significa que, por ej. se toma un coeficiente de filtro por medio para el banco de filtros más pequeño que tiene la mitad del tamaño. Sin embargo, cuando hay otras relaciones entre los tamaños de los bancos de filtros que no tienen valores enteros, luego se ejecuta un cierto tipo de interpolación de los coeficientes de ventana, de manera que, en última instancia, la ventana del banco de filtros de menor tamaño sea, una vez más, una versión submuestreada de la ventana del banco de filtros más grande.
Las realizaciones de la presente invención son particularmente ventajosas en situaciones en que sólo se necesita una porción de la señal de audio de entrada para el posterior procesamiento, y esta situación se da especialmente en el contexto de la extensión armónica del ancho de banda. En este contexto, son especialmente preferidas las operaciones de procesamiento del tipo de vocodificador.
Una ventaja de estas realizaciones es que éstas ofrecen una menor complejidad de un transpondedor de QMF por medio de operaciones eficientes en el dominio del tiempo y la frecuencia y una calidad de audio mejorada para la replicación armónica de bandas espectrales basada en QMF y DFT utilizando el alineamiento espectral.
Las realizaciones se relacionan con sistemas de codificación de origen de audio que emplean, por ej., un método de transposición armónica basada en bloques de subbandas para la reconstrucción de alta frecuencia (HFR), y con procesadores de efectos digitales, por ej. los denominados excitadores, en que la generación de distorsión armónica aporta nitidez a la señal procesada, y también con estiradores de tiempo, en que la duración de la señal se extiende manteniendo de todas maneras el contenido espectral de la original. Las realizaciones ofrecen un método para reducir la complejidad informática de un método de HFR armónica basada en bloques de subbandas por medio del filtrado eficiente y la conversión de la frecuencia de muestreo de las señales de entrada con anterioridad a las etapas de análisis del banco de filtros de HFR. Más aun, las realizaciones demuestran que los filtros de paso de banda convencionales aplicados a las señales de entrada son obsoletos en un sistema de HFR basado en bloques de subbandas. Además, las realizaciones ofrecen un método para mejorar tanto los métodos de HFR armónica de alta calidad como los métodos de HFR armónica basada en bloques de subbandas por medio del alineamiento espectral de las herramientas de HFR. En particular, las realizaciones demuestran cómo se obtiene una eficiencia mejorada mediante el alineamiento de los bordes espectrales de las señales generadas por HFR con los bordes espectrales de la tabla de frecuencias de ajuste de envolvente. Más aun, los bordes espectrales de la herramienta limitadora se alinean, por el mismo principio, con los bordes espectrales de las señales generadas por HFR.
BREVE DESCRIPCIÓN DE LOS DIBUJOS Se pasa a describir ahora la presente invención por medio de ejemplos ilustrativos, que no limitan el alcance ni el espíritu de la invención, con referencia a los dibujos que la acompañan, en los cuales: Fig. 1 ilustra el funcionamiento de un transpondedor basado en bloques que utiliza los órdenes de transposición de 2, 3 y 4 en un marco de decodificador potenciado por HFR; Fig. 2 ¡lustra el funcionamiento de las unidades de estiramiento de subbandas no lineales de la Fig. 1 ; Fig. 3 ¡lustra una implementación eficiente del transpondedor basado en bloques de la Fig. 1 , donde los remuestreadores y filtros pasa banda que preceden a los bancos de filtros de análisis de HFR se implementan utilizando remuestreadores en el dominio del tiempo multivelocidad y filtros pasa banda basados en QMF; Fig. 4 ilustra un ejemplo de bloques para la construcción de una implementación eficiente de un remuestreador multivelocidad en el dominio del tiempo de la Fig. 3; Figs. 5a-5f ilustran el efecto de un ejemplo de señal procesada por diferentes bloques de la Fig. 4 para un orden de transposición de 2; Fig. 6 ilustra una implementación eficiente del transpondedor basado en bloques de la Fig. 1 , donde los remuestreadores y filtros pasa banda que preceden a los bancos de filtros de análisis de HFR son reemplazados por pequeños bancos de filtros de síntesis submuestreados que operan en subbandas seleccionadas de un banco de filtros de análisis de 32 bandas; Fig. 7 ilustra el efecto de un ejemplo de señal procesada por un banco de filtros submuestreado de la Fig. 6 correspondiente a un orden de transposición de 2; Figs. 8a-8e ilustran los bloques de implementación de un eficiente reductor multivelocidad del número de muestras en el dominio del tiempo de un factor de 2; Figs. 9a-9-e: ilustran los bloques de implementación de un eficiente reductor multivelocidad del número de muestras en el dominio del tiempo de un factor 3/2; Fig. 10 ¡lustra el alineamiento de los bordes espectrales de las señales del transpondedor de HFR con los bordes de las bandas de frecuencia de ajuste de envolvente en un codificador potenciado por HFR; Fig. 11 ilustra una situación en que surgen anomalías debido a los bordes espectrales no alineados de las señales del transpondedor de HFR; Fig. 12 ilustra una situación en que se evitan las anomalías de la Fig. 11 como resultado de los bordes espectrales alineados de las señales del transpondedor de HFR; Fig. 13 ilustra la adaptación de los bordes espectrales en la herramienta limitadora a los bordes espectrales de las señales del transpondedor de HFR; Fig. 14 ilustra el principio de transposición armónica basada en bloques de subbandas; Fig. 15 ilustra un ejemplo de situación para la aplicación de transposición basada en bloques de subbandas usando varios órdenes de transposición en un códec de audio potenciado por HFR; Fig. 16 ilustra una situación tipo de la técnica anterior respecto del funcionamiento de una transposición basada en bloques de subbandas de múltiples órdenes mediante la aplicación de un banco de filtros de análisis separado por cada orden de transposición; Fig. 17 ilustra una situación típica según la invención con respecto al funcionamiento eficiente de una transposición basada en bloques de subbandas de múltiples órdenes que aplica un único banco de filtros de análisis QMF de 64 bandas; Fig. 18 ilustra otro ejemplo de formación de un procesamiento por señales de subbandas; Fig. 19 ilustra un patching de modulación de banda lateral única (SSB); Fig. 20 ilustra un patching de extensión armónica de ancho de banda (HBE); Fig. 21 ilustra un patching mixto, donde el primer patching se genera debido a la combinación de frecuencias y el segundo patch se genera por un copiado SSB de una porción de baja frecuencia; Fig. 22 ilustra un patching mixto alternativo que utiliza el primer patch de HBE para una operación de copiado de SSB para generar un segundo patch; Fig. 23 ilustra una estructura en cascada preferida de los bancos de filtros de análisis y síntesis; Fig. 24a ilustra una implementación preferida del pequeño banco de filtros de la Fig. 23; Fig. 24b ilustra una implementación preferida del banco de filtros adicional de la Fig. 23; Fig. 25a ilustra reseñas generales de ciertos bancos de filtros de análisis y síntesis de ISO/IEC 14496-3: 2005(E), y en especial una implementación de un banco de filtros de análisis que se puede utilizar para el banco de filtros de análisis de la Fig. 23 y una implementación de un banco de filtros de síntesis que se puede utilizar para el banco de filtros de síntesis final de la Fig. 23; Fig. 25b ilustra una implementación en forma de gráfico de flujo del banco de filtros de análisis de la Fig. 25a; Fig. 25c ilustra una implementación preferida del banco de filtros de síntesis de la Fig. 25a; Fig. 26 ilustra una reseña general del marco de trabajo en el contexto del procesamiento de extensión de ancho de banda y Fig. 27a-b ilustra una implementación preferida del procesamiento de señales de subbandas producidas como salida del banco de filtros adicional de la Fig. 23.
DESCRICIÓN DE LAS REALIZACIONES PREFERIDAS Las realizaciones descriptas a continuación son meramente ilustrativas y pueden ofrecer una reducción de la complejidad de un transpondedor QMF mediante operaciones eficientes en el dominio del tiempo y la frecuencia y una calidad de audio mejorada tanto de la SBR armónica basada en QMF como en DFT mediante el alineamiento espectral. Se entiende que otras personas con capacitación en la técnica considerarán evidentes las modificaciones y variaciones de las disposiciones y detalles aquí descriptos. Por lo tanto, se pretende que sólo estén limitados por el alcance de las reivindicaciones de patente expuestas a continuación y no por los detalles específicos presentados a manera de descripción y explicación de las presentes formas de realización.
La Fig. 23 ilustra una implementación preferida del aparato para procesar una señal de audio de entrada, donde la señal de audio de entrada puede ser una señal de entrada en el dominio del tiempo en línea 2300 producida como salida, por ejemplo, de un decodificador de audio del núcleo 2301. La señal de audio de entrada es ingresada a un primer banco de filtros de análisis 2302 que consiste, por ejemplo, en un banco de filtros de análisis con M canales. En particular, el banco de filtros de análisis 2302 produce como salida M señales de subbanda 2303, que pueden tener una frecuencia de muestreo fs = fs/M. Esto significa que el banco de filtros de análisis es un banco de filtros de análisis con muestreo crítico. Esto significa que el banco de filtros de análisis 2302 provee, por cada bloque de M muestras de entrada en la línea 2300, una sola muestra por cada canal de subbanda. Preferentemente, el banco de filtros de análisis 2302 es un banco de filtros modulado complejo, lo que significa que cada muestra de subbanda tiene una magnitud y una fase o, de modo equivalente, una parte real y una parte imaginaria. Por ende, la señal de audio de entrada en la línea 2300 está representada por una pluralidad de señales de primera subbanda 2303 que son generadas por el banco de filtros de análisis 2302.
Se ingresa una subserie de todas las señales de la primera subbanda en un banco de filtros de síntesis 2304. El banco de filtros de síntesis 2304 tiene Ms canales, donde Ms es menor que M. Por consiguiente, no todas las señales de subbandas generadas por el banco de filtros 2302 son ingresadas como entrada al banco de filtros de síntesis 2304, sino sólo una subserie, es decir un cierto número menor de canales, como se indica en 2305. En la realización de la Fig. 23, la subserie 2305 cubre un determinado ancho de banda intermedio aunque, por otro lado, la subserie puede cubrir asimismo un ancho de banda que comienza con el canal 1 del banco de filtros del banco de filtros 2302 hasta un cala que tiene un número de canal inferior a M, o por otro lado la subserie 2305 también puede cubrir un grupo de señales de subbandas alineadas con el canal M más alto y extenderse hasta un canal más bajo que tenga un número de cana superior al número de canal 1. Por otra parte, se puede iniciar la indexación de los canales con cero dependiendo de la notación empleada en realidad. Preferentemente, sin embargo, en el caso de las operaciones de extensión de ancho de banda se ingresa un cierto ancho de banda intermedio representado por el grupo de señales de subbandas indicado en 2305 en el banco de filtros de síntesis 2304.
Los demás canales que no pertenecen al grupo 2305 no son ingresados como entrada al banco de filtros de síntesis 2304. El banco de filtros de síntesis 2304 genera una señal de audio intermedia 2306, que tiene una frecuencia de muestreo igual a fs Ms/M. Dado que Ms es menor que M, la frecuencia de muestreo de la señal intermedia 2306 ha de ser menor que la frecuencia de muestreo de la señal de audio de entrada en la línea 2300. Por lo tanto, la señal intermedia 2306 representa una señal con número de muestras reducido y demodulada representada por las subbandas 2305, donde la señal es demodulada a la banda base, puesto que se ingresa el canal más bajo del grupo 2305 al canal 1 del banco de filtros de síntesis Ms y el canal más alto del bloque 2305 es ingresado a la entrada más alta del bloque 2304, aparte de ciertas operaciones de relleno de ceros correspondientes al canal más bajo o más alto a fin de evitar problemas de solapamiento ("aliasing") en los bordes de la subserie 2305. El aparato para procesar una señal de audio de entrada comprende además un banco de filtros de análisis adicional 2307 para analizar la señal intermedia 2306 y el banco de filtros adicional tiene A canales, donde MA es diferente de Ms y preferentemente es mayor que Ms. Cuando MA es mayor que MS, luego la frecuencia de muestreo de las señales de subbanda producidas como salida del banco de filtros adicional 2307 e indicadas en 2308 es menor que la frecuencia de muestreo de una señal de subbanda 2303. Sin embargo, cuando MA es menor que MS, luego la frecuencia de muestreo de una señal de subbanda 2308 ha de ser mayor que una frecuencia de muestreo de una señal de subbanda de la pluralidad de señales de primera subbanda 2303.
Por lo tanto, la cascada de bancos de filtros 2304 y 2307 (y preferentemente 2302) produce operaciones de aumento o reducción del número de muestras muy eficientes y de gran calidad o, en términos generales, una herramienta de procesamiento de remuestreo muy eficiente. La pluralidad de señales de segunda subbanda 2308 es procesada adicionalmente, preferentemente, en un procesador 2309 que ejecuta el procesamiento con los datos remuestreados por la cascada de bancos de filtros 2304, 2307 (y preferentemente 2302). Además, es preferible que el bloque 2309 también ejecute una operación de aumento del número de copias correspondiente a las operaciones de procesamiento de extensión de ancho de banda, de manera que, en última instancia, las subbandas provistas como salida por el bloque 2309 tengan la misma frecuencia de muestreo que las subbandas provistas como salida del bloque 2302. Seguidamente, en una aplicación de procesamiento de extensión de ancho de banda, estas subbandas son ingresadas junto con las subbandas adicionales indicadas en 2310, que son preferentemente las subbandas de banda baja generadas, por ejemplo, por el banco de filtros de análisis 2302, en un banco de filtros de síntesis 2311 , que finalmente produce una señal procesada en el dominio del tiempo, por ejemplo una señal de ancho de banda extendido que tiene una frecuencia de muestreo 2fs. Esta frecuencia de muestreo provista como salida del bloque 2311 es, en esta realización, el doble de la frecuencia de muestreo de la señal de la línea 2300, y esta frecuencia de muestreo provista como salida del bloque 2311 es suficientemente alta para que el ancho de banda adicional generado por el procesamiento en el bloque 2309 pueda estar representado en la señal procesada en el dominio del tiempo con gran calidad de audio.
Dependiendo de la aplicación determinada de la presente invención de los bancos de filtros en cascada, el banco de filtros 2302 puede estar en un dispositivo separado y un aparato para procesar una señal de audio de entrada puede comprender solamente el banco de filtros de síntesis 2304 y el banco de filtros adicional 2307. En otras palabras, el banco de filtros de análisis 2302 puede estar distribuido separadamente de un "posf-procesador que comprende los bloques 2304, 2307 y, dependiendo de la implementación, también los bloques 2309 y 2311.
En otras realizaciones, la aplicación de la presente invención que implementa bancos de filtros en cascada puede ser diferente por el hecho de que un dispositivo dado comprende el banco de filtros de análisis 2302 y el banco de filtros de síntesis más pequeño 2304, y la señal intermedia es enviada a un procesador diferente distribuida por un distribuidor diferente o a través de un canal de distribución diferente. Luego, la combinación del banco de filtros de análisis 2302 y el banco de filtros de síntesis más pequeño 2304 representa una manera muy eficiente de reducir el número de muestras y, al mismo tiempo, demodular la señal de ancho de banda representada por la subserie 2305 a la banda base. Esta reducción del número de muestras y demodulación a la banda base se ha realizado sin pérdida alguna de calidad de audio, y especialmente sin pérdida alguna de información de audio y, por lo tanto, es un procesamiento de gran calidad.
La tabla de la Fig. 23 ilustra ciertos números ejemplificativos correspondientes a los diferentes dispositivos. Preferentemente, el banco de filtros de análisis 2302 tiene 32 canales, el banco de filtros de síntesis tiene 12 canales, el banco de filtros adicional tiene el doble de los canales del banco de filtros de síntesis, como por ejemplo 24 canales, y el banco de filtros de síntesis final 2311 tiene 64 canales. En términos generales, el número de canales que hay en el banco de filtros de análisis 2302 es elevado, el número de canales presentes en el banco de filtros de síntesis 2304 es bajo, el número de canales del banco de filtros adicional 2307 es mediano y el número de canales del banco de filtros de síntesis 2311 es muy elevado. Las frecuencias de muestreo de las señales de subbanda procedentes como salida del banco de filtros de análisis 2302 son fs/M. La señal intermedia tiene una frecuencia de m.uestreo fs ¦ Ms/M. Los canales de subbanda del banco de filtros adicional indicados en 2308 tienen una frecuencia de muestreo de fs · MS/(M · MA), y el banco de filtros de síntesis 2311 produce una señal de salida con una frecuencia de muestreo de 2fs, cuando el procesamiento ejecutado en el bloque 2309 duplica la frecuencia de muestreo. Sin embargo, cuando el procesamiento en el bloque 2309 no duplica la frecuencia de muestreo, luego la frecuencia de muestreo producida como salida del banco de filtros de síntesis ha de ser correspondientemente más baja. A continuación se describen otras realizaciones preferidas relacionadas con la presente invención.
La Fig. 14 ilustra el principio de transposición basada en bloques de subbandas. La señal en el dominio del tiempo de entrada es alimentada a un banco de filtros de análisis 1401 que produce una multitud de señales de subbandas de valor complejo. Éstas son alimentadas a la unidad de procesamiento de subbandas 1402. La multitud de señales de subbandas de valor complejo es alimentada al banco de filtros de síntesis 1403 que, a su vez, da salida a la señal en el dominio del tiempo modificada. La unidad de procesamiento de subbandas 1402 ejecuta operaciones de procesamiento no lineal de las subbandas basadas en bloques, de tal manera que la señal en el dominio del tiempo modificada sea una versión transpuesta de la señal de entrada composiciones a un orden de transposición T > \ . La noción de un procesamiento de subbandas basado en bloques se caracteriza por comprender operaciones no lineales en bloques de más de una muestra de subbanda por vez, donde los bloques subsiguientes son colocados en ventana y agregados en forma traslapada para generar las señales de subbandas de salida.
Los bancos de filtros 1401 y 1403 pueden ser de cualquier tipo modulado exponencial complejo tal como QMF o un DFT de ventana. Pueden estar apilados en forma par o impar en la modulación y se los puede definir por un amplio rango de filtros o ventanas prototípicos. Es importante conocer el cociente ?/5 I AfA de los siguientes dos parámetros de los bancos de filtros, medidos en unidades físicas.
• AfA : el espaciamiento de frecuencias de subbandas del banco de filtros de análisis 1401 ; • Afs : el espaciamiento de frecuencias de subbandas del banco de filtros de síntesis 1403.
En cuanto a la configuración del procesamiento por subbandas 1402, es necesario hallar la correspondencia entre los índices de subbanda de origen y de destino. Se observa que una sinusoide de entrada de la frecuencia física O da origen a una contribución principal que tiene lugar en las subbandas de entrada con el índice ?8O./ AfA . Una sinusoide de salida de la frecuencia física transpuesta pretendida G O ha de ser el resultado de la alimentación a la subbanda de síntesis del índice m » T - Q/Afs . Por ende, los valores índice de origen apropiados del procesamiento por subbandas correspondientes a un índice de subbanda dado objetivo m debe acatar lo siguiente La Fig. 15 ilustra un ejemplo de situación correspondiente a la aplicación de transposición basada en bloques de subbandas usando varios órdenes de transposición en un códec de audio potenciado por HFR. Se recibe un flujo de bits transmitido en el decodificador del núcleo 1501 , que provee una señal del núcleo decodificada de bajo ancho de banda en la frecuencia de muestreo fs. Se remuestrea la baja frecuencia a la frecuencia de muestreo de salida 2fs por medio de un banco de análisis QMF complejo modulado de 32 bandas 1502 seguido por un banco de síntesis QMF de 64 bandas (QMF inversa) 1505. los dos bancos de filtros 1502 y 1505 tienen los mismos parámetros de resolución física Afs = AfA y la unidad de procesamiento de HFR 1504 simplemente deja pasar las subbandas más bajas sin modificar correspondientes a la señal del núcleo de bajo ancho de banda. El contenido de alta frecuencia de la señal de salida se obtiene alimentando las subbandas más altas del banco de síntesis QMF del banco de síntesis QMF de 64 bandas 1505 con las bandas de salida de la unidad de transpondedor múltiple 1503, sometidas a formación y modificación espectral ejecutada por la unidad de procesamiento HFR 1504. El transpondedor múltiple 1503 toma como entrada la señal del núcleo decodificada y produce como salida una multitud de señales de subbanda que representan el análisis de 64 bandas QMF de una superposición o combinación de varios componentes de señal transpuestos. El objetivo consiste en pasar por alto el procesamiento HFR; cada componente corresponde a una transposición física de un número entero de la señal del núcleo, (r = 2,3,... ).
La Fig. 16 ilustra un ejemplo de situación de la técnica anterior correspondiente a la operación de una transposición de múltiples órdenes basada en bloques de subbandas 1603 mediante la aplicación de un banco de filtros de análisis separado por cada orden de transposición. En este caso, se han de producir y transferir tres órdenes de transposición r = 2,3,4 en el domino de un QMF de 64 banda que opera a una frecuencia de muestreo de salida 2fs . La unidad de combinación 1604 simplemente selecciona y combina las subbandas pertinentes de cada rama factor de transposición para obtener una única multitud de subbandas de QMF que han de ser alimentadas a la unidad de procesamiento HFR.
Considérese en primer lugar el caso T = 2 . El objetivo consiste específicamente en que la cadena de procesamiento de un análisis QMF de 64 bandas 1602-2, una unidad de procesamiento de subbandas 1603-2 y una síntesis de QMF de 64 bandas 1505 da lugar a una transposición física de T = 2 .
Identificando estos tres bloques con 1401 , 1402 y 1403 de la Fig. 14, se encuentra que ?/^ /?/, = 2 por lo que (1 ) da lugar , en la especificación correspondiente a 1603-2, que la correspondencia entre las subbandas de origen n y destino m está dada por « = m .
En cuanto al caso 7 = 3 , el sistema ilustrativo incluye un convertidor de frecuencia de muestreo 1601-3 que convierte la frecuencia de muestreo de entrada reduciéndola en un factor 3/2 de fs a 2fs/3. El objetivo consiste específicamente en que la cadena de procesamiento del análisis QMF de 64 bandas 1602-3, la unidad de procesamiento de subbandas 1603-3 y una síntesis de QMF de 64 bandas 1505 dé lugar en una transposición física de 7 = 3 . Identificando estos tres bloques con 1401 , 1402 y 1403 de la Fig. 14, se halla, debido al remuestreo, que ?/? / ? ^ = 3 por lo que (1 ) produce la especificación correspondiente a 1603-3 que la correspondencia entre las subbandas de origen « y de destino m está dada, una vez más, por n = m .
En cuando al caso 7 = 4 , el sistema ilustrativo incluye un convertidor de frecuencia de muestreo 1601-4 que convierte la frecuencia de muestreo de entrada reduciéndola en un factor de dos de fe a fs/2. El objetivo consiste específicamente en que la cadena de procesamiento del análisis QMF de 64 bandas 1602-4, la unidad de procesamiento de subbandas 1603-4 y una síntesis de QMF de 64 bandas 1505 dé lugar en una transposición física de 7 = 4. Identificando estos tres bloques con 1401 , 1402 y 1403 de la Fig. 14, se halla, debido al remuestreo, que Afs / AfA = 4 por lo que (1 ) produce la especificación correspondiente a 1603-4 que la correspondencia entre las subbandas de origen n y de destino m también está dada por n = m .
La Fig. 17 ilustra un ejemplo de situación de acuerdo con la invención de una operación eficiente de transposición de múltiples órdenes basada en bloques de subbandas aplicando un único banco de filtros de análisis Q F de 64 bandas. Por cierto, el uso de tres bancos de análisis QMF separados y dos convertidores de frecuencia de muestreo de la Fig. 16 dan lugar a una complejidad informática más bien alta, como así también ciertas desventajas de implementación del procesamiento basado en cuadros debido a la conversión de la frecuencia de muestreo 1601-3. Las presentes realizaciones se basan en el reemplazo de las dos ramas 1601-3? 1602-3? 1603-3 y 1601-4? 1602-4? 1603-4 por el procesamiento de subbandas 1703-3 y 1703-4, respectivamente, en tanto que la rama 1602-2? 1603-2 se mantiene inalterada en comparación con la Fig 16. En este caso los tres órdenes de transposición se han de ejecutar en el dominio de un banco de filtros con referencia a la Fig. 14, donde ísf5 l ¿fA = 2 . En el caso r = 3 , la especificación para 1703-3 dada por (1) es que la correspondencia entre las subbandas de origen « y de destino m está dada por « * 2m /3 . En cuanto al caso T = 4 , las especificaciones correspondientes a 1703-4 dadas por (1 ) son que la correspondencia entre las subbandas de origen » y de destino m está dada por « * 2m . Para reducir aun más la complejidad, se pueden generar algunos órdenes de transposición copiando los órdenes de transposición ya calculados o la salida del decodificador del núcleo.
La Fig. 1 ilustra el funcionamiento de un transpondedor basado en bloques de subbandas que utiliza los órdenes de transposición de 2, 3 y 4 en un marco de trabajo de decodificador potenciado por HFR, tal como SBR [ISO/IEC 14496-3:2009, "Information technology - Coding of audio-visual objects - Parte 3: Audio]. El flujo de bits es decodificado al dominio del tiempo por el decodificador del núcleo 101 y transferido al módulo de HFR 103, lo que genera una señal de alta frecuencia a partir de la señal del núcleo de la banda base. Una vez generada, la señal generada por HFR se ajusta dinámicamente para equipararse a la señal original al máximo posible por medio de la información complementaria transmitida. Este ajuste es ejecutado por el procesador de HFR 105 en las señales de subbanda obtenidas de uno o varios bancos de análisis QMF. Una situación típica es un caso en el decodificador del núcleo opera sobre una señal en el dominio del tiempo muestreada a la mitad de la frecuencia de las señales de entrada y salida, es decir que el módulo decodificador HFR remuestrea efectivamente la señal del núcleo al doble de la frecuencia de muestreo. Esta conversión de la frecuencia de muestreo se obtiene habitualmente en el primer paso de filtrado de la señal del codificador del núcleo por medio de un banco de análisis QMF de 32 bandas 102. Las subbandas por debajo de la denominada frecuencia de cruce, es decir la serie más baja de las 32 subbandas que contiene la totalidad de la energía de la señal del codificador del núcleo se combina con la serie de subbandas que acarrean la señal generada por HFR. Habitualmente, el número de subbandas así combinadas es 64, lo que, después del filtrado por el banco de QMF de síntesis 106, da lugar a una señal del codificador del núcleo con frecuencia de muestreo convertida combinada con la salida del módulo HFR.
En el transpondedor basado en bloques de subbandas del módulo HFR 103, se han de producir tres órdenes de transposición T = 2, 3 y 4, y transferir en el dominio de un QMF de 64 bandos que funciona a una frecuencia de muestreo de salida 2fs . La señal en el dominio del tiempo de entrada es filtrada por pasa banda en los bloques 103-12, 103-13 y 103-14. Esto se hace para hacer que las señales de salida, procesadas por los diferentes órdenes de transposición, tengan contenidos espectrales no traslapados. También se reduce el número de muestras de las señales (103-23, 103-24) para adaptar la frecuencia de muestreo de las señales de entrada para ajustarse a los bancos de filtros de análisis de un tamaño constante (en este caso 64). Se puede notar que la explicación del aumento de la frecuencia de muestreo, de fs a 2fs, puede ser que los convertidores de frecuencia de muestreo utilizan factores de reducción del número de muestras de 7/2 en lugar de 7", donde esto último daría origen a señales de subbandas transpuestas con la misma frecuencia de muestreo que la señal de entrada. Las señales con número de muestras reducido son alimentadas a bancos de filtros de análisis HFR separados (103-32, 103-33 y 103-34), uno por cada orden de transposición, lo que produce una multitud de señales de subbanda de valor complejo. Estas son alimentadas a las unidades de estiramiento de subbandas no lineales (103-42, 103-43 y 103-44). La multitud de subbandas de salida de valor complejo es alimentada al módulo Fusión/Combinación 104 junto con la salida del banco de análisis submuestreado 102. La unidad de Fusión/Combinación simplemente funde las subbandas salientes del banco de filtro de análisis del núcleo 102 y cada rama de factor de estiramiento en una única multitud de subbandas QMF a alimentar a la unidad de procesamiento HFR 105.
Cuando se ajustan los espectros de señales de diferentes órdenes de transposición de manera que no se traslapen, es decir que el espectro de la señal del 7o orden de transposición debería comenzar donde termina el espectro de la señal del orden T-1 , las señales transpuestas deben ser de carácter pasa banda. De ahí, los filtros pasa banda tradicionales 103-12-103-14 de la Fig. 1. Sin embargo, por medio de una sencilla selección exclusiva entre las subbandas disponibles mediante la Unidad de fusión/combinación 104, los filtros pasa banda separados son redundantes y pueden ser evitados. Por el contrario, se aprovecha la característica de pasa banda inherente provista por el banco QMF alimentando las diferentes contribuciones de las ramas del transpondedor independientemente a diferentes canales de subbandas en 104. También basta con la aplicación de estiramiento del tiempo sólo a las bandas que se combinan en 104.
La Fig. 2 ¡lustra el funcionamiento de una unidad de estiramiento de subbandas no lineal. El extractor de bloques 201 muestrea un cuadro finito de muestras de la señal de entrada de valor complejo. El cuadro está definido por una posición de puntero de entrada. Este cuadro sufre el procesamiento no lineal en 202 y seguidamente es enventanado por una ventana de longitud finita 203. Las muestras así obtenidas se suman a las muestras de salida anteriores de la unidad de traslape y suma 204 donde la posición del cuadro de salida está definida por una posición de puntero de salida. El puntero de entrada se incrementa en una cantidad fija y el puntero de salida se incrementa en un factor de estiramiento de subbandas multiplicado por la misma cantidad. Una iteración de esta cadena de operaciones produce una señal de salida cuya duración es el factor de estiramiento de subbandas multiplicado por la duración de la señal de subbanda de entrada, hasta la longitud de la ventana de síntesis.
Si bien el transpondedor SSB empleado por SBR [ISO/IEC 14496-3:2009, "Information technology - Coding of audio-visual objects - Parte 3: Audio] aprovecha, por lo general, la totalidad de la banda base, excluyendo la primera subbanda, para generar la señal de banda alta, un transpondedor armónico utiliza generalmente una parte más pequeña del espectro del codificador del núcleo. La cantidad empleada, el denominado rango de origen, depende del orden de transposición, del factor de extensión de ancho de banda y de las reglas aplicadas al resultado combinado, por ej. si se permite que las señales generadas por diferentes órdenes de transposición se traslapen espectralmente o no. Como consecuencia de ello, sólo una parte limitada del espectro de salida del transpondedor armónico correspondiente a un determinado orden de transposición es utilizada en realidad por el módulo de procesamiento HFR 105.
La Fig. 18 ilustra otra realización de un ejemplo de ¡mplementación de procesamiento para el procesamiento de una señal de subbanda única. La señal de subbanda única ha sido sometida a algún tipo de decimación antes o después de su filtración por un banco de filtros de análisis que no se ilustra en la Fig. 18. Por lo tanto, la duración en el tiempo de la señal de subbanda única es menor que la duración en el tiempo antes de formar la decimación. La señal de subbanda única es ingresada a un extractor de bloques 1800, que puede ser idéntico al extractor de bloques 2s01 , aunque también se lo puede implementar de otra manera. El extractor de bloques 1800 de la Fig. 18 opera utilizando un valor de avance de muestra/bloque denominado ilustrativamente e. El valor de avance de muestra/bloque puede ser variable o puede ser fijo y es el ilustrado en la Fig. 18 en forma de flecha hacia el extractor de bloques box 1800. A, la salida del extractor de bloques 1800, existe una pluralidad de bloques extraídos. Estos bloques son altamente traslapados, puesto que el valor de avance de muestra/bloque e es significativamente más bajo que la longitud de bloque del extractor de bloques. Un ejemplo es que el extractor de bloques extrae los bloques de 12 muestras. El primer bloque comprende las muestras 0 a 11 , el segundo bloque comprende las muestras 1 a 12, el tercer bloque comprende las muestras 2 a 13, y así sucesivamente. En esta realización, el valor de avance de muestra/bloque e es igual a 1 , y hay un traslape de 11 veces.
Los bloques individuales son ingresados en un enventanador 1802 para colocar en ventana los bloques utilizando una función de ventana por cada bloque. Además, se incluye un calculador de fase 1804 que calcula una fase por cada bloque. El calculador de fase 1804 puede utilizar el bloque individual antes de la enventanado o posteriormente a la enventanado. Seguidamente, se calcula un valor de ajuste de fase p x k y se lo ingresa a un ajustador de fase 1806. El ajustador de fase aplica el valor de ajuste a cada muestra del bloque. Más aun, el factor k es igual al factor de extensión de ancho de banda. Cuando se debe obtener, por ejemplo, la extensión de ancho de banda en factor 2, luego se multiplica la fase p calculada con respecto a un bloque extraído por el extractor de bloques 1800 por el factor 2 y el valor de ajuste aplicado a cada muestra del bloque en el ajustador de fase 1806 es p multiplicado por 2. Este es un valor/regla ilustrativo. Por otro lado, la fase corregida para la síntesis es k * p, p + (k-1)*p. Por ello, en este ejemplo el factor de corrección es 2 si se multiplica o 1*p si se suma. Se pueden aplicar otros valores/reglas para calcular el valor de corrección de fase.
En una realización, la señal de subbanda única es una señal de subbanda compleja y se puede calcular la fase de un bloque de una pluralidad de maneras diferentes. Una manera consiste en tomar la muestra en el centro o alrededor del centro del bloque y calcular la fase de esta muestra compleja. También es posible calcular la fase por cada muestra.
Aunque se ilustra en la Fig. 18 de la manera que opera un ajustador de fase con posterioridad al dispositivo de enventanado, estos dos bloques también se pueden intercambiar, de manera que se ejecute el ajuste de fase en los bloques extraídos por el extractor de bloques y se ejecute una posterior operación de enventanado. Dado que ambas operaciones, es decir, la enventanado y el ajuste de fase son multiplicaciones de valor real o valor complejo, estas dos operaciones se pueden resumir en una única operación que utiliza un factor de multiplicación complejo que, en sí, es el producto de un factor de multiplicación para ajuste de fase y un factor de enventanado.
Los bloque con fases ajustadas son ingresados en un bloque de traslape/suma y corrección de la amplitud 1808, donde los bloques enventanados y con fase ajustada son agregados con traslape. Lo importante, sin embargo, es que el valor de avance de muestra/bloque del bloque 1808 es diferente del valor empleado en el extractor de bloques 1800. En particular, el valor de avance de muestra/bloque del bloque 1808 es mayor que el valor e usado en el bloque 1800, por lo que se obtiene un estiramiento de tiempo de la señal provista como salida del bloque 1808. Por consiguiente, la señal de subbanda procesada provista como salida del bloque 1808 tiene una longitud mayor que la señal de subbanda de entrada al bloque 1800. Cuando se debe obtener una extensión de ancho de banda de dos, luego se utiliza el valor de avance de muestra/bloque, que es dos veces el valor correspondiente del bloque 1800. Esto da lugar a un estiramiento del tiempo en un factor de dos. Cuando, de lo contrario, se deben utilizar otros factores de estiramiento del tiempo, se pueden utilizar otros valores de avance de muestra/bloque de manera que la salida del bloque 1808 tenga la duración de tiempo necesaria.
Para abordar el problema del traslape, preferentemente se ejecuta una corrección de la amplitud a fin de resolver el problema de los traslapes diferentes en los bloques 1800 y 1808. Esta corrección de la amplitud se podría introducir asimismo en el factor de multiplicación de enventanador/ajustador de fase, aunque la corrección de la amplitud se puede realizar asimismo con posterioridad al traslape/procesamiento.
En el ejemplo anterior con una longitud de bloques de 12 y un valor de avance de muestra/bloque en el extractor de bloques de uno, el valor de avance de muestra/bloque correspondiente al bloque de traslape/suma 1808 sería igual a dos, cuando se ejecuta una extensión de ancho de banda de un factor de dos. Esto de todas maneras daría como resultado un traslape de cinco bloques. Cuando se debe ejecutar una extensión de ancho de banda de un factor de tres, luego el valor de avance de muestra/bloque utilizado por el bloque 1808 sería igual a tres y el traslape descendería a un traslape de tres. Cuando se ha de ejecutar una extensión de ancho de banda de cuatro veces, luego el bloque de traslape/suma 1808 tendría que utilizar un valor de avance de muestra/bloque de cuatro, que de todas maneras daría origen a un traslape de más de dos bloques.
Se pueden obtener grandes ahorros de computación restringiendo las señales de entrada a las ramas del transpondedor para que contengan únicamente el rango de origen, y esto a una frecuencia de muestreo adaptada a cada orden de transposición. En la Fig. 3 se ilustra el esquema de bloques básico de ese tipo de sistema correspondiente a un generador de HFR basado en bloques de subbandas. La señal de entrada del codificador del núcleo es procesada por reductores del número de muestras que preceden a los bancos de filtros de análisis de HFR.
El efecto esencial de cada reductor del número de muestras es el filtrado de la señal del rango de origen y su transferencia al banco de filtros de análisis a la frecuencia de muestreo más baja posible. En este caso, la más baja posible se refiere a la frecuencia de muestreo más baja adecuada para el procesamiento posterior, no necesariamente la frecuencia de muestreo más baja que evite el solapamiento después de la decimación. La conversión de la frecuencia de muestreo se puede obtener de diversas maneras. Sin limitar el alcance de la invención, se presentan dos ejemplos: el primero demuestra el remuestreo ejecutado por un procesamiento multivelocidad en el dominio del tiempo y el segundo ilustra el remuestreo obtenido por medio del procesamiento por QMF en subbandas.
La Fig. 4 ilustra un ejemplo de los bloques de un reductor multivelocidad del número de muestras en el dominio del tiempo por un orden de transposición de 2. La señal de entrada, con un ancho de banda 8 Hz y una frecuencia de muestreo fs, es modulada por un exponencial complejo (401) a fin de desplazar en la frecuencia el comienzo del rango de origen de la frecuencia DC de la siguiente manera Los ejemplos de una señal de entrada y el espectro tras la modulación están ilustrados en las Figs. 5(a) y (b). La señal modulada es interpolada (402) y filtrada por un filtro de paso bajo de valor complejo con límites de pasa banda de 0 y B/2 Hz (403). Los espectros después de los respectivos pasos están expuestos en las Figs. 5(c) y (d). Seguidamente se decima la señal filtrada (404) y se computa la parte real de la señal (405). Los resultados después de estos pasos están expuestos en las Figs. 5(e) y (f). En este ejemplo específico, cuando 7=2, ß=0.6 (en una escala normalizada, es decir fs=2), se elige un P2 de 24, para cubrir con seguridad el rango de origen. El factor de reducción del número de muestras es entonces >2T _ 64 _ 8 P2 ~ 24 ~ 3 , donde la fracción se ha reducido en un factor común de 8. Por ende, el factor de interpolación es 3 (como se aprecia en la Fig. 5(c)) y el factor de decimación es 8. Utilizando las Identidades de Noble ["Multirate Systems And Banco de filtros," P.P. Vaidyanathan, 1993, Prentice Hall, Englewood Cliffs], se puede correr el completamente a la izquierda y el interpolador completamente a la derecha de la Fig. 4. De esta manera, la modulación y filtrado se realizan con la frecuencia de muestreo más baja posible y así se reduce aun más la complejidad informática.
Otra estrategia consiste en usar las salidas de subbandas del banco QMF de análisis de 32 bandas submuestreado 102 que ya está presente en el método de HFR SBR. Las subbandas que cubren los rangos de origen correspondientes a las diferentes ramas del transpondedor se sintetizan al dominio del tiempo mediante pequeños bancos QMF submuestreado que preceden a los bancos de filtros de análisis de HFR. Este tipo de sistema de HFR está ilustrado en la Fig. 6.
Los pequeños bandos de QMF se obtienen submuestreando el banco QMF de 64 bandas original, donde los coeficientes de filtro prototípicos se encuentran mediante la interpolación lineal del filtro prototipo original. Siguiendo la notación de la Fig. 6, el banco QMF de síntesis que precede a la rama de transpondedor de 2° orden tiene Q2=12 bandas (las subbandas con índices de base cero de 8 a 19 en el QMF de 32 bandas). Para prevenir el solapamiento en el proceso de síntesis, se ajusta la primera (índice 8) y la última (índice 19) banda a cero. La salida espectral así obtenida está expuesta en la Fig. 7. Nótese que el banco de filtros de análisis del transpondedor basado en bloques tiene 2Q2=24 bandas, es decir el mismo número de bandas que en el ejemplo basado en el reductor multivelocidad del número de muestras en el dominio del tiempo (Fig. 3).
Al comparar la Fig. 6 con la Fig. 23, se pone de manifiesto que el elemento 601 de la Fig. 6 corresponde al banco de filtros de análisis 2302 de la Fig. 23. Más aun, el banco de filtros de síntesis 2304 de la Fig. 23 corresponda al elemento 602-2, y el banco de filtros adicional 2307 de la Fig. 23 corresponde al elemento 603-2. El bloque 604-2 corresponda al bloque 2309 y el combinador 605 puede corresponder al banco de filtros de síntesis 2311 aunque, en otras realizaciones, el combinador puede estar configurado para producir como salida señales de subbanda y luego se puede utilizar otro banco de filtros de síntesis conectado al combinador. Sin embargo, dependiendo de la implementación, se puede ejecutar una determinada reconstrucción de alta frecuencia como se explica en el contexto de la Fig. 26 más adelante, antes del filtrado realizado por el banco de filtros de síntesis 2311 o el combinador 205, o bien se puede ejecutar después del filtrado de síntesis ejecutado en el banco de filtros de síntesis 2311 de la Fig. 23 o después del combinador en el bloque 605 de la Fig. 6.
Las demás ramas que se extienden de 602-3 a 604-3 o que se extienden de 602-T a 604-T no están expuestas en la Fig. 23, aunque se las puede implementar de manera similar, pero con diferentes tamaños de bancos de filtros, donde T corresponde, en la Fig. 6, a un factor de transposición. Sin embargo, como se describe en el contexto de la Fig. 27, se puede introducir la transposición en un factor de 3 y la transposición en un factor de 4 en la rama de procesamiento que consiste en el elemento 602-2 a 604-2 de manera que el bloque 604-2 no sólo produzca una transposición en un factor de 2 sino también una transposición en un factor de 3 y se utiliza un factor de 4, junto con cierto banco de filtros de síntesis de acuerdo con lo descripto en el marco de las Figs. 26 y 27.
En la realización de la Fig., Q2 corresponde a Ms y Ms es igual, por ejemplo, a 12. Asimismo, el tamaño del banco de filtros adicional 603-2 correspondiente al elemento 2307 es igual a 2MS tal como 24 en esta realización.
Más aun, como se esbozara anteriormente, el canal de la subbanda más baja y el canal de la subbanda más alta del banco de filtros de síntesis 2304 pueden ser alimentados con ceros a fin de evitar problemas de solapamiento.
El sistema delineado en la Fig. 1 puede ser considerado un caso especial simplificado del remuestreo delineado en las Figs. 3 y 4. Para simplificar la disposición, se omiten los moduladores. Más aun, todo el filtrado de análisis HFR se obtiene utilizando bancos de filtros de análisis de 64 bandas. Por ende, P2 = P3 = P4 = 64 de la Fig. 3, y los factores de reducción del número de muestras son 1 , 1 ,5 y 2 para las ramas del transpondedor de 2o, 3o y 4o orden, respectivamente.
Una ventaja de la presente invención es que, en el contexto del procesamiento de muestreo crítico de la invención, se pueden utilizar las señales de subbanda del banco QMF de análisis de 32 bandas correspondiente al bloque 2302 de la Fig. 23 o 601 de la Fig. 6 de acuerdo con lo definido en MPEG4 (ISO/IEC 14496-3). La definición de este banco de filtros de análisis en la Norma MPEG-4 está ilustrada en la porción superior de la Fig. 25a y se la ilustra en forma de gráfico de flujo en la Fig. 25b, que también ha sido tomada de la Norma MPEG-4. La porción de SBR (replicación del ancho de banda espectral) de esta norma se incorpora a la presente como referencia. En particular, se puede implementar el banco de filtros de análisis 2302 de la Fig. 23 o el QMF de 32 bandas de la Fig. 6 de conformidad con lo ilustrado en la Fig. 25a, en su porción superior y el gráfico de flujo de la Fig. 25b.
Más aun, también se puede implementar el banco de filtros de síntesis ilustrado en el bloque 2311 de la Fig. 23 como se indica en la porción inferior de la Fig. 25a y como se ilustra en el gráfico de flujo de la Fig. 25c. Sin embargo, se puede aplicar cualquier otra definición de banco de filtros, aunque por lo menos en el caso del banco de filtros de análisis 2302, es preferible la implementación ilustrada en las Figs. 25a y 25b debido a la robustez, estabilidad y alta calidad provista por este banco de filtros de análisis MPEG-4 que consta de 32 canales, por lo menos en el contexto de aplicaciones de extensión de ancho de banda tales como replicación de ancho de banda espectral o, en términos generales, en aplicaciones de procesamiento de reconstrucción de alta frecuencia.
El banco de filtros de síntesis 2304 está configurado para sintetizar una subserie de subbandas que cubren el rango de origen correspondiente a un transpondedor. Esta síntesis se realiza para sintetizar la señal intermedia 2306 en el dominio del tiempo. Preferentemente, el banco de filtros de síntesis 2304 es un pequeño banco de QMF de valor real submuestreado.
La salida en el dominio del tiempo 2306 de este banco de filtros es alimentada luego a un banco QMF de análisis de valor complejo del doble del tamaño del banco de filtros. Este banco QMF está representado por el bloque 2307 de la Fig. 23. Este procedimiento permite un ahorro sustancial de la complejidad informática ya que sólo el rango de origen relevante se transforma al dominio de subbandas QMF con la resolución de frecuencia duplicada. Los pequeños bancos de QMF se obtienen submuestreando el banco QMF de 64 bandas original, donde los coeficientes de filtro prototípicos se obtienen mediante la interpolación lineal del filtro prototipo original. Preferentemente, se utiliza el filtro prototipo asociado al banco de filtros de síntesis MPEG-4 con 640 muestras, donde el banco de filtros de análisis MPEG-4 tiene una ventana de 320 muestras de ventana.
El procesamiento de los bancos de filtros submuestrados está ilustrado en las Figs. 24a y 24b, que presentan gráficos de flujo. En primer lugar se determinan las siguientes variables: ¾ =Startsubba«daL(¾toMi .fl(0)) donde Ms es el tamaño del banco de filtros de síntesis submuestreado y kL representa el índice de subbanda del primer canal del banco QMF de 32 bandas a entrar en el banco de filtros de síntesis submuestreado. La matriz startSubband2kL (iniciosubbanda2kL) está consignada en la Tabla 1. La función piso {x} redondea el argumento x al entero más próximo hacia el infinito negativo.
Tabla 1 - y = startSubband2kl_(x) Por consiguiente, el valor Ms define el tamaño del banco de filtros de síntesis 2304 de la Fig. 23 y KL es el primer canal de la subserie 2305 indicado en la Fig. 23. Específicamente, el valor incluido en la ecuación ftabia aja está definido en ISO/IEC 14496-3, sección 4.6.18.3.2, que también se incorpora a la presente como referencia. Se debe tener en cuenta que el valor Ms sufre incrementos de 4, lo que significa que el tamaño del banco de filtros de síntesis 2304 puede ser 4, 8, 12, 16, 20, 24, 28 o 32.
Preferentemente, el banco de filtros de síntesis 2304 es un banco de filtros de síntesis de valor real. Para este fin, se calcula una serie de muestras de subbandas de valor real Ms a partir de las nuevas muestras de subbandas de valor complejo Ms de acuerdo con el primer paso de la Fig. 24a. Para este fin se utiliza la siguiente ecuación En la ecuación, exp() denota la función exponencial compleja, / es la unidad imaginaria y kL ya se había definido anteriormente.
• Desplazamiento de las muestras de la matriz v a 2Ms posiciones. Se descartan las muestras 2Ms más antiguas.
Se multiplican las muestras de subbandas de valor real Ms por la matriz N, decir que se computa el producto de matriz-vector N V, donde - (k + 0.5) -(2 - n -Ms) \0=k < Ms N(&,n) =— - eos 2MS [ =n < 2MS La salida de esta operación es almacenada en las posiciones 0 a 2/Ws~1 de la matriz v.
• Se extraen las muestras de v de acuerdo con el gráfico de flujo de la Fig. 24a para crear la matriz de 10Ms elementos g.
· Se multiplican las muestras de la matriz g por la ventana c¡ para producir la matriz w. Los coeficientes de ventana c¡ se obtienen mediante la interpolación lineal de los coeficientes c, es decir por medio de la ecuación c,.(«) = p{n) c( («) + 1) + (1 - p{n)) ?(µ(?)), 0=n < 10MS donde µ(?) y p(n) se definen como número entero y fracciones componentes de 6 - n lMs , respectivamente. Los coeficientes de ventana de c se pueden encontrar en la Tabla 4.A.87 de ISO/IEC 14496-3:2009.
Por lo tanto, el banco de filtros de síntesis tiene una calculadora de funciones de ventana prototipo para calcular una función de ventana prototipo mediante el submuestreo o interpolación utilizando una función de ventana almacenada para un banco de filtros de diferente tamaño.
• Se calculan Ms nuevas muestras de salida mediante la sumatoria de las muestras de la matriz w de acuerdo con el último paso del gráfico de flujo de la Fíg. 24a.
A continuación, se ilustra la implementacion preferida del banco de filtros adicional 2307 de la Fig. 23 junto con el gráfico de flujo de la Fig. 24b.
• Se desplazan las muestras de la matriz x 2Ms posiciones de acuerdo con el primer paso de la Fig. 24b. Se descartan las 2Ms muestras más antiguas y se almacenan las 2MS nuevas muestras en las posiciones 0 a 2Ms-1.
• Se multiplican las muestras de la matriz x por los coeficientes de ventana C2¡.
Los coeficientes de ventana c2¡ se obtienen mediante la interpolación lineal de los coeficientes c, es decir por medio de la ecuación ¾, («) = yO(«) c( i(n) + l) + (l - ?{?)) ?(µ{?)), 0 < n < 20Ms donde («) y p(n) se definen como el número entero y las fracciones componentes de 32· ni Ms , respectivamente. Los coeficientes de ventana de c se pueden encontrar en la Tabla 4.A.87 de ISO/IEC 14496-3:2009.
Por ende, el banco de filtros adicional 2307 tiene una calculadora de funciones de ventana prototipo para calcular una función de ventana prototipo mediante submuéstreo o interpolación utilizando una función de ventana almacenada para un banco de filtros de diferente tamaño.
• Se suman las muestras de acuerdo con la fórmula del gráfico de flujo de la Fig. 24b para generar la matriz de 4MS elementos u.
• Se calculan 2Ms nuevas muestras de subbandas de valor complejo mediante la multiplicación de matriz-vector M u, donde En la ecuación, exp() denota la función exponencial compleja e / es la unidad imaginaria.
En la Fig. 8(a) se ilustra un diagrama de un reductor del número de muestras de factor 2. El filtro de paso bajo ahora de valor real se puede representar como H(z) = B(z)/ A(z) , donde5(z) es la parte no recursiva (FIR) y^(z)es la parte recursiva (MR). Sin embargo, para una implementación eficiente, utilizando las identidades de Noble para reducir la complejidad informática, es conveniente diseñar un filtro en que todos los polos tengan una multiplicidad de 2 (polos dobles) en términos de A(z2) . Por ende, el filtro se puede factorear de la manera ilustrada en la Fig. 8(b). Usando la Identidad de Noble 1 , se puede correr la parte recursiva más allá del decimador ilustrado en la Fig. 8(c). Se puede implementar el filtro no recursivo B(z) utilizando una descomposición standard bicomponente polifásica según Por consiguiente, el reductor del número de muestras puede estar estructurado de acuerdo con la Fig. 8(d). Después de emplear la Identidad de Noble 1 , se computa la parte FIR a la frecuencia de muestreo más baja posible, como se ilustra en la Fig. 8(e). De la Fig. 8(e) surge claramente que la operación de FIR (retardo, decimadores y componentes polifásicos) se puede considerar una operación de suma de ventanas que utiliza un avance de entrada de dos muestras. Por cada dos muestras de entrada, se produce una nueva muestra de salida, lo que efectivamente da lugar a una reducción del número de muestras en un factor de 2.
En la Fig. 9(a) se ilustra un diagrama de bloques del reductor de número de muestras de factor 1 ,5=3/2. El filtro de paso bajo con valor real se puede escribir asimismo de la siguiente manera H(z) = B{z)l A(z) , donde B(z) es la parte no recursiva (FIR) y A(z) es la parte recursiva (MR). Como antes, para una implementación eficiente, utilizando las Identidades de Noble para reducir la complejidad informática, es ventajoso diseñar un filtro donde todos los polos tengan una multiplicidad de 2 (polos dobles) o un múltiplo de 3 (polos triples) como A(z2 ) o (?3) respectivamente. En este caso se eligen los polos dobles ya que el algoritmo de diseño para el filtro de paso bajo es más eficiente, si bien la parte recursiva se torna, en realidad, 1 ,5 veces más compleja para implementar en comparación con el enfoque de triple polo. Por ende, el filtro se puede factorear de la manera ilustrada en la Fig. 9(b). Usando la Identidad de Noble 2, la parte recursiva se puede correr adelante el interpolador como se indica en la Fig. 9(c). El filtro no recursivo B(z) puede ser implementado utilizando la descomposición polifásica estándar de 2 -3 = 6 componentes de la siguiente manera Por ende, el reductor del número de muestras puede ser estructurado como en la Fig. 9(d). Después de utilizar tanto la Identidad de Noble 1 como la 2, se computa la parte de FIR a la frecuencia de muestreo más baja posible según lo expuesto en la Fig. 9(e). De la Fig. 9(e), es fácil ver que las muestras de salida de índice par se computan utilizando el grupo más bajo de tres filtros polifásicos ( E0(z), E2(z), E4(z) ) en tanto que las muestras de índice impar se computan a partir del grupo más alto { Ex{z), E3(z), E5(z) ). La operación de cada grupo (cadena de retardo, decimadores y componentes polifásicos) se puede considerar como operación de suma de ventanas utilizando un avance de entrada de tres muestras. Los coeficientes de ventana usados en el grupo superior son los coeficientes de índice impar, en tanto que el grupo inferior utiliza los coeficientes de índice par del filtro original B(z) . Por ende, en el caso de un grupo de tres muestras de entrada, se producen dos nuevas muestras de salida, lo que da origen, efectivamente, a una reducción del número de muestras de un factor 1.5.
La señal en el dominio del tiempo procedente del decodificador del núcleo (101 in Fig. 1 ) también se puede submuestrear mediante el uso de transformadas de síntesis submuestreadas más pequeñas en el decodificador del núcleo. El uso de una transformada de síntesis de menor tamaño ofrece incluso una reducción adicional de la complejidad informática. Dependiendo de la frecuencia de cruce, es decir el ancho de banda de la señal del codificador del núcleo, la relación del tamaño de la transformada de síntesis y el tamaño nominal Q (Q < 1 ), da origen a una señal de salida del codificador del núcleo con una frecuencia de muestreo Qfs. Para procesar la señal submuestreada del codificador del núcleo en los ejemplos esbozados en la presente solicitud, todos los bancos de filtros de análisis de la Fig.1 (102, 103-32, 103-33 y 103-34) deben ser escalados en el factor Q, como así también los reductores del número de muestras (301-2, 301-3 y 301-T) de la Fig. 3, el decimador 404 de la Fig.4 y el banco de filtros de análisis 601 de la Fig. 6. Evidentemente, se debe elegir Q de manera que todos los tamaños de los bancos de filtros sean números enteros.
La Fig. 10 ilustra el alineamiento de los bordes espectrales de las señales del transpondedor de HFR con los bordes espectrales de la tabla de frecuencias de ajuste de envolvente en un codificador potenciado por HFR, tal como SBR [ISO/IEC 14496-3:2009, "Information technology - Coding of audio-visual objects - Parte 3: Audio]. La Fig. 10(a) ilustra un gráfico estilístico de las bandas de frecuencia que comprenden la tabla de ajuste de envolventes, las denominadas bandas de factor de escala, que cubren el rango de frecuencia comprendido desde la frecuencia de cruce kx a la frecuencia de cese ks. Las bandas de factores de escala constituyen la grilla de frecuencias utilizadas en un codificador potenciado por HFR al ajustar el nivel de energía de la frecuencia de banda alta regenerada, es decir la envolvente de frecuencia. Para ajustar la envolvente, se promedia la energía de las señales en todo un bloque de tiempo/frecuencia limitado por los bordes de las bandas de factor de escala y los bordes de tiempo seleccionados. Si las señales generadas por diferentes órdenes de transposición no están alineadas con las bandas de factor de escala, de acuerdo con lo ilustrado en la Fig. 10(b), pueden surgir anomalías si la energía espectral cambia drásticamente en las proximidades del borde de una banda de transposición, puesto que el proceso de ajuste de envolvente mantiene la estructura espectral dentro de una banda de factor de escala uno. Por ende, la solución propuesta consiste en adaptar los bordes de frecuencia de las señales transpuestas a los bordes de las bandas de factor de escala según lo expuesto en la Fig. 10(c). En la Figura, el borde superior de las señales generadas por los órdenes de transposición de 2 y 3 (7=2, 3) se reducen escasamente, en comparación con la Fig. 10(b), para alinear los bordes de frecuencia de las bandas de transposición con los bordes de las bandas de factores de escala existentes.
En la Fig. 11 se ilustra una situación realista que demuestra las anomalías potenciales producidas cuando se utilizan bordes no alineados. 11. La Fig. 11(a) ilustra, una vez más, los bordes de banda de factor de escala. La Fig. 11(b) ilustra las señales generadas por HFR no ajustadas de los órdenes de transposición 7=2, 3 y 4 junto con la señal de la banda base decodificada del núcleo. La Fig. 11(c) ilustra la señal con envolvente ajustada cuando se presume una envolvente plana objetivo. Los bloques con áreas cuadriculadas representan bandas de factores de escala con altas variaciones intra-banda, lo que puede causar anomalías en la señal de salida.
La Fig. 12 ¡lustra la situación de la Fig. 11 , aunque esta vez utilizando bordes alineados. La Fig. 12(a) ¡lustra los bordes de la banda de factores de escala, la Fig. 12(b) ilustra las señales generadas por HFR sin ajustar de los órdenes de transposición G=2, 3 y 4 junto con la señal de la banda base decodificada del núcleo y, en línea con la Fig.11(c), la Fig. 12(c) ilustra la señal con envolvente ajustada cuando se presume una envolvente plana objetivo. Como se observa en esta figura, no hay ninguna no banda de factores de escala con altas variaciones de energía intra-banda debido a la falta de alineamiento de las bandas de señal transpuestas y las bandas de factores de escala, y por consiguiente se reducen las potenciales anomalías.
La Fig. 13 ilustra La adaptación de los bordes de banda limitadora de HFR, de acuerdo con lo descripto, por ej., en SBR [ISO/IEC 14496-3:2009, "Information technology - Coding of audio-visual objects - Parte 3: Audio] a los patches armónicos en un codificador potenciado por HFR. El limitador opera en bandas de frecuencia con una resolución mucho más gruesa que las bandas de factores de escala, aunque el principio de operación es prácticamente el mismo. En el limitador, se calcula un valor de ganancia promedio por cada una de las bandas del limitador. No se permite que los valores de ganancia individuales, es decir los valores de ganancia de envolvente por cada una de las bandas de factores de escala, excedan el valor de ganancia promedio del limitador en más de un determinado factor de multiplicación. El objetivo del limitador es suprimir las grandes variaciones de las ganancias de las bandas de factores de escala dentro de cada una de las bandas del limitador. Si bien la adaptación de las bandas generadas por el transpondedor a las bandas de factores de escala garantiza variaciones pequeñas de la energía intra-banda dentro de una banda de factores de escala, la adaptación de los bordes de las bandas del limitador a los bordes de las bandas del transpondedor, de acuerdo con la presente invención, maneja las diferencias de energía de mayor escala entre las bandas procesadas por el transpondedor. La Fig. 13(a) ilustra los límites de frecuencia de las señales generadas por HFR de los órdenes de transposición 1=2, 3 y 4. Los niveles de energía de las diferentes señales transpuestas pueden ser sustancialmente diferentes. La Fig. 13(b) ilustra las bandas de frecuencia del limitador, que por lo general son de ancho constante en una escala de frecuencia logarítmica. Los bordes de las bandas de frecuencia del transpondedor se suman como bordes constantes del limitador y el resto de los bordes del limitador son recalculados para mantener las relaciones logarítmicas lo más estrechas posibles, como se ilustra, por ejemplo, en la Fig. 13(c). Si bien se ha descripto algunos aspectos en el contexto de un aparato, es obvio que estos aspectos también representan una descripción del método correspondiente, donde un bloque o dispositivo corresponde a un paso del método o a una característica de un paso del método. De manera análoga, los aspectos descriptos en el contexto de un paso del método también representan una descripción de un correspondiente bloque o elemento o característica de un correspondiente aparato.
Otras realizaciones emplean un esquema de patching mixto según se ilustra en la Fig. 21 , donde se ejecuta el método de patching mixto dentro de un bloque de tiempo. Para una cobertura completa de las diferentes regiones del espectro de HF, un BWE comprende varios patches. en la HVE, los patches más altos requieren altos factores de transposición dentro de los vocodificadores de fase, que deterioran particularmente la calidad perceptual de los transitorios.
Por consiguiente, las realizaciones generan los patches de más alto orden que ocupan las regiones espectrales superiores, preferentemente mediante un patching de copiado SSB eficiente desde el punto de vista informático y los patches de menor orden que cubren las regiones espectrales intermedias, para las cuales se pretende la preservación de la estructura armónica, preferentemente por patching de HBE. La mezcla individual de los métodos de patching puede ser estática en el tiempo o, preferentemente, puede ser señalizada en el flujo de bits.
En el caso de la operación de copiado, se puede utilizar la información de baja frecuencia, como se ilustra en la Fig. 21. Por otro lado, se pueden utilizar los datos de los patches que se generaran utilizando métodos de HBE como se ilustra en la Fig. 21. Esto último lleva a una estructura tonal menos densa para los patches superiores. Aparte de estos dos ejemplos, es concebible toda combinación de copiado y HBE.
Las ventajas de los conceptos propuestos son • Calidad perceptual mejorada de los transitorios • Complejidad informática reducida La Fig. 26 ilustra una cadena de procesamiento preferida destinada a la extensión de ancho de banda, donde se pueden ejecutar diferentes operaciones de procesamiento dentro del procesamiento en subbandas no lineales indicado en los bloques 1020a, 1020b. La cascada de bancos de filtros 2302, 2304, 2307 está representada, en la Fig. 26, por el bloque 1010. Más aun, el bloque 2309 puede corresponder a los elementos 1020a, 1020b y el ajustador de envolvente 1030 puede estar situado entre el bloque 2309 y el bloque 2311 de la Fig. 23 o puede estar situado después del procesamiento ejecutado en el bloque 2311. En esta implementación, el procesamiento selectivo de bandas de la señal procesada en el dominio del tiempo, como por ejemplo la señal de ancho de banda extendido, se ejecuta en el dominio del tiempo en lugar de en el dominio de la subbanda, que existe antes del banco de filtro de síntesis 2311.
La Fig. 26 ilustra un aparato para generar una señal de audio de ancho de banda extendido a partir de una señal de entrada de baja banda 1000 de acuerdo con otra forma de realización. El aparato comprende un banco de filtros de análisis 1010, un procesador de subbandas no lineales por subbandas 1020a, 1020b, un ajustador de envolvente conectado subsiguientemente 1030 o, en términos generales, un procesador de reconstrucción de alta frecuencia que opera según los parámetros de reconstrucción de alta frecuencia como por ejemplo, la entrada de la línea de parámetros 1040. El ajustador de envolvente, o en términos generales, el procesador de reconstrucción de alta frecuencia procesa las señales de subbandas individuales por cada canal de subbanda e ingresa las señales de subbanda procesadas por cada canal de subbanda a un banco de filtros de síntesis 1050. El banco de filtros de síntesis 1050 recibe, en sus señales de entrada de los canales inferiores, una representación de subbanda de la señal del decodificador del núcleo de baja banda. Dependiendo de la implementación, la baja banda también puede derivar de las salidas del banco de filtros de análisis 1010 de la Fig. 26. Las señales de subbandas transpuestas son alimentadas a los canales superiores de banco de filtros del banco de filtros de síntesis para ejecutar la reconstrucción de alta frecuencia.
El banco de filtros 1050 da salida, por último, a una señal de salida del transpondedor que comprende extensión de ancho de bandas en factores de transposición 2, 3 y 4, y la señal provista como salida del bloque 1050 ya no se limita en su ancho de banda a la frecuencia de cruce, es decir a la frecuencia más alta de la señal del codificador del núcleo que corresponde a la frecuencia más baja de los componentes de la señal generada por SBR o HFR.
En la realización de la Fig. 26, el banco de filtros de análisis ejecuta un muestreo dos veces y tiene un cierto espaciamiento entre subbandas de análisis 1060. El banco de filtros de síntesis 1050 tiene un espaciamiento de subbandas de síntesis 1070 que, en esta realización, tiene el doble del tamaño del espaciamiento de las subbandas de análisis, lo que da lugar a una contribución de transposición, como se describe más adelante en el contexto de la Fig. 27.
La Fig. 27 ilustra una implementación detallada de una realización preferida de un procesador de subbandas no lineales 1020a in Fig. 26. El circuito ilustrado en la Fig. 27 recibe como entrada una señal de subbanda única 108, que es procesada en tres "ramas". La rama superior 110a es para la transposición en un factor de transposición de 2. La rama del centro de la Fig. 27 indicada en 110b es para la transposición en un factor de transposición de 3 y la rama inferior de la Fig. 27 es para la transposición en un factor de transposición de 4 y está indicada por el número de referencia 110c. Sin embargo, La transposición real obtenida por cada elemento de procesamiento de la Fig. 27 es sólo 1 (es decir que no hay transposición) en el caso de la rama 110a. La transposición real obtenida por el elemento de procesamiento ilustrado en la Fig. 27 correspondiente a la rama intermedia 110b es igual a 1 ,5 y la transposición real obtenida por la rama inferior 110c es igual a 2. Esto está indicado por los números entre paréntesis a la izquierda de la Fig. 27, donde están indicados los factores de transposición T. Las transposiciones de 1 ,5 y 2 representan una primera contribución de transposición obtenida incluyendo las operaciones de decimación en las ramas 110b, 110c y un estiramiento de tiempo por el procesador de traslape-suma. La segunda contribución, es decir la duplicación de la transposición, es obtenida en virtud del banco de filtros de síntesis 105, que tiene un espaciamiento de subbandas de síntesis 107 que es el doble del espaciamiento de subbandas del banco de filtros de análisis. Por lo tanto, dado que el banco de filtros de síntesis tiene el doble del espaciamiento de subbandas de análisis, ninguna función de decimación tiene lugar en la rama 110a.
La rama 110b, sin embargo, tiene una funcionalidad de decimación que sirve para obtener una transposición de 1 ,5. Debido a que el banco de filtros de síntesis tiene el doble de espaciamiento físico entre subbandas del banco de filtros de análisis, se obtiene un factor de transposición de 3 como se indica en la Fig. 27 a la izquierda del extractor de bloques correspondiente a la segunda rama 110b.
De manera análoga, la tercera rama tiene una funcionalidad de decimación que corresponde a un factor de transposición de 2, y la contribución final del espaciamiento de subbandas diferente entre el banco de filtros de análisis y el banco de filtros de síntesis corresponde, en última instancia, a un factor de transposición de 4 de la tercera rama 110c.
En particular, cada rama tiene un extractor de bloques 120a, 120b, 120c y cada uno de estos extractores de bloques puede ser similar al extractor de bloques 1800 de la Fig. 18. Más aun, cada rama consta de una calculadora de fases 122a, 122b y 122c, y la calculadora de fases puede ser similar a la calculadora de fases1804 de la Fig. 18. Por añadidura, cada rama tiene un ajustador de fase 124a, 124b, 124c y el ajustador de fase puede ser similar al ajustador de fase 1806 de la Fig. 18. Además, cada rama consta de un enventanador 126a, 126b, 126c, donde cada uno de estos enventanadores puede ser similar al enventanador 1802 de la Fig. 18. No obstante ello, los enventanadores 126a, 126b, 126c también pueden estar configurados para aplicar una ventana rectangular junto con cierto "relleno de ceros (zero padding). Las señales de transposición o patch procedentes de cada rama 110a, 110b, 110c, en la realización de la Fig. 27, son ingresadas al sumador 128, que suma la contribución de cada rama a la señal de subbanda actual para obtener finalmente los denominados bloques de transposición a la salida del sumador 128. A continuación, se ejecuta un procedimiento de traslape-suma en el sumador de traslape y el sumador de traslape 130 puede ser similar al bloque de traslape/suma 1808 de la Fig. 18. El sumador de traslape aplica un valor de traslape— suma de 2 e, donde e es el valor de traslape-avance o "valor de avance" de los extractores de bloques 120a, 120b, 120c, y el sumador de traslape 130 da salida a la señal transpuesta que, en la realización de la Fig. 27, es una salida de subbanda única correspondiente al canal k, es decir el canal de subbanda observado en el momento. El procesamiento ilustrado en la Fig. 27 se ejecuta por cada subbanda de análisis o por un determinado grupo de subbandas de análisis y, como se ilustra en la Fig. 26, las señales de subbandas transpuestas son ingresadas al banco de filtros de síntesis 1050 una vez procesadas por el bloque 1030 para obtener, en última instancia, la señal de salida del transpondedor ilustrada en la Fig. 26 a la salida del bloque 1050.
En una realización, el extractor de bloques 120a de la primera rama del transpondedor 110a extrae 10 muestras de subbandas y seguidamente se ejecuta la conversión de estas 10 muestras de QMF a las coordenadas polares. Esta salida, generada por el ajustador de fase 124a, es reenviada luego al enventanador 126a, que extiende la salida mediante ceros correspondientes al primero y último valor del bloque, donde esta operación es equivalente a un enventanado (síntesis) con una ventana rectangular de longitud 10. El extractor de bloques 120a de la rama 110a no ejecuta una decimación. Por lo tanto, las muestras extraídas por el extractor de bloques son mapeadas contra un bloque extraído con el mismo espaciamiento de muestras que cuando fueran extraídas.
Sin embargo, esto es diferente en el caso de las ramas 110b y 110c. El extractor de bloques 120b extrae preferentemente un bloque de 8 muestras de subbanda y distribuye estas 8 muestras de subbanda en el bloque extraído con un espaciamiento diferente de las muestras de subbandas. Los ingresos de muestras de subbandas no enteros correspondientes al bloque extraído se obtienen mediante una interpolación, y las muestras de QMF así obtenidas, junto con las muestras interpoladas, se convierten a coordenadas polares y son procesadas por el ajustador de fase. Luego, una vez más, se ejecuta el enventanado en el enventanador 126b a fin de extender la salida del bloque por el ajustador de fase 124b mediante ceros en el caso de las primeras dos muestras y las últimas dos muestras, operación que equivale a un enventanado (síntesis) con una ventana rectangular de longitud 8.
El extractor de bloques 120c está configurado para extraer un bloque con un alcance de tiempo de 6 muestras de subbandas y ejecuta una decimación de un factor de decimación 2, ejecuta una conversión de las muestras de QMF a coordenadas polares y, una vez más, ejecuta una operación en el ajustador de fase 124b, la salida se extiende otra vez con ceros, aunque ahora con respecto a las primeras tres muestras de subbandas y las últimas tres muestras de subbandas. Esta operación es equivalente a un enventanado (síntesis) con una ventana rectangular de longitud 6.
A continuación las salidas de la transposición de cada rama son sumadas por el sumador de salidas 128 para formar la salida combinada de QMF, y por último se superponen las salidas combinadas de QMF utilizando el traslape-suma en el bloque 130, donde el valor de avance o paso de traslape-suma es el doble del valor de avance de los extractores de bloques 120a, 120b, 120c descripto anteriormente.
Una forma de realización comprende un método para decodificar una señal de audio mediante el uso de transposición armónica basada en bloques de subbandas, que comprende el filtrado de una señal decodificada del núcleo por medio de un banco de filtros de análisis de M bandas para obtener una serie de señales de subbandas, la síntesis de una subserie de dichas señales de subbandas por medio de bancos de filtros de síntesis submuestreados con un número reducido de subbandas, para obtener señales submuestreados en el rango de origen.
Una forma de realización se relaciona con un método para alinear los bordes de las bandas espectrales de las señales generadas por HFR con los bordes espectrales utilizados en un proceso paramétrico.
Una forma de realización se relaciona con un método para alinear los bordes espectrales de las señales generadas por HFR con los bordes espectrales de la tabla de frecuencias de ajuste de envolvente que comprende: la búsqueda del borde más alto de la tabla de frecuencias de ajuste de envolvente que no exceda los límites fundamentales de ancho de banda de la señal generada por HFR del factor de transposición 7; y que utiliza el borde más alto hallado como límite de frecuencia de la señal generada por HFR del factor de transposición T.
Una forma de realización se relaciona con un método para alinear los bordes espectrales de la herramienta limitadora con los bordes espectrales de las señales generadas por HFR que comprende: sumar los bordes de frecuencia de las señales generadas por HFR a la tabla de bordes utilizada al crear los bordes de las bandas de frecuencia utilizados por la herramienta limitadora y forzar al limitador a usar los bordes de frecuencia sumados como bordes constantes y a ajustar en consecuencia los bordes restantes.
Una forma de realización se relaciona con la transposición combinada de una señal de audio que comprende órdenes de transposición de números enteros en un dominio de bancos de filtros de baja resolución donde la operación de transposición es ejecutada en bloques de tiempo de señales de subbandas.
Otra forma de realización se relaciona con la transposición combinada, donde los órdenes de transposición superiores a 2 están embutidos en un entorno de transposición de orden 2.
Otra forma de realización se relaciona con la transposición combinada, donde los órdenes de transposición superiores a 3 están embutidos en un entorno de transposición de orden 3, en tanto que los órdenes de transposición inferiores a 4 son ejecutados por separado.
Otra forma de realización se relaciona con la transposición combinada, donde se generan órdenes de transposición (por ej. los órdenes de transposición superiores a 2) mediante la replicación de órdenes de transposición calculados anteriormente (es decir, especialmente los órdenes más bajos) incluyendo el ancho de banda codificado del núcleo. Toda combinación concebible de órdenes de transposición existentes y anchos de banda del núcleo es posible sin restricciones.
Una forma de realización se relaciona con la reducción de la complejidad informática debido al número reducido de bancos de filtros de análisis que son necesarios par la transposición.
Una forma de realización se relaciona con un aparato para generar una señal de ancho de banda extendido a partir de una señal de audio de entrada, que comprende: un dispositivo de patching para introducir un patch en una señal de audio de entrada a fin de obtener una primera señal con patch y una segunda señal con patch, donde la segunda señal con patch tiene una frecuencia de patch diferente de la primera señal con patch, donde la primera señal con patch se genera utilizando un primer algoritmo de patching y la segunda señal con patch se genera utilizando un segundo algoritmo de patching y un combinador para combinar la primera señal con patch y la segunda señal con patch para obtener la señal de ancho de banda extendido.
Otra forma de realización se relaciona con este aparato de acuerdo con la presente invención, en el cual el primer algoritmo de patching es un algoritmo de patching armónico y el segundo algoritmo de patching es un algoritmo de patching no armónico.
Otra forma de realización se relaciona con el aparato anterior, en el cual la primera frecuencia de patching es más baja que la segunda frecuencia de patching o viceversa.
Otra forma de realización se relaciona con el aparato precedente, en el cual la señal de entrada comprende una información de patching y en el cual el dispositivo de patching está configurado para ser controlado por la información de patching extraída de la señal de entrada para variar el primer algoritmo de patching o el segundo algoritmo de patching de acuerdo con la información de patching.
Otra forma de realización se relaciona con un aparato precedente, en el cual el dispositivo de patching cumple 'la función de patching (conexión) de diferentes bloques de señales de audio y en el cual el dispositivo de patching está configurado para aplicar el primer algoritmo de patching y el segundo algoritmo de patching al mismo bloque de muestras de audio.
Otra forma de realización se relaciona con un aparato precedente, en el cual el dispositivo de patching comprende, en órdenes arbitrarios, un decimador controlado por un factor de extensión de ancho de banda, un banco de filtros y un estirador para una señal de subbanda de banco de filtros.
Otra forma de realización se relaciona con el aparato precedente, en el cual el estirador comprende un extractor de bloques para extraer un número de bloques traslapados de acuerdo con un valor de avance de extracción, un ajustador de fase o enventanador para ajustar los valores de muestreo de subbandas en cada bloque basándose en una función de ventana o una corrección de fase y un sumador de traslape para ejecutar un procesamiento de traslape-suma de bloques enventanados y con ajuste de fases utilizando un valor de avance de traslape mayor que el valor de avance de extracción.
Otra forma de realización se relaciona con un aparato para extender el ancho de banda de una señal de audio que comprende: un banco de filtros para filtrar la señal de audio a fin de obtener señales de subbandas con número de muestras reducido, una pluralidad de diferentes procesadores de subbandas para procesar diferentes señales de subbandas de diferentes maneras, donde los procesadores de subbandas ejecutan diferentes operaciones de estiramiento de tiempo de las señales de subbandas utilizando diferentes factores de estiramiento y un fusionador para fusionar la salida de subbandas procesada por medio de la pluralidad de procesadores de subbandas diferentes para obtener una señal de audio con ancho de banda extendido.
Otra forma de realización se relaciona con un aparato para reducir el número de muestras de una señal de audio que comprende: un modulador; un interpolador que utiliza un factor de interpolación; un filtro de paso bajo complejo y un decimador que utiliza un factor de decimación, donde el factor de decimación es más alto que el factor de interpolación.
Una forma de realización se relaciona con un aparato para reducir el número de muestras de una señal de audio que comprende: un primer banco de filtro para generar una pluralidad de señales de subbanda a partir de una señal de audio, donde una frecuencia de muestreo de la señal de subbanda es menor que una frecuencia de muestreo de una señal de audio; por lo menos un banco de filtro de síntesis seguido por un banco de filtro de análisis para ejecutar una conversión de la frecuencia de muestreo, donde el banco de filtro de síntesis tiene un número de canales diferente de un número de canales del banco de filtros de análisis; un procesador de estiramiento de tiempo para procesar la señal con frecuencia de muestreo convertida y un combinador para combinar la señal con estiramiento de tiempo y una señal de baja banda o una señal con estiramiento de tiempo diferente.
Otra forma de realización se relaciona con un aparato para reducir el número de muestras de una señal de audio en un factor de reducción de número de muestras no entero que comprende: un filtro digital, un interpolador que consta de un factor de interpolación, un elemento polifásico que tiene derivaciones pares e impares y un decimador que tiene un factor de decimación que es superior al factor de interpolación, donde el factor de decimación y el factor de interpolación son seleccionados de tal manera que la relación del factor de interpolación y el factor de decimación es un número no entero.
Una forma de realización se relaciona con un aparato para procesar una señal de audio, que comprende: un decodificador del núcleo que tiene un tamaño de transformada de síntesis menor que un tamaño de transformada nominal en un factor, por lo que una señal de salida es generada por el decodificador del núcleo que tiene una frecuencia de muestreo menor que una frecuencia de muestreo nominal que corresponde al tamaño de transformada nominal y un post procesador que tiene uno o más bancos de filtros, uno o más estiradores de tiempo y un fusionador, donde un número de canales de bancos de filtro del uno o más bancos de filtros se ha reducido en comparación con un número determinado por el tamaño de transformada nominal.
Otra forma de realización se relaciona con un aparato para procesar una señal de baja banda que comprende: un generador de patch para generar múltiples patches empleando la señal de audio de baja banda, un ajustador de envolvente para ajustar una envolvente de la señal utilizando factores de escala dados para las bandas de factores de escala adyacentes que tienen bordes de bandas de factores de escala, donde el generador de patch está configurado para ejecutar los múltiples patches, por lo que un borde entre los^patches adyacentes coincide con un borde entre las bandas de factores de escala adyacentes de la escala de frecuencias.
Una forma de realización se relaciona con un aparato para procesar una señal de audio de baja banda que comprende: un generador de patch para generar múltiples patches usando la señal de audio de banda baja y un limitador del ajuste de envolvente para limitar los valores de ajuste de envolvente correspondientes a una señal mediante la limitación de las bandas limitadoras adyacentes que constan de bordes de bandas limitadoras, donde el generador de patch está configurado para ejecutar los múltiples patches de manera que un borde entre patches adyacentes coincida con un borde entre bandas limitadoras adyacentes en una escala de frecuencias.
El proceso de la invención es ventajoso para potenciar codees de audio que se basan en un esquema de extensión de ancho de banda. Especialmente, si es sumamente importante una calidad perceptual óptima a una velocidad de transmisión de bits dada y, al mismo tiempo, si la potencia de procesamiento es un recurso limitado.
La mayoría de las aplicaciones prominentes son decodificadores de audio, que con frecuencia están implementados en dispositivos manuales y, por consiguiente, operan con abastecimiento de energía por baterías.
La señal de audio codificada de la presente invención puede ser almacenada en un medio de almacenamiento digital o puede ser transmitida en un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión cableado tal como la Internet.
Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención pueden ser implementadas en hardware o en software. La implementación se puede ejecutar utilizando un medio de almacenamiento digital, por ejemplo un disco blando, un DVD, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, con señales de control legibles electrónicamente almacenadas en los mismos, que cooperen (o tengan capacidad para cooperar) con un sistema de computación programable de tal manera que se ejecute el respectivo método.
Algunas realizaciones de acuerdo con la presente invención comprenden un portador de datos que consta de señales de control legibles electrónicamente, con capacidad para cooperar con un sistema de computación programable, de tal manera que se pueda ejecutar uno de los métodos aquí descriptos.
En general, las realizaciones de la presente invención pueden ser implementadas en forma de producto programa de computación con un código de programa, donde el código de programa es operativo para ejecutar uno de los métodos al ejecutarse el producto programa de computación en una computadora. El código de programa puede ser almacenado, por ejemplo, en un portador legible por una máquina.
Otras realizaciones comprenden el programa de computación para ejecutar uno de los métodos aquí descriptos, almacenado en un portador legible por una máquina En otras palabras, una realización del método de la invención es, por lo tanto, un programa de computación que consta de un código de programa para ejecutar uno de los métodos aquí descriptos, cuando el programa de computación se ejecuta en una computadora.
Otra realización de los métodos de la invención consiste, por lo tanto, en un portador de datos (o un medio de almacenamiento digital, o un medio de legible por computadora) que comprende, grabado en el mismo, el programa de computación para ejecutar uno de los métodos aquí descriptos.
Otra forma de ejecución del método de la invención es, por lo tanto, un flujo de datos o una secuencia de señales que representan el programa de computación para ejecutar uno de los métodos aquí descriptos. El flujo de datos o la secuencia de señales puede estar configurada, por ejemplo, para transferirse a través de una conexión de comunicación de datos, por ejemplo por la Internet.
Otra realización comprende un medio de procesamiento, por ejemplo una computadora, o un dispositivo lógico programable, configurado o adaptado para ejecutar uno de los métodos aquí descriptos Otra forma de realización comprende una computadora que tiene instalado en la misma el programa de computación para ejecutar uno de los métodos aquí descriptos.
En algunas realizaciones, se puede utilizar un dispositivo lógico programable (por ejemplo una matriz de puertas programables) para ejecutar algunas o todas las funcionalidades de los métodos aquí descriptos. En algufias realizaciones, una matriz de puertas programables de campo puede cooperar con un microprocesador para ejecutar uno de los métodos aquí descriptos. En general, los métodos son ejecutados preferentemente por cualquier aparato de hardware.
Las realizaciones antes descriptas son meramente ilustrativas de los principios de la presente invención. Se entiende que las personas con capacitación en la técnica considerarán evidentes las modificaciones y variaciones de las disposiciones y detalles aquí descriptos. Por lo tanto, se pretende que estén limitadas sólo por el alcance de las reivindicaciones de patentes siguientes y no por los detalles específicos presentados a manera de descripción y explicación de las realizaciones aquí expuestas.
Literatura: [1] M. Dietz, L. Liljeryd, K. Kjórling y O. Kunz, "Spectral Band Replication, a novel approach in audio coding," en la 1 12a Convención de AES, Munich, Mayo de 2002. [2] S. Meltzer, R. Bóhm y F. Henn, "SBR enhanced audio codees for digital broadcasting such as "Digital Radio Mondiale" (DRM)," en la 112a Convención de AES, Munich, Mayo de 2002. [3] T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," en la 112a Convención de AES, Munich, Mayo de 2002. [4] Norma Internacional ISO/IEC 14496-3:2001 /FPDAM 1 , "Extensión de ancho de banda," ISO/IEC, 2002. Speech bandwidth extensión method and apparatus Vasu lyengar et al [5] E. Larsen, R. M. Aarts y M. Danessis. Efficient high-frequeney bandwidth extensión of music and speech. En la 112a Convención de AES, Munich, Alemania, mayo de 2002. [6] R. M. Aarts, E. Larsen y O. Ouweitjes. A unified approach to low- and high frequency bandwidth extensión. En la 115a Convención de AES, New York, Estados Unidos, octubre de 2003. [7] K. Káyhkó. A Robust Wideband Enhancement for Narrowband Speech Signal. Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing, 2001. [8] E. Larsen and R. M. Aarts. Audio bandwidth extensión - Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004. [9] E. Larsen, R. M. Aarts y M. Danessis. Efficient high-frequency bandwidth extensión of music and speech. En la 112a Convención de AES, Munich, Alemania, mayo de 2002. [10] J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21(3), junio de 1973. [11] Solicitud de patente de Estados Unidos 08/951 ,029, Ohmori , et al. Audio band width extending system and method [12] Patente de Estados Unidos 6895375, Malah, D & Cox, R. V.: System for frequency bandwidth extensión of Narrow-band speech [13] Frederik Nagel, Sascha Disch, "A harmonio bandwidth extensión method for audio codees," ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, abril de 2009 [14] Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, "A phase vocoder driven bandwidth extensión method with novel transient handling for audio codees," En la 126a Convención de AES, Munich, Alemania, mayo de 2009. [15] M. Puckette. Phase-locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics, Mohonk 1995.", Róbel, A.: Transient detection and preservation in the phase vocoder; citeseer.ist.psu.edu/679246.html [16] Laroche L, Dolson M.: "Improved phase vocoder timescale modification of audio", IEEE Trans. Speech and Audio Processing, vol. 7, no. 3, pp. 323— 332, [17] Patente de Estados Unidos 6549884 Laroche, J. & Dolson, M.: Phase-vocoder pitch— shifting [18] Herré, J.; Faller, C; Ertel, C; Hilpert, J.; Holzer, A.; Spenger, C, "MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio," 116a Conv.
Aud. Eng. Soc, mayo de 2004 [19] Neuendorf, Max; Gournay, Philippe; Multrus, Markus; Lecomte, Jérémie; Bessette, Bruno; Geiger, Ralf; Bayer, Stefan; Fuchs, Guillaume; Hilpert, Johannes; Rettelbach, Nikolaus; Salami, Redwan; Schuller, Gerald; Lefebvre, Roch; Grill, Bernhard: Unified Speech and Audio Coding Scheme for High Quality at Lowbitrates, ICASSP 2009, April 19-24, 2009, Taipei, Taiwan [20] Bayer, Stefan; Bessette, Bruno; Fuchs, Guillaume; Geiger, Ralf; Gournay, Philippe; Grill, Bernhard; Hilpert, Johannes; Lecomte, Jérémie; Lefebvre, Roch; Multrus, Markus; Nagel, Frederik; Neuendorf, Max; Rettelbach, Nikolaus; Robilliard, Julien; Salami, Redwan; Schuller, Gerald: A Novel Scheme for Low Bitrate Unified Speech and Audio Coding, 126a Convención de AES, mayo 7 de 2009, Munich

Claims (2)

REIVINDICACIONES Habiendo así especialmente descripto y determinado la presente invención y la forma en que la misma ha de ser llevada a la práctica, se declara reivindicar como se declara reivindicar como de propiedad y derecho exclusivo
1. Aparato para procesar una señal de audio de entrada (2300), que comprende: un banco de filtros de síntesis (2304) para sintetizar una señal de audio intermedia (2306) a partir de la señal de audio de entrada (2300), donde la señal de audio de entrada (2300) está representada por una pluralidad de señales de primera subbanda (2303) generadas por un banco de filtros de análisis (2302), donde el número de canales de bancos de filtros (Ms) del banco de filtros de síntesis (2304) es menor que el número de canales (M) del banco de filtros de análisis (2302) y un banco de filtros de análisis adicional (2307) para generar una pluralidad de señales de segunda subbanda (2308) de la señal de audio intermedia (2306), donde el banco de filtros adicional (2307) tiene un número de canales (MA) que difiere del número de canales del banco de filtros de síntesis (2304), por lo que la frecuencia de muestreo de una señal de subbanda de la pluralidad de señales de segunda subbanda (2308) es diferente de la frecuencia de muestreo de una primera señal de subbanda de la pluralidad de señales de primera subbanda (2303).
2. Un aparato de acuerdo con la reivindicación 1 , en el cual el banco de filtros de síntesis (2304) es un banco de filtros de valor real. El aparato de acuerdo con la reivindicación 1 , en el cual el número de señales de primera subbanda de la pluralidad de señales de primera subbanda (2303) es mayor o igual a 24 y en el cual el número de canales de banco de filtros canales del banco de filtros de síntesis (2304) es inferior o igual a 22. El aparato de acuerdo con una de las reivindicaciones precedentes, en el cual el banco de filtros de síntesis (2304) está configurado para procesar solamente un subgrupo (2305) de todas las señales de primera subbanda (2303) de la pluralidad de señales de primera subbanda que representan la señal de audio de entrada de ancho de banda total (2300), y en el cual el banco de filtros de síntesis (2304) está configurado para generar la señal de audio intermedia (2306) como segmento de banda de la señal de audio de entrada de ancho de banda total (2300) modulada según la banda base. El aparato de acuerdo con una de las reivindicaciones precedentes, que además comprende: el banco de filtros de análisis (2302) para recibir una representación en el dominio del tiempo de la señal de audio de entrada (2300) y para analizar la representación en el dominio del tiempo a fin de obtener la pluralidad de señales de primera subbanda s (2303), donde se da entrada a un subgrupo (2305) de la pluralidad de señales de primera subbanda (2303) al banco de filtros de síntesis (2304), y donde el resto de las señales de subbandas de la pluralidad de señales de primera subbanda no es ingresado al banco de filtros de síntesis (2304). El aparato de acuerdo con una de las reivindicaciones precedentes, en el cual el banco de filtros de análisis (2302) es un banco de filtros de valor complejo, en el cual el banco de filtros de síntesis (2304) comprende una calculadora de valor real para calcular las señales de subbanda de valor real de las señales de primera subbanda, donde las señales de valor real calculadas por la calculadora de valor real son procesadas adicionalmente por el banco de filtros de síntesis (2304) para obtener la señal de audio intermedia (2306). El aparato de acuerdo con una de las reivindicaciones precedentes, en el cual el banco de filtros adicional (2307) es un banco de filtros de valor complejo y está configurado para generar la pluralidad de señales de segunda subbanda (2308) en forma de señales de subbanda complejas. El aparato de acuerdo con una de las reivindicaciones precedentes, en el cual el banco de filtros de síntesis (2304), el banco de filtros adicional (2307) o el banco de filtros de análisis (2302) está configurado para utilizar versiones submuestreadas de la misma ventana de bancos de filtros. El aparato de acuerdo con una de las reivindicaciones precedentes, que además comprende: un procesador de señales de subbanda (2309) para procesar la pluralidad de segundas subbandas (2308) y un banco de filtros de síntesis adicional (2311) para filtrar una pluralidad de subbandas procesadas, donde el banco de filtros de síntesis adicional (2311 ), el banco de filtros de síntesis (2304), el banco de filtros de análisis (2302) o el banco de filtros adicional (2307) está configurado para usar versiones submuestreadas de la misma ventana de banco de filtros, o donde el banco de filtros de síntesis adicional (2311 ) está configurado para aplicar una ventana de síntesis y donde el banco de filtros adicional (2307), el banco de filtros de síntesis (2304) o el banco de filtros de análisis (2302) están configurados para aplicar una versión submuestreado de la ventana de síntesis empleada por el banco de filtros de síntesis adicional (2311 ). El aparato de acuerdo con una de las reivindicaciones precedentes, que además comprende un procesador de subbandas (2309) para ejecutar una operación de procesamiento no lineal por cada subbanda para obtener una pluralidad de subbandas procesadas; un procesador de reconstrucción de alta frecuencia (1030) para ajustar una señal de entrada sobre la base de parámetros transmitidos (1040) y un banco de filtros de síntesis adicional (2311 , 1050) para combinar la señal de audio de entrada (2300) y la pluralidad de señales de subbanda procesadas, donde el procesador de reconstrucción de alta frecuencia (1030) está configurado para procesar una salida del banco de filtros de síntesis adicional (1050, 2311 ) o para procesar la pluralidad de subbandas procesadas, antes de ingresar la pluralidad de subbandas procesadas en el banco de filtros de síntesis adicional (2311 , 1050). El aparato de acuerdo con una de las reivindicaciones precedentes, en el cual el banco de filtros adicional (2307) o el banco de filtros de síntesis (2304) tiene una calculadora de función de ventana prototipo para calcular una función de ventana prototipo para submuestrear o interpolar utilizando una función de ventana almacenada correspondiente a un banco de filtros de diferente tamaño utilizando información sobre el número de canales correspondientes al banco de filtros adicional (2307) o al banco de filtros de síntesis (2304). El aparato de acuerdo con una de las reivindicaciones precedentes, en el cual el banco de filtros de síntesis (2304) está configurado para ajustar a cero una entrada en un canal más bajo y el más alto de banco de filtros del banco de filtros de síntesis (2304). El aparato de acuerdo con una de las reivindicaciones precedentes, que está configurado para ejecutar una transposición armónica basada en bloques, donde el banco de filtros de síntesis (2304) es un banco de filtros submuestreado. El aparato de acuerdo con una de las reivindicaciones precedentes, que además comprende un procesador de subbandas (2309) para procesar la pluralidad de segundas subbandas (2308), donde el procesador de subbandas (2309, 1020a, 1020b) comprende, en orden arbitrario, un decimador controlado por un factor de extensión de ancho de banda y un estirador para una señal de subbanda, donde el estirador comprende un extractor de bloques (1800, 120a, 120b, 120c) para extraer un número de bloques traslapados de acuerdo con un valor de avance de extracción; un ajustador de fase (1806, 124a, 124b, 124c) o enventanador (1802, 126a, 126b, 126c) para ajustar los valores de muestreo de subbandas en cada bloque sobre la base de una función de ventana o una corrección de fase y un sumador de traslape (1808, 130) para ejecutar un procesamiento de suma y traslape de los bloques enventanados y con fase ajustada utilizando un valor de avance de traslape superior al valor de avance de extracción. El aparato de acuerdo con una de las reivindicaciones precedentes, que además comprende un procesador de subbandas (2309), donde el procesador de subbandas (2309, 1020a, 1020b) comprende: una pluralidad de ramas de procesamiento diferentes (110a, 110b, 110c) para diferentes factores de transposición para obtener una señal de transposición, donde cada rama de procesamiento está configurada para extraer (120a, 120b, 120c) muestras de bloques de subbandas; un sumador (128) para sumar las señales de transposición a fin de obtener bloques de transposición y un sumador de traslape (130) para la suma con traslape de bloques de transposición consecutivos utilizando un valor de avance de bloque que es superior a un valor de avance de bloque utilizado para la extracción de los bloques (120a, 120b, 120c) en la pluralidad de ramas de procesamiento diferentes (110a, 110b, 110c). El aparato de acuerdo con una de las reivindicaciones precedentes, que además comprende: el banco de filtros de análisis (2302), donde el banco de filtros de síntesis (2304) y el banco de filtros adicional (2307) están configurados para ejecutar una conversión de frecuencia de muestreo, un procesador de estiramiento de tiempo (100a, 100b, 100c) para procesar la señal con frecuencia de muestreo convertida y un combinador (2311 , 605) para combinar las señales de subbanda procesadas generadas por el procesador de estiramiento de tiempo para obtener una señal procesada en el dominio del tiempo. El aparato de acuerdo con una de las reivindicaciones precedentes, en el cual el número de canales del banco de filtros adicional (2307) es superior al número de canales del banco de filtros de síntesis (2304). Aparato para procesar una señal de audio de entrada (2300), que comprende: un banco de filtros de análisis (2302) que consta de un número (M) de canales de bancos de filtros de análisis, donde el banco de filtros de análisis (2302) está configurado para filtrar la señal de audio de entrada (2300) para obtener una pluralidad de señales de primera subbanda (2303) y un banco de filtros de síntesis (2304) para sintetizar una señal de audio intermedia (2306) usando un grupo (2305) de señales de primera subbanda (2303), donde el grupo comprende un número de señales de subbandas menor que el número de canales de bancos de filtros del banco de filtros de análisis (2302), donde la señal de audio intermedia (2306) es una representación submuestreada de una porción del ancho de banda de la señal de audio de entrada (2300). El aparato de acuerdo con la reivindicación 18, en el cual el banco de filtros de análisis (2302) es un banco de filtros QMF complejo con muestreo crítico y en el cual el banco de filtros de síntesis (2304) es un banco de filtros QMF de valor real con muestreo crítico. Un método para procesar una señal de audio de entrada (2300), que comprende: el filtrado de síntesis utilizando un banco de filtros de síntesis (2304) para sintetizar una señal de audio intermedia (2306) a partir de la señal de audio de entrada (2300), donde la señal de audio de entrada (2300) está representada por una pluralidad de señales de primera subbanda (2303) generadas por un banco de filtros de análisis (2302), donde el número de canales de bancos de filtros (Ms) del banco de filtros de síntesis (2304) es menor que el número de canales (M) del banco de filtros de análisis (2302) y el filtrado de análisis empleando un banco de filtros de análisis adicional (2307) para generar una pluralidad de señales de segunda subbanda (2308) de la señal de audio intermedia (2306), donde el banco de filtros adicional (2307) tiene un número de canales (MA) que difiere del número de canales del banco de filtros de síntesis (2304), por lo que la frecuencia de muestreo de una señal de subbanda de la pluralidad de señales de segunda subbanda (2308) es diferente de la frecuencia de muestreo de una primera señal de subbanda de la pluralidad de señales de primera subbanda (2303). Un método para procesar una señal de audio de entrada (2300), que comprende: el filtrado de análisis utilizando un banco de filtros de análisis (2302) que tiene un número (M) de canales de bancos de filtros de análisis, donde el banco de filtros de análisis (2302) está configurado para filtrar la señal de audio de entrada (2300) para obtener una pluralidad de señales de primera subbanda (2303) y el filtrado de síntesis utilizando un banco de filtros de síntesis (2304) para sintetizar una señal de audio intermedia (2306) usando un grupo (2305) de señales de primera subbanda (2303), donde el grupo comprende un número menor de señales de subbandas que el número de canales de bancos de filtros del banco de filtros de análisis (2302), donde la señal de audio intermedia (2306) es una representación submuestreada de una porción del ancho de banda de la señal de audio de entrada (2300). Un programa de computación que consta de un código de programa para realizar, al ejecutarse en una computadora, un método de acuerdo con la reivindicación 20 o de acuerdo con la reivindicación 21.
MX2012010415A 2010-03-09 2011-03-04 Aparato y metodo para procesar una señal de audio de entrada utilizando bancos de filtro en cascada. MX2012010415A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US31212710P 2010-03-09 2010-03-09
PCT/EP2011/053315 WO2011110500A1 (en) 2010-03-09 2011-03-04 Apparatus and method for processing an input audio signal using cascaded filterbanks

Publications (1)

Publication Number Publication Date
MX2012010415A true MX2012010415A (es) 2012-10-03

Family

ID=43987731

Family Applications (2)

Application Number Title Priority Date Filing Date
MX2012010415A MX2012010415A (es) 2010-03-09 2011-03-04 Aparato y metodo para procesar una señal de audio de entrada utilizando bancos de filtro en cascada.
MX2012010416A MX2012010416A (es) 2010-03-09 2011-03-04 Aparato y método para procesar una señal de audio usando alineación de borde de patching.

Family Applications After (1)

Application Number Title Priority Date Filing Date
MX2012010416A MX2012010416A (es) 2010-03-09 2011-03-04 Aparato y método para procesar una señal de audio usando alineación de borde de patching.

Country Status (18)

Country Link
US (7) US9305557B2 (es)
EP (6) EP2545553B1 (es)
JP (2) JP5523589B2 (es)
KR (2) KR101425154B1 (es)
CN (2) CN102939628B (es)
AR (2) AR080477A1 (es)
AU (2) AU2011226211B2 (es)
BR (5) BR122021019082B1 (es)
CA (2) CA2792452C (es)
ES (3) ES2522171T3 (es)
HU (1) HUE070311T2 (es)
MX (2) MX2012010415A (es)
MY (1) MY154204A (es)
PL (3) PL2545553T3 (es)
RU (1) RU2586846C2 (es)
SG (1) SG183967A1 (es)
TW (2) TWI444991B (es)
WO (2) WO2011110500A1 (es)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5422664B2 (ja) * 2009-10-21 2014-02-19 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
EP2362376A3 (en) * 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using envelope shaping
SG183967A1 (en) * 2010-03-09 2012-10-30 Fraunhofer Ges Forschung Apparatus and method for processing an input audio signal using cascaded filterbanks
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CA2770287C (en) 2010-06-09 2017-12-12 Panasonic Corporation Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
IL313284B2 (en) * 2010-09-16 2025-05-01 Dolby Int Ab Method and system for cross product enhanced subband block based harmonic transposition
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
USRE48258E1 (en) 2011-11-11 2020-10-13 Dolby International Ab Upsampling using oversampled SBR
TWI478548B (zh) * 2012-05-09 2015-03-21 Univ Nat Pingtung Sci & Tech 對等網路串流傳輸方法
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CN103915104B (zh) * 2012-12-31 2017-07-21 华为技术有限公司 信号带宽扩展方法和用户设备
US9530430B2 (en) * 2013-02-22 2016-12-27 Mitsubishi Electric Corporation Voice emphasis device
US9807719B2 (en) * 2013-03-14 2017-10-31 Lg Electronics Inc. Method for receiving signal by using device-to-device communication in wireless communication system
CN105393554B (zh) * 2013-03-26 2019-08-23 拉克伦·保罗·巴拉特 对音频信号进行数字滤波的方法和系统、计算机可读介质
US9305031B2 (en) 2013-04-17 2016-04-05 International Business Machines Corporation Exiting windowing early for stream computing
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
US9454970B2 (en) * 2013-07-03 2016-09-27 Bose Corporation Processing multichannel audio signals
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
TWI548190B (zh) * 2013-08-12 2016-09-01 中心微電子德累斯頓股份公司 根據控制法則來控制功率轉換器的功率級之控制器及方法
WO2015027327A1 (en) * 2013-08-28 2015-03-05 Mixgenius Inc. System and method for performing automatic audio production using semantic data
TWI557726B (zh) 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
KR102159990B1 (ko) 2013-09-17 2020-09-25 주식회사 윌러스표준기술연구소 멀티미디어 신호 처리 방법 및 장치
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
WO2015060652A1 (ko) 2013-10-22 2015-04-30 연세대학교 산학협력단 오디오 신호 처리 방법 및 장치
CN104681034A (zh) * 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
US9922660B2 (en) * 2013-11-29 2018-03-20 Sony Corporation Device for expanding frequency band of input signal via up-sampling
KR102215124B1 (ko) 2013-12-23 2021-02-10 주식회사 윌러스표준기술연구소 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
SG11201605015XA (en) 2013-12-27 2016-08-30 Sony Corp Decoding device, method, and program
CN106105269B (zh) 2014-03-19 2018-06-19 韦勒斯标准与技术协会公司 音频信号处理方法和设备
WO2015152663A2 (ko) 2014-04-02 2015-10-08 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
EP2963648A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
KR101523559B1 (ko) * 2014-11-24 2015-05-28 가락전자 주식회사 토폴로지를 이용한 오디오 스트림 형성 장치 및 방법
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI693595B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI771266B (zh) 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10129659B2 (en) 2015-05-08 2018-11-13 Doly International AB Dialog enhancement complemented with frequency transposition
KR101661713B1 (ko) * 2015-05-28 2016-10-04 제주대학교 산학협력단 파라메트릭 어레이 응용을 위한 변조 방법 및 장치
US9514766B1 (en) * 2015-07-08 2016-12-06 Continental Automotive Systems, Inc. Computationally efficient data rate mismatch compensation for telephony clocks
TR201908841T4 (tr) * 2015-09-22 2019-07-22 Koninklijke Philips Nv Ses sinyali işleme.
EP3353786B1 (en) 2015-09-25 2019-07-31 Dolby Laboratories Licensing Corporation Processing high-definition audio data
EA201992556A1 (ru) 2015-10-08 2021-03-31 Долби Лэборетериз Лайсенсинг Корпорейшн Аудиодекодер и способ декодирования
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10157621B2 (en) * 2016-03-18 2018-12-18 Qualcomm Incorporated Audio signal decoding
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10848363B2 (en) 2017-11-09 2020-11-24 Qualcomm Incorporated Frequency division multiplexing for mixed numerology
KR102697685B1 (ko) * 2017-12-19 2024-08-23 돌비 인터네셔널 에이비 통합 음성 및 오디오 디코딩 및 인코딩 qmf 기반 고조파 트랜스포저 개선을 위한 방법, 장치 및 시스템
TWI895201B (zh) * 2018-01-26 2025-08-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
WO2019145955A1 (en) 2018-01-26 2019-08-01 Hadasit Medical Research Services & Development Limited Non-metallic magnetic resonance contrast agent
CN118800273A (zh) * 2018-04-25 2024-10-18 杜比国际公司 高频音频重建技术的集成
IL313348B2 (en) * 2018-04-25 2025-08-01 Dolby Int Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
US20230085013A1 (en) * 2020-01-28 2023-03-16 Hewlett-Packard Development Company, L.P. Multi-channel decomposition and harmonic synthesis
CN111768793B (zh) * 2020-07-11 2023-09-01 北京百瑞互联技术有限公司 一种lc3音频编码器编码优化方法、系统、存储介质
TWI834408B (zh) * 2022-12-02 2024-03-01 元智大學 兩階濾波器
WO2025201625A1 (en) * 2024-03-25 2025-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder and decoder

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55107313A (en) 1979-02-08 1980-08-18 Pioneer Electronic Corp Adjuster for audio quality
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US6766300B1 (en) 1996-11-07 2004-07-20 Creative Technology Ltd. Method and apparatus for transient detection and non-distortion time scaling
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP4152192B2 (ja) 2001-04-13 2008-09-17 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の高品質タイムスケーリング及びピッチスケーリング
AU2002318813B2 (en) 2001-07-13 2004-04-29 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4313993B2 (ja) 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP4227772B2 (ja) 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7372907B2 (en) * 2003-06-09 2008-05-13 Northrop Grumman Corporation Efficient and flexible oversampled filterbank with near perfect reconstruction constraint
US20050018796A1 (en) 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
US7337108B2 (en) 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
CN100507485C (zh) * 2003-10-23 2009-07-01 松下电器产业株式会社 频谱编码装置和频谱解码装置
JP4254479B2 (ja) * 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
BRPI0517234B1 (pt) 2004-11-02 2019-07-02 Dolby International Ab Decodificador para gerar um sinal de áudio, codificador para codificar um sinal de áudio, métodos para gerar e para codificar um sinal de áudio, receptor para receber um sinal de áudio, transmissor e sistema de transmissão para transmitir um sinal de áudio, métodos para receber, transmitir, e transmitir e receber um sinal de áudio, meio de armazenamento legível por computador, equipamento reprodutor de áudio, e, equipamento gravador de áudio
CN1668058B (zh) * 2005-02-21 2011-06-15 南望信息产业集团有限公司 基于递归最小平方差的子带回声抵消器
CN102163429B (zh) 2005-04-15 2013-04-10 杜比国际公司 用于处理去相干信号或组合信号的设备和方法
JP2007017628A (ja) 2005-07-06 2007-01-25 Matsushita Electric Ind Co Ltd 復号化装置
US7565289B2 (en) 2005-09-30 2009-07-21 Apple Inc. Echo avoidance in audio time stretching
JP4760278B2 (ja) 2005-10-04 2011-08-31 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
DE602006012370D1 (de) 2005-12-13 2010-04-01 Nxp Bv Einrichtung und verfahren zum verarbeiten eines audio-datenstroms
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
FR2910743B1 (fr) * 2006-12-22 2009-02-20 Thales Sa Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade.
EP2229677B1 (en) * 2007-12-18 2015-09-16 LG Electronics Inc. A method and an apparatus for processing an audio signal
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
RU2565009C2 (ru) 2008-03-10 2015-10-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и метод для обработки аудио сигнала, содержащего переходный сигнал
US9147902B2 (en) 2008-07-04 2015-09-29 Guangdong Institute of Eco-Environmental and Soil Sciences Microbial fuel cell stack
ATE522901T1 (de) 2008-07-11 2011-09-15 Fraunhofer Ges Forschung Vorrichtung und verfahren zur berechnung von bandbreitenerweiterungsdaten mit hilfe eines spektralneigungs-steuerungsrahmens
CN102144259B (zh) 2008-07-11 2015-01-07 弗劳恩霍夫应用研究促进协会 用于产生带宽扩展输出数据的装置和方法
WO2010003557A1 (en) * 2008-07-11 2010-01-14 Frauenhofer- Gesellschaft Zur Förderung Der Angewandten Forschung E. V. Apparatus and method for generating a bandwidth extended signal
WO2010036061A2 (en) 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8258849B2 (en) 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
DK3364414T3 (da) * 2008-12-15 2022-06-27 Fraunhofer Ges Forschung Audiobåndbreddeudvidelsesafkoder, tilsvarende fremgangsmåde og computerprogram
RU2493618C2 (ru) * 2009-01-28 2013-09-20 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
ES2989851T3 (es) 2009-10-21 2024-11-27 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
US8321216B2 (en) 2010-02-23 2012-11-27 Broadcom Corporation Time-warping of audio signals for packet loss concealment avoiding audible artifacts
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio
SG183967A1 (en) * 2010-03-09 2012-10-30 Fraunhofer Ges Forschung Apparatus and method for processing an input audio signal using cascaded filterbanks

Also Published As

Publication number Publication date
AU2011226212B2 (en) 2014-03-27
US20130090933A1 (en) 2013-04-11
CN103038819B (zh) 2015-02-18
AU2011226211B2 (en) 2014-01-09
EP4148729B1 (en) 2025-01-22
BR122021014305B1 (pt) 2022-07-05
US10032458B2 (en) 2018-07-24
PL2545553T3 (pl) 2015-01-30
KR20120139784A (ko) 2012-12-27
HUE070311T2 (hu) 2025-05-28
EP2545548A1 (en) 2013-01-16
CA2792452C (en) 2018-01-16
EP4661004A2 (en) 2025-12-10
EP4475124B1 (en) 2025-10-29
US12308036B2 (en) 2025-05-20
EP3570278A1 (en) 2019-11-20
JP5588025B2 (ja) 2014-09-10
JP2013521538A (ja) 2013-06-10
EP2545553B1 (en) 2014-07-30
ES2522171T3 (es) 2014-11-13
EP2545553A1 (en) 2013-01-16
US20170194011A1 (en) 2017-07-06
US11894002B2 (en) 2024-02-06
CN102939628B (zh) 2015-05-13
PL3570278T3 (pl) 2023-03-20
US11495236B2 (en) 2022-11-08
BR112012022574A2 (pt) 2021-09-21
BR112012022740B1 (pt) 2021-12-21
AR080476A1 (es) 2012-04-11
SG183967A1 (en) 2012-10-30
CA2792450C (en) 2016-05-31
US9792915B2 (en) 2017-10-17
RU2012142732A (ru) 2014-05-27
CA2792450A1 (en) 2011-09-15
BR112012022740A2 (pt) 2020-10-13
ES3010370T3 (en) 2025-04-02
US20240135939A1 (en) 2024-04-25
AU2011226211A1 (en) 2012-10-18
CA2792452A1 (en) 2011-09-15
EP4475124C0 (en) 2025-10-29
CN102939628A (zh) 2013-02-20
RU2586846C2 (ru) 2016-06-10
US20180366130A1 (en) 2018-12-20
HK1181180A1 (en) 2013-11-01
KR101414736B1 (ko) 2014-08-06
WO2011110499A1 (en) 2011-09-15
TW201207842A (en) 2012-02-16
AR080477A1 (es) 2012-04-11
US20230074883A1 (en) 2023-03-09
EP4475124A3 (en) 2025-01-15
EP4148729C0 (en) 2025-01-22
US10770079B2 (en) 2020-09-08
EP4475124A2 (en) 2024-12-11
US20200279571A1 (en) 2020-09-03
TW201207841A (en) 2012-02-16
PL4148729T3 (pl) 2025-05-26
BR112012022574B1 (pt) 2022-05-17
EP4148729A1 (en) 2023-03-15
BR122021014312B1 (pt) 2022-08-16
US9305557B2 (en) 2016-04-05
WO2011110500A1 (en) 2011-09-15
JP2013525824A (ja) 2013-06-20
TWI444991B (zh) 2014-07-11
EP3570278B1 (en) 2022-10-26
TWI446337B (zh) 2014-07-21
US20130051571A1 (en) 2013-02-28
JP5523589B2 (ja) 2014-06-18
AU2011226212A1 (en) 2012-10-18
MX2012010416A (es) 2012-11-23
ES2935637T3 (es) 2023-03-08
CN103038819A (zh) 2013-04-10
KR101425154B1 (ko) 2014-08-13
MY154204A (en) 2015-05-15
KR20120131206A (ko) 2012-12-04
BR122021019082B1 (pt) 2022-07-26

Similar Documents

Publication Publication Date Title
US12308036B2 (en) Apparatus and method for processing an input audio signal using cascaded filterbanks
HK40084150A (en) Apparatus for downsampling an audio signal
HK40116415A (en) Method for downsampling an audio signal
HK40084150B (en) Apparatus for downsampling an audio signal
HK40011519B (en) High frequency reconstruction of an input audio signal using cascaded filterbanks
HK40011519A (en) High frequency reconstruction of an input audio signal using cascaded filterbanks
BR122021019078B1 (pt) Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata

Legal Events

Date Code Title Description
FG Grant or registration