CONFORMADO ENVOLVENTE TEMPORAL PARA CODIFICACIÓN ESPACIAL DE AUDIO USANDO FILTRADO DE WIENER DE DOMINIO DE FRECUENCIA
Campo Técnico La presente invención se refiere a codificadores de audio basados por bloque, en los cuales cuando es decodificada la información, ésta tiene una resolución envolvente temporal limitada por la velocidad de bloque, la cual incluye codificadores, decodificadores y sistemas perceptuales y paramétricos de audio, que corresponden con métodos, programas de computadora que implementan estos métodos y con un flujo de bits producido a través de estos codificadores .
Técnica Anterior Muchas técnicas de codificación de audio de velocidad-reducida-bits están "basadas por bloque" porque la codificación incluye el procesamiento que divide cada una o más de las señales de audio que están siendo codificadas en bloques de tiempo y actualiza al menos alguna de la información secundaria asociada con el audio codificado de una manera no más frecuente que la velocidad de bloque. Como resultado, la información de audio, cuando es decodificada, tiene una resolución envolvente temporal que es limitada por la velocidad de bloque. En consecuencia, la estructura detallada de las señales decodificadas de audio con respecto al tiempo no es preservada para períodos de tiempo más pequeños que la granularidad de la técnica de codificación
(normalmente, en el intervalo de 8 a 50 milisegundos por bloque) . Estas técnicas de codificación de audio basadas por bloque incluyen no sólo las técnicas perceptuales de codificación bien establecidas que son conocidas como AC-3, AAC, y varias formas de MPEG en las cuales los canales discretos son generalmente preservados a través del proceso de codificación/decodificación, sino que también incluyen las técnicas de codificación de velocidad limitada de bits recientemente introducidas, que en algunas ocasiones son referidas como "Codificación de Pista Binaural o Estereofónica" y "Codificación Paramétrica Estéreo" , en las cuales múltiples canales de entrada son de mezclado descendente y de mezclado ascendente a partir de un canal único a través del proceso de codificación/decodificación. Los detalles de estos sistemas de codificación se encuentran contenidos en varios documentos, que incluyen aquellos citados más adelante de acuerdo con el encabezado "Incorporación como Referencia" . Como consecuencia del uso de un canal único en estos sistemas de codificación, las señales reconstruidas de salida son, de manera necesaria, versiones de escala de amplitud entre sí, para un bloque particular, las distintas señales de salida tienen de una manera sustancialmente necesaria la misma estructura fina envolvente . Aunque todas las técnicas de codificación de audio basadas por bloque podrían beneficiarse a partir de una resolución envolvente temporal mejorada de sus señales decodificadas de audio, la necesidad de esta mejora es particularmente grande en técnicas de codificación basadas por bloque que no preservan canales discretos a través de todo el proceso de codificación/decodificación. Ciertos tipos de señales de entrada, tales como por ejemplo, un aplauso, son particularmente problemáticas para estos sistemas, provocando que se angoste o colapse la imagen espacial percibida que es reproducida.
Breve Descripción de las Figuras La Figura 1 es un diagrama de bloques funcional esquemático de un codificador o función de codificación que incluye los aspectos de la presente invención. La Figura 2 es un diagrama de bloques funcional esquemático de un decodificador o función de decodificación que incluye los aspectos de la presente invención.
Descripción de la Invención De acuerdo con un primer aspecto de la invención, se proporciona un método de codificación de señal de audio en el cual una o más señales de audio son codificadas en un flujo de bits que comprende la información de audio y la información secundaria que se refiere a la información de audio y que es útil en la decodificación del flujo de bits, la codificación incluye el procesamiento que divide cada una de una o más de las señales de audio en bloques de tiempo y actualiza por lo menos alguna de la información secundaria de una manera no más frecuente que la velocidad de bloque, de manera que la información de audio, cuando sea decodificada, tenga una resolución envolvente temporal que es limitada por la velocidad de bloque. La comparación es efectuada entre el envolvente temporal al menos de una señal de audio y el envolvente temporal de una reconstrucción decodificadora estimada al menos de cada una de la señal de audio, esta reconstrucción estimada emplea por lo menos alguna de la información de audio y al menos alguna de la información secundaria, representaciones de los resultados de comparación que son útiles para mejorar la resolución envolvente temporal al menos de alguna información de audio cuando es decodificada . De acuerdo con otro aspecto de la invención, es proporcionado un método de codificación y decodificación de señal de audio, en el cual una o más señales de entrada de audio son codificadas en un flujo de bits que comprende la información de audio y la información secundaria que se refiere a la información de audio y que es útil en la decodificación del flujo de bits, el flujo de bits es recibido y la información de audio es decodificada utilizando la información secundaria a fin de proporcionar una o más señales de salida de audio, la codificación y decodificación incluyen el procesamiento que divide cada una de una o más de las señales de entrada de audio y el flujo de bits decodificado, de manera respectiva, en bloques de tiempo, la codificación actualiza al menos alguna de la información secundaria de una manera no más frecuente que la velocidad de bloque, de manera que la información de audio, cuando sea decodificada, tiene un envolvente temporal que posee una resolución limitada por la velocidad de bloque. La comparación es realizada entre el envolvente temporal al menos de una señal de entrada de audio y el envolvente temporal de una reconstrucción decodificada que es estimada al menos de cada señal de entrada, esta reconstrucción estimada emplea por lo menos alguna de la información de audio y al menos alguna de la información secundaria, la comparación proporciona una representación de los resultados de la comparación, estas representaciones son útiles para mejorar la resolución envolvente temporal al menos de alguna de la información de audio cuando sea decodificada. La salida al menos de algunas de las representaciones es realizada, y es efectuada la decodificación del flujo de bits, la decodificación emplea la información de audio, la información secundaria y las representaciones que son salidas. De acuerdo con un aspecto adicional de la invención, se proporciona un método de decodificación de señal de audio, en el cual una o más señales de entrada de audio han sido codificadas en un flujo de bits que comprende la información de audio y la información secundaria que se refiere a la información de audio y es útil en la decodificación del flujo de bits, la codificación incluye el procesamiento que divide cada una de una o más de las señales de entrada de audio en bloques de tiempo y actualiza por lo menos alguna de la información secundaria de una manera no más frecuente que la velocidad de bloque, de manera que la información de audio, cuando es decodificada utilizando la información secundaria, tenga una resolución envolvente temporal que es limitada por la velocidad de bloque, la codificación además incluye la comparación del envolvente temporal al menos de una señal de entrada de audio y el envolvente temporal de una reconstrucción decodificada que es estimada al menos de cada señal de entrada de audio, esta reconstrucción estimada emplea por lo menos alguna información de audio y al menos alguna de la información secundaria, la comparación proporciona una representación de los resultados de la comparación, estas representaciones son útiles para mejorar la resolución envolvente temporal al menos de algunas de la información de audio cuando sea decodificada, y la codificación además incluye la salida al menos de algunas de las representaciones. La recepción y decodificación del flujo de bits son realizadas, la decodificación emplea la información de audio, la información secundaria y las representaciones que son salidas. Otros aspectos de la invención incluyen un aparato adaptado para realizar los métodos señalados con anterioridad, un programa de computadora, almacenado en un medio susceptible de ser leído por computadora que provoca que una computadora realice los métodos señalados con anterioridad, un flujo de bits producido por los métodos señalados con anterioridad y un flujo de bits producido por el aparato que es adaptado para realizar los métodos señalados con anterioridad.
Descripción Detallada de la Invención La Figura 1 muestra un ejemplo de un entorno de un codificador o proceso de codificación en el cual podrían emplearse los aspectos de la presente invención. Una pluralidad de señales de audio de entrada tal como las señales PCM, muestras de tiempo de las respectivas señales analógicas de audio, 1-n, es aplicada en los respectivos convertidores o funciones de conversión de dominio de tiempo a dominio de frecuencia ("T/F") 2-1 a 2-n. Las señales de audio podrían representar, por ejemplo, las direcciones espaciales tales como izquierda, central, derecha, etcétera. Cada T/F podría ser implementada, por ejemplo, dividiendo las muestras de entrada de audio en bloques, formando ventanas de los bloques, superponiendo los bloques, transformando cada uno de los bloques de ventana y de superposición en el dominio de frecuencia mediante el cálculo de una transformada discreta de frecuencia (DFT) y dividiendo los espectros de frecuencia resultantes en bandas que simulan las bandas críticas del oído, por ejemplo, 21 bandas que utilizan, por ejemplo, la escala de banda equivalente-rectangular (ERB) . Estos procesos DFT son bien conocidos en la técnica. Otros parámetros y técnicas de conversión de dominio de tiempo a dominio de frecuencia podrían ser empleados. Ni los parámetros particulares, tampoco las técnicas particulares son críticas para la invención. Sin embargo, con el propósito de facilitar su explicación, la siguiente descripción supone que es empleada esta técnica de conversión DFT. Cada una de las salidas del dominio de frecuencia de
T/F 2-1 a 2-n es un conjunto de coeficientes espectrales. Estos conjuntos podrían ser designados como Y [kA a Y[Kn] , de manera respectiva. Todos estos conjuntos podrían ser aplicados en un codificador o función de codificación basada por bloque 4 ("codificador basado por bloque") . El codificador basado por bloque podría ser, por ejemplo, cualquiera de uno de los codificadores conocidos basados por bloque que son mencionados con anterioridad solos o en algunas ocasiones en combinación o cualquiera de los codificadores basados por bloque que incluyen variaciones de estos codificadores mencionados con anterioridad. Aunque los aspectos de la invención son particularmente benéficos para uso en conexión con codificadores basados por bloque que no preservan canales discretos durante la codificación y decodificación, los aspectos de la invención son útiles en conexión virtualmente con cualquier codificador basado por bloque . Las salidas de un codificador común basado por bloque 4 podrían ser caracterizadas como "información de audio" e "información secundaria" . La información de audio podría comprender los datos que representan múltiples canales de señal como es posible en los sistemas de codificación basados por bloque tales por ejemplo, como AC-3, AAC y otros, o, podrían comprender sólo un canal único derivado por el mezclado descendente de múltiples canales de entrada, tal como la codificación de referencia binaria y los sistemas paramétricos de codificación estéreo (el canal de mezclado descendente en un codificador de cifrado de referencia binaria o un sistema paramétrico de codificación estéreo también podrían ser codificados en forma perceptual, por ejemplo, con AAC o alguna otra codificación adecuada) . También podría comprender un canal único o múltiples canales derivados mediante el mezclado descendente de múltiples canales de entrada, tal como se describe en la Solicitud Provisional de Patente de los Estados Unidos S.N. 60/588,256 presentada el 14 de Julio del 2004 por Davis et al., titulada "Low Bit Rate Audio Encoding and Decoding in Which Múltiple Channels are Represented By Monophonic Channel and Auxiliary Information". La Solicitud S.N. 60/588,256 se incorpora en la presente como referencia en su totalidad. La información secundaria podría comprender los datos que se refieren a la información de audio y es útil en su decodificación. En el caso de varios sistemas de codificación de mezclado descendente, la información secundaria podría comprender parámetros espaciales tales como por ejemplo, diferencias de amplitud entre canales, diferencias de tiempo o fase entre canales y la correlación cruzada entre canales. La información de audio y la información secundaria que provienen del codificador basado por bloque 4 podrían ser entonces aplicadas a los respectivos convertidores o funciones de conversión de dominio de frecuencia a dominio de tiempo ("F/T") 6 y 8 de manera que cada uno realice generalmente las funciones de inversión de una T/F descrita con anterioridad, a saber una FFT inversa, seguido por la adición de la - formación de ventana de la superposición. La información de dominio de tiempo de las F/T 6 y 8 es aplicada a un formador de paquete o función de paquetes de flujo de bits ("formador de paquete o paquetizador de flujo de bits") 10 que proporciona una salida codificada de flujo de bits. En forma alterna, si el codificador fuera a proporcionar un flujo de bits que representa la información de dominio de frecuencia, las F/T 6 y 8 podrían ser omitidas. La información de audio y la información secundaria del dominio de frecuencia que provienen del codificador basado por bloque 4 también son aplicadas en un estimador o función de estimación de decodificación ("estimador de decodificación") 14. El estimador de decodificación 14 podría simular al menos una porción de un decodificador o función de decodificación designada para decodificar el flujo de bits codificado que es proporcionado por el formador de paquete de flujo de bits 10. Un ejemplo de este decodificador o función de decodificación se describe más adelante en conexión con la Figura 2. El estimador de decodificación 14 podría proporcionar los conjuntos de coeficientes espectrales X [kx] a X [Kn] , que aproximan los conjuntos de coeficientes espectrales Y [k ] a Y [Kn] , de las correspondientes señales de entrada de audio que se espera sean obtenidas en el decodificador o función de decodificación. En forma alterna, éste podría proporcionar los coeficientes espectrales en una menor cantidad que todas las señales de entrada de audio, para una menor cantidad de todos los bloques de tiempo de las señales de entrada de audio y/o para menos de todas las bandas de frecuencia (es decir, no podría proporcionar todos los coeficientes espectrales) . Esto podría generarse, por ejemplo, si se deseara mejorar sólo las señales de entrada que representan los canales que se considera son más importantes que otros. Como otro ejemplo, esto podría generarse si se deseara mejorar sólo las porciones de frecuencia más baja de las señales en las cuales el oído es más sensible a los detalles finos de los envolventes temporales de forma de onda. Cada una de las salidas de dominio de frecuencia de las T/F 2-1 a 2-n, cada uno de los conjuntos de coeficientes espectrales Y [kx] a Y [Kn] , también es aplicado en los respectivos dispositivos o funciones de comparación ("comparación") 12-1 a 12 -n. Estos conjuntos son comparados con los conjuntos correspondientes de los bloques de tiempo correspondiente de los coeficientes espectrales estimados X [kx] a X [Kn] en la comparación respectiva 12-1 a 12 -n. Los resultados de la comparación en cada comparación 12-1 a 12 -n es aplicada en un calculador o función de cálculo del filtro ("cálculo de filtro") 15-1 a 15-n. Esta información tiene que ser suficiente para cada cálculo de filtro con el objeto de definir los coeficientes de un filtro para cada bloque de tiempo, este filtro, cuando es aplicado en una reconstrucción decodificada de una señal de entrada, originaría la señal que tiene un envolvente temporal con una resolución mejorada. En otras palabras, el filtro volvería a configurar la señal, de modo que esta replique más estrechamente el envolvente temporal de la señal original. La resolución mejorada es una resolución más fina que la velocidad del bloque. Los detalles adicionales de un filtro preferido son señalados más adelante . Aunque el ejemplo de la Figura 1 muestra la comparación y el cálculo de filtro en el dominio de frecuencia, en principio, la comparación y el cálculo de filtro podrían ser realizados en el dominio de tiempo. Si fueran realizados en el dominio de frecuencia o en el dominio de tiempo, sólo una configuración de filtro sería determinada por bloque de tiempo (aunque la misma configuración de filtro podría ser aplicada a algún número de bloques consecutivos de tiempo) . Aunque en principio, la configuración de filtro puede ser determinada en base a una banda por banda (tal como por banda de la escala ERB) , al hacerlo de este modo se requeriría el envío de un gran número de bits de información secundaria, lo cual perdería la ventaja de la invención, a saber, mejorar la resolución envolvente temporal con un bajo incremento en la velocidad de bits . Una medición de la comparación en cada comparación 12-1 a 12-n es aplicada en un dispositivo o función de decisión ("decisión") 16-1 a 16-n. Cada decisión compara la medición de la comparación contra un umbral o magnitud. Una medición de la comparación podría tomar varias formas y no es crítica. Por ejemplo, el valor absoluto de la diferencia de cada valor correspondiente de coeficiente podría ser calculado y las diferencias sumadas a fin de proporcionar un número único cuyo valor indique el grado en el cual las formas de onda de señal difieran entre sí durante un bloque de tiempo. Este número podría ser comparado con un umbral, de manera que si excediera el umbral, se proporcionaría un indicador "si" al correspondiente cálculo de filtro. En la ausencia de un indicador "si", los cálculos de filtro podrían ser impedidos para el bloque, o si fueran calculados, estos no podrían ser salidos por el cálculo de filtro. Esta información si/no para cada señal constituye un aviso que también podría ser aplicado al formador de paquete de flujo de bits 10 para su inclusión en el flujo de bits (de esta manera, podría existir una pluralidad de avisos, uno para cada señal de entrada y cada uno de estos avisos podría ser representado por un bitio o bit) . En forma alterna, cada decisión 16-1 a 16 -n podría recibir la información a partir de un respectivo cálculo de filtro 14-1 a 14-n en lugar o en adición a la información que proviene de una comparación respectiva 12-1 a 12 -n. La decisión respectiva 16 podría emplear las características calculadas de filtro (por ejemplo, su promedio o sus magnitudes pico) como la base para la toma de una decisión o la asistencia en la toma de una decisión. Como se mencionó con anterioridad, cada cálculo de filtro 14-1 a 14 -n proporciona una representación de los resultados de la comparación, los cuales podrían constituir los coeficientes de un filtro, este filtro, cuando es aplicado en una reconstrucción decodificada de una señal de entrada originaría la señal que tiene un envolvente temporal con una resolución mejorada. Si los coeficientes espectrales estimados X [k] i a X [K] n fueran incompletos (en el caso que el estimador de decodificación proporcionara coeficientes espectrales menores que todas las señales de entrada de audio, para una menor cantidad que todos los bloques de tiempo de las señales de entrada de audio y/o para menos de todas las bandas de frecuencia) , no podrían existir salidas para cada comparación 12-1 a 12 -n para todos los bloques de tiempo, bandas de frecuencia y señales de entrada. El lector debe observar que X [k] 2 a X [K] n se refieren a las salidas reconstruidas, mientras que Y [k] 2 a Y [K] n se refieren a las entradas . La salida de cada cálculo de filtro 14-1 a 14-n podría ser aplicada en el ensamblador de flujo de bits 10. Aunque la información de filtro podría ser enviada por separado desde el flujo de bits, se prefiere que sea enviada como parte del flujo de bits y como parte de la información secundaria. Cuando los aspectos de la invención sean aplicados en los sistemas existentes de codificación basada por bloque, la información adicional proporcionada por los aspectos de la presente invención podría ser introducida en porciones de los flujos de bits de estos sistemas que se pretende que lleven información auxiliar. En las modalidades prácticas, no sólo la información de audio sino también la información secundaria y los coeficientes de filtro serán probables para ser cuantificados o codificados en algún modo a fin de minimizar sus costos de transmisión. Sin embargo, la falta de cuantificación y descuantificación se muestran en las figuras con el propósito de simplificación en la presentación y debido a que estos detalles son bien conocidos y no ayudan en el entendimiento de la invención. Di seño de Fil tro de Wiener en el Dominio de Frecuencia De preferencia, cada uno de los dispositivos o funciones de cálculo de filtro 14-1 a 14-n se caracteriza por un filtro FIR en el dominio de frecuencia se representa los cambios multiplicativos en el dominio de tiempo que son requeridos para obtener una reproducción más exacta de un envolvente temporal original del canal de señal . Este problema de filtro puede ser formulado al menos como un problema de cuadros, el cual a menudo es referido como un diseño de filtro Wiener véase por ejemplo, X. Rong Li , Probabili ty, Random Signáis, and Statistics, CRC Press 1999, New York, pp . 423. La aplicación de las técnicas de filtro Wiener tiene la ventaja de reducir los bits adicionales que son requeridos para transmitir la información de reconfiguración de filtro a un decodificador. Normalmente, las aplicaciones convencionales del filtro Wiener son diseñadas y aplicadas en el dominio de tiempo. El problema de diseño de filtro de menos cuadros de dominio de frecuencia podría ser definido como sigue: dada la representación espectral DFT de una señal original Y [k] y la representación espectral DFT de una aproximación de este canal original X [k] , se calcula un conjunto de coeficientes de filtro ( am) que minimiza la ecuación 1. Se observa que Y[k] y X [k] son valores complejos y por lo tanto, en general, am también será un valor complejo.
en donde k es el índice espectral, E es el operador de expectativa y M es la longitud del filtro que está siendo diseñado . La ecuación 1 puede ser nuevamente expresada utilizando expresiones de matriz como se muestra en la ecuación 2 : en donde
r*-[p*íl x = [X[k] X[k-?¡ - X[k-M + 1]]
y
De esta manera, mediante el ajuste de las derivadas parciales en la ecuación 2 con respecto a cada uno de los coeficientes de filtro en cero, es simple mostrar la solución al problema de minimización, el cual es dado por la ecuación
3. A = R??R?r, (3)
en donde
R x = [E(Y?Xl) E{Y?Xlx) .» E(Y?X M+1)].
La ecuación 3 define el cálculo de los coeficientes óptimos de filtro que minimizan el error entre el espectro original [ Y [k] ) y el espectro reconstruido [X [k] ) de un canal particular. De manera general, un conjunto de coeficientes de filtro se calcula para cada bloque de tiempo de cada señal de entrada . En una modalidad práctica de los aspectos de la invención, es empleado un filtro Wiener de doceavo orden, aunque la invención no se limita al uso de un filtro Wiener de este tamaño. Esta modalidad práctica emplea el procesamiento en el dominio de frecuencia enseguida de una DFT. En consecuencia, los coeficientes de filtro Wiener son números complejos y cada filtro requiere la transmisión de veinticuatro números reales. Para transmitir de manera eficiente esta información de filtro a un decodificador, el proceso de cuantificación de vector (VQ) podría ser utilizado para codificar los coeficientes de cada filtro. Un libro de códigos podría ser empleado, de manera que sólo el índice necesita ser enviado al decodificador para transmitir la información compleja de filtro de doceavo orden. En una modalidad práctica, un libro de códigos de tabla VQ que tiene 24 dimensiones y 16,536 entradas se ha encontrado que es útil. La invención no se limita al uso de la cuantificación de vector, tampoco al uso del libro de códigos. Mientras que la descripción anterior supone el uso de una DFT para estimar el contenido espectral y para diseñar el filtro Wiener, en general cualquier transformada podría ser utilizada. La Figura 2 muestra un ejemplo de un entorno de decodificador o proceso de decodificación en el cual los aspectos de la presente invención podrían ser empleados. Este codificador o proceso de codificación podría ser adecuado para la operación en cooperación con un codificador o proceso de codificación como se describió en conexión con el ejemplo de la Figura 1. Un flujo de bits codificados, tal como el que se produce a través del arreglo de la Figura 1, es recibido a través de cualquier modo adecuado de transmisión o almacenamiento de señal y es aplicado en un despaquetizador de flujo de bits 30 que desempaca el flujo de bits según sea necesario para separar la información codificada de audio de la información secundaria y los avisos de sí/no (si fueron incluidos en el flujo de bits) . De preferencia, la información secundaria incluye un conjunto de coeficientes de filtro para uso en la mejora de la reconstrucción de cada una de una o más de las señales de entrada que fueron aplicadas en el arreglo de codificación de la Figura 1. En este ejemplo, se supone que existe una señal reproducida que corresponde con cada señal de entrada y que la información de reconfiguración de filtro de envolvente temporal es proporcionada para cada señal reproducida, aunque éste no necesita ser el caso, como se mencionó con anterioridad. De esta manera, los conjuntos 1-n de la información secundaria de coeficientes de filtro son mostrados como salidas del despaquetizador de flujo de bits 30. La información de coeficientes de filtro para cada señal de entrada es aplicada en los respectivos filtros de reconfiguración 36-1 a 36-n, cuya operación se explica más adelante. Cada uno de los filtros también podría recibir un aviso respectivo de sí/no 31-1 a 31-n indicando si el filtro tiene que ser activo durante un bloque particular de tiempo. La información secundaria que proviene del paquetizador de flujo de bits 30 también podría incluir otra información tal como por ejemplo, las diferencias de amplitud entre canales, las diferencias de tiempo o fase entre canales y la correlación cruzada entre canales en el caso de una codificación de referencia binaural o sistema paramétrico de estéreo. Un decodificador basado por bloque 42 recibe la información secundaria que proviene del despaquetizador de flujo de bits 30 junto con la información convertida de audio de dominio de tiempo-a-frecuencia del despaquetizador de flujo de bits 30. La información de audio del despaquetizador 30 es aplicada por medio del convertidor o función de conversión de dominio de tiempo a dominio de frecuencia ("T/F") 46, que podría ser la misma que cualquiera de uno de los convertidores o funciones de conversión de dominio de frecuencia ("T/F") 2-1 a 2-n de la Figura 1. El decodificador basado por bloque 42 proporciona una o más salidas, cada una de las cuales es una aproximación de una señal correspondiente de entrada en la Figura 1. Aunque algunas señales de entrada no podrían tener una correspondiente señal de salida, el ejemplo de la Figura 2 muestra las señales de salida 1-n, cada una de las cuales es una aproximación que corresponde con la respectiva señal de las señales de entrada 1-n de la Figura 1. En este ejemplo, cada una de las señales de salida 1-n del decodificador 42 es aplicada en el respectivo filtro de reconfiguración 36-1 a 36-n, cada una de las cuales podría ser implementada como un filtro FIR. Los coeficientes de cada filtro FIR son controlados, en una base de bloque, a través de la respectiva información de filtro que se refiere a un canal particular de entrada cuya salida reconstruida será mejorada. De preferencia, la reconfiguración multiplicativa del envolvente en el dominio de tiempo es conseguida mediante la convolución de cada filtro FIR con una salida de decodificador basado por bloque en cada uno de los filtros 36-1 a 36 -n. De esta manera, la configuración de envolvente temporal de acuerdo con los aspectos de la presente invención toma ventaja de la dualidad de frecuencia de tiempo, la convolución en el dominio de tiempo es equivalente a la multiplicación en el dominio de frecuencia y viceversa. Cada una de las señales de salida decodificadas y filtradas, es entonces aplicada en los respectivos convertidores o funciones de conversión de dominio de frecuencia a dominio de tiempo ("F/T") 44-1 a 44 -n de manera que cada una realice las funciones inversas de una T/F descrita con anterioridad, a saber, una FFT inversa, seguida por la adición de formación de ventana y de superposición. En forma alterna, un filtro adecuado de reconfiguración de dominio de tiempo podría ser empleado en seguida de cada uno de los convertidores de dominio de frecuencia-a-tiempo. Por ejemplo, los n coeficientes polinomiales de una curva polinomial de enésimo orden podrían ser enviados como la información secundaria en lugar de los coeficientes de filtro FIR y la curva aplicada por la multiplicación en el dominio de tiempo. Aunque se prefiere emplear las técnicas de filtro Wiener para transmitir la información de reconfiguración de filtro al decodificador, otras técnicas de dominio de frecuencia y dominio de tiempo podrían ser empleadas, tales como aquellas señaladas en la Solicitud de Patente de los Estados Unidos S. N. 10/113,858 de Truman and Vinton, titulada "Broadband Frequency Translation for High Frequency Regeneration" , presentada el 28 de Marzo del 2002 y publicada como el documento US 2003/0187663 Al el 02 de Octubre del 2003. La solicitud se incorpora en la presente como referencia en su otalidad.
Implemen tación La invención podría ser implementada en hardware o software, o una combinación de ambos (por ejemplo, en series lógicas programables) . A menos que sea especificado de otro modo, los algoritmos incluidos como parte de la invención no son inherentemente relacionados con ninguna computadora particular u otro aparato. En particular, varias máquinas de uso general podrían ser empleadas con programas escritos de acuerdo con las enseñanzas en la presente, o podría ser más conveniente la construcción de aparatos más especializados (por ejemplo, circuitos integrados) para realizar las etapas requeridas de método. Por lo tanto, la invención podría ser implementada en uno o más programas de computadora que se ejecutan en uno o más sistemas programables de cómputo, cada uno de los cuales comprende al menos un procesador, por lo menos un sistema de almacenamiento de datos (que incluye una memoria volátil y no volátil y/o elementos de almacenamiento) , al menos un dispositivo o puerto de entrada y por lo menos un dispositivo o puerto de salida. El código de programa es aplicado en los datos de entrada para realizar las funciones descritas en la presente y generar la información de salida. La información de salida es aplicada en uno o más dispositivos de salida, en un modo conocido. Cada programa podría ser implementado en cualquier lenguaje deseado de cómputo (que incluye los lenguajes de programación de máquina, ensamble, o procedimiento de alto nivel, lógico u orientado por objeto) para comunicarse con un sistema de cómputo. En cualquier caso, el lenguaje podría ser un lenguaje compilado o interpretado. De preferencia, cada programa de cómputo es almacenado o descargado en un dispositivo o medios de almacenamiento (por ejemplo, en una memoria de estado sólido o medios, o medios magnéticos u ópticos) que pueden ser leídos a través de una computadora programable de uso general o especial, que configura y opera la computadora cuando los medios o el dispositivo de almacenamiento sean leídos por el sistema de cómputo para realizar los procedimientos descritos en la presente. El sistema inventivo también podría ser considerado que es implementado como un medio de almacenamiento susceptible de ser leído por computadora, el cual es configurado con un programa de cómputo, en donde el medio de almacenamiento configurado de este modo, provoca que el sistema de cómputo funcione en un modo específico y predefinido para realizar las funciones descritas en la presente. Un número de modalidades de la invención ha sido descrito. Sin embargo, será entendido que varias modificaciones podrían realizarse sin apartarse del espíritu y alcance de la invención. Por ejemplo, algunas de las etapas descritas en la presente podrían ser independientes del orden, y por lo tanto, pueden ser realizadas en un orden diferente del descrito. Incorporación como Referencia Las siguientes patentes, solicitudes y publicaciones de patentes son incorporadas en la presente como referencia, cada una en su totalidad. AC-3 Estándar ATSC A52/A : Estándar de Compresión de Audio
Digi tal (AC-3 ) , Revisión A, Advanced Televisión Systems
Committee, 20 de Agosto del 2001. El documento A/52A se encuentra disponible en la Red Amplia Mundial (WWW) en http : //www. atsc . org/standards .html . "Design and Implementation of AC-3 Coders," de Steve Vernon, IEEE Trans . Consumer Electronics , Vol. 41, No .3 , Agosto del 1995. "The AC-3 Multichannel Coder" de Mark Davis, Audio
Engineering Society Preprint 3774, 95a Convención AES, Octubre del 1993. "High Quality, Low-Rate Audio Transform Coding for Transmission and Multimedia Applications," de Bosi et al, Audio Engineering Society Preprint 3365, 93er Convención AES, Octubre del 1992. Patentes de los Estados Unidos Nos. 5,583,962; 5,632,005; 5,633,981; 5,727, 119; y 6,021,386. AAC ISO/IEC JTC1/SC29, "Information technology - very low bitrate audio-visual coding," ISO/IEC IS-14496 (Parte 3, Audio) , 1996 I) ISO/IEC 13818-7. "MPEG-2 advanced audio coding, AAC". Estándar Internacional, 1997; M. Bosi, K. Brandenburg, S. Quackenbush, L. Fielder,
K. Akagiri, H. Fuchs, M. Dietz, J. Herré, G. Davidson, e Y. Oikawa: "ISO/IEC MPEG-2 Advanced Audio Coding". Proc . de la 101a Convención AES, 1996; M. Bosi, K. Brandenburg, S. Quackenbush, L. Fielder, K. Akagiri, H. Fuchs, M. Dietz, J. Herré, G. Davidson, Y. Oikawa: "ISO/IEC MPEG-2 Advanced Audio Coding", Diario de la AES, Vol. 45, No. 10, Octubre del 1997, pp . 789-814; Karlheinz Brandenburg: "MP3 and AAC explained" . Proc . de la Uva AES International Conference on High Quality Audio Coding, Florencia, Italia, 1999; y G.A. Soulodre et al.: "Subjective Evaluation of State-of-the-Art Two-Channel Audio Codees" J. Audio Eng. Soc . , Vol. 46, No.3, pp 164-177, Marzo de 1998. Estéreo de Intensidad MPEG Patentes de los Estados Unidos Nos. 5,323,396;
,539,829; 5,606,618 y 5,621,855. Solicitud Publicada de Patente de los Estados Unidos US 2001/0044713, publicada. Codificación Espacial y Paramétrica Solicitud Provisional de Patente de los Estados Unidos S.N. 60/588,256, presentada el 14 de Julio del 2004 de Davis et al, titulada "Low Bit Rate Audio Encoding and Decoding in Wlrich Múltiple Channels are Represented By Monophonic Channel and Auxiliary Information." Solicitud Publicada de Patente de los Estados Unidos
US 2003/0026441, publicada el 06 de Febrero del 2003 Solicitud Publicada de Patente de los Estados Unidos US 2003/0035553, publicada el 20 de Febrero del 2003, Solicitud Publicada de Patente de los Estados Unidos US 2003/0219130 (Baumgarte & Faller) publicada el 27 de Noviembre del 2003, Audio Engineering Society Paper 5852, Marzo del 2003
Solicitud Publicada de Patente de los Estados Unidos WO 03/090206, publicada el 30 de Octubre del 2003 Solicitud Publicada de Patente de los Estados Unidos
WO 03/090207, publicada el 30 de Octubre del 2003 Solicitud Publicada de Patente de los Estados Unidos WO 03/090208, publicada el 30 de Octubre del 2003 Solicitud Publicada de Patente de los Estados Unidos WO 03/007656, publicada el 22 de Enero del2003 Publicación de Solicitud Publicada de Patente de los
Estados Unidos US 2003/0236583 Al, Baumgarte et al, publicada el 25 de Diciembre del 2003, "Hybrid Multi -Channel/Cue
Coding/Decoding of Audio Signáis," Solicitud S.N. 10/246,570. "Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression, " de Faller et al, Audio Engineering Society Convention Paper 5574, 112va Convención, Munich, Mayo del 2002. "Why Binaural Cue Coding is Better than Intensity Stereo Coding," by Baumgarte et al, Audio Engineering Society Convention Paper 5575, 112va Convención, Munich, Mayo del 2002. "Design and Evaluatin of Binaural Cue Coding Schemes," de Baumgarte et al, Audio Engineering Society Convention Paper 5706, 113va Convención, Los Angeles, Octubre del 2002. "Efficient Representation of Spatial Audio Using Perceptual Parametrization, " de Faller et al, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001, New Paltz, New York, Octubre del 2001, pp . 199-202. "Estimation of Auditory Spatial Cues for Binaural Cue Coding," de Baumgarte et al, Proc. ICASSP 2002, Orlando, Florida, Mayo del 2002, pp . 11-1801-1804. "Binaural Cue Coding: A Novel and Efficient Representation of Spatial Audio," de Faller et al, Proc. ICASSP 2002, Orlando, Florida, Mayo del 2002, pp . II-1841-II-1844. "High-quality parametric spatial audio coding at low bitrates," de Breebaart et al, Audio Engineering Society Convention Paper 6072, 116va Convención, Berlín, Mayo del 2004. "Audio Coder Enhancement using Scalable Binaural Cue Coding with Equalized Mixing," de Baumgarte et al, Audio Engineering Society Convention Paper 6060, 116va Convención, Berlín, Mayo del 2004. "Low complexity parametric stereo coding," de Schuijers et al, Audio Engineering Society Convention Paper
6073, 116va Convención, Berlín, Mayo del 2004. "Synthetic Ambience in Parametric Stereo Coding," de Engdegard et al, Audio Engineering Society Convention Paper
6074, 116va Convención, Berlín, Mayo del 2004. Otras Patente de los Estados Unidos No. 5,812,971, Herré, "Enhanced Joint Stereo Coding Method Using Temporal Envelope Shaping," 22 de Septiembre de 1998 "Intensity Stereo Coding," de Herré et al, Audio Engineering Society Preprint 3799, 96a Convención, Ámsterdam, 1994.