[go: up one dir, main page]

MX2010012580A - Aparato de mezcla ascendente estereo parametrico, decodificador estereo parametrico, aparato de mezcla descendente estereo parametrico, codificador estereo parametrico. - Google Patents

Aparato de mezcla ascendente estereo parametrico, decodificador estereo parametrico, aparato de mezcla descendente estereo parametrico, codificador estereo parametrico.

Info

Publication number
MX2010012580A
MX2010012580A MX2010012580A MX2010012580A MX2010012580A MX 2010012580 A MX2010012580 A MX 2010012580A MX 2010012580 A MX2010012580 A MX 2010012580A MX 2010012580 A MX2010012580 A MX 2010012580A MX 2010012580 A MX2010012580 A MX 2010012580A
Authority
MX
Mexico
Prior art keywords
signal
monaural
difference
parametric stereo
downmix
Prior art date
Application number
MX2010012580A
Other languages
English (en)
Inventor
Erik G P Schuijers
Original Assignee
Koninkl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40943873&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=MX2010012580(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninkl Philips Electronics Nv filed Critical Koninkl Philips Electronics Nv
Publication of MX2010012580A publication Critical patent/MX2010012580A/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

Un aparato de mezcla ascendente estéreo paramétrico (300, 400) para generar una señal izquierda (206) y una señal derecha (207) a partir de una señal monoaural de mezcla descendente (204) con base en parámetros espaciales (205). La mezcla ascendente estéreo paramétrico se caracteriza porque comprende un medio (310) para predecir una señal de diferencia (311) que comprende una diferencia entre la señal izquierda (206) y la señal derecha (207) con base en la señal monoaural de mezcla descendente (204) escalada con un coeficiente de predicción (321). El coeficiente de predicción se deriva de los parámetros espaciales (205). El aparato de mezcla ascendente estéreo paramétrico (300, 400) adicionalmente comprende un medio aritmético (330) para derivar la señal izquierda (206) y la señal derecha (207) con base en una suma y una diferencia de la señal monoaural de mezcla descendente (204) y la señal de diferencia (311).

Description

APARATO DE MEZCLA ASCENDENTE ESTEREO PARAMETRICO, DECODIPICADOR ESTEREO PARAMETRICO, APARATO DE MEZCLA DESCENDENTE ESTEREO PARAMETRICO, CODIFICADOR ESTEREO PARAMETRICO Campo de la Invención La invención se relaciona con un aparato de mezcla ascendente estéreo paramétrico para generar una señal izquierda y una señal derecha a partir de una señal monoaural de mezcla descendente basada en parámetros espaciales. La invención se relaciona además con un decodificador estéreo paramétrico que comprende un aparato de mezcla ascendente estéreo paramétrico, un método para generar una señal izquierda y una señal derecha a partir de una señal monoaural de mezcla descendente basada en parámetros espaciales, un dispositivo de reproducción de audio, un aparato de mezcla descendente estéreo paramétrico, un codificador estéreo paramétrico, un método para generar una señal residual de predicción para una señal de diferencia, y un producto de programa de cómputo.
Antecedentes de la Invención El Estéreo Paramétrico (PS, por sus siglas en inglés) es uno de los mayores avances en la codificación de audio en el último par de años. La base del Estéreo Paramétrico se explica en J. Breebaart, S. van de Par, A. Kohlrausch y E.
Ref.: 214281 Schuijers, "Parametric Coding of Stereo Audio", en EURASIP J. Appl. Signal Process., vol 9, páginas 1305-1322 (2004). En comparación con la codificación tradicional de señales de audio, también conocida como discreta, el codificador PS como se ilustra en la figura 1 transforma un par de señales estéreo (l,r) 101, 102 a una sola señal monoaural de mezcla descendente 104 más una pequeña cantidad de parámetros 103 que describen la imagen espacial . Estos parámetros comprenden Diferencias de Intensidad Intercanal, (iids, por sus siglas en inglés) , Diferencias de Fase (o Tiempo) Intercanal (ipds/itds, por sus siglas en inglés) y Coherencia/Correlación Intercanal (ices, por sus siglas en inglés) . En el codificador PS 100 la imagen espacial de la señal de entrada estéreo (l,r) es analizada dando como resultado los parámetros iid, ipd e ice. Preferentemente, los parámetros dependen del tiempo y la frecuencia. Para cada bloque de tiempo/frecuencia se determinan los parámetros de iid, ipd e ice. Estos parámetros son cuantificados y codificados 140 obteniendo el flujo de bits PS. Además, los parámetros también se usan típicamente para controlar la forma en la que se genera la mezcla descendente de la señal de entrada estéreo. La señal de suma monoaural resultante (s) 104 se codifica subsiguientemente usando un codificador de audio monoaural antiguo 120. Finalmente el flujo de bits monoaural y PS resultante se reúnen para construir el flujo de bits estéreo global 107.
En el decodificador PS 200 el flujo de bits estéreo se divide en un flujo de bits monoaural 202 y un flujo de bits PS 203. La señal de audio es decodificada dando como resultado una reconstrucción de la señal monoaural de mezcla descendente 204. La señal monoaural de mezcla descendente se alimenta a la mezcla ascendente PS 230 junto con · los parámetros de imagen espacial decodificados 205. La mezcla ascendente PS genera entonces el par de señales estéreo de salida (l,r) 206, 207. Con el fin de sintetizar las indicaciones de ice, la mezcla ascendente PS emplea una denominada señal descorrelacionada (sd) , es decir, una señal generada de la señal de audio monoaural que tiene aproximadamente la misma envolvente espectral y temporal, que sin embargo tiene una correlación sustancialmente de cero con respecto a la señal de entrada monoaural. Después, con base en los parámetros de imagen espacial, en la mezcla ascendente PS para cada bloque de tiempo/frecuencia se determina una matriz de 2x2 y se aplica: en donde Hij representa un entrada H de matriz de mezcla ascendente (i,j). Las entradas de la matriz H son funciones de los parámetros PS iid, ice y opcionalmente ipd/opd. En el sistema PS del estado de la técnica en caso de que se empleen parámetros ipd/opd, la matriz de mezcla ascendente H puede descomponerse como: en donde la matriz de la izquierda de 2x2 representa las rotaciones de fases, una función de los parámetros ipd y opd, y la matriz de la derecha de 2x2 representa la parte que restaura los parámetros iid e ice.
En WO2003090206 Al se propone distribuir igualmente el ipd en los canales izquierdo y derecho en el decodificador. Además, se propone generar una señal de mezcla descendente haciendo girar las señales izquierda y derecha una hacia la otra a la mitad de la ipd medida para obtener la alineación. En la práctica, en el caso de señales casi fuera de fase, esto da como resultado, tanto para la mezcla descendente en el decodificador como para la mezcla ascendente generada en el decodificador de que la ipd a través del tiempo varía ligeramente aproximadamente 180 grados, lo cual debido a la envolvente puede consistir de una secuencia de ángulos tales como 179, 178, -179, 177, -179, ... Como resultado de estos saltos los bloques de tiempo/frecuencia subsiguientes en la mezcla descendente presenta discontinuidades de fase o en otras palabras inestabilidad de fase. Debido a la estructura de síntesis de traslape agregado inherente esto resulta en artefactos audibles.
Como ejemplo, considere la mezcla descendente en donde en el bloque de tiempo/frecuencia la mezcla descendente se genera como: s = iej<n 2-e,+rej<-n/2'e> , en donde e es algún pequeño ángulo arbitrario, lo que significa que la ipd medida estaba cerca de 180 grados, mientras que para el siguiente bloque de tiempo-frecuencia la mezcla descendente se genera como: s = iej<-n/2'c>+rej'n/2''> , lo que significa que la ipd medida estaba cerca de -180 grados. Usando la síntesis de traslape agregado típica ocurre una cancelación de fases entre los puntos intermedios de los bloques de tiempo/frecuencia subsiguientes que producen artefactos.
Una desventaja principal de la codificación estéreo paramétrica como se discute arriba es la inestabilidad de una síntesis de las indicaciones de Diferencias de Fases Interaural (ipd) en el decodificador PS las cuales se usan en la generación del par estéreo de salida. Esta inestabilidad tiene su fuente en las modificaciones de fases realizadas en el codificador PS con el fin de generar la mezcla descendente, y en el decodificador PS con el fin de generar la señal de salida. Como resultado de esta inestabilidad se experimenta una calidad de audio inferior del par de estéreo de salida.
Con el fin de lidiar con este problema de inestabilidad de fases en la práctica la síntesis de ipd a menudo se descarta. Sin embargo, esto da como resultado una calidad de audio (espacial) reducida de la señal estéreo reconstruida.
Otra alternativa de lidiar con este problema de inestabilidad cuando se usan parámetros de ipd es incorporar las denominadas Diferencias de Fases Globales (opds) en el flujo de bits con el fin de proporcionar al decodificador una referencia de fase. En esta forma la continuidad en los bloques de tiempo/frecuencia puede aumentar permitiendo una rotación de fases común. Sin embargo, esto sucede a expensas de un aumento en la velocidad de transferencia de bits, y por lo tanto resulta en el deterioro del desempeño global del sistema .
Breve Descripción de la Invención Un objeto de la invención es proporcionar un aparato de mezcla ascendente estéreo paramétrico mejorado para generar una señal izquierda y una señal derecha a partir de una señal monoaural de mezcla descendente que tiene calidad de audio mejorada de las señales izquierdas y derecha generadas sin un aumento adicional de la velocidad de transmisión de bits, y ¦ no tiene las desventajas de las inestabilidades inferidas por la síntesis de diferencias de fases interaurales (ipds) .
Este objeto se logra por medio de un aparato de mezcla ascendente estéreo paramétrico (PS) que comprende un medio para predecir una señal . de diferencia que comprende una diferencia entre la señal izquierda y la señal derecha con base en la señal monoaural de mezcla descendente escalada con un coeficiente de predicción. El coeficiente de predicción se deriva de los parámetros espaciales. El aparato de mezcla ascendente PS adicionalmente comprende un medio aritmético para derivar la señal izquierda y la señal derecha con base en una suma y una diferencia de la señal monoaural de mezcla descendente y la señal de diferencia.
El aparato de mezcla ascendente PS propuesto ofrece una manera diferente de derivación de la señal de izquierda y la señal de derecha para esto del decodificador PS. En lugar de aplicar los parámetros espaciales para restaurar la imagen espacial correcta en un sentido estadístico como se hace en el decodificador PS conocido, el aparato de mezcla ascendente PS propuesto construye la señal de diferencia a partir de la señal monoaural de mezcla descendente y los parámetros espaciales. Tanto el PS conocido como propuesto tienen como objetivo restaurar las relaciones de energía correctas (iids) , correlaciones cruzadas (ices) y relaciones de fases (ipds) . Sin embargo, el decodificador PS conocido no está dirigido a obtener el ajuste de formas de onda más preciso. En lugar de asegurar que los parámetros del codificador medidos coinciden estadísticamente con los parámetros de decodificador restaurados. En la mezcla ascendente PS propuesta por medio de operaciones aritméticas simples, tales como una suma y una diferencia, aplicadas a la señal monoaural de mezcla descendente y la señal de diferencia estimada se obtienen la señal izquierda y la señal derecha. La construcción proporciona resultados mucho mejores para la calidad y estabilidad de las señales izquierda y derecha reconstruidas dado que proporciona un ajuste estrecho de formas de onda que restaura el comportamiento de fase original de la señal.
En una modalidad, el coeficiente de predicción se basa en el ajuste de formas de onda a la señal de mezcla descendente en la señal de diferencia. El ajuste de formas de onda como tal no tiene las desventajas de inestabilidades del enfoque estadístico usado en el decodificador PS conocido para la síntesis de ipd y opd dado que inherentemente proporciona la conservación de fase. Por lo tanto al usar la señal de diferencia derivada como una señal monoaural de mezcla descendente escalada (complejo valorado) y derivando el coeficiente de predicción con base en el ajuste de formas de onda se elimina la fuente de inestabilidades del decodificador PS conocido. El ajuste de formas de onda comprende por ejemplo un ajuste por mínimos cuadrados de la señal monoaural de mezcla descendente sobre la señal de diferencia, calculando la señal de diferencia como: d = a-s, en donde s es la señal de mezcla descendente y a es el coeficiente de predicción. Es bien sabido que la solución de predicción de mínimos cuadrados está dada por: n donde (s,d>* representa el conjugado complejo de la correlación cruzada de la mezcla descendente y la señal de diferencia y (s,s> representa la energía de la señal de mezcla descendente.
En una modalidad adicional, el coeficiente de predicción está dado como una función de los parámetros espaciales: iid - \ -j- 2- s' (ipd)- ice- "Jiid a = : r =~ iid+ \ + 2- cos(ipd)- ice- -y iid en donde iid, ipd, e ice son parámetros espaciales, e iid es una diferencia de intensidad intercanal, ipd es una diferencia de fases intercanal, e ice es una coherencia intercanal. Generalmente es difícil cuantificar el coeficiente de predicción de valor complejo a en un sentido de percepción significativa dado que la precisión requerida depende de las propiedades de las señales de audio izquierda y derecha que serán reconstruidas. Por lo tanto, la ventaja de esta modalidad es que en contraste al coeficiente de predicción compleja a, las precisiones de cuantificación requeridas para los parámetros espaciales son bien conocidas en la psicoacústica. Como tal, el uso óptimo del conocimiento de la psicoacústica puede emplearse para cuantificar eficientemente, es decir con el menor numero de etapas posibles, el coeficiente de predicción para disminuir la velocidad de transmisión de bits. Además, esta modalidad permite la mezcla ascendente usando contenido PS compatible hacia atrás.
En una modalidad adicional, los medios para predecir la señal de diferencia se disponen para mejorar la señal de diferencia por la adición de una señal monoaural de mezcla descendente descorrelacionada escalada. Dado que en general no es posible predecir completamente la señal de diferencia del codificador original a partir de la señal monoaural de mezcla descendente, esto da lugar a una señal residual. Esta señal residual no tiene correlación con la señal de mezcla descendente como de otra manera se hubiera tomado en cuenta mediante el coeficiente de predicción. En muchos casos la señal residual comprende un campo de sonido reverberante de una grabación. La señal residual puede sintetizarse efectivamente usando una señal monoaural de mezcla descendente descorrelacionada, derivada de la señal monoaural de mezcla descendente.
En una modalidad adicional, la mezcla monoaural descendente descorrelacionada . se obtiene por medio de filtración de la señal monoaural de mezcla descendente. El objetivo de esta filtración es generar efectivamente una • señal con una envolvente espectral y temporal similar a la señal monoaural de mezcla descendente, pero con una correlación sustancialmente cercana a cero de tal manera que corresponde con una variante sintética del componente residual derivado en el codificador. Esto puede, por ejemplo, lograrse por medio de filtración de todo paso, retardos, filtros de reverberación reticular, redes de retardos de retroalimentación o una combinación de los mismos. Adicionalmente, puede aplicarse la normalización de energía a la señal descorrelacionada con el fin de asegurar que la energía para cada bloque de tiempo/frecuencia de la señal descorrelacionada corresponde estrechamente con la de la señal monoaural de mezcla descendente. En esta forma se asegura que la señal de salida del decodificador contendrá la cantidad correcta de energía de señal descorrelacionada.
En una modalidad adicional, se establece un factor de escalamiento aplicado a la señal monoaural de mezcla descendente descorrelacionada para compensar una pérdida de energía de predicción. El factor de escalamiento aplicado a la señal monoaural de mezcla descendente descorrelacionada asegura que la energía de señal global de la señal izquierda y la señal derecha en el lado del decodificador coincide con la energía de señal de la energía de señal izquierda y derecha en el lado del decodificador, respectivamente. Como tal el factor de escalamiento ß también puede interpretarse como un factor de predicción de compensación de pérdida de energía.
En una modalidad adicional, el factor de escalamiento aplicado a la señal monoaural de mezcla descendente se da como una función de los parámetros espaciales: En donde iid, ipd, e ice son parámetros espaciales, e iid es una diferencia de intensidad intercanal, ipd es una diferencia de fase intercanal, ice es una coherencia intercanal, y OÍ es el coeficiente de predicción. Similarmente como en el caso del coeficiente de predicción, que expresa el factor de escalamiento descorrelacionado ß como una función de los parámetros espaciales permite el uso del conocimiento acerca de las precisiones de cuantificación requeridas de estos parámetros espaciales. Como tal, el uso óptimo del conocimiento psicoacústico puede emplearse para disminuir la velocidad de transmisión de bits.
En una modalidad adicional, la mezcla ascendente estéreo paramétrico tiene una señal residual de predicción para la señal de diferencia como una entrada adicional, con lo cual los medios aritméticos se disponen para derivar la señal izquierda y la señal derecha también con base en la señal residual de predicción para la señal de diferencia. Para evitar nombres largos de señales se usa una señal residual de predicción para la señal residual de predicción para la señal de diferencia a través del resto de la solicitud de patente. La señal residual de predicción opera como un reemplazo para la señal de descorrelación sintética por su contraparte de decodificador original. Esto permite restaurar la señal estéreo original en el decodificador . Sin embargo esto es a costa de la velocidad de transmisión de bits adicional dado que la señal de predicción necesita codificarse y transmitirse al decodificador . Por lo tanto, típicamente el ancho de banda de la señal residual de predicción está limitada. La señal residual de predicción puede ya sea, reemplazar completamente la señal monoaural de mezcla descendente descorrelacionada para un bloque de tiempo/frecuencia dado o puede trabajar en una forma complementaria. Esto último puede ser benéfico en el caso de que la señal residual de predicción solo esté escasamente codificada, por ejemplo, soló unos cuantos de los acumuladores de frecuencia más significativos estén codificados. En ese caso, en comparación con la situación del codificador, aún faltará energía. Esta falta de energía será llenada por la señal descorrelacionada. Entonces se calcula un nuevo factor de escalamiento ß' como: en donde (dres,cod, dres,cod> es la energía de señal de la señal residual de predicción codificada y <s,s) es la energía de la señal monoaural de mezcla descendente. Estas energías de señales pueden medirse en el lado del decodificador y por lo tanto no necesitan transmitirse como parámetros de señal.
La invención proporciona adicionalmente un decodificador estéreo paramétrico que comprende el aparato de mezcla ascendente estéreo paramétrico y un dispositivo de reproducción de audio que comprende el decodificador estéreo paramétrico .
La invención también proporciona un aparato de mezcla descendente estéreo paramétrico y un codificador estéreo paramétrico que comprende el aparato de mezcla descendente estéreo paramétrico.
La invención proporciona además reivindicaciones de método así como un producto de programa de cómputo que permite que un dispositivo programable realice el método de conformidad con la invención.
Breve Descripción de las Figuras Estos y otros aspectos de la invención serán evidentes y se determinarán al hacer referencia a las modalidades mostradas en las figuras, en las cuales: La figura 1 muestra esquemáticamente una arquitectura de un codificador estéreo paramétrico (técnica anterior) ; la figura 2 muestra esquemáticamente una arquitectura de un decodificador estéreo paramétrico (técnica anterior) ; la figura 3 muestra un aparato de mezcla ascendente estéreo paramétrico de conformidad con la invención, el aparato -de mezcla ascendente estéreo paramétrico genera una señal izquierda y una señal derecha a partir de una señal monoaural de mezcla descendente con base en parámetros espaciales; la figura 4 muestra el aparato de mezcla ascendente estéreo paramétrico que comprende un medio de predicción dispuesto para mejorar la señal de diferencia mediante la adición de una señal monoaural de mezcla descendente descorrelacionada escalada; la figura 5 muestra el aparato de mezcla ascendente estéreo paramétrico que tiene una señal residual de predicción para la señal de diferencia como una entrada adicional; la figura 6. muestra el decodificador estéreo paramétrico que comprende el aparato de mezcla ascendente estéreo paramétrico de conformidad con la invención; la figura 7 muestra un diagrama de flujo para un método para generar la señal izquierda y la señal derecha a partir de la señal monoaural de mezcla descendente con base en parámetros espaciales de conformidad con la invención; la figura 8 muestra un aparato de mezcla descendente estéreo paramétrico de conformidad con la invención, el aparato de mezcla descendente estéreo paramétrico genera una señal monoaural de mezcla descendente a partir de la señal izquierda y la señal derecha con base en parámetros espaciales; la figura 9 muestra el. codificador estéreo paramétrico que comprende el aparato de mezcla descendente estéreo paramétrico de conformidad con lá invención.
A lo largo de las figuras, los mismos números de referencia indican características similares o correspondientes. Algunas de las características indicadas en las figuras se implementan típicamente en software, y como tal representan entidades de software, tales como módulos u objetos de software.
Descripción Detallada de la Invención La figura 3 muestra un aparato de mezcla ascendente estéreo paramétrico 300 de conformidad con la invención. El aparato de mezcla ascendente estéreo paramétrico 300 genera una señal izquierda 206 y una señal derecha 207 a partir de una señal monoaural de mezcla descendente 204 con base en parámetros espaciales 205.
El aparato de mezcla ascendente estéreo paramétrico 300 comprende un medio 310 para predecir una señal de diferencia 311 que comprende una diferencia entre la señal izquierda 206 y la señal derecha 207 con basé en la señal monoaural de mezcla descendente 204 escalada con un coeficiente de predicción 321, mediante lo cual el coeficiente de predicción 321 se deriva de los parámetros espaciales 205 en una unidad 320 y un medio aritmético 330 para derivar la señal izquierda 206 y la señal derecha 207 con base en una suma y una diferencia de la señal monoaural de mezcla descendente 204 y la señal de diferencia 311.
La señal izquierda 206 y la señal derecha 207 se reconstruyen preferentemente como sigue: 1 = s+d, r = s-d, en donde s es la señal monoaural de mezcla descendente, y d es la señal de diferencia. Esto, suponiendo que la señal de suma del codificador se calcula como: l + r s = . 2 En la práctica la normalización de ganancias se aplica con frecuencia cuando se construye la señal izquierda 206 y la señal derecha 207: l = ^- (s + d), 2c r =™ (s - d), 2c en donde c es una constante de normalización de ganancias y es función de los parámetros espaciales. La normalización de ganancias asegura que una energía de la señal monoaural de mezcla descendente 204 es igual a una suma de energías de la señal izquierda 206 y la- señal derecha 207. En este caso la señal de suma del decodificador se calculó como: s = c · (1+r) .
Los parámetros espaciales se determinan de antemano en un codificador y se transmiten al decodificador que comprende un mezclador ascendente estéreo paramétrico 300. Los parámetros espaciales se determinan trama por trama para cada bloque de tiempo/frecuencia como: ipd = Z(l,r), en donde iid es una diferencia de intensidad intercanal, ice es una coherencia intercanal, ipd es una diferencia de fases intercanal, y (1,1) y (r,r) son las energías de las señales izquierda y derecha respectivamente y (l,r) representa el coeficiente de covarianza de valor complejo no normalizado entre las señales izquierda y derecha.
Para un dominio de frecuencia de valor complejo típico tal como DFT (FFT) , estas energías se miden como: (u)= ?/[*]·/?[*! ^€k (r,r) = ?r[k} r * [k\ (hr) = ?l[k r * [k en donde kbioque representa los acumuladores de DFT que corresponden a una banda de parámetros. Se apreciará que también podría usarse otra representación de dominio compleja, tal como por ejemplo, un banco QMF complejo exponencialmente modulado como se describe en P. Ekstrand, "Bandwidth extensión of audio signáis by spectral band replication" , en Proc. lst IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002) , Leuven, Bélgica, Nov. 2002, páginas 73-79.
Para bajas frecuencias hasta 1.5-2 kHz aplican las ecuaciones anteriores. Sin embargo, para frecuencias mayores los parámetros de ipd no son relevantes para la percepción y por lo tanto se fijan a un valor de cero dando como resultado: ipd = 0.
Alternativamente, dado que a frecuencias mayores, la envolvente de banda ancha es más importante que las diferencias de fases para la percepción, ice se calcula como: La constante de normalización de ganancias c se expresa como: ud+\ y iid+1 + 2· ice- cos(ipd)' ~Jtid Dado que c puede tender á infinito debido a que las señales izquierda y derecha están fuera de fase, el valor de la constante de normalización de ganancias c está limitada típicamente como: üd+ l c = minl I iid + 1 +2· ice · cos(ipd)- üd ' max / siendo cmax el factor de amplificación máxima, por ejemplo, cmax=2.
En una modalidad, el coeficiente de predicción se basa en estimar la señal de diferencia 311 a partir de la señal monoaural de mezcla descendente 204 usando el ajuste de formas de onda. El ajuste de formas de onda comprende, por ejemplo, un ajuste por mínimos cuadrados de la señal monoaural de mezcla descendente 204 sobre la señal de diferencia 311, dando como resultado la señal de diferencia que está dada como: d = - s, en donde s es la señal monoaural de mezcla descendente 204 y a es el coeficiente de predicción 321.
Además del ajuste por mínimos cuadrados puede usarse un ajuste de formas de onda usando una norma diferente de la norma L2. Alternativamente, el error de norma p ||d-Qí-s|| podría por ejemplo, ponderarse perceptivamente. Sin embargo, el ajuste por mínimos cuadrados es ventajoso porque produce cálculos relativamente simples para derivar el coeficiente de predicción de los parámetros de imágenes espaciales transmitidos .
Es bien sabido que la solución de predicción por mínimos cuadrados para el coeficiente de predicción o¡ está dada por: M* {s,s) en donde <s,d>* representa el conjugado complejo de la correlación cruzada de la señal monoaural de mezcla descendente 204 y la señal de diferencia 311 y <s,s) representa la energía de la señal monoaural de mezcla descendente .
En una modalidad adicional, el coeficiente de predicción 321 está dado como una función de los parámetros espaciales: iid- \ -j- 2- s pd)- ice- ?[? (X— ' · iid+1+2· cos(ipd)- ice- '•¡iid El coeficiente de predicción se calcula en la unidad 320 de acuerdo con la fórmula anterior.
La figura 4 muestra el aparato de mezcla ascendente estéreo paramétrico 300 que comprende un medio de predicción 310 dispuesto para, mejorar la señal de diferencia mediante la adición de una señal monoaural de mezcla descendente descorrelacionada escalada. La señal monoaural de mezcla descendente 204 se suministra a la unidad 340 para descorrelacionar. Como resultado la señal monoaural de mezcla descendente descorrelacionada 341 se suministra a la salida de la unidad 340. En el medio de predicción 310 una primera parte de la señal de diferencia se calcula escalando la señal monoaural de mezcla descendente 204 con el coeficiente de predicción 321. Adicionalmente la señal monoaural de mezcla descendente descorrelacionada 341 también es escalada en el medio de predicción 310 con el factor de escala 322. Una segunda parte resultante de la señal de diferencia se añade consecuentemente a la primera parte de la señal de diferencia dando como resultado la señal de diferencia mejorada 311. La señal monoaural de mezcla descendente 204 y la señal de diferencia mejorada 311 se proveen al medio aritmético 330, el cual calcula la señal izquierda 206 y la señal derecha 207.
En general no es posible predecir con precisión la señal de diferencia de la señal monoaural de mezcla descendente solo escalando con el coeficiente de predicción. Esto da lugar a una señal residual dres ~ d-a~s. Esta señal residual no tiene correlación con la señal de mezcla descendente como de otra manera se hubiera tomado en cuando por medio del coeficiente de predicción. En muchos casos la señal residual comprende un campo de sonido reverberante de una grabación. La señal residual se sintetiza efectivamente usando una señal monoaural de mezcla descendente descorrelacionada, derivada de la señal monoaural de mezcla descendente. La señal descorrelacionada es la segunda parte de la señal de diferencia que se calcula en el medio de predicción 310.
En una modalidad adicional, la señal monoaural de mezcla descendente descorrelacionada 341 se obtiene por medio de filtración de la señal monoaural de mezcla descendente 204. La filtración se realiza en la unidad 340. Esta filtración genera una señal con una envolvente espectral y temporal similar a la señal monoaural de mezcla descendente 204, pero con una correlación sustancialmente cercana a cero de tal manera que corresponde con una variante sintética del componente residual derivado en el codificador. Este efecto se logra por medio de, por ejemplo, filtración de todo paso, retardos, filtros de reverberación reticular, redes de retardos de retroalimentación o una combinación de los mismos .
En una modalidad adicional, se establece un factor de escalamiento 322 aplicado a la señal monoaural de mezcla descendente descorrelacionada 341 para compensar una pérdida de energía de predicción. El factor de escalamiento 322 aplicado a la señal monoaural de mezcla descendente descorrelacionada 341 asegura que toda la energía de señal de la señal izquierda 206 y la señal derecha 207 en la salida del aparato de mezcla ascendente estéreo paramétrico 300 coincide con la energía de señal de la energía de las señales izquierda y derecha en el lado del codificador, respectivamente. Como . tal el factor de escalamiento 322 indicado además como ß se interpreta como un factor de compensación de pérdida de energía de predicción. La señal de diferencia d se expresa entonces como : d = a¦ s + ß-Sd en donde Sd es . la señal monoaural de mezcla descendente descorrelacionada.
Puede verse que el factor de escalamiento 322 puede expresarse como: en términos de energías de señal que corresponden a la señal de diferencia d y a la señal monoaural de mezcla descendente s · En una modalidad adicional, el factor de escalamiento 322 aplicado a la señal monoaural de mezcla descendente descorrelacionada 341 está dado como una función de los parámetros espaciales 205: El factor de escalamiento 322 se deriva en la unidad 320.
En el caso de que no se aplique una normalización a la mezcla descendente en el codificador, es decir, la señal de mezcla descendente se calculó como s = l/2(l+r), la señal izquierda 206 y la señal derecha 207 se expresan entonces como : En el caso de aplicarse la normalización a la mezcla descendente, es decir que la señal de mezcla descendente se calculó como s = c(l+r), la señal izquierda 206 y la señal derecha 207 se expresan entonces como: La figura 5 muestra el aparato de mezcla ascendente estéreo paramétrico 500 que tiene una señal residual de predicción para la señal de diferencia 331 como una entrada adicional. Los medios aritmético 330 se disponen para derivar la señal izquierda 206 y la señal derecha 207 con base en la señal monoaural de mezcla descendente 204, la diferencia de señal 311, y la señal de predicción residual 331. Los medios 310 predicen una señal de diferencia 311 con base en la señal monoaural de mezcla descendente 204 escalada con un coeficiente de predicción 321. El coeficiente de predicción 321 se deriva en la unidad 320 con base en los parámetros espaciales 205.
. La señal izquierda 206 y la señal derecha 207, respectivamente, están dados como: 1 = s+d+ res, r = s-d-dres , en donde dres es la señal residual de predicción.
Alternativamente, en el caso de que se aplicara una normalización de energía a la mezcla descendente, pero no a la señal residual, la señal izquierda y la señal derecha pueden derivarse como: l = ^--(s+d) + dres, 2c r = -- (s-d)-dres. 2c La señal residual de predicción 331 opera como un reemplazo para la señal de descorrelación sintética 341 por su contraparte de codificador original. Esto permite restaurar la señal estéreo original por medio del aparato de mezcla ascendente estéreo paramétrico 300. La señal residual de predicción 331 puede ya sea reemplazar completamente la señal monoaural de mezcla descendente descorrelacionada 341 para un bloque de tiempo/frecuencia dado o puede trabajar en una forma complementaria. Esto último es benéfico en el caso de que la señal residual de predicción solo esté escasamente codificada, por ejemplo, solo unos cuantos de los acumuladores de frecuencia más significativos están codificados. En ese caso, aún falta energía en comparación con la señal residual de predicción del codificador. Esta falta de energía es llenada por la señal descorrelacionada 341. Entonces se calcula un nuevo factor de escalamiento ß' como: en donde (dres,cod, dres,cod> es la energía de señal de la señal residual de predicción codificada y (s,s> es la energía de la señal monoaural de mezcla descendente 204.
El aparato de mezcla ascendente estéreo paramétrico 300 puede usarse en la arquitectura del estado de la técnica del decodificador estéreo paramétrico sin ninguna adaptación adicional. El aparato de mezcla ascendente estéreo paramétrico 300 reemplaza entonces a la unidad de mezcla ascendente 230 como se ilustra en la figura 2. Cuando la señal residual de predicción 331 es utilizada por la mezcla ascendente estéreo paramétrico 400 se requieren un par de adaptaciones, las cuales se ilustran en la figura 6.
La figura 6 muestra el decodificador estéreo paramétrico que comprende el aparato de mezcla ascendente estéreo paramétrico 400 de conformidad con la invención. Un decodificador estéreo paramétrico comprende un medio de desmultiplexión 210 para dividir el flujo de bits de entrada en un flujo de bits monoaural 202, un flujo de bits residual de predicción 332, y un flujo de bits de parámetros 203. Un medio de decodificación monoaural 220 decodifica el flujo de bits monoaural 202 a una señal monoaural de mezcla descendente 204. El medio de decodificación monoaural está configurado adicionalmente para decodificar el flujo de bits residual de predicción 332 en la señal- residual de predicción 331. Un medio de decodificación de parámetros 240 decodifica el flujo de bits de parámetros 203 a parámetros espaciales 205. El aparato de mezcla ascendente estéreo paramétrico 400 genera una señal izquierda 206 y una señal derecha 207 a partir de la señal monoaural de mezcla descendente 204 y la señal residual de predicción 331 con base en parámetros espaciales 205. A pesar de que la descodificación de la señal monoaural de mezcla descendente 204 y la señal residual de predicción la realiza el medio de decodificación 220, es posible que la decodificación se realice por medio de un software y/o hardware de decodificación separado para cada una de las señales que serán decodificadas .
La figura 7 muestra un diagrama de flujo para un método para generar la señal izquierda 206 y la señal derecha 207 a partir de la señal monoaural de mezcla descendente 204 con base en parámetros espaciales de conformidad con la invención. En una primera etapa 710 una primera señal dé diferencia 311 que comprende una diferencia entre la señal izquierda 206 y la señal derecha 207 se predice con base en la señal monoaural de mezcla descendente 204 escalada con un coeficiente de predicción 321, con lo cual el coeficiente de predicción se deriva de los parámetros espaciales 205. En una segunda etapa 720 la señal izquierda 206 y la señal derecha 207 se derivan con base en una suma y una diferencia de la señal monoaural de mezcla descendente 204 y la señal de diferencia 311.
Cuando la señal residual de predicción está disponible en la segunda etapa 720 la señal residual de predicción enseguida de la señal monoaural de mezcla descendente 204 y la señal de diferencia 311 se usa para derivar la señal izquierda 206 y la señal derecha 207. .
Cuando la mezcla ascendente estéreo paramétrico 300 se usa en el decodificador estéreo paramétrico no se requiere ninguna modificación al codificador estéreo paramétrico.
Puede usarse el codificador estéreo paramétrico como se conoce en la técnica anterior.
Sin embargo, cuando se usa la mezcla ascendente estéreo paramétrico 400 el codificador estéreo paramétrico debe adaptarse para proporcionar la señal residual de predicción en el flujo de bits.
La figura 8 muestra un aparato de mezcla descendente estéreo paramétrico 800 de conformidad con la invención, el aparato de mezcla descendente estéreo paramétrico genera una señal monoaural de mezcla descendente a partir de la señal izquierda y la señal derecha con base en parámetros espaciales. El aparato de mezcla descendente estéreo paramétrico 800 emite enseguida de la señal monoaural de mezcla descendente 104 una señal adicional 801, la cual es la señal residual de predicción. El aparato de mezcla descendente estéreo paramétrico 800 comprende un medio aritmético adicional 810 para derivar la señal monoaural de mezcla descendente 104 y una señal de diferencia 811 que comprende una diferencia entre la señal izquierda 101 y la señal derecha 102. El aparato de mezcla descendente estéreo paramétrico 800 comprende adicionalmente un medio de predicción adicional 820 para derivar una señal residual de predicción (para la señal de diferencia) 801 como una diferencia entre la señal de diferencia 811 y la señal monoaural de mezcla descendente 104 escalada con un coeficiente de predicción predeterminado 831 derivado de los parámetros espaciales 103. El coeficiente de predicción predeterminado se determina en una unidad 830. El coeficiente de predicción predeterminado se selecciona para proporcionar la señal residual de predicción 801 que es ortogonal a la señal monoaural de mezcla descendente 104. Además puede usarse la normalización de energía de la señal de mezcla descendente (no se muestra en la figura 8) .
Aunque la numeración de las señales que corresponden con la mezcla descendente monoaural y la señal residual de predicción tienen diferentes números de referencia en el aparato de mezcla ascendente estéreo paramétrico y el aparato de mezcla descendente estéreo paramétrico, debe estar claro que cada una de las señales monoaurales de mezcla descendente 204 y 104 son correspondientes entre sí y la señal residual de predicción 331 y 801 también son correspondientes entre sí.
La figura 9 muestra el codificador estéreo paramétrico que comprende el aparato de mezcla descendente estéreo paramétrico 800 de conformidad con la invención. El codificador estéreo paramétrico comprende: - un medio de estimación 130 para derivar parámetros espaciales 103 de la señal izquierda 101 y la señal derecha 102, - un aparato de mezcla descendente estéreo paramétrico 110 de conformidad con la invención para generar una señal monoaural de mezcla descendente 104 de la señal izquierda 101 y la señal derecha 102 con base en parámetros espaciales 103, - un medio de codificación monoaural 120 para codificar la señal monoaural de mezcla descendente 104 a un flujo de bits monoaural 105, el medio codificador monoaural 120 está además dispuesto para codificar la señal residual de predicción 801 a un flujo de bits residual de predicción 802, - un medio de codificación paramétrico 140 para codificar parámetros espaciales 103 a un flujo de bits de parámetros 106, y - un medio de multiplexión 150 para reunir el flujo de bits monoaural 105, el flujo de bits de parámetros 106 y el flujo de bits residual de predicción 802 en un flujo de bits de salida 107.
A pesar de que la codificación de la señal monoaural de mezcla descendente 104 y la señal residual de predicción 801 la realiza el medio de codificación 120, es posible que la codificación la realice un software y/o hardware de decodificación separado para cada una de las señales que van a codificarse.
Además, aunque se enumera individualmente, pueden implementarse una pluralidad dé medios, elementos o etapas de método, por ejemplo, una sola unidad o procesador. Adicionalmente, aunque pueden incluirse características individuales en diferentes reivindicaciones, posiblemente éstas puedan combinarse ventajosamente, y la inclusión en diferentes reivindicaciones no implica que una combinación de características no sea factible' y/o ventajosa. También la inclusión ¦ de una característica en una categoría de reivindicaciones no implica una limitación a esta categoría sino más bien indica que la característica es igualmente aplicable a otras categorías de reivindicaciones según sea apropiado. Además, el orden de las características en las reivindicaciones no implica ningún orden específico en el cual las características deben trabajarse y en particular el orden de etapas individuales en una reivindicación de método no implica que las etapas deben realizarse en este orden. Más bien, las etapas pueden realizarse en cualquier orden apropiado. Además, las referencia singulares no excluyen una pluralidad. Por lo tanto las referencias a "un", "una", "primero", "segundo", etc., no. descartan una pluralidad. Los signos de referencia en las reivindicaciones se proporcionan simplemente como un ejemplo de aclaración y no deben considerarse como limitantes del alcance de las reivindicaciones en ninguna forma.
Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (17)

REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones :
1. Un aparato de mezcla ascendente estéreo paramétrico para generar una señal izquierda y una señal derecha a partir de una señal monoaural de mezcla descendente con base en parámetros espaciales, caracterizado porque comprende un medio para predecir una señal de diferencia que comprende una diferencia entre la señal izquierda y la señal derecha con base en la señal monoaural de mezcla descendente escalada con un coeficiente de predicción, mediante lo cual el coeficiente de predicción se deriva de los parámetros espaciales,, y un medio aritmético para derivar la señal izquierda y la señal derecha con base en una suma y una diferencia de la señal monoaural de mezcla descendente y la señal de diferencia.
2. Un aparato de mezcla ascendente estéreo paramétrico de conformidad con la reivindicación 1, caracterizado porque el coeficiente de predicción se basa en el ajuste de formas de onda de la señal de mezcla descendente sobre la señal de diferencia.
3. Un aparato de mezcla ascendente estéreo paramétrico de conformidad con la reivindicación 2, caracterizado porque el coeficiente de predicción está dado como una función los parámetros espaciales: en donde iid, ipd, e ice son parámetros espaciales, e iid es una diferencia de intensidad intercanal, ipd es una diferencia de fases intercanal, e ice es una coherencia intercanal .
4. Un aparato de mezcla ascendente estéreo paramétrico de conformidad con la reivindicación 1 a 3, caracterizado porque los medios para predecir la señal de diferencia se disponen para mejorar la señal de diferencia por la adición de una señal monoaural de mezcla descendente descorrelacionada escalada.
5.. Un aparato de mezcla ascendente estéreo paramétrico de conformidad con la reivindicación 4, caracterizado porque la mezcla monoaural descendente descorrelacionada se obtiene por medio dé filtración de la señal monoaural de mezcla descendente .
6. Un aparato de mezcla ascendente estéreo paramétrico de conformidad con la reivindicación 4, caracterizado porque el factor de escalamiento aplicado a la mezcla descendente descorrelacionada se establece para compensar una pérdida de energía de predicción.
7. Un aparato de mezcla ascendente estéreo paramétrico de conformidad con la reivindicación 6, caracterizado porque un factor de escalamiento aplicado a la mezcla descendente monoaural descorrelacionada se da como una función de los parámetros espaciales: en donde iid, ipd, e ice son parámetros espaciales, e iid es una diferencia de intensidad intercanal, ipd es una diferencia de fases intercanal, ice es una coherencia intercanal, y a es el coeficiente de predicción.
8. Un aparato de mezcla ascendente estéreo paramétrico de conformidad con la reivindicación 1 a 7, caracterizado porque la mezcla ascendente estéreo paramétrico tiene una señal residual de predicción para la señal de diferencia como una entrada adicional, con lo cual los medios aritméticos se disponen para derivar la señal izquierda y la señal derecha también con base en la señal monoaural de mezcla descendente, la señal de diferencia, y la señal residual de predicción para la señal de diferencia.
9. Un decodificador estéreo paramétrico caracterizado porque comprende medios de desmultiplexión para dividir el flujo de bits de entrada en un flujo de bits monoaural y un flujo de bits de parámetros, un medio de decodificación monoaural para decodificar el flujo de bits monoaural a una · señal' monoaural de mezcla descendente/ un medio de decodificación de parámetros para decodificar el flujo de bits de parámetros a parámetros espaciales, y un medio de mezcla ascendente estéreo paramétrico para generar una señal izquierda y una señal derecha a partir de la señal monoaural de mezcla descendente con base en parámetros espaciales, el decodificador estéreo paramétrico adicionalmente comprende el aparato de mezcla ascendente estéreo paramétrico de conformidad con las reivindicaciones 1-7.
10. Un decodificador estéreo paramétrico que comprende medios de desmultiplexión para dividir el flujo de bits de entrada en un flujo de bits monoaural y un flujo de bits de parámetros, un medio de decodificación monoaural para decodificar el flujo de bits monoaural a una señal monoaural de mezcla descendente, un medio de decodificación de parámetros para decodificar el flujo de bits de parámetros a parámetros espaciales, y un medio de mezcla ascendente estéreo paramétrico para generar una señal izquierda y una señal derecha a partir de una señal monoaural de mezcla descendente con base en parámetros espaciales, caracterizado porque los medios de desmultiplexión se disponen adicionalmente para extraer un flujo de bits residual de predicción del flujo de bits de entrada, los medios de decodificación monoaurales se disponen adicionalmente para decodificar una señal residual de predicción para la señal de diferencia a partir del flujo de bits residual de predicción, y los medios de mezcla ascendente estéreo paramétrico son el aparato de mezcla ascendente estéreo paramétrico de conformidad con la reivindicación 8.
11. Un método para generar una señal izquierda y una señal derecha a partir de una señal monoaural de mezcla descendente con base en parámetros espaciales, caracterizado porque comprende : predecir una señal de diferencia que comprende una diferencia entre la señal izquierda y la señal derecha con base en la señal monoaural de mezcla descendente con un coeficiente de predicción, mediante lo cual el coeficiente de predicción se deriva de parámetros espaciales; derivar la señal izquierda y la señal derecha con base en una suma y una diferencia de la señal monoaural de mezcla descendente y la señal de diferencia.
12. Un método para generar una señal izquierda y una señal derecha a partir de una señal monoaural de mezcla descendente con base en parámetros espaciales de conformidad con la reivindicación 11, caracterizado porque la etapa de derivar la señal izquierda y la señal derecha también se basa en la señal residual de predicción para la señal de diferencia.
13. Un dispositivo de reproducción de audio caracterizado porque comprende un decodificador estéreo paramétrico de conformidad con la reivindicación 9 ó 10.
14. Un aparato dé mezcla descendente estéreo paramétrico para generar una señal monoaural de mezcla descendente de una señal izquierda y una señal derecha con base en parámetros espaciales, caracterizado porque el aparato de 5- mezcla descendente estéreo paramétrico tiene una señal residual de predicción para una señal de diferencia como una salida adicional, mediante lo cual el aparato de mezcla descendente estéreo paramétrico comprende un medio aritmético adicional para derivar la señal monoaural de mezcla 0 descendente y una señal de diferencia que comprende una diferencia entre la señal izquierda y la señal derecha, y un medio de predicción adicional para derivar una señal residual de predicción para la señal de diferencia como una diferencia entre la señal de diferencia y la señal monoaural de mezcla 5 descendente escalada con un coeficiente de predicción predeterminado derivado de los parámetros espaciales.
15. Un codificador estéreo paramétrico que comprende un medio de estimación para derivar parámetros espaciales de una señal izquierda y una señal derecha, un medio de mezcla 0 descendente estéreo paramétrico para generar una señal monoaural de mezcla descendente a partir de la señal izquierda y la señal derecha con base en parámetros espaciales, un medio de codificación monoaural para codificar la señal monoaural de mezcla descendente a un flujo de bits 5 monoaural, un medio de codificación de parámetros para codificar parámetros espaciales a un flujo de bits de parámetros, y un medio de multiplexión para reunir el flujo de bits monoaural y el flujo de bits de parámetros en un flujo. de bits de salida, caracterizado porque los medios de mezcla descendente estéreo paramétrico son el aparato de mezcla descendente estéreo paramétrico de conformidad con la reivindicación 14, y los medios de codificación monoaural están además dispuestos para codificar la señal residual de predicción para la señal de diferencia a un flujo de bits residual de predicción, y los medios de multiplexión están además dispuestos para reunir el flujo de bits de predicción en el flujo de salida.
16. Un método para generar una señal residual de predicción para una señal de diferencia a partir de una señal izquierda y una señal derecha con base en parámetros espaciales, caracterizado porque comprende: derivar la señal de diferencia entre la señal izquierda y la señal derecha; derivar una señal residual para la señal de diferencia como una diferencia entre la señal de diferencia y la señal monoaural de mezcla descendente con un coeficiente de predicción derivado de los parámetros espaciales .
17. Un producto de programa de cómputo caracterizado porque es para ejecutar el método de conformidad con cualquiera de las reivindicaciones 11, 12 ó 16.
MX2010012580A 2008-05-23 2009-05-14 Aparato de mezcla ascendente estereo parametrico, decodificador estereo parametrico, aparato de mezcla descendente estereo parametrico, codificador estereo parametrico. MX2010012580A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP08156801 2008-05-23
PCT/IB2009/052009 WO2009141775A1 (en) 2008-05-23 2009-05-14 A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder

Publications (1)

Publication Number Publication Date
MX2010012580A true MX2010012580A (es) 2010-12-20

Family

ID=40943873

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2010012580A MX2010012580A (es) 2008-05-23 2009-05-14 Aparato de mezcla ascendente estereo parametrico, decodificador estereo parametrico, aparato de mezcla descendente estereo parametrico, codificador estereo parametrico.

Country Status (10)

Country Link
US (6) US8811621B2 (es)
EP (1) EP2283483B1 (es)
JP (1) JP5122681B2 (es)
KR (1) KR101629862B1 (es)
CN (1) CN102037507B (es)
BR (3) BR122020009727B1 (es)
MX (1) MX2010012580A (es)
RU (1) RU2497204C2 (es)
TW (1) TWI484477B (es)
WO (1) WO2009141775A1 (es)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4643453B2 (ja) 2006-01-10 2011-03-02 株式会社東芝 情報処理装置及び情報処理装置の動画像復号方法
RU2497204C2 (ru) * 2008-05-23 2013-10-27 Конинклейке Филипс Электроникс Н.В. Устройство параметрического стереофонического повышающего микширования, параметрический стереофонический декодер, устройство параметрического стереофонического понижающего микширования, параметрический стереофонический кодер
CN101826326B (zh) * 2009-03-04 2012-04-04 华为技术有限公司 一种立体声编码方法、装置和编码器
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
PL3093843T3 (pl) * 2009-09-29 2021-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder sygnału audio MPEG-SAOC, koder sygnału audio MPEG-SAOC, sposób dostarczania reprezentacji sygnału upmixu z wykorzystaniem dekodowania MPEG-SAOC, sposób dostarczania reprezentacji sygnału downmixu z wykorzystaniem dekodowania MPEG-SAOC oraz program komputerowy wykorzystujący wspólną wartość parametru korelacji międzyobiektowej zależną od czasu/częstotliwości
TWI444989B (zh) * 2010-01-22 2014-07-11 Dolby Lab Licensing Corp 針對改良多通道上混使用多通道解相關之技術
CN102859590B (zh) * 2010-02-24 2015-08-19 弗劳恩霍夫应用研究促进协会 产生增强下混频信号的装置、产生增强下混频信号的方法以及计算机程序
ES2656815T3 (es) * 2010-03-29 2018-02-28 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung Procesador de audio espacial y procedimiento para proporcionar parámetros espaciales en base a una señal de entrada acústica
CA3105050C (en) 2010-04-09 2021-08-31 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
AU2016222372B2 (en) * 2010-04-09 2018-06-28 Dolby International Ab Mdct-based complex prediction stereo coding
PL3779979T3 (pl) * 2010-04-13 2024-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji
CN102314882B (zh) * 2010-06-30 2012-10-17 华为技术有限公司 声音信号通道间延时估计的方法及装置
JP2012100241A (ja) 2010-10-05 2012-05-24 Panasonic Corp 画像編集装置、画像編集方法、及び、そのプログラム
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
US8654984B2 (en) 2011-04-26 2014-02-18 Skype Processing stereophonic audio signals
JP6133413B2 (ja) 2012-06-14 2017-05-24 ドルビー・インターナショナル・アーベー マルチチャネル・オーディオのためのなめらかな構成切り換え
PT2880654T (pt) 2012-08-03 2017-12-07 Fraunhofer Ges Forschung Descodificador e método para um conceito paramétrico generalizado de codificação de objeto de áudio espacial para caixas de downmix/upmix multicanal
CN107452392B (zh) * 2013-01-08 2020-09-01 杜比国际公司 临界采样滤波器组中的基于模型的预测
US9830918B2 (en) 2013-07-05 2017-11-28 Dolby International Ab Enhanced soundfield coding using parametric component generation
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
KR101461110B1 (ko) * 2013-09-06 2014-11-12 광주과학기술원 스테레오 확장장치 및 스테레오 확장방법
CN105637581B (zh) 2013-10-21 2019-09-20 杜比国际公司 用于音频信号的参数重建的去相关器结构
RU2648947C2 (ru) 2013-10-21 2018-03-28 Долби Интернэшнл Аб Параметрическая реконструкция аудиосигналов
CN103700372B (zh) * 2013-12-30 2016-10-05 北京大学 一种基于正交解相关技术的参数立体声编码、解码方法
JP6640849B2 (ja) * 2014-10-31 2020-02-05 ドルビー・インターナショナル・アーベー マルチチャネル・オーディオ信号のパラメトリック・エンコードおよびデコード
JP6412292B2 (ja) * 2016-01-22 2018-10-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法
US9978381B2 (en) * 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
US10224042B2 (en) 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
AU2017357454B2 (en) 2016-11-08 2021-02-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
PL3539127T3 (pl) * 2016-11-08 2021-04-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Moduł downmixu i sposób downmixu co najmniej dwóch kanałów oraz koder wielokanałowy i dekoder wielokanałowy
JP7076824B2 (ja) * 2017-01-04 2022-05-30 ザット コーポレイション 複数のオーディオ強調モードに構成可能なシステム
US10877192B2 (en) 2017-04-18 2020-12-29 Saudi Arabian Oil Company Method of fabricating smart photonic structures for material monitoring
US10401155B2 (en) 2017-05-12 2019-09-03 Saudi Arabian Oil Company Apparatus and method for smart material analysis
CN117690442A (zh) * 2017-07-28 2024-03-12 弗劳恩霍夫应用研究促进协会 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置
CN117198302A (zh) * 2017-08-10 2023-12-08 华为技术有限公司 时域立体声参数的编码方法和相关产品
CN109389987B (zh) 2017-08-10 2022-05-10 华为技术有限公司 音频编解码模式确定方法和相关产品
CN114005455A (zh) * 2017-08-10 2022-02-01 华为技术有限公司 时域立体声编解码方法和相关产品
KR102697685B1 (ko) 2017-12-19 2024-08-23 돌비 인터네셔널 에이비 통합 음성 및 오디오 디코딩 및 인코딩 qmf 기반 고조파 트랜스포저 개선을 위한 방법, 장치 및 시스템
TWI812658B (zh) 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
JP7596146B2 (ja) 2017-12-19 2024-12-09 ドルビー・インターナショナル・アーベー 音声音響統合復号および符号化の改良のための方法、機器、およびシステム
EP4636757A3 (en) 2018-04-05 2025-12-31 Telefonaktiebolaget LM Ericsson (publ) SUPPORT FOR GENERATION OF COMFORT NOISE, AND GENERATION OF COMFORT NOISE
CA3095971C (en) 2018-04-05 2023-04-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method or computer program for estimating an inter-channel time difference
CN112352277B (zh) 2018-07-03 2024-05-31 松下电器(美国)知识产权公司 编码装置及编码方法
US10841689B2 (en) * 2018-10-02 2020-11-17 Harman International Industries, Incorporated Loudspeaker and tower configuration
CN117809663A (zh) 2018-12-07 2024-04-02 弗劳恩霍夫应用研究促进协会 从包括至少两个声道的信号产生声场描述的装置、方法
KR102799690B1 (ko) 2019-06-14 2025-04-23 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 매개변수 인코딩 및 디코딩
US12100403B2 (en) * 2020-03-09 2024-09-24 Nippon Telegraph And Telephone Corporation Sound signal downmixing method, sound signal coding method, sound signal downmixing apparatus, sound signal coding apparatus, program and recording medium
CN115244618B (zh) * 2020-03-09 2025-04-15 日本电信电话株式会社 声音信号编码方法、声音信号解码方法、声音信号编码装置、声音信号解码装置、程序产品以及记录介质
WO2021181746A1 (ja) * 2020-03-09 2021-09-16 日本電信電話株式会社 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
JP7380837B2 (ja) * 2020-03-09 2023-11-15 日本電信電話株式会社 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体
CN121079736A (zh) * 2023-04-13 2025-12-05 奥兰治 用于缩减立体声音频信号声道的优化处理
FR3147898A1 (fr) * 2023-04-13 2024-10-18 Orange Traitement optimisé de réduction de canaux d’un signal audio stéréophonique

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
GB8913758D0 (en) 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JP4805540B2 (ja) * 2002-04-10 2011-11-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ステレオ信号の符号化
WO2003090206A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Signal synthesizing
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
KR20060132697A (ko) * 2004-02-16 2006-12-21 코닌클리케 필립스 일렉트로닉스 엔.브이. 트랜스코더 및 트랜스코딩 방법
EP1735777A1 (en) * 2004-04-05 2006-12-27 Koninklijke Philips Electronics N.V. Multi-channel encoder
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
MX2007005261A (es) 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
JP5106115B2 (ja) * 2004-11-30 2012-12-26 アギア システムズ インコーポレーテッド オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
EP1905006B1 (en) 2005-07-19 2013-09-04 Koninklijke Philips Electronics N.V. Generation of multi-channel audio signals
KR100923156B1 (ko) * 2006-05-02 2009-10-23 한국전자통신연구원 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
AU2008243406B2 (en) * 2007-04-26 2011-08-25 Dolby International Ab Apparatus and method for synthesizing an output signal
EP2023600A1 (en) 2007-07-27 2009-02-11 Thomson Licensing Method of color mapping from non-convex source gamut into non-convex target gamut
RU2497204C2 (ru) * 2008-05-23 2013-10-27 Конинклейке Филипс Электроникс Н.В. Устройство параметрического стереофонического повышающего микширования, параметрический стереофонический декодер, устройство параметрического стереофонического понижающего микширования, параметрический стереофонический кодер

Also Published As

Publication number Publication date
TW201011736A (en) 2010-03-16
RU2010152580A (ru) 2012-06-27
JP2011522472A (ja) 2011-07-28
US11871205B2 (en) 2024-01-09
CN102037507A (zh) 2011-04-27
US20190058960A1 (en) 2019-02-21
US20170134875A1 (en) 2017-05-11
EP2283483B1 (en) 2013-03-13
TWI484477B (zh) 2015-05-11
BRPI0908630B1 (pt) 2020-09-15
BRPI0908630A8 (pt) 2017-12-12
EP2283483A1 (en) 2011-02-16
US11019445B2 (en) 2021-05-25
US10136237B2 (en) 2018-11-20
RU2497204C2 (ru) 2013-10-27
US12192734B2 (en) 2025-01-07
BR122020009732B1 (pt) 2021-01-19
KR20110020846A (ko) 2011-03-03
US20210274302A1 (en) 2021-09-02
WO2009141775A1 (en) 2009-11-26
US20240121567A1 (en) 2024-04-11
JP5122681B2 (ja) 2013-01-16
CN102037507B (zh) 2013-02-06
KR101629862B1 (ko) 2016-06-24
US8811621B2 (en) 2014-08-19
BR122020009727B1 (pt) 2021-04-06
US9591425B2 (en) 2017-03-07
US20140321652A1 (en) 2014-10-30
US20110096932A1 (en) 2011-04-28
BRPI0908630A2 (pt) 2017-10-03

Similar Documents

Publication Publication Date Title
US12192734B2 (en) Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
JP7270096B2 (ja) フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法
CA2809437C (en) Apparatus for decoding a signal comprising transients using a combining unit and a mixer
RU2393646C1 (ru) Усовершенствованный способ для формирования сигнала при восстановлении многоканального аудио
CA2887228C (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
EP1999747B1 (en) Audio decoding
AU2015201672B2 (en) Apparatus for generating a decorrelated signal using transmitted phase information

Legal Events

Date Code Title Description
FG Grant or registration