MX2013013261A - Asignacion de bits, codificacion y decodificacion de audio. - Google Patents
Asignacion de bits, codificacion y decodificacion de audio.Info
- Publication number
- MX2013013261A MX2013013261A MX2013013261A MX2013013261A MX2013013261A MX 2013013261 A MX2013013261 A MX 2013013261A MX 2013013261 A MX2013013261 A MX 2013013261A MX 2013013261 A MX2013013261 A MX 2013013261A MX 2013013261 A MX2013013261 A MX 2013013261A
- Authority
- MX
- Mexico
- Prior art keywords
- bits
- audio
- frequency band
- spectrum
- unit
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Es proporcionado un método de asignación de bits que incluye determinar el número asignado de bits en unidades de punto decimal en función de cada banda de frecuencia, de modo que la Relación de Señal-a-Ruido (SNR) de un espectro existente en una banda predeterminada de frecuencia es maximizada dentro de un intervalo del número permisible de bits para un cuadro dado; y ajustar el número asignado de bits en función de cada banda de frecuencia.
Description
ASIGNACION DE BITS, CODIFICACION Y DECODIFICACION DE AUDIO
Campo de la Invención
Los aparatos, dispositivos y artículos de manufactura consistentes con la presente descripción se refieren a la codificación y decodificación de audio, y de manera más particular, se refieren a un método y aparato para la distribución o asignación, de manera eficiente, de los bits a un área de frecuencia perceptivamente importante en función de las sub-bandas, también se refieren a un método y aparato de codificación de audio, un método y aparato de decodificación de audio, un medio de grabación y a un dispositivo multimedia que emplea los mismos.
Antecedentes de la Invención
Cuando una señal de audio es codificada o decodificada, es requerido que utilice, de manera eficiente, un número limitado de bits para restaurar la señal de audio que tiene la mejor calidad de sonido en un intervalo del número limitado de bits. En particular, a una baja velocidad de bits, es requerida una técnica de codificación y decodificación de una señal de audio para distribuir uniformemente los bits a los componentes espectrales perceptivamente importantes en lugar de concentrar los bits en un área específica de frecuencia.
En particular, a una baja velocidad de bits, cuando
REF. 245009
la codificación es efectuada con los bits asignados a cada banda de frecuencia, tal como una sub-banda, podría ser generado un agujero espectral debido a un componente de frecuencia, que no es codificado debido al número insuficiente de bits, con lo cual, se origina una disminución en la calidad de sonido.
Breve Descripción de la Invención
Problema Técnico
Un aspecto es el suministro de un método y aparato para la asignación, de manera eficiente, de los bits a un área de frecuencia perceptivamente importante en función de las sub-bandas, un método y aparato de codificación de audio, un método y aparato de decodificación de audio, un medio de grabación y a un dispositivo multimedia que emplean los mismos .
Un aspecto es el suministro de un método y aparato para la asignación, de manera eficiente, de los bits a un área de frecuencia perceptivamente importante con una baja complejidad en función de las sub-bandas, un método y aparato de codificación de audio, un método y aparato de decodificación de audio, un medio de grabación y a un dispositivo multimedia que emplean los mismos.
Solución al Problema
De acuerdo con un aspecto de una o más [modalidades de ejemplo] se proporciona un método de asignación de bits
que comprende: determinar el número asignado de bits en unidades de punto decimal en función de cada banda de frecuencia, de modo que la Relación de Señal-a-Ruido (SNR) de un espectro existente en una banda predeterminada de frecuencia es maximizada dentro de un intervalo del número permisible de bits para un cuadro dado; y ajustar el número asignado de bits en función de cada banda de frecuencia.
De acuerdo con otro aspecto de una o más [modalidades de ejemplo] se proporciona un aparato de asignación de bits que comprende: una unidad de transformada que transforma una señal de audio en el dominio de tiempo para un espectro de audio en un dominio de frecuencia; y una unidad de asignación de bits que estima el número permisible de bits en unidades de punto decimal utilizando un umbral de enmascaramiento basado en las bandas de frecuencia incluidas en un cuadro dado en el espectro de audio, además, estima el número asignado de bits en unidades de punto decimal utilizando la energía espectral, y ajusta el número asignado de bits para que no exceda el número permisible de bits.
De acuerdo con otro aspecto de una o más [modalidades de ejemplo] se proporciona un aparato de codificación de audio que comprende: una unidad de transformada que transforma una señal de audio en el dominio de tiempo para un espectro de audio en un dominio de frecuencia; una unidad de asignación de bits que determina el
número asignado de bits en unidades de punto decimal en función de cada banda de frecuencia, de modo que la Relación de Señal-a-Ruido (SNR por sus siglas en inglés) de un espectro existente en una banda predeterminada de frecuencia es maximizada dentro de un intervalo del número permisible de bits para un cuadro dado del espectro de audio y ajusta el número asignado de bits determinado en función de cada banda de frecuencia; y una unidad de codificación que codifica el espectro de audio utilizando el número de bits ajustado en función de cada banda de frecuencia y la energía espectral.
De acuerdo con otro aspecto de una o más [modalidades de ejemplo] , se proporciona un aparato de decodificación de audio que comprende: una unidad de transformada que transforma una señal de audio en el dominio de tiempo para un espectro de audio en un dominio de frecuencia; una unidad de asignación de bits que determina el número asignado de bits en unidades de punto decimal en función de cada banda de frecuencia, de modo que la Relación de Señal-a-Ruido (SNR) de un espectro existente en una banda predeterminada de frecuencia es maximizada dentro de un intervalo del número permisible de bits para un cuadro dado del espectro de audio y ajusta el número asignado de bits determinado en función de cada banda de frecuencia; y una unidad de codificación que codifica el espectro de audio utilizando el número de bits ajustado en función de cada
banda de frecuencia y la energía espectral.
De acuerdo con otro aspecto de una o más [modalidades de ejemplo] , se proporciona un aparato de decodificación de audio que comprende: una unidad de asignación de bits que estima el número permisible de bits en unidades de punto decimal utilizando un umbral de enmascaramiento basado en las bandas de frecuencia incluidas en un cuadro dado, estima el número asignado de bits en unidades de punto decimal utilizando la energía espectral, y ajusta el número asignado de bits para que no exceda el número permisible de bits; una unidad de decodificación que decodifica un espectro de audio incluido en un flujo de bits utilizando el número de bits ajustado en función de cada banda de frecuencia y la energía espectral; y una unidad de transformada inversa que transforma el espectro de audio decodificado en una señal de audio en el dominio de tiempo.
Breve Descripción de las Figuras
Los anteriores y otros aspectos serán más aparentes mediante la descripción en detalle de las modalidades ejemplo de las mismas con referencia a las figuras adjuntas, en las cuales :
La Figura 1 es un diagrama de bloque de un aparato de codificación de audio de acuerdo con una modalidad de ej emplo;
La Figura 2 es un diagrama de bloque de una unidad
de asignación de bits en el aparato de codificación de audio de la Figura 1, de acuerdo con una modalidad de ejemplo;
La Figura 3 es un diagrama de bloque de una unidad de asignación de bits en el aparato de codificación de audio de la Figura 1, de acuerdo con otra modalidad de ejemplo;
La Figura 4 es un diagrama de bloque de una unidad de asignación de bits en el aparato de codificación de audio de la Figura 1, de acuerdo con otra modalidad de ejemplo;
La Figura 5 es un diagrama de bloque de una unidad de codificación en el aparato de codificación de audio de la Figura 1, de acuerdo con una modalidad de ejemplo;
La Figura 6 es un diagrama de bloque de un aparato de codificación de audio de acuerdo con otra modalidad de ejemplo;
La Figura 7 es un diagrama de bloque de un aparato de decodificación de audio de acuerdo con una modalidad de ejemplo;
La Figura 8 es un diagrama de bloque de una unidad de asignación de bits en el aparato de decodificación de audio de la Figura 7, de acuerdo con una modalidad de ej emplo;
La Figura 9 es un diagrama de bloque de una unidad de decodificación en el aparato de decodificación de audio de la Figura 7, de acuerdo con una modalidad de ejemplo;
La Figura 10 es un diagrama de bloque de una unidad
de decodificación en el aparato de decodificación de audio de la Figura 7, de acuerdo con otra modalidad de ejemplo;
La Figura 11 es un diagrama de bloque de una unidad de decodificación en el aparato de decodificación de audio de la Figura 7, de acuerdo con otra modalidad de ejemplo;
La Figura 12 es un diagrama de bloque de un aparato de decodificación de audio de acuerdo con otra modalidad de ejemplo;
La Figura 13 es un diagrama de bloque de un aparato de decodificación de audio de acuerdo con otra modalidad de ejemplo;
La Figura 14 es un diagrama de flujo que ilustra un método de asignación de bits de acuerdo con otra modalidad de ejemplo;
La Figura 15 es un diagrama de flujo que ilustra un método de asignación de bits de acuerdo con otra modalidad de ej emplo ;
La Figura 16 es un diagrama de flujo que ilustra un método de asignación de bits de acuerdo con otra modalidad de ejemplo;
La Figura 17 es un diagrama de flujo que ilustra un método de asignación de bits de acuerdo con otra modalidad de ej emplo;
La Figura 18 es un diagrama de bloque de un dispositivo multimedia que incluye un módulo de codificación,
de acuerdo con una modalidad de ejemplo;
La Figura 19 es un diagrama de bloque de un dispositivo multimedia que incluye un módulo de decodificación, de acuerdo con una modalidad de ejemplo; and
La Figura 20 es un diagrama de bloque de un dispositivo multimedia que incluye un módulo de codificación y un módulo de decodificación, de acuerdo con una modalidad de ejemplo.
Descripción Detallada de la Invención
El presente concepto inventivo podría permitir varios tipos de cambios o modificaciones y varios cambios en la forma y las modalidades específicas de ejemplo serán ilustradas en las figuras y serán descritas en detalle en la especificación. Sin embargo, debe entenderse que las modalidades específicas de ejemplo no limitan el presente concepto inventivo a la forma específica descrita sino que incluyen cada forma modificada, equivalente o reemplazada dentro del espíritu y el alcance técnico del presente concepto inventivo. En la siguiente descripción, las funciones o construcciones bien conocidas no son descritas en detalle debido a que podrían obscurecer la invención con detalle innecesario.
Aunque los términos, tales como 'primero' y 'segundo' pueden ser utilizados para describir varios elementos, los elementos no pueden ser limitados por los
términos. Los términos pueden ser utilizados para clasificar un cierto elemento de otro elemento.
La terminología utilizada en la solicitud sólo es utilizada para describir las modalidades específicas de ejemplo y no tiene alguna intención de limitar el presente concepto inventivo. Aunque los términos generales que son actualmente utilizados en forma amplia como es posible son seleccionados como los términos utilizados en el presente concepto inventivo mientras se toman en cuenta las funciones en el presente concepto inventivo, éstos podrían variar de acuerdo con la intención de aquellas personas de experiencia ordinaria en la técnica, los precedentes judiciales, o la aparición de una nueva tecnología. En adición, en casos específicos, podrían ser utilizados términos intencionalmente seleccionados por la solicitante, y en este caso, el significado de los términos será descrito en la correspondiente descripción de la invención. En consecuencia, los términos utilizados en el presente concepto inventivo no tienen que ser definidos por los simples nombres de los términos sino por el significado de los términos y el contenido con respecto al presente concepto inventivo.
Una expresión en singular incluye una expresión en plural a menos que sean claramente diferentes entre sí en un contexto. En la solicitud, debe entenderse que términos tales como 'incluyen' y 'tienen' son utilizados para indicar la
existencia de una configuración, número, etapa, operación, elemento, parte implementada o una combinación de ellos sin excluir por adelantado la posibilidad de existencia o adición de una o más de otras configuraciones, números, etapas, operaciones, elementos, partes o combinaciones de ellos.
De aquí en adelante, el presente concepto inventivo será descrito de manera más completa con referencia a las figuras que la acompañan, en las cuales son mostradas las modalidades ejemplo. Los mismos números de referencia en las figuras denotan los mismos elementos, y de esta manera, será omitida su descripción repetitiva.
Como se utiliza en la presente, expresiones tales como al menos uno de, cuando preceden una lista de elementos, modifican toda la lista de elementos y no modifican los elementos individuales de la lista.
La Figura 1 es un diagrama de bloque de un aparato de codificación de audio 100 de acuerdo con una modalidad de ej emplo .
El aparato de codificación de audio 100 de la Figura 1 podría incluir una unidad de transformada 130, una unidad de asignación de bits 150, una unidad de codificación 170 y una unidad de multiplexión 190. Los componentes del aparato de codificación de audio 100 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador (por ejemplo, una unidad de procesamiento central
(CPU) ) . Aquí, el audio podría indicar una señal de audio, una señal de voz, o una señal obtenida mediante su sintetización, aunque de aquí en adelante, el audio indica, de manera general, una señal de audio por conveniencia de la descripción .
Con referencia a la Figura 1, la unidad de transformada 130 podría generar un espectro de audio al transformar una señal de audio en el dominio de tiempo en una señal de audio en un dominio de frecuencia. La transformada de dominio de tiempo a dominio de frecuencia podría ser efectuada utilizando varios métodos bien conocidos, tales como la Transformada del Coseno Discreto (DCT, por sus siglas en inglés) .
La unidad de asignación de bits 150 podría determinar un umbral de enmascaramiento que es obtenido utilizando la energía espectral o un modelo psico-acústico con respecto al espectro de audio y el número de bits asignado en función de cada sub-banda utilizando la energía espectral. Aquí, una sub-banda es una unidad de agrupamiento de muestras del espectro de audio y podría tener una longitud uniforme o no uniforme al reflejar una banda de umbral. Cuando las sub-bandas tienen longitudes no uniformes, las sub-bandas podrían ser determinadas, de modo que el número de muestras de una muestra de inicio a una última muestra incluida en cada sub-banda generalmente se incrementa por
cuadro. Aquí, el número de sub-bandas o el número de muestras incluido en cada subcuadro podría ser previamente determinado. En forma alterna, una vez que un cuadro es dividido en un número predeterminado de sub-bandas que tiene una longitud uniforme, la longitud uniforme podría ser ajustada de acuerdo con una distribución de los coeficientes espectrales. La asignación de los coeficientes espectrales podría ser determinada utilizando la medición de planeidad espectral, la diferencia entre un valor máximo y el valor mínimo, o el valor diferencial del valor máximo.
De acuerdo con una modalidad de ejemplo, la unidad de asignación de bits 150 podría estimar un número permisible de bits utilizando un valor de Norma obtenido en función de cada sub-banda, es decir, la energía espectral promedio, además podría asignar los bits en función de la energía espectral promedio, y podría limitar el número asignado de bits para no exceder el número permisible de bits.
De acuerdo con una modalidad de ejemplo, la unidad de asignación de bits 150 podría estimar un número permisible de bits utilizando un modelo psico-acústico en función de cada sub-banda, también podría asignar los bits en función de la energía espectral promedio, y podría limitar el número asignado de bits para no exceder el número permisible de bits .
La unidad de codificación 170 podría generar la
información con respecto a un espectro codificado al cuantificar y codificar sin pérdida el espectro de audio en función del número asignado de bits finalmente determinado en función de cada sub-banda.
La unidad de multiplexión 190 genera un flujo de bits al multiplexar el valor codificado de Norma proporcionado a partir de la unidad de asignación de bits 150 y la información con respecto al espectro codificado que es proporcionada a partir de la unidad de codificación 170.
El aparato de codificación de audio 100 podría generar un nivel de ruido para una sub-banda opcional y podría proporcionar el nivel de ruido a un aparato de decodificación de audio (700 de la Figura 7, 1200 de la Figura 12, o 1300 de la Figura 13) .
La Figura 2 es un diagrama de bloque de una unidad de asignación de bits 200 que corresponde con la unidad de asignación de bits 150 en el aparato de codificación de audio 100 de la Figura 1, de acuerdo con una modalidad de ejemplo.
La unidad de asignación de bits 200 de la Figura 2 podría incluir un estimador de Norma 210, un codificador de Norma 230 y un estimador y asignador de bits 250. Los componentes de la unidad de asignación de bits 200 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador.
Con referencia a la Figura 2, el estimador de Norma
210 podría obtener un valor de Norma que corresponde con la energía espectral promedio en función de cada sub-banda. Por ejemplo, el valor de Norma podría ser calculado por la Ecuación 1 aplicada en ITU-T G.719 aunque no es limitada con el mismo.
[Ecuación 1]
En la Ecuación 1, cuando las P sub-bandas o sub-sectores existen en un cuadro, N(p) denota un valor de Norma de una p-enésima sub-banda o sub-sector, Lp denota la longitud de la p-enésima sub-banda o sub-sector, es decir, el número de muestras o coeficientes espectrales, sp y ep denotan una muestra de inicio y una última muestra de la p-enésima sub-banda, de manera respectiva, y y(k) denota el tamaño de la muestra o el coeficiente espectral (es decir, la energía) .
El valor de Norma obtenido en función de cada sub-banda podría proporcionarse a la unidad de codificación (170 de la Figura 1) .
El codificador de Norma 230 podría cuantificar y codificar sin pérdida el valor de Norma obtenido en función de cada sub-banda. El valor de Norma cuantificado en función de cada sub-banda o el valor de Norma que es obtenido mediante la cuantificación del valor cuantificado de Norma
podría proporcionarse al estimador y asignador de bits 250. El valor de Norma cuantificado y codificado sin pérdida en función de cada sub-banda podría proporcionarse a la unidad de multiplexión (190 de la Figura 1) .
El estimador y asignador de bits 250 podría estimar y distribuir un número requerido de bits utilizando el valor de Norma. De preferencia, el valor descuantificado de Norma podría ser utilizado, de modo que una parte de codificación y una parte de decodificación pueden utilizar el mismo proceso de estimación y distribución de bits. En este caso, podría ser utilizado un valor de Norma ajustado al tomar en cuenta el efecto de enmascaramiento. Por ejemplo, el valor de Norma podría ser ajustado utilizando la ponderación psico-acústica aplicada en ITU-T G.719 como en la Ecuación 2 aunque no se limita con la misma.
[Ecuación 2]
¡t(p)= IN"(P)+ WSpep)
En la Ecuación 2,
denota un índice de un valor cuantificado de Norma de la p-enésima sub-banda,
J ^0?)
denota un índice de un valor ajustado de Norma de la
p-enésima sub-banda, y
WSpe(p)
denota un espectro de cambio para el ajuste de valor de Norma .
El estimador y asignador de bits 250 podría calcular un umbral de enmascaramiento utilizando el valor de Norma en función de cada sub-banda y podría estimar un número perceptualmente requerido de bits utilizando el umbral de enmascaramiento. Para hacer esto, el valor de Norma obtenido en función de cada sub-banda podría ser igualmente representado como la energía espectral en unidades de dB como es mostrado en la Ecuación 3.
[Ecuación 3]
Como un método de obtención del umbral de enmascaramiento utilizando la energía espectral, podrían ser utilizados varios métodos bien conocidos. Es decir, el umbral de enmascaramiento es un valor que corresponde con La Distorsión Justa Perceptible (JND, por sus siglas en inglés) , y cuando un ruido de cuantificación es menor que el umbral de enmascaramiento, perceptual el ruido no puede ser percibido. De esta manera, un número mínimo de bits requerido para no percibir el ruido persa actual podría ser calculado
utilizando el umbral de enmascaramiento. Por ejemplo, la Relación de Señal-a-Enmascaramiento (S R, por sus siglas en inglés) podría ser calculada utilizando la relación del valor de Norma con el umbral de enmascaramiento en función de cada sub-banda, y el número de bits que satisface el umbral de enmascaramiento podría estimarse utilizando la relación de 6.025 dB = 1 bit con respecto a la SMR calculada. Aunque el número estimado de bits es el número mínimo de bits requerido para no percibir el ruido perceptual, debido a que no existe necesidad de utilizar más que el número estimado de bits en términos de compresión, el número estimado de bits podría considerarse como un número máximo de los bits permisibles en función de cada sub-banda (de aquí en adelante, el número permisible de bits) . El número permisible de bits de cada sub-banda podría ser representado en unidades de punto decimal .
El estimador y asignador de bits 250 podría efectuar la asignación de bits en unidades de punto decimal utilizando el valor de Norma en función de cada sub-banda. En este caso, los bits son secuencialraente asignados a partir de una sub-banda que tiene un valor más grande de Norma que los otros, y podría ajustarse que más bits sean asignados a una sub-banda perceptualmente importante mediante la ponderación de acuerdo con la importancia de percepción de cada sub-banda con respecto al valor de Norma en función de cada sub-banda. La
importancia de percepción podría ser determinada, por ejemplo, a través de la ponderación psico-acústica como en ITU-T G.719.
El estimador y asignador de bits 250 podría asignar, de manera secuencial, los bits a muestras de una sub-banda que tiene un valor más grande de Norma que las otras. En otras palabras, en primer lugar, los bits por muestra son asignados para una sub-banda que tiene el valor máximo de Norma, y la prioridad de la sub-banda que tiene el valor máximo de Norma es cambiada al disminuir el valor de Norma de la sub-banda en unidades predeterminadas, de modo que los bits son asignados a otra sub-banda. Este proceso es realizado, en forma repetida, hasta que el número total B de los bits permisibles en el cuadro dado sea asignado en forma clara .
El estimador y asignador de bits 250 podría determinar finalmente el número asignado de bits limitando el número asignado de bits para no exceder el número estimado de bits, es decir, el número permisible de bits, para cada sub-banda. Para todas las sub-bandas, el número asignado de bits es comparado con el número estimado de bits, y si el número asignado de bits es más grande que el número estimado de bits, el número asignado de bits es limitado al número estimado de bits. Si el número asignado de bits de todas las sub-bandas en el cuadro dado, que es obtenido como resultado
de la limitación de número de bits, es menor que el número total B de los bits permisibles en el cuadro dado, el número de bits que corresponde con la diferencia podría ser uniformemente asignado a todas las sub-bandas o no uniformemente asignado de acuerdo con la importancia de percepción.
Debido a que el número de bits asignado a cada sub-banda puede determinarse en unidades de punto decimal y es limitado al número permisible de bits, el número total de bits de un cuadro dado podría ser asignado, de manera eficiente .
De acuerdo con una modalidad de ejemplo, el método detallado de la estimación y distribución del número de bits requerido para cada sub-banda es como sigue. De acuerdo con este método, debido a que el número de bits asignado a cada sub-banda puede determinarse en una ocasión sin varios tiempos de repetición, la complejidad podría ser disminuida.
Por ejemplo, una solución, que podría optimizar la distorsión de cuantificación y el número de bits asignado a cada sub-banda, podría ser obtenida aplicando la función de LaGrange representada por la Ecuación 4.
[Ecuación 4]
L = ? + ? ( ? NbLb - B
En la Ecuación 4, L denota la función de LaGrange, D
denota la distorsión de cuantificación, B denota el número total de bits permisibles en el cuadro dado, N denota el número de muestras de una b-enésima sub-banda, y Lb denota el número de bits asignado a la b-enésima sub-banda. Es decir, NbLb denota el número de bits asignado a la b-enésima sub-banda.
? denota el multiplicador de LaGrange que es un coeficiente de optimización.
Utilizando la Ecuación 4, Lb que minimiza la diferencia entre el número total de bits asignado a las sub-bandas incluidas en el cuadro dado y el número permisible de bits para el cuadro dado podría ser determinado mientras se considera la distorsión de cuantificación .
La distorsión de cuantificación D podría ser definido por la Ecuación 5.
[Ecuación 5]
En la Ecuación 5,
a un espectro de entrada, y
espectro decodificado . Es decir,
distorsión de cuantificación D podría ser definido como un Error por Medio Cuadrado (MSE, por sus siglas en inglés) con respecto al espectro de entrada
y el espectro de codificado
cuadro arbitrario.
El denominador en la Ecuación 5 es un valor constante determinado por un espectro dado de entrada, y en consecuencia, debido a que el denominador en la Ecuación 5 no afecta la optimización, la Ecuación 7 podría ser simplificada por la Ecuación 6.
[Ecuación 6]
(S?^-?)
i
Un valor de Norma,
Sb
que es la energía espectral promedio de la b-enésima sub-banda con respecto al espectro de entrada,
podría ser definido por la Ecuación 7, un valor de Norma
cuantificado por una escala logarítmica podría ser definido por la Ecuación 8, y un valor descuantificado de
Norma
Sb
podrxa ser definido por la Ecuación 9,
[Ecuación 7]
[Ecuación 8]
nb = L21og2 gb + 0.5 J
[Ecuación 9]
~ 0.5nh
8t = 2
En la Ecuación 7, sb y eb denotan una muestra de inicio y una última muestra de la b-enésima sub-banda, de manera respectiva.
Un espectro normalizado yi es generado dividiendo el espectro de entrada
entre el valor descuantificado de Norma
Sb
como en la Ecuación 10, y un espectro decodificado
es generado multiplicando un espectro normalizado
restaurado
y i
por el valor descuantificado de Norma
Sb
como en la Ecuación 11.
[Ecuación 11]
y¿ = -^r- 5 i^[sb,...eb]
gb
El término distorsión de cuantificación podria ser colocado por la Ecuación 12 utilizando las ecuaciones 9 a 11.
[Ecuación 12]
En forma común, a partir de la relación entre la distorsión de cuantificación y el número asignado de bits, es definido que la Relación de Señal-a-Ruido (SNR) se incrementa en 6.02 dB cada vez que es agregado 1 bit por muestra, y mediante la utilización de esto, podria ser definida la distorsión de cuantificación del espectro normalizado por la Ecuación 13.
[Ecuación 13)
_ 2 *
En el caso de la actual codificación de audio, la Ecuación 14 podría ser definida mediante la aplicación de un valor de escala dB C, el cual podría variar de acuerdo con las características de señal, sin fijar la relación de 1 bitio/muestra = 6.025 dB.
[Ecuación 14]
En la Ecuación 14, cuando C es 2, 1 bitio/muestra corresponde con 6.02 dB, y cuando C es 3, 1 bitio/muestra corresponde con 9.03 dB.
De esta manera, la Ecuación 6 podría ser representada por la Ecuación 15 de las Ecuaciones 12 y 14.
[Ecuación 15]
L=
Para obtener !¾ y ? óptimos de la Ecuación 15, un diferencial parcial es efectuado para Lb y ? como en la Ecuación 16.
[Ecuación 16]
+ Nb = 0
Cuando la Ecuación 16 es colocada, Lb podría ser representado por la Ecuación 17.
[Ecuación 17]
Utilizando la Ecuación 17, el número asignado de bits Lb por muestra de cada sub-banda, que podría maximizar la SNR del espectro de entrada, podría estimarse en un intervalo del número total B de los bits permisibles en el cuadro dado.
El número asignado de bits en función de cada sub-banda, que es determinado por el estimador y asignador de bits 250, podría proporcionarse a la unidad de codificación (170 de la Figura 1) .
La Figura 3 es un diagrama de bloque de una unidad de asignación de bits 300 que corresponde con la unidad de asignación de bits 150 en el aparato de codificación de audio 100 de la Figura 1, de acuerdo con otra modalidad de ejemplo.
La unidad de asignación de bits 300 de la Figura 3 podría incluir un modelo psico-acústico 310, un estimador y asignador de bits 330, un estimador de factor de escala 350 y
un codificador de factor de escala 370. Los componentes de la unidad de asignación de bits 300 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador.
Con referencia a la Figura 3, el modelo psico-acústico 310 podría obtener un umbral de enmascaramiento para cada sub-banda mediante la recepción de un espectro de audio de la unidad de transformada (130 de la Figura 1) .
El estimador y asignador de bits 330 podría estimar un número perceptualmente requerido de bits utilizando un umbral de enmascaramiento en función de cada sub-banda. Es decir, podría ser calculada la SMR en función de cada sub-banda, y podría estimarse el número de bits que satisface el umbral de enmascaramiento utilizando la relación de 6.025 dB = 1 bit con respecto a la SMR calculada. Aunque el número estimado de bits es el número mínimo de bits requerido para no percibir el ruido perceptual, debido a que no existe necesidad de utilizar más que el número estimado de bits en términos de compresión, el número estimado de bits podría considerarse como el número máximo de los bits permisibles en función de cada sub-banda (de aquí en adelante, el número permisible de bits) . El número permisible de bits de cada sub-banda podría ser representado en unidades de punto decimal .
El estimador y asignador de bits 330 podría efectuar
la asignación de bits en unidades de punto decimal utilizando la energía espectral en función de cada sub-banda. En este caso, por ejemplo, podría ser utilizado el método de asignación de bits utilizando las Ecuaciones 7 a 20.
El estimador y asignador de bits 330 compara el número asignado de bits con el número estimado de bits para todas las sub-bandas, si el número asignado de bits es más grande que el número estimado de bits, el número asignado de bits es limitado al número estimado de bits. Si el número asignado de bits de todas las sub-bandas en un cuadro dado, que es obtenido como resultado de la limitación de número de bits, es menor que el número total B de los bits permisibles en el cuadro dado, el número de bits que corresponde con la diferencia podría ser uniformemente asignado a todas las sub-bandas o no uniformemente asignado de acuerdo con la importancia de percepción.
El estimador de factor de escala 350 podría estimar un factor de escala utilizando el número asignado de bits finalmente determinado en función de cada sub-banda. El factor de escala estimado en función de cada sub-banda podría proporcionarse a la unidad de codificación (170 de la Figura 1) ·
El codificador de factor de escala 370 podría cuantificar y codificar sin pérdida el factor de escala estimado en función de cada sub-banda. El factor de escala
codificado en función de cada sub-banda podría proporcionarse a la unidad de multiplexión (190 de la Figura 1) .
La Figura 4 es un diagrama de bloque de una unidad de asignación de bits 400 que corresponde con la unidad de asignación de bits 150 en el aparato de codificación de audio 100 de la Figura 1, de acuerdo con otra modalidad de ejemplo.
La unidad de asignación de bits 400 de la Figura 4 podría incluir un estimador de Norma 410, un estimador y asignador de bits 430, un estimador de factor de escala 450 y un codificador de factor de escala 470. Los componentes de la unidad de asignación de bits 400 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador.
Con referencia a la Figura 4, el estimador de Norma 410 podría obtener el valor de Norma que corresponde con la energía espectral promedio en función de cada sub-banda.
El estimador y asignador de bits 430 podría obtener un umbral de enmascaramiento utilizando la energía espectral en función de cada sub-banda y podría estimar el número perceptualmente requerido de bits, es decir, el número permisible de bits, utilizando el umbral de enmascaramiento.
El estimador y asignador de bits 430 podría efectuar la asignación de bits en unidades de punto decimal utilizando la energía espectral en función de cada sub-banda. En este caso, por ejemplo, podría ser utilizado el método de
asignación de bits utilizando las Ecuaciones 7 a 20.
El estimador y asignador de bits 430 compara el número asignado de bits con el número estimado de bits para todas las sub-bandas, si el número asignado de bits es más grande que el número estimado de bits, el número asignado de bits es limitado al número estimado de bits. Si el número asignado de bits de todas las sub-bandas en un cuadro dado, que es obtenido como resultado de la limitación de número de bits, es menor que el número total B de los bits permisibles en el cuadro dado, el número de bits que corresponde con la diferencia podría ser uniformemente asignado a todas las sub-bandas o no uniformemente asignado de acuerdo con la importancia de percepción.
El estimador de factor de escala 450 podría estimar un factor de escala utilizando el número asignado de bits finalmente determinado en función de cada sub-banda. El factor de escala estimado en función de cada sub-banda podría proporcionarse a la unidad de codificación (170 de la Figura 1) ·
El codificador de factor de escala 470 podría cuantificar y codificar sin pérdida el factor de escala estimado en función de cada sub-banda. El factor de escala codificado en función de cada sub-banda podría proporcionarse a la unidad de multiplexión (190 de la Figura 1) .
La Figura 5 es un diagrama de bloque de una unidad
de codificación 500 que corresponde con la unidad de codificación 170 en el aparato de codificación de audio 100 de la Figura 1, de acuerdo con una modalidad de ejemplo.
La unidad de codificación 500 de la Figura 5 podría incluir una unidad de normalización de espectro 510 y un codificador de espectro 530. Los componentes de la unidad de codificación 500 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador.
Con referencia a la Figura 5, la unidad de normalización de espectro 510 podría normalizar un espectro utilizando el valor de Norma proporcionado a partir de la unidad de asignación de bits (150 de la Figura 1) .
El codificador de espectro 530 podría cuantificar el espectro normalizado utilizando el número asignado de bits de cada sub-banda y podría codificar sin pérdida el resultado de la cuantificación. Por ejemplo, la codificación de impulso factorial podría ser utilizada para la codificación de espectro aunque no es limitada a la misma. De acuerdo con la codificación de impulso factorial, la información, tal como la posición de impulso, la magnitud de impulso, y el signo de impulso, podría ser representada en una forma factorial dentro de un intervalo del número asignado de bits.
La información con respecto al espectro codificado mediante el codificador de espectro 530 podría proporcionarse a la unidad de multiplexión (190 de la Figura 1).
La Figura 6 es un diagrama de bloque de un aparato de codificación de audio 600 de acuerdo con otra modalidad de ejemplo.
El aparato de codificación de audio 600 de la Figura 6 podría incluir una unidad de detección de transitorio 610, una unidad de transformada 630, una unidad de asignación de bits 650, una unidad de codificación 670 y una unidad de multiplexión 690. Los componentes del aparato de codificación de audio 600 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador. Debido a que existe una diferencia en que el aparato de codificación de audio 600 de la Figura 6 además incluye la unidad de detección de transitorio 610 cuando el aparato de codificación de audio 600 de la Figura 6 es comparado con el aparato de codificación de audio 100 de la Figura 1, la descripción detallada de los componentes comunes es omitida en la presente.
Con referencia a la Figura 6, la unidad de detección de transitorio 610 podría detectar un intervalo que indica una característica transitoria mediante el análisis de una señal de audio. Varios métodos bien conocidos podrían ser utilizados para la detección de un intervalo transitorio. La información de la señalización de transitorio proporcionada a partir de la unidad de detección de transitorio 610 podría ser incluida en un flujo de bits a través de la unidad de
multiplexión 690.
La unidad de transformada 630 podría determinar el tamaño de ventana utilizado para la transformada de acuerdo con el resultado de la detección del intervalo transitorio y podría realizar la transformada de dominio de tiempo a dominio de frecuencia en función del tamaño determinado de ventana. Por ejemplo, una ventana corta podría ser aplicada a una sub-banda a partir de la cual es detectado un intervalo de transitorio, y una ventana larga podría ser aplicada a una sub-banda a partir de la cual no es detectado un intervalo de transitorio .
La unidad de asignación de bits 650 podría ser implementada por una de las unidades de asignación de bits 200, 300, y 400 de las Figuras 2, 3, y 4, de manera respectiva .
La unidad de codificación 670 podría determinar el tamaño de ventana utilizado para la codificación de acuerdo con el resultado de la detección del intervalo transitorio.
El aparato de codificación de audio 600 podría generar un nivel de ruido para una sub-banda opcional y podría proporcionar el nivel de ruido a un aparato de decodificación de audio (700 de la Figura 7, 1200 de la Figura 12, o 1300 de la Figura 13) .
La Figura 7 es un diagrama de bloque de un aparato de decodificación de audio 700 de acuerdo con una modalidad
de ejemplo.
El aparato de decodificación de audio 700 de la Figura 7 podría incluir una unidad de desmultiplexión 710, una unidad de asignación de bits 730, una unidad de decodificación 750 y una unidad de transformada inversa 770. Los componentes del aparato de decodificación de audio podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador.
Con referencia a la Figura 7, la unidad de desmultiplexión 710 podría desmultiplexar un flujo de bits para extraer un valor de Norma cuantificado y codificado sin pérdida y la información con respecto a un espectro codificado .
La unidad de asignación de bits 730 podría obtener un valor descuantificado de Norma del valor cuantificado y codificado sin pérdida de Norma en función de cada sub-banda y podría determinar el número asignado de bits utilizando el valor descuantificado de Norma. La unidad de asignación de bits 730 podría operar sustancialmente igual que la unidad de asignación de bits 150 ó 650 del aparato de codificación de audio 100 ó 600. Cuando el valor de Norma es ajustado por la ponderación psico-acústica en el aparato de codificación de audio 100 ó 600, el valor descuantificado de Norma podría ser ajustado por el aparato de decodificación de audio 700 en el mismo modo.
La unidad de decodificación 750 podría descuantificar y decodificar sin pérdida el espectro codificado utilizando la información con respecto al espectro codificado proporcionado a partir de la unidad de desmultiplexión 710. Por ejemplo, la decodificación de impulso podría ser utilizada para la decodificación de espectro .
La unidad de transformada inversa 770 podría generar una señal restaurada de audio al transformar el espectro de codificado en el dominio de tiempo.
La Figura 8 es un diagrama de bloque de una unidad de asignación de bits 800 en el aparato de decodificación de audio 700 de la Figura 7, de acuerdo con una modalidad de ej emplo .
La unidad de asignación de bits 800 de la Figura 8 podría incluir un decodificador de Norma 810 y un estimador y asignador de bits 830. Los componentes de la unidad de asignación de bits 800 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador.
Con referencia a la Figura 8, el decodificador de Norma 810 podría obtener un valor descuantificado de Norma del valor cuantificado y codificado sin pérdida de Norma que es proporcionado a partir de la unidad de desmultiplexión (710 de la Figura 7).
El estimador y asignador de bits 830 podría determinar el número asignado de bits utilizando el valor descuantificado de Norma. En detalle, el estimador y asignador de bits 830 podría obtener un umbral de enmascaramiento utilizando la energía espectral, es decir, el valor de Norma, en función de cada sub-banda y podría estimar el número perceptualmente requerido de bits, es decir, el número permisible de bits, utilizando el umbral de enmascaramiento .
El estimador y asignador de bits 830 podría efectuar la asignación de bits en unidades de punto decimal utilizando la energía espectral, es decir, el valor de Norma, en función de cada sub-banda. En este caso podría ser utilizado, por ejemplo, el método de asignación de bits utilizando las Ecuaciones 7 a 20.
El estimador y asignador de bits 830 compara el número asignado de bits con el número estimado de bits para todas las sub-bandas, si el número asignado de bits es más grande que el número estimado de bits, el número asignado de bits es limitado al número estimado de bits. Si el número asignado de bits de todas las sub-bandas en un cuadro dado, que es obtenido como resultado de la limitación de número de bits, es menor que el número total B de los bits permisibles en el cuadro dado, el número de bits que corresponde con la diferencia podría ser uniformemente asignado a todas las sub-
bandas o no uniformemente asignado de acuerdo con la importancia de percepción.
La Figura 9 es un diagrama de bloque de una unidad de decodificación 900 que corresponde con la unidad de decodificación 750 en el aparato de decodificación de audio 700 de la Figura 7, de acuerdo con una modalidad de ejemplo.
La unidad de decodificación 900 de la Figura 9 podría incluir un decodificador de espectro 910 y una unidad de conformado de envolvente 930. Los componentes de la unidad de decodificación 900 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador .
Con referencia a la Figura 9, el decodificador de espectro 910 podría descuantificar y decodificar sin pérdida el espectro codificado utilizando la información con respecto al espectro codificado proporcionada a partir de la unidad de desmultiplexión (710 de la Figura 7) y el número asignado de bits proporcionado a partir de la unidad de asignación de bits (730 de la Figura 7) . El espectro de codificado del decodificador de espectro 910 es un espectro normalizado.
La unidad de conformado de envolvente 930 podría restaurar un espectro antes de la normalización al realizar el conformado de envolvente en el espectro normalizado proporcionado a partir del decodificador de espectro 910 utilizando el valor descuantificado de Norma proporcionado a
partir de la unidad de asignación de bits (730 de la Figura 7) .
La Figura 10 es un diagrama de bloque de una unidad de decodificación 1000 que corresponde con la unidad de decodificación 750 en el aparato de decodificación de audio 700 de la Figura 7, de acuerdo con una modalidad de ejemplo.
La unidad de decodificación 1000 de la Figura 9 podría incluir un decodificador de espectro 1010, una unidad de conformado de envolvente 1030 y una unidad de llenado de espectro 1050. Los componentes de la unidad de decodificación 1000 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador.
Con referencia a la Figura 10, el decodificador de espectro 1010 podría descuantificar y decodificar sin pérdida el espectro codificado utilizando la información con respecto al espectro codificado proporcionada a partir de la unidad de desmultiplexión (710 de la Figura 7) y el número asignado de bits proporcionado a partir de la unidad de asignación de bits (730 de la Figura 7) . El espectro de codificado del decodificador de espectro 1010 es un espectro normalizado.
La unidad de conformado de envolvente 1030 podría restaurar un espectro antes de la normalización al realizar el conformado de envolvente en el espectro normalizado proporcionado a partir del decodificador de espectro 1010 utilizando el valor descuantificado de Norma proporcionado a
partir de la unidad de asignación de bits (730 de la Figura 7) .
Cuando existe una sub-banda, que incluye una parte descuantificada en 0, en el espectro proporcionado a partir de la unidad de conformado de envolvente 1030, la unidad de llenado de espectro 1050 podría llenar un componente de ruido en la parte descuantificada en 0 en la sub-banda. De acuerdo con una modalidad de ejemplo, el componente de ruido podría ser generado en forma aleatoria o podría ser generado copiando un espectro de una sub-banda descuantificada en un valor diferente de 0, que es adyacente a la sub-banda que incluye la parte descuantificada en 0, o un espectro de una sub-banda descuantificada en un valor diferente de 0. De acuerdo con otra modalidad de ejemplo, la energía del componente de ruido podría ser ajustada al generar un componente de ruido para la sub-banda que incluye la parte descuantificada en 0 y utilizando la relación de energía del componente de ruido con el valor descuantificado de Norma proporcionado a partir de la unidad de asignación de bits (730 de la Figura 7), es decir, la energía espectral. De acuerdo con otra modalidad de ejemplo, podría ser generado un componente de ruido para la sub-banda que incluye la parte descuantificada en 0, y podría ser ajustada la energía promedio del componente de ruido para que sea 1.
La Figura 11 es un diagrama de bloque de una unidad
de decodificación 1100 que corresponde con la unidad de decodificación 750 en el aparato de decodificación de audio 700 de la Figura 7, de acuerdo con otra modalidad de ejemplo.
La unidad de decodificación 1100 de la Figura 11 podría incluir un decodificador de espectro 1110, una unidad de llenado de espectro 1130 y una unidad de conformado de envolvente 1150. Los componentes de la unidad de decodificación 1100 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador. Debido a que existe una diferencia en que un arreglo de la unidad de llenado de espectro 1130 y la unidad de conformado de envolvente 1150 es diferente cuando la unidad de decodificación 1100 de la Figura 11 es comparada con la unidad de decodificación 1000 de la Figura 10, la descripción detallada de los componentes comunes es omitida en la presente.
Con referencia a la Figura 11, cuando existe una sub-banda, que incluye una parte descuantificada en 0, en el espectro normalizado proporcionado a partir del decodificador de espectro 1110, la unidad de llenado de espectro 1130 podría llenar un componente de ruido en la parte descuantificada en 0 en la sub-banda. En este caso, podrían ser utilizados varios métodos de llenado de ruido aplicados a la unidad de llenado de espectro 1050 de la Figura 10. De preferencia, para la sub-banda que incluye la parte
descuantificada en 0, podría ser generado el componente de ruido, y podría ser ajustada la energía promedio del componente de ruido para que sea 1.
La unidad de conformado de envolvente 1150 podría restaurar un espectro antes de la normalización para el espectro que incluye la sub-banda en la cual el componente de ruido es llenado utilizando el valor descuantificado de Norma proporcionado a partir de la unidad de asignación de bits (730 de la Figura 7) .
La Figura 12 es un diagrama de bloque de un aparato de decodificación de audio 1200 de acuerdo con otra modalidad de ejemplo.
El aparato de decodificación de audio 1200 de la Figura 12 podría incluir una unidad de desmultiplexión 1210, un decodificador de factor de escala 1230, un decodificador de espectro 1250 y una unidad de transformada inversa 1270. Los componentes del aparato de decodificación de audio 1200 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador.
Con referencia a la Figura 12, la unidad de desmultiplexión 1210 podría desmultiplexar un flujo de bits para extraer un factor de escala cuantificado y codificado sin pérdida y la información con respecto a un espectro codificado .
El decodificador de factor de escala 1230 podría
descuantificar y decodificar sin pérdida el factor de escala cuantificado y codificado sin pérdida en función de cada sub-banda.
El decodificador de espectro 1250 podría descuantificar y decodificar sin pérdida el espectro codificado utilizando la información con respecto al espectro codificado y el factor descuantificado de escala proporcionado a partir de la unidad de desmultiplexión 1210. La unidad de decodificación de espectro 1250 podría incluir los mismos componentes que la unidad de decodificación 1000 de la Figura 10.
La unidad de transformada inversa 1270 podría generar una señal restaurada de audio al transformar el espectro decodificado por el decodificador de espectro 1250 en el dominio de tiempo.
La Figura 13 es un diagrama de bloque de un aparato de decodificación de audio 1300 de acuerdo con otra modalidad de ejemplo.
El aparato de decodificación de audio 1300 de la Figura 13 podría incluir una unidad de desmultiplexión 1310, una unidad de asignación de bits 1330, una unidad de decodificación 1350 y una unidad de transformada inversa 1370. Los componentes del aparato de decodificación de audio 1300 podrían ser integrados al menos en un módulo y podrían ser implementados al menos por un procesador.
Debido a que existe una diferencia en que la información de la señalización de transitorio es proporcionada a la unidad de decodificación 1350 y la unidad de transformada inversa 1370 cuando el aparato de decodificación de audio 1300 de la Figura 13 es comparado con el aparato de decodificación de audio 700 de la Figura 7, la descripción detallada de los componentes comunes es omitida en la presente.
Con referencia a la Figura 13, la unidad de decodificación 1350 podría decodificar un espectro utilizando la información con respecto- a un espectro codificado proporcionado a partir de la unidad de desmultiplexion 1310. En este caso, el tamaño de ventana podría variar de acuerdo con la información de la señalización de transitorio.
La unidad de transformada inversa 1370 podría generar una señal restaurada de audio al transformar el espectro de codificado en el dominio de tiempo. En este caso, el tamaño de ventana podría variar de acuerdo con la información de la señalización de transitorio.
La Figura 14 es un diagrama de flujo que ilustra un método de asignación de bits de acuerdo con otra modalidad de ej emplo .
Con referencia a la Figura 14, en la operación 1410, la energía espectral de cada sub-banda es adquirida. La energía espectral podría ser de un valor de Norma.
En la operación 1420, un umbral de enmascaramiento es adquirido utilizando la energía espectral en función de cada sub-banda.
En la operación 1430, el número permisible de bits es estimado en unidades de punto decimal utilizando el umbral de enmascaramiento en función de cada sub-banda.
En la operación 1440, los bits son asignados en unidades de punto decimal en función de la energía espectral en función de cada sub-banda.
En la operación 1450, el número permisible de bits es comparado con el número asignado de bits en función de cada sub-banda.
En la operación 1460, si el número asignado de bits es más grande que el número permisible de bits para una sub-banda dada como resultado de la comparación en la operación 1450, el número asignado de bits es limitado al número permisible de bits.
En la operación 1470, si el número asignado de bits es mayor o igual al número permisible de bits para una sub-banda dada como resultado de la comparación en la operación 1450, el número asignado de bits es utilizado como es, o el número final asignado de bits es determinado para cada sub-banda utilizando el número permisible de bits limitado en la operación 1460.
Aunque no se muestra, si la suma de los números
asignados de bits determinados en la operación 1470 para todas las sub-bandas en un cuadro dado es menor o mayor que el número total de bits permisibles en el cuadro dado, el número de bits que corresponde con la diferencia podría ser uniformemente asignado a todas las sub-bandas o no uniformemente asignado de acuerdo con la importancia de percepción .
La Figura 15 es un diagrama de flujo que ilustra un método de asignación de bits de acuerdo con otra modalidad de ejemplo.
Con referencia a la Figura 15, en la operación 1500, un valor descuantificado de Norma de cada sub-banda es adquirido .
En la operación 1510, un umbral de enmascaramiento es adquirido utilizando el valor descuantificado de Norma en función de cada sub-banda.
En la operación 1520, una SMR es adquirida utilizando el umbral de enmascaramiento en función de cada sub-banda .
En la operación 1530, el número permisible de bits es estimado en unidades de punto decimal al utilizar la SMR en función de cada sub-banda.
En la operación 1540, los bits son asignados en unidades de punto decimal en función de la energía espectral (o el valor descuantificado de Norma) en función de cada sub-
banda .
En la operación 1550, el número permisible de bits es comparado con el número asignado de bits en función de cada sub-banda.
En la operación 1560, si el número asignado de bits es más grande que el número permisible de bits para una sub-banda dada como resultado de la comparación en la operación 1550, el número asignado de bits es limitado al número permisible de bits.
En la operación 1570, si el número asignado de bits es mayor o igual al número permisible de bits para una sub-banda dada como resultado de la comparación en la operación 1550, el número asignado de bits es utilizado como es, o el número final asignado de bits es determinado para cada sub-banda utilizando el número permisible de bits limitado en la operación 1560.
Aunque no se muestra, si la suma de los números asignados de bits determinada en la operación 1570 para todas las sub-bandas en un cuadro dado es menor o mayor que el número total de bits permisibles en el cuadro dado, el número de bits que corresponde con la diferencia podría ser uniformemente asignado a todas las sub-bandas o no uniformemente asignado de acuerdo con la importancia de percepción .
La Figura 16 es un diagrama de flujo que ilustra un
método de asignación de bits de acuerdo con otra modalidad ej emplo .
Con referencia a la Figura 16, en la operación 1610, la inicialización es efectuada. Como un ejemplo de la inicialización, cuando el número asignado de bits para cada sub-banda es estimado utilizando la Ecuación 20, podría ser reducida la complejidad total calculando un valor constante
para todas las sub-bandas.
En la operación 1620, el número asignado de bits para cada sub-banda es estimado en unidades de punto decimal utilizando la Ecuación 17. El número asignado de bits para cada sub-banda podría ser obtenido al multiplicar el número asignado Lb de bits por muestra por el número de muestras por sub-banda. Cuando el número asignado Lb de bits por muestra de cada sub-banda es calculado utilizando la Ecuación 17, Lb podría tener un valor menor que 0. En este caso, 0 es asignado a Lb que tiene un valor menor que 0 como en la Ecuación 18.
rF.c ac ón 1 fi 1
Como resultado, la suma de los números asignados de bits estimada para todas las sub-bandas incluidas en un cuadro dado podría ser más grande que el número B de los bits permisibles en el cuadro dado.
En la operación 1630, la suma de los números asignados de bits estimada para todas las sub-bandas incluidas en el cuadro dado es comparada con el número B de los bits permisibles en el cuadro dado.
En la operación 1640, los bits son reasignados para cada sub-banda utilizando la Ecuación 19 hasta que la suma de los números asignados de bits estimados para todas las sub-bandas incluidas en el cuadro dado sea la misma que el número B de los bits permisibles en el cuadro dado.
[Ecuación 19]
En la Ecuación 19,
*-l
b
denota el número de bits determinado por una (k- 1) enésima repetición, y
^ T kb
denota el número de bits determinado por una repetición k-enésima. El número de bits determinado por cada repetición no tiene que ser menor de 0, y en consecuencia, la
operación 1640 es efectuada para las sub-bandas que tienen el número de bits más grande que 0.
En la operación 1650, si la suma de los números asignados de bits estimados para todas las sub-bandas incluidas en el cuadro dado es la misma que el número B de los bits permisibles en el cuadro dado como resultado de la comparación en la operación 1630, el número asignado de bits de cada sub-banda es utilizado como es, o el número final asignado de bits es determinado para cada sub-banda utilizando el número asignado de bits de cada sub-banda, que es obtenido como resultado de la redistribución en la operación 1640.
La Figura 17 es un diagrama de flujo que ilustra un método de asignación de bits de acuerdo con otra modalidad de e emplo .
Con referencia a la Figura 17, del mismo modo que la operación 1610 de la Figura 16, la inicialización es efectuada en la operación 1710. Del mismo modo que la operación 1620 de la Figura 16, en la operación 1720, el número asignado de bits para cada sub-banda es estimado en unidades de punto decimal, y cuando el número asignado Lb de bits por muestra de cada sub-banda es menor que 0, el número 0 es asignado a Lb que tiene un valor menor que 0 como en la Ecuación 18.
En la operación 1730, el número mínimo de bits
requerido para cada sub-banda es definido en términos de la SNR, y el número asignado de bits en la operación 1720 más grande que 0 y menor que el número mínimo de bits es ajustado limitando el número asignado de bits al número mínimo de bits. Como tal, al limitar el número asignado de bits de cada sub-banda al número mínimo de bits, podría ser reducida la posibilidad de disminución de la calidad de sonido. Por ejemplo, el número mínimo de bits requerido para cada sub-banda es definido como el número mínimo de bits requerido para la codificación de impulso en la codificación de impulso factorial. La codificación de impulso factorial representa una señal mediante la utilización de todas las combinaciones de una posición de impulso diferente de 0, una magnitud de impulso, y una señal de impulso. En este caso, un número ocasional N de todas las combinaciones, que pueden representar un impulso, podría ser representado por la Ecuación 20.
[Eucación 20]
En la Ecuación 20, 21 denota un número ocasional de los signos que pueden ser representados con +/- para las señales en posiciones diferentes de cero i.
En la Ecuación 20, F(n, i) podría ser definido por la Ecuación 21, lo cual indica un número ocasional para la
selección de las posiciones diferentes de cero i para las n muestras dadas, es decir, las posiciones.
[Ecuación 21]
/<·(//./) = rf" =
!(,/- )!
En la Ecuación 20, D(m, i) podría ser representado por la Ecuación 22, lo cual indica un número ocasional que representa las señales seleccionadas en las posiciones diferentes de cero i a través de las m magnitudes.
[Ecuación 22]
El número M de bits requerido para representar las N combinaciones podría ser representado por la Ecuación 23.
[Ecuación 23]
M = [ log 2 N 1
Como resultado, el número mínimo
de bits requerido para codificar un mínimo de 1 impulso para las Nb muestras en una b-enésima sub-banda dada podría ser representado por la Ecuación 24.
TEcuación 241
Lbrni .n = 1 + log2Nb
En este caso, el número de bits utilizado para
transmitir un valor de ganancia requerido para la cuantificación podría ser agregado al número mínimo de bits requerido en la codificación de impulso factorial y podría variar de acuerdo con la velocidad de bits. El número mínimo de bits requerido en función de cada sub-banda podría ser determinado por un valor más grande de entre el número mínimo de bits requerido en la codificación de impulso factorial y el número Nb de muestras de una sub-banda dada como en la Ecuación 25. Por ejemplo, el número mínimo de bits requerido en función de cada sub-banda podría ser establecido como 1 bit por muestra.
[Ecuación 25]
Lb = max(iV¿,l + log2jV¿ + L ·„)
Cuando los bits que serán utilizados no son suficientes en la operación 1730 debido a que es pequeña la velocidad objetivo de bits, para una sub-banda para la cual el número asignado de bits es más grande que 0 y menor que el número mínimo de bits, el número asignado de bits es extraído y ajustado en 0. En adición, para una sub-banda para la cual el número asignado de bits es más pequeño que aquellos de la Ecuación 24, el número asignado de bits podría ser extraído, y para una sub-banda para la cual el número asignado de bits es más grande que aquellos de la Ecuación 24 y más pequeño que el número mínimo de bits de la Ecuación 25, el número mínimo de bits podría ser asignado.
En la operación 1740, la suma de los números asignados de bits estimada para todas las sub-bandas en un cuadro dado es comparada con el número de bits permisible en el cuadro dado.
En la operación 1750, los bits son reasignados para una sub-banda en la cual es asignado más que un número mínimo de bits hasta que la suma de los números asignados de bits estimada para todas las sub-bandas en el cuadro dado sea la misma que el número de bits permisible en el cuadro dado.
En la operación 1760, es determinado si el número asignado de bits de cada sub-banda es cambiado entre una repetición previa y una repetición actual para la redistribución de bits. Si el número asignado de bits de cada sub-banda no es cambiado entre la repetición previa y la repetición actual para la redistribución de bits, o hasta que la suma de los números asignados de bits estimada para todas las sub-bandas en el cuadro dado sea la misma que el número de bits permisible en el cuadro dado, son efectuadas las operaciones 1740 a 1760.
En la operación 1770, si el número asignado de bits de cada sub-banda no es cambiado entre la repetición previa y la repetición actual para la redistribución de bits como resultado de la determinación en la operación 1760, los bits son extraídos, de manera secuencial, de la sub-banda superior a la sub-banda inferior, y las operaciones 1740 a 1760 son
efectuadas hasta que sea satisfecho el número de bits permisible en el cuadro dado.
Es decir, para una sub-banda para la cual el número asignado de bits es más grande que el número mínimo de bits de la Ecuación 25, es efectuada la operación de ajuste mientras se reduce el número asignado de bits, hasta que sea satisfecho el número de bits permisible en el cuadro dado. En adición, si el número asignado de bits es igual o más pequeño que el número mínimo de bits de la Ecuación 25 para todas las sub-bandas y la suma del número asignado de bits es más grande que el número de bits permisible en el cuadro dado, el número asignado de bits podría ser extraído de una banda de alta frecuencia hacia una banda de baja frecuencia.
De acuerdo con los métodos de asignación de bits de las Figuras 16 y 17, para distribuir o asignar los bits a cada sub-banda, después que los bits iniciales son asignados a cada sub-banda en un orden de la energía espectral o la energía espectral ponderada, el número de bits requerido para cada sub-banda podría estimarse a la vez sin repetir la operación de búsqueda de la energía espectral o la energía espectral es ponderada varias veces. En adición, mediante la redistribución de bits a cada sub-banda hasta que la suma de los números asignados de bits estimada para todas las sub-bandas en un cuadro dado sea la misma que el número de bits permisible en el cuadro dado, es posible la asignación
eficiente de bits. En adición, al garantizar el número minimo de bits hacia una sub-banda arbitraria, la generación de un agujero espectral que ocurre debido al número suficiente de las muestras espectrales o impulsos no puede ser codificada debido a que podría ser evitada la asignación de un número pequeño de bits.
Los métodos de las Figuras 14 a 17 podrían ser programados y podrían ser realizados al menos por medio de un dispositivo de procesamiento, por ejemplo, una unidad de procesamiento central (CPU) .
La Figura 18 es un diagrama de bloque de un dispositivo multimedia que incluye un módulo de codificación, de acuerdo con una modalidad de ejemplo.
Con referencia a la Figura 18, el dispositivo multimedia 1800 podría incluir una unidad de comunicación 1810 y un módulo de codificación 1830. En adición, el dispositivo multimedia 1800 además podría incluir una unidad de almacenamiento 1850 para el almacenamiento de un flujo de bits de audio obtenido como resultado de la codificación de acuerdo con el uso del flujo de bits de audio. Además, el dispositivo multimedia 1800 además podría incluir un micrófono 1870. Es decir, la unidad de almacenamiento 1850 y el micrófono 1870 podrían ser incluidos, de manera opcional. El dispositivo multimedia 1800 además podría incluir un módulo de decodificación arbitraria (no se muestra) , por
ejemplo, un módulo de decodificación para la realización de una función general de decodificación o un módulo de decodificación de acuerdo con una modalidad de ejemplo. El módulo de codificación 1830 podría ser implementado al menos por un procesador, por ejemplo, una unidad de procesamiento central (no se muestra) al ser integrada con otros componentes (no se muestran) incluidos en el dispositivo multimedia 1800 como un cuerpo.
La unidad de comunicación 1810 podría recibir al menos uno de una señal de audio o un flujo codificado de bits proporcionado desde el exterior o podría transmitir al menos uno de una señal restaurada de audio o un flujo codificado de bits obtenido como resultado de la codificación por medio del módulo de codificación 1830.
La unidad de comunicación 1810 es configurada para transmitir y recibir datos hacia y a partir de un dispositivo multimedia externo a través de una red inalámbrica, tal como la Internet inalámbrica, la intranet inalámbrica, una red inalámbrica de teléfono, una Red de Área Local inalámbrica (LAN por sus siglas en inglés) , una red Wi-Fi, Wi-Fi Directa (WFD) , una red de tercera generación (3G), una red de cuarta generación (4G), Bluetooth, una red de la Asociación de Datos Infrarrojos (IrDA), la Identificación de Frecuencias de Radio (RFID por sus siglas en inglés) , la Ultra Banda Ancha (ÜWB, por sus siglas en inglés), 'Zigbee' , o la Comunicación de
Campo Cercano (NFC, por sus siglas en inglés) , o una red alambrada, tal como una red alambrada de teléfono o la Internet alambrada.
De acuerdo con una modalidad de ejemplo, el módulo de codificación 1830 podría generar un flujo de bits al transformar una señal de audio en el dominio de tiempo, que se proporciona a través de la unidad de comunicación 1810 o el micrófono 1870, a un espectro de audio en el dominio de frecuencia, además, podría determinar el número asignado de bits en unidades de punto decimal en función de las bandas de frecuencia de modo que una SNR de un espectro existente en una banda predeterminada de frecuencia es maximizado dentro de un intervalo del número de bits permisible en un cuadro dado del espectro de audio, ajustar el número asignado de bits determinado en función de las bandas de frecuencia, y también podría codificar el espectro de audio utilizando el número de bits ajustado en función de las bandas de frecuencia y la energía espectral.
De acuerdo con otra modalidad de ejemplo, el módulo de codificación 1830 podría generar un flujo de bits al transformar una señal de audio en el dominio de tiempo, que se proporciona a través de la unidad de comunicación 1810 o el micrófono 1870, en un espectro de audio en el dominio de frecuencia, estimar el número permisible de bits en unidades de punto decimal utilizando un umbral de enmascaramiento
basado en las bandas de frecuencia incluidas en un cuadro dado del espectro de audio, además, podría estimar el número asignado de bits en unidades de punto decimal utilizando la energía espectral, ajustar el número asignado de bits para no exceder el número permisible de bits, y también podría codificar el espectro de audio utilizando el número de bits ajustado en función de las bandas de frecuencia y la energía espectral .
La unidad de almacenamiento 1850 podría almacenar el flujo codificado de bits generado por el módulo de codificación 1830. En adición, la unidad de almacenamiento 1850 podría almacenar varios programas requeridos para operar el dispositivo multimedia 1800.
El micrófono 1870 podría proporcionar una señal de audio de un usuario o el exterior hacia el módulo de codificación 1830.
La Figura 19 es un diagrama de bloque de un dispositivo multimedia que incluye un módulo de decodificación, de acuerdo con una modalidad de ejemplo.
El dispositivo multimedia 1900 de la Figura 19 podría incluir una unidad de comunicación 1910 y un módulo de decodificación 1930. En adición, de acuerdo con el uso de una señal restaurada de audio obtenida como el resultado de la decodificación, el dispositivo multimedia 1900 de la Figura 19 además podría incluir una unidad de almacenamiento 1950
para el almacenamiento de señal restaurada de audio. En adición, el dispositivo multimedia 1900 de la Figura 19 además podría incluir un altavoz 1970. Es decir, la unidad de almacenamiento 1950 y el altavoz 1970 son opcionales. El dispositivo multimedia 1900 de la Figura 19 además podría incluir un módulo de codificación (no se muestra) , por ejemplo, un módulo de codificación para la realización de una función general de codificación o un módulo de codificación de acuerdo con una modalidad de ejemplo. El módulo de decodificación 1930 podría ser integrado con otros componentes (no se muestra) incluidos en el dispositivo multimedia 1900 y podría ser implementado al menos por un procesador, por ejemplo, una unidad de procesamiento central (CPU) .
Con referencia a la Figura 19, la unidad de comunicación 1910 podría recibir al menos uno de una señal de audio o un flujo codificado de bits proporcionado desde el exterior o podría transmitir al menos uno de una señal restaurada de audio obtenida como resultado de la decodificación del módulo de decodificación 1930 o un flujo de bits de audio obtenido como resultado de la codificación. La unidad de comunicación 1910 podría ser implementada de una manera sustancialmente similar a la unidad de comunicación 1810 de la Figura 18.
De acuerdo con una modalidad de ejemplo, el módulo
de decodificación 1930 podría generar una señal restaurada de audio al recibir un flujo de bits proporcionado a través de la unidad de comunicación 1910, determinar el número asignado de bits en unidades de punto decimal en función de las bandas de frecuencia de modo que una SNR de un espectro existente en a cada banda de frecuencia es maximizada dentro de un intervalo del número permisible de bits en un cuadro dado, ajustar el número asignado de bits determinado en función de las bandas de frecuencia, además, podría decodificar un espectro de audio incluido en el flujo de bits utilizando el número de bits ajustado en función de las bandas de frecuencia y la energía espectral, y también podría transformar el espectro de audio decodificado en una señal de audio en el dominio de tiempo.
De acuerdo con otra modalidad de ejemplo, el módulo de decodificación 1930 podría generar un flujo de bits al recibir un flujo de bits proporcionado a través de la unidad de comunicación 1910, además, podría estimar el número permisible de bits en unidades de punto decimal utilizando un umbral de enmascaramiento basado en las bandas de frecuencia incluidas en un cuadro dado, estimar el número asignado de bits en unidades de punto decimal utilizando la energía espectral, ajustar el número asignado de bits para no exceder el número permisible de bits, decodificar un espectro de audio incluido en el flujo de bits utilizando el número de
bits ajustado en función de las bandas de frecuencia y la energía espectral, y también podría transformar el espectro de audio decodificado en una señal de audio en el dominio de tiempo .
La unidad de almacenamiento 1950 podría almacenar la señal restaurada de audio generada por el módulo de decodificación 1930. En adición, la unidad de almacenamiento 1950 podría almacenar varios programas requeridos para operar el dispositivo multimedia 1900.
El altavoz 1970 podría dar salida a la señal restaurada de audio generada por el módulo de decodificación 1930 hacia el exterior.
La Figura 20 es un diagrama de bloque de un dispositivo multimedia que incluye un módulo de codificación y un módulo de decodificación, de acuerdo con una modalidad de ejemplo.
El dispositivo multimedia 2000 mostrado en la Figura 20 podría incluir una unidad de comunicación 2010, un módulo de codificación 2020 y un módulo de decodificación 2030. En adición, el dispositivo multimedia 2000 además podría incluir una unidad de almacenamiento 2040 para el almacenamiento de un flujo de bits de audio obtenido como resultado de la codificación o una señal restaurada de audio obtenida como resultado de la decodificación de acuerdo con el uso del flujo de bits de audio o la señal restaurada de audio. En
adición, el dispositivo multimedia 2000 además podría incluir un micrófono 2050 y/o un altavoz 2060. El módulo de codificación 2020 y el módulo de decodificación 2030 podrían ser implementados al menos por un procesador, por ejemplo, una unidad de procesamiento central (CPU) (no se muestra) al ser integrada con otros componentes (no se muestra) incluidos en el dispositivo multimedia 2000 como un cuerpo.
Debido a que los componentes del dispositivo multimedia 2000 mostrados en la Figura 20 corresponden con los componentes del dispositivo multimedia 1800 mostrados en la Figura 18 o los componentes del dispositivo multimedia 1900 mostrados en la Figura 19, la descripción detallada de los mismos es omitida.
Cada uno de los dispositivos multimedia 1800, 1900, y 2000 mostrado en las Figuras 18, 19, y 20 podría incluir una terminal sólo de comunicación de voz, tal como un teléfono o teléfono móvil, un dispositivo de radiodifusión o sólo de música, tal como una TV o un reproductor MP3, o un dispositivo de terminal híbrida de una terminal sólo de comunicación de voz y un dispositivo de radiodifusión o sólo de música aunque no se limita a los mismos. En adición, cada uno de los dispositivos multimedia 1800, 1900, y 2000 podría ser utilizado como un cliente, un servidor o un transductor desplazado entre un cliente y un servidor.
Cuando el dispositivo multimedia 1800, 1900 ó 2000
es, por ejemplo, un teléfono móvil, aunque no se muestra, el dispositivo multimedia 1800, 1900 ó 2000 además podría incluir una unidad de entrada de usuario, tal como un teclado, una unidad de pantalla para la visualización de la información procesada por una interfaz de usuario o el teléfono móvil, y un procesador para controlar las funciones del teléfono móvil. En adición, el teléfono móvil además podría incluir una unidad de cámara que tiene una función de captura de imagen y al menos un componente para realizar una función requerida por el teléfono móvil.
Cuando el dispositivo multimedia 1800, 1900 ó 2000 es, por ejemplo, una TV, aunque no se muestra, el dispositivo multimedia 1800, 1900 ó 2000 además podría incluir una unidad de entrada de usuario, tal como un teclado, una unidad de pantalla para la visualización de la información recibida de radiodifusión, y un procesador que controla todas las funciones de la TV. En adición, la TV además podría incluir al menos un componente para la realización de una función de la TV.
Los métodos de acuerdo con las modalidades ejemplo pueden ser escritos como programas de computadora y pueden ser implementados en computadoras digitales de uso general que ejecutan los programas utilizando un medio de grabación susceptible de ser leído en computadora. En adición, las estructuras de datos, los comandos de programa o los archivos
de datos que pueden ser utilizados en las modalidades ejemplo podrían ser grabados en un medio de grabación susceptible de ser leído en computadora en varios modos. El medio de grabación susceptible de ser leído en computadora es cualquier dispositivo de almacenamiento de datos que puede almacenar datos, los cuales pueden ser posteriormente leídos por un sistema de computadora. Los ejemplos medio de grabación susceptible de ser leído en computadora incluyen medios magnéticos, tales como discos duros, discos flexibles, y cintas magnéticas, medios ópticos, tales como CD-ROMs y DVDs, y medios magnético-ópticos, tales como discos ópticos, y dispositivos de hardware tales como ROMs, RAMs, y memorias de tipo *flash', particularmente configuradas para almacenar y ejecutar comandos de programa. En adición, el medio de grabación susceptible de ser leído en computadora podría ser un medio de transmisión para la transmisión de una señal en la cual son designados el comando de programa y la estructura de datos. Los comandos de programa podrían incluir códigos de lenguaje de máquina editados por un compilador y códigos de lenguaje de alto nivel que pueden ser ejecutados por una computadora utilizando un intérprete.
Mientras el presente concepto inventivo ha sido particularmente mostrado y descrito con referencia a las modalidades de ejemplo de la misma, será entendido por aquellas personas de experiencia ordinaria en la técnica que
varios cambios en la forma y los detalles podrían realizarse en las mismas sin apartarse del espíritu y alcance del presente concepto inventivo como es definido por las siguientes reivindicaciones.
Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.
Claims (28)
1. Un método de asignación de bits, caracterizado porque comprende: determinar el número asignado de bits en unidades de punto decimal en función de cada banda de frecuencia, de modo que la Relación de Señal-a-Ruido (SNR) de un espectro existente en una banda predeterminada de frecuencia es maximizada dentro de un intervalo del número permisible de bits para un cuadro dado; y ajustar el número asignado de bits en función de cada banda de frecuencia.
2. El método de asignación de bits de conformidad con la reivindicación 1, caracterizado porque la determinación del número asignado de bits es realizada utilizando la energía espectral de la banda predeterminada de frecuencia y el número permisible de bits para el cuadro dado .
3. El método de asignación de bits de conformidad con la reivindicación 1, caracterizado porque la determinación del número asignado de bits comprende determinar el número asignado de bits, de modo que es minimizada la diferencia entre la suma de los números de bits asignados a todas las bandas de frecuencia incluidas en el cuadro dado y el número permisible de bits para el cuadro dado .
4. El método de asignación de bits de conformidad con la reivindicación 1, caracterizado porque la determinación del número asignado de bits es realizada utilizando la siguiente ecuación, en donde Lb denota el número de bits asignado a cada muestra en una b-enésima banda de frecuencia, C denota un valor de escala dB, Nb denota un valor de Norma descuantificado por una escala de registro en la b-enésima banda de frecuencia, Nb denota el número de muestras de la b-enésima banda de frecuencia, y B denota el número total de bits permisibles en el cuadro dado.
5. El método de asignación de bits de conformidad con la reivindicación 1, caracterizado porque el ajuste del número asignado de bits comprende, si el número asignado de bits en cada muestra incluida en la banda predeterminada de frecuencia es menor que 0, la asignación de 0 al número asignado de bits.
6. El método de asignación de bits de conformidad con la reivindicación 5, caracterizado porque el ajuste del número asignado de bits comprende la redistribución de bits a cada banda de frecuencia hasta que la suma de los números asignados de bits determinados para las bandas de frecuencia incluidas en el cuadro dado sea la misma que el número total de bits permisibles en el cuadro dado.
7. El método de asignación de bits de conformidad con la reivindicación 1, caracterizado porque el ajuste del número asignado de bits comprende definir el número mínimo de bits requerido para la banda predeterminada de frecuencia y limitar el número asignado de bits al número mínimo de bits para una banda de frecuencia para la cual el número asignado de bits es menor que el número mínimo de bits.
8. El método de asignación de bits de conformidad con la reivindicación 1, caracterizado porque el ajuste del número asignado de bits comprende definir el número mínimo de bits requerido para la banda predeterminada de frecuencia y ajustar el número asignado de bits en 0 para una banda de frecuencia para la cual el número asignado de bits es menor que el número mínimo de bits.
9. El método de asignación de bits de conformidad con la reivindicación 7 u 8, caracterizado porque el número mínimo de bits es definido utilizando el número de bits requerido para codificar al menos un impulso en la banda predeterminada de frecuencia.
10. El método de asignación de bits de conformidad con la reivindicación 7 u 8, caracterizado porque el ajuste del número asignado de bits comprende la redistribución de bits a cada banda de frecuencia hasta que la suma de resultados ajustados al utilizar el número mínimo de bits para las bandas de frecuencia incluidas en el cuadro dado sea la misma que el número total de bits permisibles en el cuadro dado .
11. El medio no transitorio de grabación susceptible de ser leído por computadora, caracterizado porque almacena un programa susceptible de ser leído por computadora para la ejecución del método de conformidad con la reivindicación 1.
12. Un aparato de asignación de bits, caracterizado porque comprende: una unidad de transformada que transforma una señal de audio en el dominio de tiempo para un espectro de audio en un dominio de frecuencia; y una unidad de asignación de bits que estima el número permisible de bits en unidades de punto decimal utilizando un umbral de enmascaramiento basado en las bandas de frecuencia incluidas en un cuadro dado en el espectro de audio, estima el número asignado de bits en unidades de punto decimal utilizando la energía espectral, y ajusta el número asignado de bits para que no exceda el número permisible de bits .
13. El aparato de asignación de bits de conformidad con la reivindicación 12, caracterizado porque la unidad de asignación de bits distribuye, en función de la magnitud de la energía espectral de las bandas de frecuencia incluidas en el cuadro dado, los bits restantes como resultado de la limitación del número asignado de bits para que no excedan el número permisible de bits en función de las bandas de frecuencia .
14. El aparato de asignación de bits de conformidad con la reivindicación 12, caracterizado porque la energía espectral de cada banda de frecuencia es ponderada de acuerdo con la importancia de perceptual.
15. Un aparato de codificación de audio, caracterizado porque comprende: una unidad de transformada que transforma una señal de audio en el dominio de tiempo para un espectro de audio en un dominio de frecuencia; una unidad de asignación de bits que determina el número asignado de bits en unidades de punto decimal en función de cada banda de frecuencia, de modo que la Relación de Señal-a-Ruido (SNR) de un espectro existente en una banda predeterminada de frecuencia es maximizada dentro de un intervalo del número permisible de bits para un cuadro dado del espectro de audio y ajusta el número asignado de bits determinado en función de cada banda de frecuencia; y una unidad de codificación que codifica el espectro de audio utilizando el número de bits ajustado en función de cada banda de frecuencia y la energía espectral.
16. El aparato de codificación de audio de conformidad con la reivindicación 15, caracterizado porque además comprende una unidad de detección de transitorio que detecta un intervalo que tiene una característica transitoria de la señal de audio en el dominio de tiempo para determinar el tamaño de ventana utilizado para la transformada de dominio de tiempo a dominio de frecuencia utilizando el intervalo detectado.
17. Un aparato de codificación de audio, caracterizado porque comprende: una unidad de transformada que transforma una señal de audio en el dominio de tiempo para un espectro de audio en un dominio de frecuencia; una unidad de asignación de bits que estima el número permisible de bits en unidades de punto decimal utilizando un umbral de enmascaramiento basado en las bandas de frecuencia incluidas en un cuadro dado en el espectro de audio, estima el número asignado de bits en unidades de punto decimal utilizando la energía espectral, y ajusta el número asignado de bits para que no exceda el número permisible de bits; y un codificador que codifica el espectro de audio utilizando el número de bits ajustado en función de cada banda de frecuencia y la energía espectral.
18. El aparato de codificación de audio de conformidad con la reivindicación 17, caracterizado porque además comprende una unidad de detección de transitorio que detecta un intervalo que tiene una característica transitoria de la señal de audio en el dominio de tiempo para determinar el tamaño de ventana utilizado para la transformada de dominio de tiempo a dominio de frecuencia utilizando el intervalo detectado.
19. Un aparato de decodificación de audio, caracterizado porque comprende: una unidad de asignación de bits que determina el número asignado de bits en unidades de punto decimal en función de cada banda de frecuencia, de modo que la Relación de Señal-a-Ruido (SNR) de un espectro existente en cada banda de frecuencia es maximizada dentro de un intervalo del número permisible de bits para un cuadro dado y ajusta el número asignado de bits determinado en función de cada banda de frecuencia; una unidad de decodificación que decodifica un espectro de audio incluido en un flujo de bits utilizando el número de bits ajustado en función de cada banda de frecuencia y la energía espectral; y una unidad de transformada inversa que transforma el espectro de audio decodificado en una señal de audio en el dominio de tiempo.
20. El aparato de decodificación de audio de conformidad con la reivindicación 19, caracterizado porque el tamaño de ventana utilizado en la unidad de transformada inversa es establecido en función de la información de la señalización de transitorio incluida en el flujo de bits.
21. El aparato de decodificación de audio de conformidad con la reivindicación 19, caracterizado porque la unidad de decodificación genera un componente de ruido para una banda de frecuencia que incluye una parte codificada en 0 y ajusta la energía del componente de ruido utilizando un nivel de ruido.
22. El aparato de decodificación de audio de conformidad con la reivindicación 19, caracterizado porque la unidad de decodificación genera un componente de ruido para una banda de frecuencia que incluye una parte codificada en 0 y ajusta la energía del componente de ruido utilizando una relación de la energía del componente de ruido con la energía espectral .
23. El aparato de decodificación de audio de conformidad con la reivindicación 19, caracterizado porque la unidad de decodificación genera un componente de ruido para una banda de frecuencia que incluye una parte codificada en 0 y ajusta la energía promedio del componente de ruido para que sea de 1.
24. Un aparato de decodificación de audio, caracterizado porque comprende: una unidad de asignación de bits que estima el número permisible de bits en unidades de punto decimal utilizando un umbral de enmascaramiento basado en las bandas de frecuencia incluidas en un cuadro dado, estima el número asignado de bits en unidades de punto decimal utilizando la energía espectral, y ajusta el número asignado de bits para que no exceda el número permisible de bits; una unidad de decodificación que decodifica un espectro de audio incluido en un flujo de bits utilizando el número de bits ajustado en función de cada banda de frecuencia y la energía espectral; y una unidad de transformada inversa que transforma el espectro de audio decodificado en una señal de audio en el dominio de tiempo.
25. El aparato de decodificación de audio de conformidad con la reivindicación 24, caracterizado porque el tamaño de ventana utilizado en la unidad de transformada inversa es establecido en función de la información de la señalización de transitorio incluida en el flujo de bits.
26. El aparato de decodificación de audio de conformidad con la reivindicación 24, caracterizado porque la unidad de decodificación genera un componente de ruido para una banda de frecuencia que incluye una parte codificada en 0 y ajusta la energía del componente de ruido utilizando un nivel de ruido.
27. El aparato de decodificación de audio de conformidad con la reivindicación 24, caracterizado porque la unidad de decodificación genera un componente de ruido para una banda de frecuencia que incluye una parte codificada en 0 y ajusta la energía del componente de ruido utilizando una relación de la energía del componente de ruido con la energía espectral .
28. El aparato de decodificación de audio de conformidad con la reivindicación 24, caracterizado porque la unidad de decodificación genera un componente de ruido para una banda de frecuencia que incluye una parte codificada en 0 y ajusta la energía promedio del componente de ruido para que sea de 1.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201161485741P | 2011-05-13 | 2011-05-13 | |
| US201161495014P | 2011-06-09 | 2011-06-09 | |
| PCT/KR2012/003777 WO2012157932A2 (en) | 2011-05-13 | 2012-05-14 | Bit allocating, audio encoding and decoding |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| MX2013013261A true MX2013013261A (es) | 2014-02-20 |
Family
ID=47141906
Family Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| MX2013013261A MX2013013261A (es) | 2011-05-13 | 2012-05-14 | Asignacion de bits, codificacion y decodificacion de audio. |
| MX2015005615A MX337772B (es) | 2011-05-13 | 2012-05-14 | Asignacion de bits, codificacion y decodificacion de audio. |
| MX2016003429A MX345963B (es) | 2011-05-13 | 2012-05-14 | Asignación de bits, codificación y decodificación de audio. |
Family Applications After (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| MX2015005615A MX337772B (es) | 2011-05-13 | 2012-05-14 | Asignacion de bits, codificacion y decodificacion de audio. |
| MX2016003429A MX345963B (es) | 2011-05-13 | 2012-05-14 | Asignación de bits, codificación y decodificación de audio. |
Country Status (15)
| Country | Link |
|---|---|
| US (7) | US9159331B2 (es) |
| EP (5) | EP2707874A4 (es) |
| JP (3) | JP6189831B2 (es) |
| KR (7) | KR102053899B1 (es) |
| CN (3) | CN105825859B (es) |
| AU (3) | AU2012256550B2 (es) |
| BR (1) | BR112013029347B1 (es) |
| CA (1) | CA2836122C (es) |
| MX (3) | MX2013013261A (es) |
| MY (2) | MY186720A (es) |
| RU (2) | RU2648595C2 (es) |
| SG (1) | SG194945A1 (es) |
| TW (5) | TWI562133B (es) |
| WO (2) | WO2012157932A2 (es) |
| ZA (1) | ZA201309406B (es) |
Families Citing this family (34)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20100266989A1 (en) | 2006-11-09 | 2010-10-21 | Klox Technologies Inc. | Teeth whitening compositions and methods |
| CN105825859B (zh) | 2011-05-13 | 2020-02-14 | 三星电子株式会社 | 比特分配、音频编码和解码 |
| TWI605448B (zh) * | 2011-06-30 | 2017-11-11 | 三星電子股份有限公司 | 產生帶寬延伸訊號的裝置 |
| US8586847B2 (en) * | 2011-12-02 | 2013-11-19 | The Echo Nest Corporation | Musical fingerprinting based on onset intervals |
| US11116841B2 (en) | 2012-04-20 | 2021-09-14 | Klox Technologies Inc. | Biophotonic compositions, kits and methods |
| CN103854653B (zh) | 2012-12-06 | 2016-12-28 | 华为技术有限公司 | 信号解码的方法和设备 |
| PL2933799T3 (pl) | 2012-12-13 | 2017-12-29 | Panasonic Intellectual Property Corporation Of America | Urządzenie kodujące głos, urządzenie dekodujące głos, sposób kodowania głosu i sposób dekodowania głosu |
| CN103107863B (zh) * | 2013-01-22 | 2016-01-20 | 深圳广晟信源技术有限公司 | 一种分段平均码率的数字音频信源编码方法及装置 |
| SG11201505893TA (en) * | 2013-01-29 | 2015-08-28 | Fraunhofer Ges Forschung | Noise filling concept |
| US20140276354A1 (en) | 2013-03-14 | 2014-09-18 | Klox Technologies Inc. | Biophotonic materials and uses thereof |
| CN108198564B (zh) | 2013-07-01 | 2021-02-26 | 华为技术有限公司 | 信号编码和解码方法以及设备 |
| CN110867190B (zh) * | 2013-09-16 | 2023-10-13 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
| EP3063761B1 (en) * | 2013-10-31 | 2017-11-22 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
| ES2969736T3 (es) | 2014-02-28 | 2024-05-22 | Fraunhofer Ges Forschung | Dispositivo de decodificación y método de decodificación |
| CN104934034B (zh) | 2014-03-19 | 2016-11-16 | 华为技术有限公司 | 用于信号处理的方法和装置 |
| EP4376304A3 (en) * | 2014-03-31 | 2024-07-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, encoding method, decoding method, and program |
| CN105336339B (zh) * | 2014-06-03 | 2019-05-03 | 华为技术有限公司 | 一种语音频信号的处理方法和装置 |
| US9361899B2 (en) * | 2014-07-02 | 2016-06-07 | Nuance Communications, Inc. | System and method for compressed domain estimation of the signal to noise ratio of a coded speech signal |
| EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
| EP3176780A4 (en) | 2014-07-28 | 2018-01-17 | Samsung Electronics Co., Ltd. | Signal encoding method and apparatus and signal decoding method and apparatus |
| EP3208800A1 (en) | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
| CN105957533B (zh) * | 2016-04-22 | 2020-11-10 | 杭州微纳科技股份有限公司 | 语音压缩方法、语音解压方法及音频编码器、音频解码器 |
| CN106782608B (zh) * | 2016-12-10 | 2019-11-05 | 广州酷狗计算机科技有限公司 | 噪声检测方法及装置 |
| CN108174031B (zh) * | 2017-12-26 | 2020-12-01 | 上海展扬通信技术有限公司 | 一种音量调节方法、终端设备及计算机可读存储介质 |
| US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
| US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
| US10580424B2 (en) * | 2018-06-01 | 2020-03-03 | Qualcomm Incorporated | Perceptual audio coding as sequential decision-making problems |
| US10734006B2 (en) | 2018-06-01 | 2020-08-04 | Qualcomm Incorporated | Audio coding based on audio pattern recognition |
| CN108833324B (zh) * | 2018-06-08 | 2020-11-27 | 天津大学 | 一种基于时域限幅噪声消除的haco-ofdm系统接收方法 |
| CN108922556B (zh) * | 2018-07-16 | 2019-08-27 | 百度在线网络技术(北京)有限公司 | 声音处理方法、装置及设备 |
| WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
| CN110265043B (zh) * | 2019-06-03 | 2021-06-01 | 同响科技股份有限公司 | 自适应有损或无损的音频压缩和解压缩演算方法 |
| EP4601299A1 (en) | 2019-11-01 | 2025-08-13 | Samsung Electronics Co., Ltd. | Hub device, multi-device system including the hub device and plurality of devices, and operating method of the hub device and multi-device system |
| EP4478355A1 (en) * | 2023-06-16 | 2024-12-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder and method for coding of frames using a quantization noise shaping |
Family Cites Families (72)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4899384A (en) * | 1986-08-25 | 1990-02-06 | Ibm Corporation | Table controlled dynamic bit allocation in a variable rate sub-band speech coder |
| JPH03181232A (ja) | 1989-12-11 | 1991-08-07 | Toshiba Corp | 可変レート符号化方式 |
| JP2560873B2 (ja) * | 1990-02-28 | 1996-12-04 | 日本ビクター株式会社 | 直交変換符号化復号化方法 |
| JPH0414355A (ja) | 1990-05-08 | 1992-01-20 | Matsushita Electric Ind Co Ltd | 構内交換機のリンガ信号送出方法 |
| JPH04168500A (ja) * | 1990-10-31 | 1992-06-16 | Sanyo Electric Co Ltd | 信号符号化方法 |
| JPH05114863A (ja) * | 1991-08-27 | 1993-05-07 | Sony Corp | 高能率符号化装置及び復号化装置 |
| JP3141450B2 (ja) | 1991-09-30 | 2001-03-05 | ソニー株式会社 | オーディオ信号処理方法 |
| EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
| JP3153933B2 (ja) * | 1992-06-16 | 2001-04-09 | ソニー株式会社 | データ符号化装置及び方法並びにデータ復号化装置及び方法 |
| JP2976701B2 (ja) * | 1992-06-24 | 1999-11-10 | 日本電気株式会社 | 量子化ビット数割当方法 |
| JPH06348294A (ja) * | 1993-06-04 | 1994-12-22 | Sanyo Electric Co Ltd | 帯域分割符号化装置 |
| TW271524B (es) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
| US5893065A (en) * | 1994-08-05 | 1999-04-06 | Nippon Steel Corporation | Apparatus for compressing audio data |
| KR0144011B1 (ko) * | 1994-12-31 | 1998-07-15 | 김주용 | 엠펙 오디오 데이타 고속 비트 할당 및 최적 비트 할당 방법 |
| DE19638997B4 (de) * | 1995-09-22 | 2009-12-10 | Samsung Electronics Co., Ltd., Suwon | Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung |
| US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
| JP3189660B2 (ja) | 1996-01-30 | 2001-07-16 | ソニー株式会社 | 信号符号化方法 |
| JP3328532B2 (ja) * | 1997-01-22 | 2002-09-24 | シャープ株式会社 | デジタルデータの符号化方法 |
| KR100261254B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
| JP3802219B2 (ja) * | 1998-02-18 | 2006-07-26 | 富士通株式会社 | 音声符号化装置 |
| JP3515903B2 (ja) * | 1998-06-16 | 2004-04-05 | 松下電器産業株式会社 | オーディオ符号化のための動的ビット割り当て方法及び装置 |
| JP2000148191A (ja) * | 1998-11-06 | 2000-05-26 | Matsushita Electric Ind Co Ltd | ディジタルオーディオ信号の符号化装置 |
| TW477119B (en) * | 1999-01-28 | 2002-02-21 | Winbond Electronics Corp | Byte allocation method and device for speech synthesis |
| JP2000293199A (ja) * | 1999-04-05 | 2000-10-20 | Nippon Columbia Co Ltd | 音声符号化方法および記録再生装置 |
| US6687663B1 (en) * | 1999-06-25 | 2004-02-03 | Lake Technology Limited | Audio processing method and apparatus |
| US6691082B1 (en) | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
| JP3616307B2 (ja) * | 2000-05-22 | 2005-02-02 | 日本電信電話株式会社 | 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体 |
| JP2002006895A (ja) * | 2000-06-20 | 2002-01-11 | Fujitsu Ltd | ビット割当装置および方法 |
| JP4055336B2 (ja) * | 2000-07-05 | 2008-03-05 | 日本電気株式会社 | 音声符号化装置及びそれに用いる音声符号化方法 |
| JP4190742B2 (ja) | 2001-02-09 | 2008-12-03 | ソニー株式会社 | 信号処理装置及び方法 |
| DE60209888T2 (de) * | 2001-05-08 | 2006-11-23 | Koninklijke Philips Electronics N.V. | Kodieren eines audiosignals |
| US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
| KR100462611B1 (ko) * | 2002-06-27 | 2004-12-20 | 삼성전자주식회사 | 하모닉 성분을 이용한 오디오 코딩방법 및 장치 |
| US7272566B2 (en) * | 2003-01-02 | 2007-09-18 | Dolby Laboratories Licensing Corporation | Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique |
| FR2849727B1 (fr) * | 2003-01-08 | 2005-03-18 | France Telecom | Procede de codage et de decodage audio a debit variable |
| JP2005202248A (ja) * | 2004-01-16 | 2005-07-28 | Fujitsu Ltd | オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路 |
| US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
| JP2005265865A (ja) * | 2004-02-16 | 2005-09-29 | Matsushita Electric Ind Co Ltd | オーディオ符号化のためのビット割り当て方法及び装置 |
| CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
| KR100695125B1 (ko) * | 2004-05-28 | 2007-03-14 | 삼성전자주식회사 | 디지털 신호 부호화/복호화 방법 및 장치 |
| US7725313B2 (en) * | 2004-09-13 | 2010-05-25 | Ittiam Systems (P) Ltd. | Method, system and apparatus for allocating bits in perceptual audio coders |
| US7979721B2 (en) * | 2004-11-15 | 2011-07-12 | Microsoft Corporation | Enhanced packaging for PC security |
| CN1780278A (zh) * | 2004-11-19 | 2006-05-31 | 松下电器产业株式会社 | 子载波通信系统中自适应调制与编码方法和设备 |
| KR100657948B1 (ko) * | 2005-02-03 | 2006-12-14 | 삼성전자주식회사 | 음성향상장치 및 방법 |
| DE202005010080U1 (de) | 2005-06-27 | 2006-11-09 | Pfeifer Holding Gmbh & Co. Kg | Verbindungsvorrichtung |
| US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
| US7734053B2 (en) * | 2005-12-06 | 2010-06-08 | Fujitsu Limited | Encoding apparatus, encoding method, and computer product |
| US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
| JP2007264154A (ja) * | 2006-03-28 | 2007-10-11 | Sony Corp | オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置 |
| SG136836A1 (en) * | 2006-04-28 | 2007-11-29 | St Microelectronics Asia | Adaptive rate control algorithm for low complexity aac encoding |
| JP4823001B2 (ja) * | 2006-09-27 | 2011-11-24 | 富士通セミコンダクター株式会社 | オーディオ符号化装置 |
| US7953595B2 (en) * | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
| KR101291672B1 (ko) * | 2007-03-07 | 2013-08-01 | 삼성전자주식회사 | 노이즈 신호 부호화 및 복호화 장치 및 방법 |
| PT2186089T (pt) | 2007-08-27 | 2019-01-10 | Ericsson Telefon Ab L M | Método e dispositivo para descodificação espetral percetual de um sinal áudio que inclui preenchimento de buracos espetrais |
| CN101790757B (zh) * | 2007-08-27 | 2012-05-30 | 爱立信电话股份有限公司 | 语音与音频信号的改进的变换编码 |
| CN101239368A (zh) | 2007-09-27 | 2008-08-13 | 骆立波 | 异型盖整平模具及其整平方法 |
| US8280744B2 (en) * | 2007-10-17 | 2012-10-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio object encoder, method for decoding a multi-audio-object signal, multi-audio-object encoding method, and non-transitory computer-readable medium therefor |
| US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
| EP2077551B1 (en) * | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
| US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
| US8364471B2 (en) | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
| US8463599B2 (en) | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
| CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
| CN102884575A (zh) * | 2010-04-22 | 2013-01-16 | 高通股份有限公司 | 话音活动检测 |
| CN101957398B (zh) | 2010-09-16 | 2012-11-28 | 河北省电力研究院 | 一种基于机电与电磁暂态混合仿真技术检测计算电网一次时间常数的方法 |
| JP5609591B2 (ja) * | 2010-11-30 | 2014-10-22 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
| FR2969805A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
| DK2975611T3 (en) * | 2011-03-10 | 2018-04-03 | Ericsson Telefon Ab L M | FILLING OF UNCODED SUBVECTORS IN TRANSFORM CODED AUDIO SIGNALS |
| JP5648123B2 (ja) * | 2011-04-20 | 2015-01-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 |
| CN105825859B (zh) * | 2011-05-13 | 2020-02-14 | 三星电子株式会社 | 比特分配、音频编码和解码 |
| DE102011106033A1 (de) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels |
| RU2505921C2 (ru) * | 2012-02-02 | 2014-01-27 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ и устройство кодирования и декодирования аудиосигналов (варианты) |
-
2012
- 2012-05-14 CN CN201610341675.1A patent/CN105825859B/zh active Active
- 2012-05-14 KR KR1020120051070A patent/KR102053899B1/ko active Active
- 2012-05-14 MY MYPI2017001633A patent/MY186720A/en unknown
- 2012-05-14 WO PCT/KR2012/003777 patent/WO2012157932A2/en not_active Ceased
- 2012-05-14 JP JP2014511291A patent/JP6189831B2/ja active Active
- 2012-05-14 EP EP12785222.6A patent/EP2707874A4/en not_active Ceased
- 2012-05-14 KR KR1020120051071A patent/KR102053900B1/ko active Active
- 2012-05-14 BR BR112013029347-0A patent/BR112013029347B1/pt active IP Right Grant
- 2012-05-14 TW TW101117139A patent/TWI562133B/zh active
- 2012-05-14 CN CN201280034734.0A patent/CN103650038B/zh active Active
- 2012-05-14 EP EP12786182.1A patent/EP2707875A4/en not_active Ceased
- 2012-05-14 EP EP18170208.5A patent/EP3385949A1/en active Pending
- 2012-05-14 US US13/471,046 patent/US9159331B2/en active Active
- 2012-05-14 MX MX2013013261A patent/MX2013013261A/es active IP Right Grant
- 2012-05-14 TW TW106103488A patent/TWI604437B/zh active
- 2012-05-14 CA CA2836122A patent/CA2836122C/en active Active
- 2012-05-14 WO PCT/KR2012/003776 patent/WO2012157931A2/en not_active Ceased
- 2012-05-14 RU RU2013155482A patent/RU2648595C2/ru active
- 2012-05-14 TW TW105133790A patent/TWI606441B/zh active
- 2012-05-14 MY MYPI2013004216A patent/MY164164A/en unknown
- 2012-05-14 RU RU2018108586A patent/RU2705052C2/ru active
- 2012-05-14 MX MX2015005615A patent/MX337772B/es unknown
- 2012-05-14 TW TW105133789A patent/TWI576829B/zh active
- 2012-05-14 CN CN201610341124.5A patent/CN105825858B/zh active Active
- 2012-05-14 TW TW101117138A patent/TWI562132B/zh active
- 2012-05-14 EP EP21193627.3A patent/EP3937168A1/en active Pending
- 2012-05-14 SG SG2013084173A patent/SG194945A1/en unknown
- 2012-05-14 MX MX2016003429A patent/MX345963B/es unknown
- 2012-05-14 US US13/471,020 patent/US9236057B2/en active Active
- 2012-05-14 EP EP18158653.8A patent/EP3346465A1/en not_active Ceased
- 2012-05-14 AU AU2012256550A patent/AU2012256550B2/en active Active
-
2013
- 2013-12-12 ZA ZA2013/09406A patent/ZA201309406B/en unknown
-
2015
- 2015-10-09 US US14/879,739 patent/US9489960B2/en active Active
- 2015-12-11 US US14/966,043 patent/US9711155B2/en active Active
-
2016
- 2016-11-07 US US15/330,779 patent/US9773502B2/en active Active
- 2016-11-23 AU AU2016262702A patent/AU2016262702B2/en active Active
-
2017
- 2017-05-10 JP JP2017094252A patent/JP2017194690A/ja not_active Ceased
- 2017-07-17 US US15/651,764 patent/US10276171B2/en active Active
- 2017-09-25 US US15/714,428 patent/US10109283B2/en active Active
-
2018
- 2018-01-16 AU AU2018200360A patent/AU2018200360B2/en active Active
-
2019
- 2019-04-18 JP JP2019079583A patent/JP6726785B2/ja active Active
- 2019-12-03 KR KR1020190159364A patent/KR102193621B1/ko active Active
- 2019-12-03 KR KR1020190159358A patent/KR102209073B1/ko active Active
-
2020
- 2020-12-15 KR KR1020200175854A patent/KR102284106B1/ko active Active
-
2021
- 2021-01-22 KR KR1020210009642A patent/KR102409305B1/ko active Active
-
2022
- 2022-01-03 KR KR1020220000533A patent/KR102491547B1/ko active Active
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102491547B1 (ko) | 비트할당방법, 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 기록매체와 이를 채용하는 멀티미디어 기기 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FG | Grant or registration |