MX2010012343A - Aparato, metodo y programa de computacion para generar una representacion de una señal de ancho de banda ampliado en base a la representacion de una señal de entrada utilizando una combinacion de una ampliacion de ancho de banda armonico y una amplia - Google Patents
Aparato, metodo y programa de computacion para generar una representacion de una señal de ancho de banda ampliado en base a la representacion de una señal de entrada utilizando una combinacion de una ampliacion de ancho de banda armonico y una ampliaInfo
- Publication number
- MX2010012343A MX2010012343A MX2010012343A MX2010012343A MX2010012343A MX 2010012343 A MX2010012343 A MX 2010012343A MX 2010012343 A MX2010012343 A MX 2010012343A MX 2010012343 A MX2010012343 A MX 2010012343A MX 2010012343 A MX2010012343 A MX 2010012343A
- Authority
- MX
- Mexico
- Prior art keywords
- representation
- patch
- domain
- values
- signal
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Complex Calculations (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Stored Programmes (AREA)
Abstract
Un aparato para generar una representación de una señal de ancho de banda ampliado sobre la base de la representación de una señal de entrada comprende un vocodificador de fases configurado para obtener los valores de una representación en el dominio espectral de un primer parche de la señal de ancho de banda ampliado sobre la base de la representación de la señal de entrada. El aparato comprende además una copiadora de valores configurada para copiar una serie de valores de la representación en el dominio espectral del primer parche, valores que son provistos por el vocodificador de fases, para obtener una serie de valores de una representación en el dominio espectral de un segundo parche, donde el segundo parche está asociado a frecuencias más elevadas que el primer parche. El aparato está configurado para obtener la representación de la señal de ancho de banda ampliado usando los valores de la representación en el dominio espectral del primer parche y los valores de la representación en el dominio espectral del segundo parche.
Description
APARATO, MÉTODO Y PROGRAMA DE COMPUTACIÓN NERAR UNA REPRESENTACIÓN DE UNA SEÑAL DE ANCHO D AMPLIADO EN BASE A LA REPRESENTACIÓN DE UNA SEÑ ENTRADA UTILIZANDO UNA COMBINACIÓN DE UNA AMPLIAC CHO DE BANDA ARMÓNICO Y UNA AMPLIACIÓN DE ANCHO
NO ARMÓNICO
Descripción
Campo Técnico
Las realizaciones de acuerdo con la invención se relacionan con generar una representación de una seña! de ancho de banda am ase de la representación de una señal de entrada. Otras realiz rdo con la invención se relacionan con un método para g esentación de una señal de ancho de banda ampliado que se esentación de una señal de entrada. Otras realizaciones de acu
ado, se forzaba a los codificadores a reducir drásticamente el anch audio transmitido cuando sólo se disponía de una velocidad de tran muy baja. Los codees (codifjcador-decodificador) de audio modern ificar las señales de banda ancha utilizando métodos de ampliación banda (BWE). Esos métodos han sido descriptds, por ejemp rendas [1] a [12]. Estos algoritmos se basan en una repr métrica del contenido de alta frecuencia (HF), que se genera des baja frecuencia (LF) con codificación de forma de onda d odificada por medio de la transposición a la región espectr roducción de parche") y la aplicación de un post procesamiento pro parámetros.
E la técnica, se utilizan métodos de ampliación del ancho de b o replicación de la banda espectral (SBR) como método eficiente p ales de alta frecuencia en los codees basados en HFR (reconstrucc uencia).
La replicación de la banda espectral (SBR) descripta en la refer ue también se hace referencia en forma breve como "SBR", utiliza u
En la SBR standard, la introducción de parches siempre se ll iante una operación de copia dentro del dominio de QMF. Se ha esto puede llevar, en ocasiones, a artefactos auditivos, especialn ian sinusoides cerca de otras en el borde de la LF y la parte de HF consiguiente, se puede afirmar que la SBR standard tiene el pr erar artefactos auditivos. Asimismo, algunas implementaciones conv concepto de ampliación de ancho de banda traen aparejada una c parativamente elevada. Más aun, en algunas implementacio nción de los conceptos de ampliación del ancho de banda, el e a muy ralo en el caso de los parches altos (factores de extensión el puede dar lugar a distorsiones de audio incompatibles (audibles).
En vista de la explicación que antecede, un objetivo de l nción consiste en crear un concepto para generar la representaci al de ampliación de ancho de banda sobre la base de la representa al dé entrada, lo que trae aparejada una relación mejorada entre co ad de audio.
Síntesis de la invención
el vocodificador de fase, para obtener una serie de valore esentación del dominio espectral de un segundo parche. El segu asociado a frecuencias más elevadas que el primer parche. El a figurado para obtener la representación de la señal de ancho liado usando los valores de la representación del dominio espectral he y los valores de la representación del dominio espectral d he.
El concepto clave de la presente invención es que se obtiene u icularmente favorable entre la complejidad informática y la calidad d señal de ancho de banda ampliado combinando Un vocodificador e copiadora de valores, de tal manera que el primer parche de l ho -de banda ampliado sea obtenida por el vocodificador en fas undo parche de la señal de ancho de banda ampliado se obteng e del uso de la copiadora de valores por el primer parche. En conse tenido del primer parche es una versión transpuesta armónica tenido de la parte de baja frecuencia (LF) de la señal de entrada (re
s (es decir, comprenden valores que no son cero), de tal man zcan o eviten las distorsiones audibles, que se producirían en algun l segundo parche estuviera sólo escasamente cargado de datos.
Para resumir, el concepto de la invención trae aparejadas co tajas con respecto a los métodos de introducción convencionales d ue la ampliación armónica del ancho de banda, se aplica só nción de valores de representación del dominio espectral del prirr ecir, para la parte inferior del espectro, en tanto que la ampliación n ancho de banda, que se basa en la copia de valores de la represe inio espectral del primer parche para obtener valores de la represe inio espectral del primer parche, es utilizada para frecuencias sup secuencia, el rango inferior (que también se denomina "primer pa ción de frecuencia de la ampliación (que es una porción de frec ima de la frecuencia de cruce) se presenta como ampliación ar go de la frecuencia fundamental (es decir, en el rango de frecuencia entrada, que cubre frecuencias inferiores a las frecuencias de la
En resumen, el concepto de la presente invención da origen a resión auditiva con una complejidad informática comparativamente b
En una realización preferida el vocodificador de fases está config iar una serie de valores de magnitud asociados con una plu rangos de frecuencia dados de la representación espectral de en ner una serie de valores de magnitud asociados con los sub uencias correspondientes del primer parche, donde un par de un s uencia dado de la representación espectral de entrada y un corre rango de frecuencias del primer parche abarca (o comprende) un pa una frecuencia fundamental y u armónico de la frecuencia funda plo un primer armónico de la frecuencia fundamental). El vocod s también está configurado, preferentemente, para multiplicar los s asociados con la pluralidad de subrangos de frecuencia da resentación espectral de entrada por un factor predeterminado (por a obtener valores de fases asociados con los correspondientes su
uenciá. Los subrangos de frecuencias pueden ser, por ejemplo, uencias asociados a los coeficientes de una Transformada Rápida cualquier transformada comparable). Por otro lado, los sub uencias pueden ser rangos de frecuencias asociados a señales indi anco de filtros QMF. Por lo general, el ancho de los subrangos de f omparativamente pequeño en comparación con la frecuencia cen los subrangos de frecuencias cubren un intervalo de frecuencias relación de frecuencias entre una frecuencia de partida ificativamente inferior a 2:1. En otras palabras, aunque los sub uencias de la representación espectral de entrada (que puede tom ejemplo, de coeficientes FFT, o la forma de señales de bancos de fi es indispensable que los subrangos de frecuencias del primer p damente armónicos entre sí, por lo general es posible iden ciación entre un subrango de frecuencias (por ej., con un índice de e la representación espectral de entrada y un correspondiente s uencias (por ej., con un índice de frecuencia 2k) del primer parche, ubrango de frecuencias (2k) del primer parche representa, por
En una realización preferida, la copiadora de valores está config iar los valores, de manera tal que se obtiene un desplazamient ún (o desplazamiento de frecuencia) de los valores del primer pa valores del segundo parche.
En una realización preferida, el vocodificador de fases está obtener los valores de la representación del dominio espectral he por lo que los valores de la representación del dominio espectral che representan una versión armónicamente convertida con el uencia de un rango de la frecuencia fundamental de la represent al de entrada (por ejemplo, un rango de la frecuencia fundamental una frecuencia denominada de cruce). La copiadora de va figurada preferentemente para obtener los valores de la represe inio espectral del segundo parche de manera tal que los val resentación del dominio espectral del segundo parche representan desplazamiento de frecuencia del primer parche. En consec
n dominio de la frecuencia, a fin de obtener la representación de l ada. El aparato también está configurado preferentemente para res de magnitud ak (los que también se designan con la denomin res de fase cpk, que representan un colector de frecuencia k (don ce de colector de frecuencia) de la representación de la señal de copiar los valores de magnitud valores de magnitud ak, a fin res de magnitud copiados ask (también designados con la notaci esentan un colector de frecuencia con un índice de colector de fre primer parche, donde s es un factor de extensión con s=2. Más aun, configurado preferentemente para copiar y escalar los valores ciados a un colector de frecuencia con un índice de colector de frec presentación de la señal de entrada, para obtener valores de fase alados qpsk asociados con un colector de frecuencia que tiene un uencia sk del primer parche. Además, el aparato está erentemente para copiar los valores pk^ asociados con un uencia k- ?? de la representación del dominio espectral del primer p ner los valores k de la representación del dominio espectral d
l dominio de la frecuencia, en el cual se puede ejecutar una transf ominio espectral, por ejemplo en un dominio FFT o un dominio QMF
En una realización preferida, el aparato comprende un conv inio del tiempo al dominio espectral (por ejemplo, un medio de Tr ida de Fourier o un banco de filtros QMF) configurado para prod esentación de la señal de entrada, valores de una representa inio espectral (por ejemplo, coeficientes de Transformada Rápida d ales de subbandas QMF) de una señal de audio de entrada, o de iamente procesada (por ej. con número de muestras reducida y/o tana) de la señal de audio de entrada (por ejemplo una señal mo ificación de pulsos provista por el núcleo de un decodificador de rato comprende preferentemente un convertidor del dominio e inio del tiempo (por ejemplo, u medio de Transformada Rápida rsa o un medio de síntesis de QMF) configurado para pr esentación en el dominio del tiempo de la señal de ancho de band leando los valores de la representación del dominio espectr ficientes de FFT o señales de subbandas de QMF) del primer p
ios de Transformada Rápida de Fourier o banco de filtros QMF), p ertidor del dominio espectral al dominio del tiempo está config esar un mayor número de colectores de frecuencia (por ej. col uencia por Transformada Rápida de Fourier o bandas de frecuencia convertidor del dominio del tiempo al dominio de la frecu secuencia, se obtiene una ampliación del ancho de banda por el he onvertidor del dominio espectral al dominio del tiempo comprende or de colectores de frecuencia que el convertidor del dominio de inio de la frecuencia.
En una realización preferida, el aparato comprende un ge tanas de análisis configurado para colocar en una ventana una señ el domino del tiempo, para obtener una versión en ventanas de l io de entrada en el dominio del tiempo, lo que constituye la base p epresentación de la señal de entrada. Además, el aparato com erador de ventanas de síntesis configurado para exhibir en v ción de una representación en el dominio del tiempo de la señal d da ampliado, para obtener una porción exhibida en venta
al de ancho de banda ampliado. La desviación temporal entre las desplazamiento en el tiempo que se superponen transitoriamente udio de entrada en el dominio del tiempo es menor o igual a un c itud de ventana de una ventana de análisis. Se ha descubiert erposición temporal comparativamente grande entre porciones adya plazamiento en el tiempo de la señal de audio ^e entrada en el d po (y/o una superposición temporal comparativamente grande iones con desplazamiento temporal adyacentes de la representa inio del tiempo de la señal de ancho de banda ampliado) da l liación del ancho de banda junto con una impresión auditiva favora se toman en cuenta las faltas de estactonaridad de la señal en erposición temporal comparativamente grande.
En una realización preferida, el aparato comprende un pr mación transitoria configurado para producir una información qu encia de un transitorio en la señal de entrada (representa esentación de la señal de entrada). El aparato comprende asi era rama de procesamiento para producir una representación de u
esamiento. En consecuencia, las porciones de la señal que comp itorio pueden ser tratadas con una resolución espectral mayor, lo artefactos audibles en presencia de transitorios. Por otra parte, ar una resolución espectral reducida para las porciones de sitorios (es decir, para porciones de la señal en las cuales el pr mación sobre transitorios no identifica un transitorio). De esa tiene elevada la eficiencia informática y sólo se utiliza la resolució entada cuando trae consigo ventajas (por ejemplo, si da lugar a esión auditiva en la proximidad de transitorios).
En una realización preferida, el aparato comprende un atenua ositivo de relleno con ceros) configurado para atenuar a cero u sitoria de la señal de entrada, a fin de obtener una porción poralmente ampliada de la señal de entrada. En este caso, la prime esamiento comprende un (primer) convertidor del dominio del inio de la frecuencia configurado para producir un primer número ominio espectral asociados con una primera porción no transitoria entrada, y la segunda rama de procesamiento comprende un
res cero de una porción de señal de ancho de banda ampliado re la base de la porción transitoria temporalmente ampliada de l ada. De esa manera se invierte la ampliación temporal de la señal se obtiene en virtud de la pérdida uniforme ajustada a cero.
En una realización preferida, el aparato comprende un reductor muestras configurado para reducir el número de muestra esentación en el dominio del tiempo de la señal de entrada. cción del número de muestras de la señal de entrada, se puede iencia informática si la señal de entrada no cubre la totalidad del da Nyquist de un flujo de entrada de muestras moduladas por codi os.
Otra realización de acuerdo con la presente invención da o rato, en el cual se invierte el orden de procesamiento del pro izado por la copiadora de valores y el vocodificador de fases. 15.
aparato para generar una representación de una señal de ancho liado sobre la base de la representación de una señal de entrada prende una copiadora de valores configurada para copiar una serie
uencia superiores a las del primer parche. El aparato está config ner la representación (120;426) de la señal de ancho de band leando los valores de la representación en el dominio espectral he y los valores de la representación en el dominio espectral d he.
Este aparato tiene la capacidad de obtener una señal de anch liado con una complejidad informática comparativamente baja, y o una buena impresión auditiva de la señal de ancho de banda a lizar la vocodificacion de fases después de la operación de odificador de fases puede ser operado con una relación de iparativamente pequeña (la relación entre la frecuencia de odificador y la frecuencia de entrada del vocodificado), lo que da n llenado espectral y evita la presencia de grandes agujeros e más, se ha encontrado que la impresión auditiva, utilizando este c mejor que en el caso de un concepto que se basa meramente en o copiado sin la acción de un vocodificador de fases, aunque el pri rche de frecuencia más baja) se obtenga utilizando la operación d
Otras realizaciones de acuerdo con la invención introducen mé erar una representación de una señal de ancho de banda amplia e de la representación de una señal de entrada. Dicho método se mas ideas que el aparato precedentemente descripto.
Otra realización de acuerdo con la presente invención produce u omputación para implementar el método.
Breve Descripción de las Figuras
La Fig. 1 ilustra un diagrama esquemático de bloques de un a generar una representación de una señal de ancho de banda ampli ase de la representación de una señal de entrada, de acuerdo con u ización de la invención;
La Fig. 2 ilustra una representación esquemática del co liación del ancho de banda de acuerdo con la presente invención;
La Fig. 3 ilustra un diagrama esquemático de bloques detall odificador de audio que comprende un aparato para ge resentación de una señal de ancho de banda ampliado sobre la resentación de una señal de entrada, de acuerdo con una realiz
La Fig. 6 ilustra un diagrama esquemático de bloque odificador de audio, de acuerdo con un segundo ejemplo comparativ
Descripción Detallada de las Realizaciones
1. Aparato de acuerdo con la Fig. 1
La Fig. 1 ilustra un diagrama esquemático de bloques de un a generar una representación de una señal de ancho de banda amp ase de la representación de una señal de entrada. El aparat figurado para recibir la representación de una señal de entrada 110 re la base de ésta, una señal de ancho de banda ampliado 120. El a prende un vocodificador de fases configurado para obtener los valo resentación del dominio espectral 130 de un primer parche de l ho de banda ampliado 120 sobre la base de la representación de l ada 110. Los valpres de la representación en el dominio espectral he se designan, por ejemplo, con las letras ß? a ß2?. El aparato 100 más una copiadora de valores 140 configurada para copiar un res de la representación .del dominio espectral 132 del primer parch
del segundo parche. Por ejemplo, la representación 120 de la seña anda ampliado puede comprender tanto los valores de la represent inio espectral 132 del primer parche como la representación en ectral 142 del segundo parche. Más aun, la representación 120 de I ho de banda ampliado puede comprender, por ejemplo, los valor esentación en el dominio espectral de la señal de entrada (represe plo, por la representación de la señal de entrada 110). Sin e esentación 120 de la señal de ancho de banda ampliado también representación en el dominio del tiempo, que se puede basar en la representación en el dominio espectral 132 del primer parche y la representación en el dominio espectral 142 del segundo ionalmente, otros valores, como por ejemplo los valores de la repr el dominio espectral 116 de la señal de entrada, y/o los valor resentación en el dominio espectral de parches adicionales).
A continuación se describe la funcionalidad y funcionamiento en forma detallada, tomando como referencia la Fig. 2, que esentacion esquemática del concepto de la invención para g
uencias que tiene un índice k de una conversión por QMF). La repr la señal de entrada 110 puede comprender, por ejemplo, los nitud ak correspondientes a k = 1 a k = ?, donde ? may designa un uencia de la denominada frecuencia de cruce y describe una frecu la ampliación de ancho de banda. También se describe un ra uencia fundamental, por ejemplo, mediante los valores de fases f?, ndice de colector de frecuencia, como se señalara anteriormente.
De manera similar, el primer parche está indicado por una serie na representación en el dominio espectral, por ejemplo, valores ß e ? y 2?. Por otro lado, el primer parche puede estar representado agnitud a?< y valores de fases cpk, con el índice de colector de frec e ? y 2?.
Cómo ya se mencionara, el vocodificador de fases 130 está ejecutar una transposición armónica sobre la base de la represent al de entrada 110 para obtener los valores de la representación d ectral 132 del primer parche. Para lograr este fin, el vocodificador d de establecer un valor de magnitud Q2k de un colector de frecuen
e el índice 2k puede ser un colector de frecuencia de la represe inio espectral 132 del primer parche. Además, un colector de frec e el índice 2k puede comprender una frecuencia que es un primer a frecuencia incluida en el colector de frecuencia que tiene el índice era se pueden obtener valores de magnitud <¾ y valores de qp2k, q res de la representación en el dominio espectral 132 del prim espondientes a 2k en el rango de ? a 2?, tal como <¾= Ok y q 2k=2q , y de manera equivalente, se pueden obtener valores ß2^ que son la representación del dominio espectral 132 del prime espondientes a 2k de entre ? y 2?, como por ejemplo ß? = akeJ2*k .
Para resumir, suponiendo que el colector de frecuencias que tien de manera equivalente, 2k y así sucesivamente), que son, p ctores de frecuencia de una representación de Transformada rier, están espaciados en dirección lineal en la frecuencia (de tal índice del colector de frecuencia, por ej. k o 2k, sea por ximadamente proporcional a una frecuencia comprendida en el ctor de frecuencia, por ejemplo una frecuencia central de un k°
esentado por los valores ß? a ß2? (o, de manera equivalente, por los nitud a? a c¾ y los valores de fase f? a f2?. En consecuencia, los v (o, de manera equivalente, los valores de magnitud c¾ a a3? y los f2? a f3?) de la representación del dominio espectral 142 d he se obtienen mediante un copiado no armónico, que es ejecut iadora de valores 140. Por ejemplo, se pueden obtener los valores rados de manera compleja ^ a ß3? de la representación del domini del segundo parche sobre la base de los correspondientes valores epresentación del dominio espectral 132 del primer parche de a ß -? en el caso de k entre 2? y 3 ?. Del mismo modo, se pueden obte magnitud c¾ a a3? de la representación del dominio espectral 142 d he sobre la base de los valores de magnitud de la representa inio espectral 132 del primer parche de acuerdo con ak=ak_^ en el e 2? y 3?. En este caso, se pueden obtener valores de fase f2? resentación del dominio espectral 142 del segundo parche sobre la res de fase q^ a f2? de la representación del dominio espectral 132 che de acuerdo con
en el caso de k entre 2? y 3?.
eñal de ancho de banda ampliado. Dependiendo de los re esentacion 120 de la señal de ancho de banda ampliado pued esentación del dominio espectral o una representación en el d po. Si se pretende obtener una representación en el dominio del de emplear un convertidor del dominio de la frecuencia al dominio derivar la representación en el dominio del tiempo sobre la b res ß? a ß2? de la representación del dominio espectral 132 del prim valores ß2? a ß de la representación del dominio espectral 142 d he. Por otro lado (y de manera equivalente), se pueden utilizar los F? a F2?, c¾ a a3? y F2? a ?3? para derivar la representación 120 de ho de banda ampliado (ya sea en el dominio espectral o en el d po).
Como se señalara anteriormente, el concepto descripto con res . 1 y 2 trae aparejado una buena impresión auditiva y complejidad tivamente baja. La vocodificación de fases sólo es necesaria una v utilice una pluralidad de parches (por ejemplo el primer parche y he). Además, se evita la existencia de grandes agujeros espect
inio espectral de un tercer parche sobre la base de los val esentación en el dominio espectral 132 del primer parche empl iadora de valores, como se describe en forma más detallada tom renda la Fig. 3.
Las realizaciones de acuerdo con las Figs 1 y 2 (y también izaciones) se pueden modificar de una amplia variedad de ma plo, se puede obtener un primer parche empleando un vocodificado puede obtener un segundo, tercer y cuarto parches mediante una opiado de los valores espectrales. Por otro lado, se puede obtener undo parches utilizando vocodificadores de fases, y se puede ero y un cuarto parches utilizando el copiado de valores espectrale ral, se pueden aplicar diferentes combinaciones de la ope dificación de fases y la operación de copiado.
Por otro lado, sin embargo, se puede obtener un primer parch operación de copiado (copiadora de valores) de los valores espect esentación de la señal de entrada, y se puede obtener un segun ando un vocodificador de fases (sobre la base de los valores co
El decodificador de audio 300 está configurado para recibir un fluj y para producir, basándose en los mismos, una forma de onda de ecodificador de audio 300 comprende un decodificador del núcle configurado para aportar, por ejemplo, datos modulados por codi os ("datos PCM") 322 sobre la base del flujo de datos 310. El decod leo 320 puede ser, por ejemplo, un decodificador de audio de acu cripto en la norma internacional ISO/IEC 14496-3:2005(e), parte parte 4: codificación general de audio (GA)-AAG, Twin VQ, plo, el decodificador del núcleo 320 puede ser un denominado de núcleo de codificación de audio avanzado (AAC), al que se de liadamente en dicha normal y que es muy conocido por la pe acitación en la técnica. Por consiguiente, los datos de audio mod ificación de pulsos 322 pueden ser producidos por el decodificador sobre la base del flujo de datos 310. Por ejemplo, los datos ulados por codificación de pulsos 322 pueden comprender una l dro de 1024 muestras.
El decodificador de audio 300 comprende además una amp
1
ase de éstos, datos QMF con parches 342. La ampliación del anch comprende asimismo un formateo de la envolvente (o formate olvente) 344, que recibe los datos QMF con parches 342 y datos de ateo de la envolvente 346 y produce, sobre ja base de estos, dato olvente formateada 348. La ampliación del ancho de banda 330 más una síntesis QMF (o sintetizador QMF) 350, que recibe los parches y envolvente formateada 348 y produce, sobre la base d ía de onda 312 mediante la ejecución de una síntesis QMF.
2.2. Provisión de datos QMF con Parche 340
2.2.1. Provisión de datos QMF con Parche - Reseña general
La provisión de datos QMF con parche 340 (que puede ser eje roveedor de datos QMF con parche 340 en una implementación de de ser conmutable entre dos modos, es decir un primer modo en uta la introducción de parches por replicacion de la banda espectr egundo modo en el cual se ejecuta la introducción de parches por ónica del ancho de banda (HBE). Por ejemplo, los datos de audio codificación de pulsos 322 pueden ser retardados por un retardado
El introductor de parches por replicación de la banda espectral izar, por ejemplo, la introducción de un parche por replicación d ectral, que se describe, por ejemplo,, en la sección 4.6.18 "SBR a internacional ISO/IEC 14496-3:2005(e), parte 3, subpar secuencia, el introductor de parches por replicación de la banda es de otorgar una representación del dominio QMF de 64 bandas.
Por otro lado, o además, el introductor de parches por ampliació ancho de banda 368 puede aportar una representación del dominio das 372, que es una representación de ancho de banda ampliado d audio PCM 322. Se puede utilizar un conmutador 374, al que endiendo de los datos de control de ampliación del ancho de aídos del flujo de datos 310, para decidir si se aplica la i n tro hes por replicación de la banda espectral 366 o la introducción de p liación armónica del ancho de banda 368 para obtener los datos he 342 (que pueden ser iguales a la representación del dominio das 370 o iguales a la representación del dominio QMF de 64 b endiendo del estado del conmutador 374) .
sformada Rápida de Fourier o a un dominio QMF), en el cual se liación armónica del ancho de banda en el dominio espectral, y en a la representación del dominio espectral de la señal de ancho liado obtenida, o una representación derivada de la mism ducción de parches por ampliación armónica del ancho de banda.
En la realización de la Fig. 3, se reduce el número de muestras d udio modulados por codificación de pulsos 322 por medio de un r ero de muestras 380, por ejemplo, en un factor de 2, para obten io modulados por codificación de pulsos con número de muestra . A continuación, los datos de audio modulados por codificación de ero de muestras reducido 381 son colocados en ventana por un ge tanas 382, que puede comprender, por ejemplo, una longitud de . Se debe tener en cuenta que la ventana tiene un desplaza plo, de 64 muestras de los datos de audio modulados por codi os con número de muestras reducido 381 en los pasos subsig cesamiento, por lo que se obtiene una superposición comparativam las porciones encuadradas en ventanas 383 de los datos de audio
Las porciones encuadradas en ventanas 383 de los datos de número de muestras reducido 381 pueden ser procesadas sele leando una primera rama de procesamiento 386 o una segund esamiento 388. La primera rama 386 se puede utilizar para pr ión rio transitoria encuadrada en ventana 383 de los datos de audi ero de muestras reducido (para lo cual el detector de transitorios 3 encia de un transitorio) y se puede utilizar una segunda rama 3 esamiento de una porción transitoria encuadrada en ventana 383 d audio PCM con número de muestras reducido (para lo cual el d sitorios 384 indica la presencia de un transitorio).
La primera rama 386 recibe una porción no transitoria encu tana 383. y produce, sobre la base de ésta, una representación d da ampliado 387, 434 de la porción encuadrada en ventana 383. ilar, la segunda rama 388 recibe una porción transitoria encuadrada de los datos de audio PCM con número de muestras reducido 381 re la base de estos, una representación de ancho de banda ampliad ión encuadrada en ventana (transitoria) 383. Como se indicara ant
sto que hay una superposición temporal considerable de las iones temporariamente encuadradas en ventanas 383).
La ampliación armónica del ancho de banda 368 comprende as ositivo de superposición y suma 390, que está configurado para su ar las diferentes representaciones de ancho de banda ampliad ciadas con diferentes porciones encuadradas en ventana (tem esivas) 383. Un incremento de superposición y suma puede ser aj plo, a 256 muestras. De esa manera se obtiene una señal sup ada 392.
La ampliación armónica del ancho de banda 368 comprende lizador QMF de 64 bandas 394, que está configurado para recib erpuesta y sumada 392 y producir, sobre la base de ésta, un iinio QMF de 64 bandas 396. La señal en dominio QMF de 64 b de representar, por ejemplo, un rango de frecuencias más amplio q ominio QMF de 32 bandas 365 provista por el analizador QMF de
La ampliación armónica del ancho de banda 368 comprende
amental) de la señal en dominio QMF de 64 bandas 372 están dét la salida del analizador QMF de 32 bandas 364, y de tal manera ponentes del rango de frecuencia superior de la señal en dominio das 372 están determinados por los 32 componentes del rango uencia de la señal en dominio QMF de 64 bandas 396.
Naturalmente, el número de componentes de las señales en F puede variar, dependiendo de los requerimientos específicos. Na posición de frecuencia de una transición entre un rango de la amental (también denominado rango de frecuencia más baja) y u uencias de ancho de banda ampliado (también denominado uencias más elevadas) puede depender de la frecuencia de e era equivalente, del ancho de banda de la señal de audio represent s de audio modulados por codificación de pulsos 322.
En los párrafos siguientes se describen detalles con respecto a a de procesamiento 386. La primera rama 386 comprende un con inio del tiempo al dominio de la frecuencia 400, que está implem plo, en la forma de un medio de Transformada Rápida de Fourier c
e los coeficientes de Transformada Rápida de Fourier. Además, a 386 comprende un dispositivo para producir valores de fase 404 c proporcionar valores de fase < k de los; coeficientes de Transform ourier.
La primera rama 386 comprende además un vocodificador de puede recibir los valores de magnitud ak y los valores de fas esentación de una señal de entrada, y que puede comprender la fu vocodificador de fases 130 antes descripto. En consecuencia, el vo ases 406 puede dar salida a valores ß2?, en un rango comprendid de una representación en el dominio espectral de un primer p res ß2 se designan con 408, y pueden ser equivalentes a los va esentación del dominio espectral 132 de un primer parche. La pri comprende además una copiadora de valores 410, que puede ionalidad de la copiadora de valores 140, y que puede rec rmación de entrada, los valores ß2? (por ej. en un rango comprendid . En consecuencia, la primera copiadora de valores 410 puede p res pk en un rango de ß2? a ß3?, los que se designan con 412 y que
rta valores espectrales ß3? a ß4? de úna representación del domini n tercer parche, la que también se designa 416.
La primera rama 386 puede comprender un interpolador opcion de estar configurado para recibir los valores 412, 416 de las repres l dominio espectral del segundo parche y del tercer parche (y, opci bién los valores 408 de la representación en el dominio espectral he) y para proporcionar valores interpolados 422 de la represent inio espectral del segundo y tercer parches (y, opcionalmente, t ier parche).
La primera rama 386 puede comprender además un atenuador está configurado para recibir los valores interpolados 422 (o, de l valores originales 412, 416) de las representaciones en el domini segundo y tercer parches (y, opcionalmente, también del prime a obtener, sobre la base de estas, una versión atenuada a cero de una representación del dominio espectral, que está atenuada a ce ptarla a una dimensión del convertidor del dominio espectral al po 428.
Tiinio del tiempo 430 de la porción de señal de ancho de banda ampl car una generación de ventanas de síntesis, a fin de ob resentacion en el dominio del tiempo encuadrada en ventana de si ión de señal de ancho de banda ampliado 430.
El decodificador de audio 300 comprende además un segundo cesamiento 388, que ejecuta un procesamiento muy similar en c el primer trayecto 386. Sin embargo, el segundo trayecto 388 co uador a cero en el dominio del tiempo 438, que está configurado orción transitoria encuadrada en ventana 383 de los datos de audio codificación de pulsos con número de pulsos reducido 381 y para
*
ión atenuada a cero 439 de la porción encuadrada en ventana era que el comienzo de la porción atenuada a cero 439 y el final d nuada a cero 439 estén atenuadas con ceros, y de tal manera que e dispuesto en una región central (entre las muestras iniciales atenu S muestras finales atenuadas a cero) de la porción atenuada a cero El segundo trayecto 388 comprende además un transformador tiempo al dominio espectral 440, por ejemplo, un Transformador
La segunda rama 388 comprende además un determinador de nitud 442 y un determinador de valores de fase 444, que pueden c isma funcionalidad que los medios correspondientes 402, 404 de a 386, aunque con dimensión incrementada N=1024. De modo unda rama 388 comprende además un vocodificador de fases iera copiadora de valores 450, una segunda copiadora de valor rpolador opcional 460 y un atenuador a cero opcional 464, prender las mismas funcionalidades que los medios correspondie era rama 386, aunque con dimensiones incrementadas. En p ce ? de la banda de cruce puede ser más elevado en la segunda ra a primera rama 386, por ejemplo, en un factor de 2.
En consecuencia, se puede enviar una representación del domini comprende, por ejemplo, 4096 coeficientes de Transformada rier a un Transformador Rápido de Fourier inverso 468, que a su v señal en el dominio del tiempo 470 que consta de 4096 muestras.
La segunda rama 388 comprende además un generador de v esis 472, que está configurado para otorgar una versión encu
En consecuencia, la representación en el dominio del tiempo 38 porciones no transitorias (por ej. cuadros de audio) de los dato ulados por codificación de pulsos 322, y la representación en el d po 478 se utiliza para porciones transitorias de los datos de audio codificación de pulsos 322. En consecuencia, las porciones trans esadas con una resolución más elevada en el dominio espe unda rama de procesamiento 388, en tanto que las porciones no procesadas con una resolución espectral más baja en la primer esamiento 386.
2.3. Formateo de Envolvente 344
A continuación se resume brevemente el formateo de envol más, se hace referencia a los respectivos comentarios present ión introductoria, que también se aplican al concepto de la invenció
Los datos QMF con parche 342, que se obtienen sobre la base el dominio QMF de 64 bandas 396, son procesados por el fo olvente 344, para obtener la representación de señal 348, que es o entrada al sintetizador QMF 350. El formateo de envolvente pue
ueden aplicar diferentes conceptos de formateo de envolvente de á requisitos.
3. Explicación v comparación de las diferentes soluciones
A continuación se presenta una breve explicación y resumen de a invención.
Las realizaciones de acuerdo con la presente invención, por rato 100 de acuerdo con la Fig. 1 y el decodificador de audio 300 la Fig. 3, son (o comprenden) nuevos algoritmos de parches d icación de la banda espectral (SBR). Se puede utilizar la intro hes en el dominio espectral de diferentes maneras para dar cue rentes características o restricciones de señal dictadas por los req oftware o hardware.
En la SBR normal, la introducción de parches se lleva a ca iante una operación de copia dentro del dominio QMF. Esto pued siones, a artefactos auditivos, especialmente si se copian sinusoi imidades unas de otras en el límite de la parte de LF y HF gener o, se ha introducido un nuevo algoritmo de parches que evi
s (factores de extensión elevados), que puede dar lugar a artefacto agradables.
Dos realizaciones evitan el alto número de Transformadas rier mediante el traslado de la generación de diferentes parches d tiempo al dominio de la frecuencia. En la Fig. 6, se presenta un eje l se obtiene la transformación al dominio de la frecuencia con ia ay sformada Rápida de Fourier. En lugar de la Transformación de den utilizar, sin embargo, otras transformaciones de tiempo-frecuen
La Fig. 3 ilustra una solución híbrida del algoritmo de la Fig. ducción de parches SBR. Sólo el primer parche es generado por vocodificador de fases (por ejemplo, el bloque 406 de la primera ra ue 446 de la segunda rama 388) en tanto que los parches sup plo, el segundo parche y el tercer parche) se generan sólo copiand he (por ejemplo, utilizando las copiadoras de valores 410, 414 de a 386, y/o las copiadoras de valores 450, 454 de la segunda rama n espectro menos ralo.
A continuación se explica brevemente el algoritmo de comparac
2. Se encuadra la señal en ventanas (Se proponen la de "Hann" aunque se pueden utilizar otras formas de ventana) los denominados granos (por ejemplo, las porciones de señal en en ventana 383) de longitudes N de la señal. Las ventanas se por la señal con un tamaño de salto H. Se propone una su N/H=8 veces.
3. Si el grano (por ejemplo, una porción de señal enc ventana 383) contiene un evento transitorio en los bordes, est (por ejemplo por el atenuador a cero 438) con ceros, lo que sobremuestreo en el dominio de la frecuencia.
4. Los granos se transforman al dominio de la frec ejemplo, usando los transformadores del dominio del tiempo espectral 400, 440).
5. Los granos en el dominio de la frecuencia son (opcionalmente) a una longitud de salida conveniente del al introducción de parches.
6. Se calcula la magnitud y la fase (por ejemplo, uti
fase para una nueva posición de muestreo (por ej., una p frecuencia) que se puede obtener utilizando el algoritmo descri documento o cualquier algoritmo alternativo.
8. Se pueden llenar colectores de frecuencia que no datos por el copiado mediante la aplicación de una función de in (por ejemplo, utilizando los interpoladores 420, 460).
9. Los granos se, transforman de nuevo al dominio (por ejemplo, utilizando los Transformadores Rápidos de Fouri
428, 468).
10. Los granos en el dominio del tiempo se multiplic ventana de síntesis (una vez más, se proponen las ventanas de ejemplo utilizando los generadores de ventanas de síntesis 432,
11. Eh caso de haberse llevado a cabo la atenuación a paso 3, se vuelven a eliminar los ceros (por ejemplo, utilizando el de ceros 476).
12. Se genera una señal o cuadro de ancho de band (por ejemplo, la señal 392), respectivamente, utilizando supe
Se encuadra en ventana la señal (Se proponen las ventanas que se pueden utilizar otras formas de ventana) y se toman los de os (por ejemplo, las porciones de señal encuadradas en ventan itudes N de la señal. Las ventanas se desplazan por la señal con alto H. Se propone una superposición N/H=8 veces.
Si el grano (por ejemplo, una porción de señal encuadrada en ve tiene un evento transitorio en los bordes, está rellenada (por eje uador a cero 438) con ceros, lo que lleva a un sobremuestreo en a frecuencia.
Los granos se transforman al dominio de la frecuencia (por ejem ransformadores del dominio del tiempo al dominio espectral 400, 44
Los granos en el dominio de la frecuencia son rellenados (opción longitud de salida conveniente del algoritmo de introducción de parc
Se calcula la magnitud y la fase (por ejemplo, utilizando los m 442, 444).
Se copia el contenido del colector de frecuencia a la po multiplica la fase por el
Los granos en el dominio del tiempo se multiplican por una v sis (una vez más, se proponen las ventanas de Hann) (por ejempl eneradores de ventanas de síntesis 432, 472).
En caso de haberse llevado a cabo la atenuación a cero en el ven a eliminar los ceros (por ejemplo, utilizando el eliminador de cer
Se genera una señal o cuadro de ancho de banda ampliado (por l 392), respectivamente, utilizando superposición y suma (OLA) (p ando la superposición y suma 390).
Sin embargo, también se puede intercambiar el orden de iduales en algunas realizaciones alternativas, y se pueden fusion s pasos en un solo paso en algunas realizaciones alternativas.
Por consiguiente, todos los pasos son idénticos en el alg rencia (que está implementado en el decodificador de audio ilustrad el algoritmo de la invención (que está implementado en el decod o ilustrado en la Fig. 3), excepto por el paso 7, que ha sido reemp iguientes pasos:
7.a) Se copia el contenido del colector de frecuencia a la posición
ctro en el plano de la SBR o la presentada en la Fig. 5 (ver, por rencia [13]).
Por ejemplo, las señales de voz se podrían beneficiar con el alg jecutado por el aparato, el decodificador de audio y el método de a igs. 1 , 2, 3 y 4, ya que se mantiene mejor la estructura de tren de ípica de las señales de voz, que con la estrategia presentada en la ·
Las aplicaciones más prominentes de las realizaciones de acue nción son los decodificadores de audio, que con frecuencia se imple ositivos manuales y, por consiguiente, funcionan con abasteci rgía por baterías.
4. Método de acuerdo con la Fig. 4.
A continuación se describe un método 400 para generar una repr a señal de ampliación del ancho de banda sobre la base de la repr na señal de entrada haciendo referencia a la Fig. 4, que ilustra un de ese método. El método 400 comprende un paso 410 que c ner los valores de una representación en el dominio espectral de
^
esentación de la señal de ancho de banda ampliado utilizando los presentacion en el dominio espectral del primer parche y los val esentación en el dominio espectral del segundo parche.
El método 400 puede ser complementado por cualquiera de lo ionalidades aquí descriptos con respecto al aparato de la invención.
5. Alternativas de implementación
Si bien se han descripto algunos aspectos en el contexto de u da claro que estos aspectos también representan una descripc odo correspondiente, en el que un bloque o dispositivo corresponde método o a una característica de un paso del método. De manera a ectos descriptos en el contexto de un paso del método repres cripción de un correspondiente bloque o elemento o característ espondiente aparato. Algunos o la totalidad de los pasos del méto ejecutados por medio de (o utilizando) un aparato de hardware, plo un microprocesador, una computadora programable o trónico. En algunas realizaciones, uno o más cualesquiera de los ortantes del método pueden ser ejecutados por ese aparato.
ramable de tal manera que se ejecute el método respectivo. Por l io de almacenamiento digital puede ser legible por computadora.
Algunas realizaciones de acuerdo con la invención comprenden u atos con señales de control aptas para leer electrónicamente, qu cidad de cooperar con un sistema de computación programable de se ejecute uno de los métodos aquí descriptos.
En general, las realizaciones de la presente invención s ementar en forma de producto programa de computación con un rama, donde el código de programa cumple la función de desarrol métodos al ejecutarse el programa de computación en una comp igo del programa puede estar almacenado, por ejemplo, en un porta una máquina.
Otras realizaciones comprenden el programa de computación pa de los métodos descriptos en la presente, almacenado en un porta una máquina.
En otras palabras, una realización del método de la invención co nto, en un programa de computación que consta de un código de
putación para ejecutar uno de los métodos aquí descriptos. El flujo cuencia de señales puede estar configurada, por ejemplo, para ser vés de una conexión de comunicaciones, por ejemplo por internet.
Otra realización comprende un medio de procesamiento, por ej putadora o un dispositivo lógico programable, configurado o ada utar uno de los métodos aquí descriptos.
Otra realización comprende una computadora que tiene instal ma el programa de computación para ejecutar uno de los mét criptos.
En algunas realizaciones, se puede utilizar un disposit ramable (por ejemplo una matriz de puertas programable en ca izar algunas o todas las funcionalidades descriptas en la presente. izaciones, una matriz de puertas programable en campo puede co microprocesador a fin de ejecutar uno de los métodos aquí des eral, los métodos se ejecutan preferentemente mediante cualquier ware.
Las realizaciones antes descriptas son meramente ilustrativ
6. Ejemplo comparativo de acuerdo con la Fig. 5
A continuación, se describe en forma breve un ejemplo c iendo referencia a la Fig. 5. La funcionalidad del ejemplo comp erdo con la Fig. 5 es similar a la función del decodificador de audio la Fig. 3, por lo que no se vuelven a explicar los medios y funcionali argo, el ejemplo comparativo de acuerdo con la Fig. 5 se basa en vocodificadores de fases 590, 592, 594, o 596, 597, 598 por sformadores Rápidos de Fourier inversos, los generadores de v esis, los dispositivos de superposición y suma individuales, están a vocodificadores de fases individuales, como se puede apreciar e más, en algunas de las subramas, se utiliza la reducción individual muestras (factor |) y el retardo individual (z " ^ ) . En conse rato 500 de acuerdo con la Fig. 5 no es tan eficiente desde el pun rmático como el aparato 300 de acuerdo con la Fig. 3. De todas rato 500 trae aparejadas significativas mejoras con respecto dificadores de audio convencionales.
7. Ejemplo comparativo de acuerdo con la Fig. 6
nos casos. De todas maneras, el aparato 500 trae consigo si oras con respecto a algunos decodificadores de audio convencional
8. Conclusión
En vista de la explicación que antecede, se puede apreciar que de acuerdo con la Fig. 1 , el decodificador de audio 300 de acuerdo el método 400 de acuerdo con la Fig. 4 presentan un número de v ecto a los ejemplos comparativos, que han sido descriptos en forma rencia a las Figs. 5 y 6.
El concepto de la invención se puede aplicar a una amplia v caciones y puede ser modificado en un gran número de formas. En Transformadores Rápidos de Fourier pueden ser reemplazados por s QMF y los Transformadores Rápidos de Fourier inversos p plazados por sintetizado res QMF.
Además, en algunas realizaciones, se pueden resumir algunos os de procesamiento en un solo paso. Por ejemplo, se puede sim uencia de procesamiento que comprende una síntesis QMF y u lisis QMF omitiendo las transformadas repetidas.
Referencias:
[1] M. Dietz, L. Liljeryd, K. Kjórling y O. Kunz, "Spe lication, a novel approach in audio coding," en la 112a. Convenció ich, mayo de 2002.
[2] S. Meltzer, R. Bóhm y F. Henn, "SBR enhanced audio tal broadcasting such as "Digital Radio Mondiale" (DR )," en vención de AES, Munich, mayo de 2002.
[3] T. Ziegler; A. Ehret, P. Ekstrand y M. Lutzky, "Enhancin : Features and Capabilities of the new mp3PRO Algorithm," e vención de AES, Munich, mayo de 2002.
[4] International Standard ISO/IEC 14496-3:2001 /FPDAM 1 , nsion," ISO/IEC, 2002. Speech bandwidth extensión method and u lyengar et al.
[5] E. Larsen, R. M. Aarts, y M. Danessis. Efficient high dwidth extensión of music and speech. En la 112a. Convenció ich, Alemania, mayo de 2002.
[6] R. M. Aarts, E. Larsen, y O. Ouweltjes. A unified approa
[9] E. Larsen, R. . Aarts, and M. Danessis. Efficient high dwidth extensión of music and speech. En la 112a. Convenció ich, Alemania, mayo de 2002.
[10] J. Makhoul. Spectral Analysis of Speech by Linear Predi sactions on Audio and Electroacoustics, AU-21(3), junio de 1973.
[11] , Solicitud de patente de los Estados Unidos 08/951 ,029, udio band width extending system and method.
[12] Patente de los Estados Unidos 6895375, Malah, D & tem for bandwidth extensión of Narrow-band speech.
[13] Frederik Nagel, Sascha Disch, "A harmonio bandwidth hod for audio codees," ICASSP International Conference on Acousti Signal Processing, IEEE CNF, Taipei, Taiwan, abril de 2009.
Claims (1)
- REIVINDICACIONES Habiendo así especialmente descripto y determinado la natura enté invención u la forma como la misma ha de ser llevada a la p ara reivindicar como de propiedad y derecho exclusivo: 1. Un aparato (100;386) para generar una representación (12 señal de ancho de banda ampliado sobre la base de la representa l de entrada (110; 383), donde el aparato comprende: un vocodificador de fases (130; 406) configurado par res (ß? ... ß2?, 408) de una representación en el dominio espectral d he de la señal de ancho de banda ampliado sobre la b esentación de la señal de entrada y una. copiadora de valores (140; 410,416) configurada para de valores (ß? ... (¾, 408) de la representación en el dominio es er parche, valores que son provistos por el vocodificador de f ner una serie de valores (ß2? ... ß3?, 408) de una representación en ctral de un segundo parche, donde el segundo parche está a uencias más elevadas ue el rimer arche ner una serie de valores de magnitud (a? ... c¾ ) asociado espondientes subrangos de frecuencias del primer parche, donde un par de un subrango de frecuencias dado de la represe eñal de entrada y de un subrango de frecuencias correspondiente he cubre un par de una frecuencia fundamental y un armó uencia fundamental, en el cual el vocodificador de fases (130; 406) está config iplicar valores de fase (f?/2 ... ??) asociados a la pluralidad de su uencias dados de la representación de la señal de entrada por eterminado, para obtener una serie de valores de fase (f? ... f2?) a orrespondientes subrangos de frecuencias del primer parche, y donde la copiadora de valores (140; 410) está configurada para e de valores (ß? ... ß2?) asociados a una pluralidad de subrangos uencias del primer parche, para obtener una serie de valores ( ciados a los correspondientes subrangos de frecuencias del segun de la copiadora de valores está configurada para dejar inalterados ase en el copiado. er parche por lo que los valores de la representación en el domini primer parche representan una versión armónicamente convertida e n rango de la frecuencia fundamental de la representación de l ada (110; 383) y donde la copiadora de valores (140;410) está configu ner los valores (ß2? ... ß3?) de la representación en el dominio esp ) del segundo parche por lo que los valores de la representación en ectral del segundo parche representan una versión con desplazam uencia del contenido de audio del primer parche. 5. El aparato (100; 380,382, 386) de acuerdo con u indicaciones 1 a 4, donde el aparato está configurado para recibi io de entrada (322), para reducir el número de muestras (380) de los datos d ada (322), a fin de obtener datos de audio con número reducido d ), para encuadrar en ventanas (382) los datos de audio con stras reducido (381), para obtener datos de entrada encuadrados e para usar (130; 406) una pluralidad de valores de magni esentan colectores de frecuencia con índices de colector de frecue esentación de la señal de entrada (383), para obtener valores de m representan colectores de frecuencia con índices de colector de fre primer parche, cuando s es un factor de extensión con s de entre 1 ,5 y 2,5 para copiar y escalar (130; 406) los valores de fase <pk a ctores de frecuencia que tienen índices de colector de frecuenc esentación de la señal de entrada (383), para obtener valores de fa iados y escalados asociados con colectores de frecuencia que tien olector de frecuencia 2k del primer parche, para copiar (140; 410) los valores k_¡? asociados a col iencia que tienen índices de colector de frecuencia k— ?? de la repr l dominio espectral (132;408) del primer parche, para obtener los va presentación en el dominio espectral (142; 412) del segundo parche para convertir (428) la representación (426) de la señal d da ampliado al dominio del tiempo, para obtener una representa señal de audio de entrada (322), o de una versión previamente ) de la señal de audio de entrada (322) y donde el aparato comprende un convertidor del dominio inio del tiempo (428) configurado para producir una representa inio del tiempo (430) de la señal de ancho de banda ampliado uti res (ß? ... ß2?, 408) de la representación del dominio espectral he y los valores (ß2? ... ßß?, 412) de la representación del dominio e undo parche; donde el convertidor del dominio espectral al dominio ) está configurado de tal manera que un número (N=2048) ectrales diferentes (426) recibidos por el convertidor del dominio inio del tiempo (428) sea mayor que un número (N=512) ectrales diferentes (401) provistos por el dominio del convertidor d tiempo al espectral (400), por lo que el convertidor del dominio e inio del tiempo (428) está configurado para procesar un número ctores de frecuencia que el convertidor del convertidor del dominio ominio espectral (400). donde el aparato comprende un generador de ventanas ) configurado para encuadrar en ventana una porción de una repr l dominio del tiempo (430) de la señal de ancho de banda amp ner una porción encuadrada en ventana (434) de la representa inio del tiempo de la señal de ancho, de banda ampliado. 8. El aparató (100; 382,386) de acuerdo con la reivindicació parato está configurado para procesar una pluralidad de por plazamiento temporal temporalmente superpuestas de la señal d ada en el dominio del tiempo (322), para obtener una pluralidad de desplazamiento temporal temporalmente superpuestas encua tanas (434) de la representación en el dominio del tiempo de la señ anda ampliado, donde un desvío en el tiempo (lnc=64) entre porc plazamiento en el tiempo temporalmente adyacentes de la señal d ada en el dominio del tiempo (322) es menor o igual a un cuarto de na ventana (512) del generador de ventana de análisis (382). 9. El aparato (100; 382,386) de acuerdo con una de las reivi liado sobre la base de una porción transitoria de la representación ntrada (383); donde la segunda rama de procesamiento (388) está c procesar una representación del dominio espectral (441) de la ada que tiene una resolución espectral más elevada- (N= 1024) esentación del dominio espectral (401) de la señal de entrada pro rimera rama de procesamiento (386). 10. El aparato (100; 382,386) de acuerdo con la reivindicaci la segunda rama de procesamiento (388) comprende un atenuado ominio del tiempo (438) configurado para atenuar a cero una p enido de transitorios (383) de la señal de entrada, a fin de obtener u contenido de transitorios temporalmente ampliada (439) de la ada y en el cual la primera rama de procesamiento (386) com ertidor del dominio del tiempo al dominio de la frecuencia (400) c producir un primer número (N=512) de valores en el dominio esp ciados a la porción no transitoria (383) de la señal de entrada y 11. El aparato (100; 382,386) de acuerdo con la reivindicació l la segunda rama de procesamiento comprende un eliminador de c igurado para eliminar una pluralidad de valores cero de una porció ncho de banda ampliado (474) obtenida sobre la base del la p enido de transitorios temporalmente ampliada (439) de la señal de e 12. El aparato (100; 380, 382,386) de acuerdo con un indicaciones .1 a 1 1, donde el aparato comprende un reductor del stras (380) configurado para reducir el número de muestra esentación en el dominio del tiempo (322) de la señal de entrada. 13. Un decodificador de audio (300) que comprende un ap ) de acuerdo con una de Jas reivindicaciones 1 a 12. 14. Un método (400) para generar una representación de un ho de banda ampliado sobre la base de la representación de un ada, método que comprende: obtener (410), utilizando una vocodificación de fases, los representación del dominio espectral de un primer parche de l ho de banda ampliado sobre la base de la representación de l er parche y los valores de la representación del dominio espectral d he. 15. Un aparato (100;386) para generar una representación (1 señal de ancho de banda ampliado sobre la base de la representac al de entrada (110; 383), aparato que comprende: una copiadora de valores configurada para copiar una serie de ?) de la representación de la señal de entrada, para obtener uñ res (ß? ... ß2?) de una representación en el dominio espectral de he, donde el primer parche está asociado a frecuencias más eleva esentación de la señal de entrada y un vocodificador de fases (130; 406) configurado pa res ( 2? ... ß3?) de una representación en el dominio espectral de u he de la señal de ancho de banda ampliado sobre la base de los v 2? de la representación en el dominio espectral del primer parch undo parche está asociado a frecuencias más elevadas que el prime donde el aparato está configurado para obtener la repr ;426) de la señal de ancho de banda ampliado utilizando los va ntrada, donde el primer parche está asociado a frecuencias más ele presentación de la señal de entrada y obtener, empleando una vocddificación de fases, una res de la representación del dominio espectral del segundo parch de una serie de valores de la representación del dominio espectral he, valores de la representación en el dominio espectral del primer obtenidos del copiado, donde el segundo parche está asociado a f elevadas que el primer parche y obtener (430) la representación de la señal de ancho liado empleando los valores de la representación del dominio es er parche y los valores de la representación del dominio espectral d he. 17. Un programa de computación para desarrollar el método la reivindicación 14 o la reivindicación 16, al ejecutarse el pr putación en una computadora.
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US16612509P | 2009-04-02 | 2009-04-02 | |
| US16806809P | 2009-04-09 | 2009-04-09 | |
| EP09181008A EP2239732A1 (en) | 2009-04-09 | 2009-12-30 | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
| PCT/EP2010/054422 WO2010112587A1 (en) | 2009-04-02 | 2010-04-01 | Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| MX2010012343A true MX2010012343A (es) | 2011-02-23 |
Family
ID=42123165
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| MX2011002419A MX2011002419A (es) | 2009-04-09 | 2010-04-01 | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio. |
| MX2010012343A MX2010012343A (es) | 2009-04-02 | 2010-04-01 | Aparato, metodo y programa de computacion para generar una representacion de una señal de ancho de banda ampliado en base a la representacion de una señal de entrada utilizando una combinacion de una ampliacion de ancho de banda armonico y una amplia |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| MX2011002419A MX2011002419A (es) | 2009-04-09 | 2010-04-01 | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio. |
Country Status (20)
| Country | Link |
|---|---|
| US (14) | US9697838B2 (es) |
| EP (3) | EP2239732A1 (es) |
| JP (2) | JP5227459B2 (es) |
| KR (2) | KR101248321B1 (es) |
| CN (2) | CN102177545B (es) |
| AR (3) | AR076199A1 (es) |
| AT (1) | ATE534119T1 (es) |
| AU (2) | AU2010233858B9 (es) |
| BR (1) | BRPI1003636B1 (es) |
| CA (2) | CA2721629C (es) |
| CO (1) | CO6311123A2 (es) |
| EG (1) | EG26400A (es) |
| ES (2) | ES2396686T3 (es) |
| MX (2) | MX2011002419A (es) |
| MY (2) | MY153798A (es) |
| PL (2) | PL2351025T3 (es) |
| RU (1) | RU2501097C2 (es) |
| SG (1) | SG174113A1 (es) |
| TW (2) | TWI492222B (es) |
| WO (2) | WO2010112587A1 (es) |
Families Citing this family (50)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| ES2374486T3 (es) | 2009-03-26 | 2012-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dispositivo y método para manipular una señal de audio. |
| RU2452044C1 (ru) * | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот |
| EP2239732A1 (en) | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
| JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
| PL4435778T3 (pl) * | 2010-01-19 | 2025-05-19 | Dolby International Ab | Transpozycja harmonicznych oparta na ulepszonym bloku pod-pasma |
| AU2015203065B2 (en) * | 2010-01-19 | 2017-05-11 | Dolby International Ab | Improved subband block based harmonic transposition |
| EP2362376A3 (en) * | 2010-02-26 | 2011-11-02 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using envelope shaping |
| JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
| JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
| WO2011128399A1 (en) * | 2010-04-16 | 2011-10-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension |
| CA2770287C (en) | 2010-06-09 | 2017-12-12 | Panasonic Corporation | Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus |
| CA3209829C (en) | 2010-07-19 | 2024-05-21 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
| US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
| JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
| JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
| PT2677519T (pt) * | 2011-02-18 | 2019-09-30 | Ntt Docomo Inc | Descodificador de voz, codificador de voz, método de descodificação de voz, método de codificação de voz, programa de descodificação de voz, e programa de codificação de voz |
| DE102011106034A1 (de) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Verfahren und Vorrichtung zur Spektralbandreplikation und Verfahren und System zur Audiodecodierung |
| US20130006644A1 (en) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Method and device for spectral band replication, and method and system for audio decoding |
| TWI605448B (zh) * | 2011-06-30 | 2017-11-11 | 三星電子股份有限公司 | 產生帶寬延伸訊號的裝置 |
| CN103035248B (zh) * | 2011-10-08 | 2015-01-21 | 华为技术有限公司 | 音频信号编码方法和装置 |
| USRE48258E1 (en) | 2011-11-11 | 2020-10-13 | Dolby International Ab | Upsampling using oversampled SBR |
| WO2013124445A2 (en) * | 2012-02-23 | 2013-08-29 | Dolby International Ab | Methods and systems for efficient recovery of high frequency audio content |
| EP2682941A1 (de) * | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
| EP2704142B1 (en) * | 2012-08-27 | 2015-09-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal |
| EP2709106A1 (en) | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
| US9258428B2 (en) | 2012-12-18 | 2016-02-09 | Cisco Technology, Inc. | Audio bandwidth extension for conferencing |
| CN103971693B (zh) | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
| AU2014211479B2 (en) | 2013-01-29 | 2017-02-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension |
| KR101775086B1 (ko) * | 2013-01-29 | 2017-09-05 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법 |
| KR102243688B1 (ko) | 2013-04-05 | 2021-04-27 | 돌비 인터네셔널 에이비 | 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더 |
| JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
| CN104217727B (zh) * | 2013-05-31 | 2017-07-21 | 华为技术有限公司 | 信号解码方法及设备 |
| EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
| WO2015041070A1 (ja) | 2013-09-19 | 2015-03-26 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
| EP3063761B1 (en) | 2013-10-31 | 2017-11-22 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
| EP2881943A1 (en) * | 2013-12-09 | 2015-06-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal with low computational resources |
| SG11201605015XA (en) | 2013-12-27 | 2016-08-30 | Sony Corp | Decoding device, method, and program |
| KR102244612B1 (ko) * | 2014-04-21 | 2021-04-26 | 삼성전자주식회사 | 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법 |
| EP2963648A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using vertical phase correction |
| KR102306537B1 (ko) | 2014-12-04 | 2021-09-29 | 삼성전자주식회사 | 소리 신호를 처리하는 방법 및 디바이스. |
| WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
| WO2016149085A2 (en) * | 2015-03-13 | 2016-09-22 | Psyx Research, Inc. | System and method for dynamic recovery of audio data and compressed audio enhancement |
| TWI771266B (zh) | 2015-03-13 | 2022-07-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
| JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
| EP3483878A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
| CN109036457B (zh) * | 2018-09-10 | 2021-10-08 | 广州酷狗计算机科技有限公司 | 恢复音频信号的方法和装置 |
| TWI742486B (zh) * | 2019-12-16 | 2021-10-11 | 宏正自動科技股份有限公司 | 輔助歌唱系統、輔助歌唱方法及其非暫態電腦可讀取記錄媒體 |
| EP3971892A1 (en) * | 2020-09-18 | 2022-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for combining repeated noisy signals |
| GB202203733D0 (en) * | 2022-03-17 | 2022-05-04 | Samsung Electronics Co Ltd | Patched multi-condition training for robust speech recognition |
| US12469506B2 (en) * | 2023-06-13 | 2025-11-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for audio decoding supporting two spectral band replication modes |
Family Cites Families (50)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5127054A (en) | 1988-04-29 | 1992-06-30 | Motorola, Inc. | Speech quality improvement for voice coders and synthesizers |
| US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
| JPH10124088A (ja) | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
| SE9700772D0 (sv) | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
| SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
| SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
| US6549884B1 (en) | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
| US7742927B2 (en) | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
| US6584438B1 (en) | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
| SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
| JP2002082685A (ja) * | 2000-06-26 | 2002-03-22 | Matsushita Electric Ind Co Ltd | 音声帯域拡張装置及び音声帯域拡張方法 |
| US20020016698A1 (en) * | 2000-06-26 | 2002-02-07 | Toshimichi Tokuda | Device and method for audio frequency range expansion |
| SE0004818D0 (sv) | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
| US20020128839A1 (en) | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
| AU2002318813B2 (en) | 2001-07-13 | 2004-04-29 | Matsushita Electric Industrial Co., Ltd. | Audio signal decoding device and audio signal encoding device |
| JP2003108197A (ja) * | 2001-07-13 | 2003-04-11 | Matsushita Electric Ind Co Ltd | オーディオ信号復号化装置およびオーディオ信号符号化装置 |
| US6988066B2 (en) | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
| US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
| JP3926726B2 (ja) * | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
| EP1444688B1 (en) | 2001-11-14 | 2006-08-16 | Matsushita Electric Industrial Co., Ltd. | Encoding device and decoding device |
| EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
| US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
| TWI288915B (en) * | 2002-06-17 | 2007-10-21 | Dolby Lab Licensing Corp | Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components |
| FR2841031B1 (fr) | 2002-06-17 | 2005-02-11 | Hurel Hispano Le Havre | Procede de fabrication d'un panneau acoustique a double resonateur |
| US20040138876A1 (en) | 2003-01-10 | 2004-07-15 | Nokia Corporation | Method and apparatus for artificial bandwidth expansion in speech processing |
| KR100917464B1 (ko) | 2003-03-07 | 2009-09-14 | 삼성전자주식회사 | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
| FI119533B (fi) | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
| EP2752843A1 (en) | 2004-11-05 | 2014-07-09 | Panasonic Corporation | Encoder, decoder, encoding method, and decoding method |
| JP2006243041A (ja) | 2005-02-28 | 2006-09-14 | Yutaka Yamamoto | 高域補間装置及び再生装置 |
| US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
| KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
| US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
| EP1970900A1 (en) | 2007-03-14 | 2008-09-17 | Harman Becker Automotive Systems GmbH | Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal |
| CN101276587B (zh) * | 2007-03-27 | 2012-02-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及其方法和声音解码装置及其方法 |
| PT2186089T (pt) * | 2007-08-27 | 2019-01-10 | Ericsson Telefon Ab L M | Método e dispositivo para descodificação espetral percetual de um sinal áudio que inclui preenchimento de buracos espetrais |
| CN101393743A (zh) * | 2007-09-19 | 2009-03-25 | 中兴通讯股份有限公司 | 一种可配置参数的立体声编码装置及其编码方法 |
| JP5098569B2 (ja) | 2007-10-25 | 2012-12-12 | ヤマハ株式会社 | 帯域拡張再生装置 |
| CA2704807A1 (en) | 2007-11-06 | 2009-05-14 | Nokia Corporation | Audio coding apparatus and method thereof |
| CN101896967A (zh) | 2007-11-06 | 2010-11-24 | 诺基亚公司 | 编码器 |
| EP2229677B1 (en) | 2007-12-18 | 2015-09-16 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
| US8880410B2 (en) * | 2008-07-11 | 2014-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
| JP5244971B2 (ja) | 2008-07-11 | 2013-07-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号合成器及びオーディオ信号符号器 |
| ATE522901T1 (de) * | 2008-07-11 | 2011-09-15 | Fraunhofer Ges Forschung | Vorrichtung und verfahren zur berechnung von bandbreitenerweiterungsdaten mit hilfe eines spektralneigungs-steuerungsrahmens |
| WO2010036061A2 (en) | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
| PL3598445T3 (pl) | 2009-01-16 | 2021-12-27 | Dolby International Ab | Transpozycja harmonicznych rozszerzona o iloczyn wektorowy |
| EP2211339B1 (en) | 2009-01-23 | 2017-05-31 | Oticon A/s | Listening system |
| RU2452044C1 (ru) | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот |
| EP2239732A1 (en) | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
| EP2481048B1 (en) | 2009-09-25 | 2017-10-25 | Nokia Technologies Oy | Audio coding |
| MX2012006823A (es) * | 2009-12-16 | 2012-07-23 | Dolby Int Ab | Mezcla descendente de parametros de corriente de bits sbr. |
-
2009
- 2009-12-30 EP EP09181008A patent/EP2239732A1/en not_active Withdrawn
-
2010
- 2010-03-29 TW TW099109379A patent/TWI492222B/zh active
- 2010-04-01 MX MX2011002419A patent/MX2011002419A/es active IP Right Grant
- 2010-04-01 EP EP10712439A patent/EP2269189B1/en active Active
- 2010-04-01 MY MYPI2011002195A patent/MY153798A/en unknown
- 2010-04-01 AU AU2010233858A patent/AU2010233858B9/en active Active
- 2010-04-01 KR KR1020117010755A patent/KR101248321B1/ko active Active
- 2010-04-01 RU RU2011109670/08A patent/RU2501097C2/ru active
- 2010-04-01 EP EP10712944A patent/EP2351025B1/en active Active
- 2010-04-01 JP JP2011529585A patent/JP5227459B2/ja active Active
- 2010-04-01 WO PCT/EP2010/054422 patent/WO2010112587A1/en not_active Ceased
- 2010-04-01 WO PCT/EP2010/054434 patent/WO2010115845A1/en not_active Ceased
- 2010-04-01 MY MYPI2010005335 patent/MY151346A/en unknown
- 2010-04-01 CN CN2010800028666A patent/CN102177545B/zh active Active
- 2010-04-01 PL PL10712944T patent/PL2351025T3/pl unknown
- 2010-04-01 MX MX2010012343A patent/MX2010012343A/es active IP Right Grant
- 2010-04-01 TW TW099110102A patent/TWI416507B/zh active
- 2010-04-01 JP JP2011507945A patent/JP5165106B2/ja active Active
- 2010-04-01 CA CA2721629A patent/CA2721629C/en active Active
- 2010-04-01 ES ES10712944T patent/ES2396686T3/es active Active
- 2010-04-01 CA CA2734973A patent/CA2734973C/en active Active
- 2010-04-01 ES ES10712439T patent/ES2377551T3/es active Active
- 2010-04-01 KR KR1020107025594A patent/KR101207120B1/ko active Active
- 2010-04-01 SG SG2011035433A patent/SG174113A1/en unknown
- 2010-04-01 US US12/992,051 patent/US9697838B2/en active Active
- 2010-04-01 CN CN2010800015312A patent/CN102027537B/zh active Active
- 2010-04-01 PL PL10712439T patent/PL2269189T3/pl unknown
- 2010-04-01 BR BRPI1003636-9A patent/BRPI1003636B1/pt active IP Right Grant
- 2010-04-01 AU AU2010230129A patent/AU2010230129B2/en active Active
- 2010-04-01 AT AT10712439T patent/ATE534119T1/de active
- 2010-04-05 AR ARP100101129A patent/AR076199A1/es active IP Right Grant
- 2010-04-08 AR ARP100101184A patent/AR076237A1/es active IP Right Grant
- 2010-10-22 CO CO10131388A patent/CO6311123A2/es active IP Right Grant
- 2010-11-10 EG EG2010111906A patent/EG26400A/en active
-
2012
- 2012-11-28 US US13/687,678 patent/US9076433B2/en not_active Ceased
-
2014
- 2014-09-02 AR ARP140103280A patent/AR097531A2/es active IP Right Grant
-
2022
- 2022-06-22 US US17/846,565 patent/USRE50601E1/en active Active
- 2022-06-23 US US17/848,244 patent/USRE50767E1/en active Active
- 2022-06-23 US US17/848,196 patent/USRE50710E1/en active Active
- 2022-06-23 US US17/848,264 patent/USRE50693E1/en active Active
- 2022-06-23 US US17/848,163 patent/USRE50692E1/en active Active
- 2022-06-23 US US17/848,212 patent/USRE50676E1/en active Active
-
2024
- 2024-11-22 US US18/956,655 patent/US20250225991A1/en active Pending
- 2024-11-22 US US18/956,689 patent/US20250225992A1/en active Pending
- 2024-11-22 US US18/956,633 patent/US20250225990A1/en active Pending
- 2024-11-22 US US18/956,747 patent/US20250225994A1/en active Pending
- 2024-11-22 US US18/956,606 patent/US20250225989A1/en active Pending
- 2024-11-22 US US18/956,709 patent/US20250225993A1/en active Pending
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| MX2010012343A (es) | Aparato, metodo y programa de computacion para generar una representacion de una señal de ancho de banda ampliado en base a la representacion de una señal de entrada utilizando una combinacion de una ampliacion de ancho de banda armonico y una amplia | |
| US20230197089A1 (en) | Harmonic transposition in an audio coding method and system | |
| US12159636B2 (en) | Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension | |
| AU2010209673B2 (en) | Improved harmonic transposition | |
| AU2020201239B2 (en) | Improved Harmonic Transposition | |
| HK1152791B (en) | Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension | |
| BR122021012115B1 (pt) | Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica | |
| BR122021012290B1 (pt) | Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica | |
| BRPI1001239B1 (pt) | Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica | |
| BR122021012125B1 (pt) | Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica | |
| BR122021012137B1 (pt) | Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica | |
| HK1165077B (en) | Improved harmonic transposition |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FG | Grant or registration |