[go: up one dir, main page]

BRPI0615114A2 - aparelho e método para codificar e decodificar sinal de áudio - Google Patents

aparelho e método para codificar e decodificar sinal de áudio Download PDF

Info

Publication number
BRPI0615114A2
BRPI0615114A2 BRPI0615114-0A BRPI0615114A BRPI0615114A2 BR PI0615114 A2 BRPI0615114 A2 BR PI0615114A2 BR PI0615114 A BRPI0615114 A BR PI0615114A BR PI0615114 A2 BRPI0615114 A2 BR PI0615114A2
Authority
BR
Brazil
Prior art keywords
time division
bits
channel
represented
parameter
Prior art date
Application number
BRPI0615114-0A
Other languages
English (en)
Inventor
Hee Suk Pang
Hyeon O Oh
Dong Soo Kim
Jae Hyun Lim
Yang Won Jung
Original Assignee
Lg Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060004063A external-priority patent/KR20070025907A/ko
Priority claimed from KR1020060004051A external-priority patent/KR20070025903A/ko
Application filed by Lg Electronics Inc filed Critical Lg Electronics Inc
Publication of BRPI0615114A2 publication Critical patent/BRPI0615114A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

APARELHO E MéTODO PARA CODIFICAR E DECODIFICAR SINAL DE áUDIO. A informação espacial associada com um sinal de áudio é codificada em um fluxo de bits, que pode ser transmitido a um decodificador ou gravado em uma mídia de armazenamento. O fluxo de bits pode incluir diferentes sintaxes relacionadas ao tempo, frequência e domínios espaciais. Em algumas modalidades, o fluxo de bits inclui uma ou mais estruturas de dados (por exemplo, quadros) que contêm conjuntos ordenados de canais aos quais parâmetros podem ser aplicados. As estruturas de dados podem ser fixas ou variáveis. Um indicador de tipo de estrutura de dados pode ser inserido no fluxo de bits para habilitar um decodificador a determinar o tipo de estrutura de dados e para invocar um processo de decodificação apropriado. A estrutura de dados pode incluir a informação de posição que pode ser usada por um decodificador para identificar o canal correto ao qual um dado conjunto de parâmetros é aplicado. A informação de posição do canal pode ser codificada com ou um número fixo de bits ou um número variável de bits baseados no tipo de estrutura de dados como indicado pelo indicador de tipo de estrutura de dados. Para tipos de estrutura de dados variáveis, a informação de posição do canal pode ser codificada com um número variável de bits baseados na posição do canal no conjunto ordenado de canais.

Description

"APARELHO E MÉTODO PARA CODIFICAR E DECODIFICARSINAL DE ÁUDIO"
Campo da Invenção
O assunto desse pedido refere-se geralmente a pro-cessamento de sinal de áudio.
Fundamentos da Invenção
Esforços estão a caminho para pesquisar e desen-volver novas aproximações em codificação perceptiva de áudiomulticanal, comumente referida como Codificação de Áudio Es-pacial (SAC). A SAC permite a transmissão de áudio multica-nal em baixas taxas de bits, tornando a SAC disponível paramuitas aplicações de áudio populares (por exemplo, transmis-são contínua de Internet, transferência de musicas).
Ao invés de executar uma codificação discreta decanais de entrada de áudio individuais, a SAC captura a ima-gem espacial de um sinal de áudio multicanal em um conjuntocompacto de parâmetros. Os parâmetros podem ser transmitidosa um decodificador onde eles são usados para síntese ou re-construção das propriedades espaciais do sinal de áudio.
Em algumas aplicações SAC, os parâmetros espaciaissão transmitidos a um decodif icador como parte de um fluxode bits. O fluxo de bits inclui quadros espaciais que contêmconjuntos ordenados de canais de divisão de tempo aos quaisos conjuntos de parâmetros espaciais podem ser aplicados. 0fluxo de bits também inclui informação de posição que podeser usada por um decodificador para identificar o canal dedivisão de tempo correto ao qual um dado conjunto de parâme-tros é aplicado.Algumas aplicações SAC fazem uso de elementos con-ceituais nos caminhos de codificação/decodificação. Um ele-mento é comumente referido como um Um-para-Dois (OTT) e umoutro elemento é comumente referido como Dois-para-Três(TTT), onde os nomes implicam no número de canais de entradae saida de um elemento decodificador correspondente, respec-tivamente. 0 elemento codificador OTT extrai dois parâmetrosespaciais e cria um sinal de mistura descendente e sinal re-sidual. 0 elemento TTT mistura de forma descendente três si-nais de áudio em um sinal de mistura descendente estéreomais um sinal residual. Esses elementos podem ser combinadospara fornecer uma variedade de configurações de um ambientede áudio espacial (por exemplo, som ambiente).
Algumas aplicações SAC podem operar em um modo deoperação não guiado, onde somente um sinal de mistura des-cendente estéreo é transmitido de um codificador a um deco-dificador sem uma necessidade por transmissão de parâmetroespacial. 0 decodificador sintetiza parâmetros espaciais dosinal de mistura descendente e usa esses parâmetros paraproduzir um sinal de áudio multicanal.
Sumário da Invenção
Informação espacial associada com um sinal de áu-dio é codificada em um fluxo de bits, que pode ser transmi-tido a um decodif icador ou gravada em um meio de armazena-mento. 0 fluxo de bits pode incluir diferente sintaxe rela-cionada aos domínios do tempo, freqüência e espacial. Em al-gumas modalidades, o fluxo de bits inclui uma ou mais estru-turas de dados (por exemplo, quadros) que contêm conjuntosordenados de canais aos quais os parâmetros podem ser apli-cados. As estruturas de dados podem ser fixas ou variáveis.
Um indicador de tipo de estrutura de dados pode ser inseridono fluxo de bits para habilitar um decodificador a determi-nar o tipo de estrutura de dados e para invocar um processode decodificação apropriado. A estrutura de dados pode in-cluir a informação de posição que pode ser usada por um de-codificador para identificar o canal correto ao qual um dadoconjunto de parâmetros é aplicado. A informação de posiçãodo canal pode ser codificada com ou um número fixo de bitsou um número variável de bits baseados no tipo de estruturade dados como indicado pelo indicador de tipo de estruturade dados. Para tipos de estrutura de dados variáveis, a in-formação de posição do canal pode ser codificada com um nú-mero variável de bits baseados na posição do canal no con-junto ordenado de canais.
Em uma implementação, um método de codificar umsinal de áudio inclui: determinar um número de canais de di-visão de tempo e um número de conjuntos de parâmetros, osconjuntos de parâmetros incluem um ou mais parâmetros; gerarinformação que indica uma posição de no mínimo um canal dedivisão de tempo em um conjunto ordenado de canais de divi-são de tempo ao qual um conjunto de parâmetros é aplicado;codificar o sinal de áudio como um fluxo de bits incluindoum quadro, o quadro inclui o conjunto ordenado de canais dedivisão de tempo; e inserir um número variável de bits nofluxo de bits que representa a posição do canal de divisãode tempo no conjunto ordenado de canais de divisão de tempo,onde o número variável de bits é determinado pela posição docanal de divisão de tempo.
Em algumas modalidades, um método de decodificarum sinal de áudio inclui: receber um fluxo de bits que re-presenta um sinal de áudio, o fluxo de bits tem um quadro;determinar um número de canais de divisão de tempo e um nú-mero de conjuntos de parâmetros do fluxo de bits, os conjun-tos de parâmetros incluem um ou mais parâmetros; determinara informação de posição do fluxo de bits, a qual indica aposição de um canal de divisão de tempo em um conjunto orde-nado de canais de divisão de tempo ao qual o conjunto de pa-râmetros é aplicado, onde o conjunto ordenado de canais detempo está incluído no quadro; e decodificar o sinal de áu-dio baseado no número de canais de divisão de tempo, no nú-mero de conjuntos de parâmetros e na informação de posição,onde a informação de posição é representada por um númerovariável de bits baseados na posição do canal de divisão detempo.
Outras modalidades de codificação de posição decanal de divisão de tempo são descritas, as quais são dire-cionadas a sistemas, a métodos, a aparelhos e estruturas dedados e a meios legíveis por computador.
É entendido que ambas a descrição geral anterior ea seguinte descrição detalhada das modalidades são exempli-ficadas e explanatórias e não pretendem fornecer explicaçãoadicional da invenção como reivindicado.
Breve Descrição dos Desenhos
Os desenhos em anexo, que estão incluídos parafornecer um entendimento adicional da invenção e são incor-porados e constituem parte desse pedido, ilustram modalida-de (s) da invenção, e juntos com a descrição, servem para ex-plicar o principio da invenção. Nos desenhos:
A FIG. 1 é um diagrama que ilustra um principio degerar informação espacial de acordo com uma modalidade dapresente invenção;
A FIG. 2 é um diagrama de bloco de um codificadorpara codificar um sinal de áudio de acordo com uma modalida-de da presente invenção;
A FIG. 3 é um diagrama de bloco de um decodifica-dor para decodificar um sinal de áudio de acordo com uma mo-dalidade da presente invenção;
A FIG. 4 é um diagrama de bloco de um módulo deconversão de canal incluído em uma unidade de mistura ascen-dente de um decodificador de acordo com uma modalidade dapresente invenção;
A FIG. 5 é um diagrama para explicar um método deconfigurar um fluxo de bits de um sinal de áudio de acordocom uma modalidade da presente invenção;
As FIGs. 6A e 6B são um diagrama e um gráfico detempo/freqüência, respectivamente, para explicar relaçõesentre um conjunto de parâmetros, canais de divisão de tempoe bandas de parâmetros de acordo com uma modalidade da pre-sente invenção;
A FIG. 7A ilustra uma sintaxe para representar in-formação de configuração de um sinal de informação espacialde acordo com uma modalidade da presente invenção;A FIG. 7Β é uma tabela para um número de bandas deparâmetros de um sinal de informação espacial de acordo comuma modalidade da presente invenção;
A FIG. 8A ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicados a um conversor OTTcomo um número fixo de bits de acordo com uma modalidade dapresente invenção;
A FIG. 8B ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicados a um conversor OTTpor um número variável de bits de acordo com uma modalidadeda presente invenção;
A FIG. 9A ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicados a um conversor TTTpor um número fixo de bits de acordo com uma modalidade dapresente invenção;
A FIG. 9B ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicados a um conversor TTTpor um número variável de bits de acordo com uma modalidadeda presente invenção;
A FIG. IOA ilustra uma sintaxe de informação deconfiguração de extensão espacial para um quadro de extensãoespacial de acordo com uma modalidade da presente invenção;
As FIGs. IOB e IOC ilustram sintaxe de informaçãode configuração de extensão espacial para um sinal residualno caso em que este está incluído em um quadro de extensãoespacial de acordo com uma modalidade da presente invenção;
A FIG. 10D ilustra uma sintaxe para um método derepresentar um número de bandas de parâmetros para um sinalresidual de acordo com uma modalidade da presente invenção;
A FIG. IlA é um diagrama de bloco de um aparelhode decodificação usando codificação não guiada de acordo comuma modalidade da presente invenção;
A FIG. IlB é um diagrama para um método de repre-sentar um número de bandas de parâmetros como um grupo deacordo com uma modalidade da presente invenção;
A FIG. 12 ilustra uma sintaxe de informação deconfiguração de um quadro espacial de acordo com uma modali-dade da presente invenção;
A FIG. 13A ilustra uma sintaxe de informação deposição de um canal de divisão de tempo ao qual um conjuntode parâmetros é aplicado de acordo com uma modalidade dapresente invenção;
A FIG. 13B ilustra uma sintaxe para representarinformação de posição de um canal de divisão de tempo aoqual um conjunto de parâmetros é aplicado como um valor ab-soluto e um valor de diferença de acordo com uma modalidadeda presente invenção;
A FIG. 13C é um diagrama para representar uma plu-ralidade de informação de posição de canais de divisão detempo ao qual conjuntos de parâmetros são aplicados como umgrupo de acordo com uma modalidade da presente invenção;
A FIG. 14 é um fluxograma de um método de codifi-cação de acordo com uma modalidade da presente invenção;
A FIG. 15 é um fluxograma de um método de decodi-ficação de acordo com uma modalidade da presente invenção;
A FIG. 16 é um diagrama de bloco de uma arquitetu-ra de dispositivo para implementar os processos de codifica-ção e decodificação descritos com relação às FIGs. 1-15.
Descrição Detalhada da Invenção
A FIG. 1 é um diagrama que ilustra um principio degerar informação espacial de acordo com uma modalidade dapresente invenção. Esquemas de codificação perceptivos parasinais de áudio multicanal são baseados em um fato de quehumanos podem perceber sinais de áudio através do espaçotridimensional. 0 espaço tridimensional de um sinal de áudiopode ser representado usando informação espacial, incluindo,mas não limitado aos seguintes parâmetros espaciais conheci-dos: Diferenças de Nivel de Canal (CLD), Coerên-cia/Correlação Intercanal (ICC), Diferença de Tempo de Canal(CTD), Coeficientes de Predição de Canal (CPC), etc. O parâ-metro CLD descreve as diferenças (nivel) de energia entredois canais de áudio, o parâmetro ICC descreve a quantidadede correlação ou coerência entre dois canais de áudio e oparâmetro CTD descreve a diferença de tempo entre dois ca-nais de áudio.
A geração de parâmetros CTD e CLD é ilustrada naFIG. 1. Uma primeira onda sonora direta 103 a partir de umafonte de som remota 101 chega em um ouvido humano esquerdo107 e uma segunda onda sonora direta 102 é difratada em tor-no de uma cabeça humana para alcançar um ouvido humano di-reito 106. As ondas sonoras diretas 102 e 103 diferem uma daoutra em tempo de chegada e nivel de energia. Os parâmetrosCTD e CLD podem ser gerados baseados nas diferenças de tempode chegada e nivel de energia das ondas sonoras 102 e 103,respectivamente. Em adição, as ondas sonoras refletidas 104e 105 chegam nos ouvidos 106 e 107, respectivamente, e nãotêm correlações mútuas. Um parâmetro ICC pode ser gerado ba-seado na correlação entre as ondas sonoras 104 e 105.
No codificador, a informação espacial (por exem-plo, parâmetros espaciais) é extraída de um sinal de entradade áudio multicanal e um sinal de mistura descendente é ge-rado. 0 sinal de mistura descendente e os parâmetros espaci-ais são transferidos a um decodificador. Qualquer número decanais de áudio pode ser usado para o sinal de mistura des-cendente, incluindo, mas não limitado a: um sinal mono, umsinal estéreo, ou um sinal de áudio multicanal. No decodifi-cador, um sinal de mistura ascendente multicanal é criado apartir do sinal de mistura descendente e dos parâmetros es-paciais.
A FIG. 2 é um diagrama de bloco de um codificadorpara codificar um sinal de áudio de acordo com uma modalida-de da presente invenção. 0 codificador inclui uma unidade demistura descendente 202, uma unidade de geração de informa-ção espacial 203, uma unidade de codificação de sinal demistura descendente 207 e uma unidade de multiplexação 209.
Outras configurações de um codificador são possíveis. Os co-dificadores podem ser implementados em hardware, software ouuma combinação de ambos hardware e software. Os codificado-res podem ser implementados em placas de circuito integrado,conjuntos de chips, sistema integrado em um chip (SoC), pro-cessadores de sinal digital, processadores de propósito ge-ral e vários dispositivos digitais e analógicos.A unidade de mistura descendente 202 gera um sinalde mistura descendente 204 a partir do sinal de áudio multi-canal 201. Na FIG. 2, X1, ..., xn indicam canais de áudio deentrada. Como mencionado anteriormente, o sinal de misturadescendente 204 pode ser um sinal mono, um sinal estéreo ouum sinal de áudio multicanal. No exemplo mostrado, Xf1, ...,x'm indicam números de canais do sinal de mistura descenden-te 204. Em algumas modalidades, o codificador processa umsinal de mistura descendente fornecido externamente 205 (porexemplo, uma mistura descendente artística) ao invés do si-nal de mistura descendente 204.
A unidade de geração de informação espacial 203extrai informação espacial do sinal de áudio multicanal 201.Nesse caso, "informação espacial" significa informação rela-cionada aos canais de sinal de áudio usados na mistura as-cendente do sinal de mistura descendente 204 para um sinalde áudio multicanal no decodificador. O sinal de misturadescendente 204 é gerado misturando-se de forma descendenteo sinal de áudio multicanal. A informação espacial é codifi-cada para fornecer um sinal de informação espacial codifica-da 206.
A unidade de codificação de sinal de mistura des-cendente 207 gera um sinal de mistura descendente codificado208 codificando-se o sinal de mistura descendente 204 geradoa partir da unidade de mistura descendente 202.
A unidade de multiplexação 209 gera um fluxo debits 210 incluindo o sinal de mistura descendente codificado208 e o sinal de informação espacial codificado 206. O fluxode bits 210 pode ser transferido a um decodificador de mis-tura descendente e/ou gravado em um meio de armazenamento.
A FIG. 3 é um diagrama de bloco de um decodif ica-dor para decodificar um sinal de áudio codificado de acordocom uma modalidade da presente invenção. 0 decodificador in-clui uma unidade de demultiplexação 302, uma unidade de de-codificação de sinal de mistura descendente 305, uma unidadede decodificação de informação espacial 307 e uma unidade demistura ascendente 309. Os decodificadores podem ser imple-mentados em hardware, software ou uma combinação de amboshardware e software. Os decodificadores podem ser implemen-tados em placas de circuito integrado, conjuntos de chips,sistemas integrados em um chip (SoC), processadores de sinaldigital, processadores de propósito geral e vários disposi-tivos digitais e analógicos.
Em algumas modalidades, a unidade de demultiplexa-ção 302 recebe um fluxo de bits 301 representando um sinalde áudio e então separa um sinal de mistura descendente co-dificado 303 e . um sinal de informação espacial codificado304 do fluxo de bits 301. Na FIG. 3, x'i, ..., x'm indicamos canais do sinal de mistura descendente 303. A unidade dedecodificação de sinal de mistura descendente 305 emite umsinal de mistura descendente decodificado 306 decodificando-se o sinal de mistura descendente codificado 303. Se o deco-dificador é incapaz de emitir um sinal de áudio multicanal,a unidade de decodificação de sinal de mistura descendente305 pode diretamente emitir o sinal de mistura descendente306. Na FIG. 3, y'i, ·.., y'm indicam canais de saida diretada unidade de decodificação de sinal de mistura descendente 305.
A unidade de decodificação de sinal de informaçãoespacial 307 extrai informação de configuração do sinal deinformação espacial a partir do sinal de informação espacialcodificado 304 e então decodifica o sinal de informação es-pacial 304 usando a informação de configuração extraída.
A unidade de mistura ascendente 309 pode misturarde forma ascendente o sinal de mistura descendente 30 6 em um -sinal de áudio multicanal 310 usando a informação espacialextraída 308. Na FIG. 3, yi, yn indicam um número decanais de saída da unidade de mistura ascendente 309.
A FIG. 4 é um diagrama de bloco de um módulo deconversão de canal que pode ser incluído na unidade de mis-tura ascendente 309 do decodificador mostrado na FIG. 3. Emalgumas modalidades, a unidade de mistura ascendente 309 po-de inclui uma pluralidade de módulos de conversão de canal.0 módulo de conversão de canal é um dispositivo conceituaique pode diferenciar um número de canais de entrada e um nú-mero de canais de saída uns dos outros usando informação es-pecífica.
Em algumas modalidades, o módulo de conversão decanal pode inclui um conversor OTT (um para dois) para. con-verter um canal em dois canais e vice-versa, e um conversorTTT (dois para três) para converter dois canais em três ca-nais e vice-versa. Os conversores OTT e/ou TTT podem ser ar-ranjados em uma variedade de configurações úteis. Por exem-plo, a unidade de mistura ascendente 309 mostrada na FIG. 3pode inclui uma configuração 5-1-5, uma configuração 5-2-5,uma configuração 7-2-7, uma configuração 7-5-7, etc. Em umaconfiguração 5-1-5, um sinal de mistura descendente tendo umcanal é gerado misturando-se de forma descendente cinco ca-nais em um canal, que pode então ser misturado de forma as-cendente em cinco canais. Outras configurações podem sercriadas da mesma maneira usando várias combinações de con-versores OTT e TTT.
Com relação à FIG. 4, uma configuração 5-2-5 exem-plificada para uma unidade de mistura ascendente 400 é mos-trada. Em uma configuração 5-2-5, um sinal de mistura des-cendente 401 tendo dois canais é inserido na unidade de mis-tura ascendente 400. No exemplo mostrado, um canal esquerdo(L) e um canal direito (R) são fornecidos como entrada naunidade de mistura ascendente 400. Nessa modalidade, a uni-dade de mistura ascendente 400 inclui um conversor TTT 402 etrês conversores OTT 406, 407 e 408. 0 sinal de mistura des-cendente 401 tendo dois canais é fornecido como entrada parao conversor TTT (TTTo) 402, que processa o sinal de misturadescendente 401 e fornece como saida, três canais 403, 404 e405. Um ou mais parâmetros espaciais (por exemplo, CPC, CLD,ICC) podem ser fornecidos como entrada para o conversor TTT402, e são usados para processar o sinal de mistura descen-dente 401, como descrito abaixo. Em algumas modalidades, umsinal residual pode ser seletivamente fornecido como entradapara o conversor TTT 402. Em tal caso, o CPC pode ser des-crito como um coeficiente de predição para gerar três canaisa partir de dois canais.O canal 403 que é fornecido como saída a partir doconversor TTT 402 é fornecido como entrada para o conversorOTT 406 que gera dois canais de saída usando um ou mais pa-râmetros espaciais. No exemplo mostrado, os dois canais desaída representam posições de alto-falante esquerdo frontal(FL) e esquerdo traseiro (BL) em, por exemplo, um ambientede som ambiente. 0 canal 404 é fornecido como entrada para oconversor OTT 407, que gera dois canais de saída usando umou mais parâmetros espaciais. No exemplo mostrado, os doiscanais de saída representam posições de alto falante frontaldireito (FR) e traseiro direito (BR). 0 canal 405 é forneci-do como entrada para o conversor OTT 4 08, que gera dois ca-nais de saída. No exemplo mostrado, os dois canais de saídarepresentam uma posição de alto-falante central (C) e canalde efeitos de baixa freqüência (LFE). Nesse caso, informaçãoespacial (por exemplo, CLD, ICC) pode ser fornecida como en-trada para cada um dos conversores OTT. Em algumas modali.da-des, sinais residuais (Resl, Res2) podem ser fornecidos comoentradas para os conversores OTT 406 e 407. Em tal modalida-de, um sinal residual pode não ser fornecido como entradapara o conversor OTT 408 que emite um canal central e um ca-nal LFE.
A configuração mostrada na FIG. 4 é um exemplo deuma configuração para um módulo de conversão de canal. Ou-tras configurações para um módulo de conversão de canal sãopossíveis, incluindo várias combinações de conversores OTT eTTT. Já que cada um dos módulos de conversão de canal podeoperar em um domínio de freqüência, um número de bandas deparâmetros aplicados a cada um dos módulos de conversão decanal pode ser definido. Uma banda de parâmetro significapelo menos uma banda de freqüência aplicável a um parâmetro.0 número de bandas de parâmetros é descrito com relação à FIG. 6B.
A FIG. 5 é um diagrama que ilustra um método deconfigurar um fluxo de bits de um sinal de áudio de acordocom uma modalidade da presente invenção. A FIG. 5(a) ilustraum fluxo de bits de um sinal de áudio incluindo um sinal deinformação espacial somente, e as FIGs. 5(b) e 5(c) ilustramum fluxo de bits de um sinal de áudio incluindo um sinal demistura descendente e um sinal de informação espacial.
Com relação à FIG. 5 (a) , um fluxo de bits de umsinal de áudio pode incluir informação de configuração 501 eum quadro 503. 0 quadro 503 pode ser repetido no fluxo debits e em algumas modalidades inclui um único quadro espaci-al 502 contendo informação de áudio espacial.
Em algumas modalidades, a informação de configura-ção 501 inclui informação que descreve um número total decanais de divisão de tempo em um quadro espacial 502, um nú-mero total de bandas de parâmetro expandindo uma faixa defreqüência do sinal de áudio, um número de bandas de parâme-tros em um conversor OTT, um número de bandas de parâmetrosem um conversor TTT e um número de bandas de parâmetros emum sinal residual. Outra informação pode estar incluída nainformação de configuração 501 se desejado.
Em algumas modalidades, o quadro espacial 502 in-clui um ou mais parâmetros espaciais (por exemplo, CLD,ICC) , um tipo de quadro, um número de conjuntos de parâme-tros em um quadro e canais de divisão de tempo ao quais osconjuntos de parâmetros podem ser aplicados. Outra informa-ção pode ser incluída no quadro espacial 502 se desejado. Osignificado e uso da informação de configuração 501 e a in-formação contida no quadro espacial 502 serão explicados comrelação às FIGs. 6 a 10.
Com relação à FIG. 5 (b) , um fluxo de bits de umsinal de áudio pode incluir informação de configuração 504,um sinal de mistura descendente 505, e um quadro espacial506. Nesse caso, um quadro 507 pode incluir o sinal de mis-tura descendente 505 e o quadro espacial 506, e o quadro 507pode ser repetido no fluxo de bits.
Com relação à FIG. 5 (c) , um fluxo de bits de umsinal de áudio pode incluir um sinal de mistura descendente508, informação de configuração 509 e um quadro espacial510. Nesse caso, um quadro 511 pode incluir a informação deconfiguração 509 e o quadro espacial 510, e o quadro 511 po-de ser repetido no fluxo de bits. Se a informação de confi-guração 509 é inserida em cada quadro 511, o sinal de áudiopode ser reproduzido por um dispositivo de reprodução em umaposição arbitrária.
Embora a FIG. 5 (c) ilustre que a informação deconfiguração 509 está inserida no fluxo de bits pelo quadro511, deveria estar aparente que a informação de configuração509 pode ser inserida no fluxo de bits por uma pluralidadede quadros que repetem periodicamente ou não periodicamente.
As FIGs. 6A e 6B são diagramas que ilustram rela-ções entre um conjunto de parâmetros, canais de divisão detempo e bandas de parâmetros de acordo com uma modalidade dapresente invenção. Um conjunto de parâmetros significa um oumais parâmetros espaciais aplicados a um canal de divisão detempo. Os parâmetros espaciais podem incluir informação es-pacial, tal como CDL, ICC, CPC, etc. Um canal de divisão detempo significa um intervalo de tempo de um sinal de áudioao qual os parâmetros espaciais podem ser aplicados. Um qua-dro espacial pode incluir um ou mais canais de divisão detempo.
Com relação à FIG. 6A, um número de conjuntos deparâmetros 1, ..., P pode ser usado em um quadro espacial, ecada conjunto de parâmetros pode incluir um ou mais camposde dados 1, ..., Q-I. Um conjunto de parâmetros pode ser a-plicado a uma faixa inteira de freqüências de um sinal deáudio, e cada parâmetro espacial no conjunto de parâmetrospode ser aplicado a uma ou mais partes da banda de freqüên-cias. Por exemplo, se um conjunto de parâmetros inclui 20parâmetros espaciais, a banda inteira de freqüências de umsinal de áudio pode ser dividida em 20 zonas (referidas como"bandas de parâmetros") e os 20 parâmetros espaciais do con-junto de parâmetros podem ser aplicados às 20 bandas de pa-râmetros. Os parâmetros podem ser aplicados às bandas de pa-râmetros como desejado. Por exemplo, os parâmetros espaciaispodem ser densamente aplicados a bandas de parâmetros debaixa freqüência e esparsamente aplicados a bandas de parâ-metros de alta freqüência.
Com relação à FIG. 6B, um gráfico de tem-po/freqüência mostra a relação entre os conjuntos de parâme-tros e os canais de divisão de tempo. No exemplo mostrado,três conjuntos de parâmetros (conjunto de parâmetros 1, con-junto de parâmetros 2, conjunto de parâmetros 3) são aplica-dos a um conjunto ordenado de 12 canais de divisão de tempoem um único quadro espacial. Nesse caso, uma faixa inteirade freqüência de um sinal de áudio é dividida em 9 bandas deparâmetros. Assim, o eixo horizontal indica o número de ca-nais de divisão de tempo e o eixo vertical indica o númerode bandas de parâmetros. Cada um dos três conjuntos de parâ-metros é aplicado a um canal de divisão de tempo especifico.Por exemplo, um primeiro conjunto de parâmetros (conjunto deparâmetros 1) é aplicado a um canal de divisão de tempo #1,um segundo conjunto de parâmetros (conjunto de parâmetros 2)é aplicado a um canal de divisão de tempo #5, e um terceiroconjunto de parâmetros (conjunto de parâmetros 3) é aplicadoa um canal de divisão de tempo #9. Os conjuntos de parâme-tros podem ser aplicados a outros canais de divisão de tempointerpolando-se e/ou copiando-se os conjuntos de parâmetrospara aqueles canais de divisão de tempo. Geralmente, o núme-ro de conjuntos de parâmetros pode ser igual ou menor ao nú-mero de canais de divisão de tempo, e o número de bandas deparâmetros pode ser igual ou menor ao número de bandas defreqüência do sinal de áudio. Codificando-se informação es-pacial para partes do domínio do tempo-freqüência de um si-nal de áudio ao invés do domínio inteiro de tempo-freqüênciado sinal de áudio, é possível reduzir a quantidade de infor-mação espacial enviada a partir de um codificador a um deco-dificador. Essa redução de dados é possível desde que infor-mação esparsa no domínio de tempo-freqüência seja freqüente-mente suficiente para a percepção auditiva humana de acordocom princípios conhecidos de codificação de áudio perceptivo.
Uma característica importante das modalidades des-critas é a codificação e decodificação de posições de canaisde divisão de tempo aos quais os conjuntos de parâmetros sãoaplicados usando um número fixo ou variável de bits. 0 núme-ro de bandas de parâmetros pode também ser representado comum número fixo de bits ou um número variável de bits. 0 es-quema de codificação de bits variáveis pode também ser apli-cado a outra informação usada em codificação de áudio espa-cial, incluindo, mas não limitada à informação associada comos domínios de tempo, espacial e/ou da freqüência (por exem-pio, aplicado a um número de sub-bandas de freqüência emiti-das a partir de um banco de filtros).
A FIG. 7A ilustra uma sintaxe para representar in-formação de configuração de um sinal de informação espacialde acordo com uma modalidade da presente invenção. A infor-mação de configuração inclui uma pluralidade de campos 701 a718 aos quais um número de bits pode ser atribuído.
Um campo "bsSamplingFrequencylndex" 701 indica umafreqüência de amostragem obtida a partir de um processo deamostragem de um sinal de áudio. Para representar a freqüên-cia de amostragem, 4 bits são alocados ao campo "bsSampling-Frequencylndex" 701. Se um valor do campo "bsSamplingFre-quencylndex" 701 é 15, isto é, um número binário de 1111, umcampo "bsSamplingFrequency" 702 é adicionado para represen-tar a freqüência de amostragem. Nesse caso, 24 bits são alo-cados ao campo "bsSamplingFrequency" 702.
Um campo "bsFrameLength" 703 indica um número to-tal de canais de divisão de tempo (chamado "numSlots") em umquadro espacial, e uma relação de numSlots = bsFrameLength+1 pode existir entre "numSlots" e o campo "bsFrameLength"703.
Um campo "bsFreqRes" 7 04 indica um número total debandas de parâmetros expandindo um domínio inteiro de fre-qüência de um sinal de áudio. O campo "bsFreqRes" 705 indicainformação para uma configuração em árvore incluindo umapluralidade de módulos de conversão de canal, tal como des-crito com relação à FIG. 4. A informação para a configuraçãoem árvore inclui tal informação como um tipo de módulo deconversão de canal, um número de módulos de conversão de ca-nal, um tipo de informação espacial usada no módulo de con-versão de canal, um número de canais de entrada/saída de umsinal de áudio, etc.
A configuração em árvore pode ter uma de uma con-figuração 5-1-5, uma configuração 5-2-5, uma configuração 7-2-7, uma configuração 7-5-7 e seus similares, de acordo comum tipo de um módulo de conversão de canal ou um número decanais. A configuração 5-2-5 da configuração em árvore émostrada na FIG. 4.
Um campo "bsQuantMode" 706 indica informação demodo de quantização de informação espacial.
Um campo "bsOnelcc" 707 indica se um sub-conjuntode parâmetros ICC é usado para todos os conversores OTT.Nesse caso, o sub-conjunto de parâmetros significa um con-junto de parâmetros aplicado a um canal de divisão de tempoespecifico e um módulo de conversão de canal especifico.
Um campo "bsArbitraryDownmix" 708 indica uma pre-sença ou não presença de um ganho de mistura descendente ar-bitrário.
Um campo "bsFixedGainSur" 709 indica um ganho a-plicado a um canal ambiente, por exemplo, LS (ambiente es-querdo) e RS (ambiente direito).
Um campo "bsFixedGainLF" 710 indica um ganho apli-
cado a um canal LFE.Um campo "bsFixedGainDM" 711 indica um ganho apli-cado a um sinal de mistura descendente.
Um campo "bsMatrixMode" 712 indica se um sinal demistura descendente estéreo compatível com matriz é gerado apartir de um codificador.
Um campo "bsTempShapeConfig" 713 indica um modo deoperação de moldagem temporal (por exemplo, TES (ajuste deenvelope temporal) e/ou TP (ajuste temporal)) em um decodi-ficador.
O campo "bsDecorrConfig" 714 indica um modo de o-peração de um decorrelator de um decodificador.
Ε, o campo "bs3DaudioMode" 715 indica se um sinalde mistura descendente é codificado em um sinal 3D e se umprocessamento HRTF inverso é usado.
Depois que informação de cada um dos campos foideterminada/extraída em um codificador/decodificador, infor-mação para um número de bandas de parâmetros aplicadas a ummódulo de conversão de canal é determinado/extraído no codi-ficador/decodificador. Um número de bandas de parâmetros a-plicadas a um conversor OTT é primeiro determinado/extraído(716) e um número de bandas de parâmetros aplicado a um con-versor TTT é então determinado/extraído (717). O número debandas de parâmetros para o conversor OTT e/ou conversor TTTserá descrito em detalhes com relação às FIGs. 8A a 9B.
No caso em que um quadro de extensão existe, umbloco "spatialExtensionConfig" 718 inclui informação de con-figuração para o quadro de extensão. A informação incluídano bloco "spatialExtensionConfig" 718 será descrita com re-lação às FIGs. IOA a 10D.
A FIG. 7B é uma tabela para um número de bandas deparâmetros de um sinal de informação espacial de acordo comuma modalidade da presente invenção. Um "numBands" indica umnúmero de bandas de parâmetros para um domínio inteiro defreqüência de um sinal de áudio e "bsFreqRes" indica infor-mação de índice para o número de bandas de parâmetros. Porexemplo, o domínio inteiro de freqüência de um sinal de áu-dio pode ser dividido por um número de bandas de parâmetroscomo desejado (por exemplo, 4, 5, 7, 10, 14, 20, 28, etc.).
Em algumas modalidades, um parâmetro pode ser a-plicado a cada banda de parâmetro. Por exemplo, se o "nura-Bands" é 28, então o domínio inteiro de freqüência de um si-nal de áudio é dividido em 28 bandas de parâmetro e cada umdos 28 parâmetros pode ser aplicado a cada um das 28 bandasde parâmetros. Em um outro exemplo, se o "numBands" é 4, en-tão o domínio inteiro de freqüência de um dado sinal de áu-dio é dividido em 4 bandas de parâmetro e cada um dos 4 pa-râmetros pode ser aplicado a cada uma das 4 bandas de parâ-metros. Na FIG. 7B, o termo "Reservado" significa que um nú-mero de bandas de parâmetros para o domínio inteiro de fre-qüência de um dado sinal de áudio não é determinado.
Dever-se-ia notar que um órgão auditivo humano nãoé sensível ao número de bandas de parâmetro usadas no esque-ma de codificação. Assim, usar um pequeno número de bandasde parâmetro pode fornecer efeito de áudio espacial similara um ouvinte do que se um grande número de bandas de parâme-tros fosse usado.
Diferente do "numBands", o "numSlots" representadopelo campo "bsFrameLength" 7 03 mostrado na FIG. 7A pode re-presentar todos os valores. Os valores de "numSlots" podemser limitados, entretanto, se o número de amostras em umquadro espacial é exatamente divisível pelo "numSlots". As-sim, se um valor máximo do "numSlots" a ser substancialmenterepresentado é , cada valor do campo "bsFrameLength" 703pode ser representado por bit(s) teto{log2 (b) } . Nesse caso,Ateto(x)' significa um inteiro mínio maior ou igual ao valorλχ' . Por exemplo, se um quadro espacial inclui 72 canais dedivisão de tempo, então teto{log2 (72) } = 7 bits pode ser a-locado ao campo "bsFrameLength" 703, e o número de bandas deparâmetros aplicadas a um módulo de conversão de canal podeser decidido no "numBands".
A FIG. 8A ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicadas a um conversor OTTpor um número fixo de bits de acordo com uma modalidade dapresente invenção. Com relação às FIGs. 7A e 8A, um valor deλί' tem um valor de zero para numOttBoxes-1, onde AnumOttBo-xes' é o número total de conversores OTT. Ou seja, o valorde indica cada conversor OTT, e um número e bandas deparâmetros aplicadas a cada conversor OTT é representado deacordo com o valor de Λί'. Se um conversor OTT tem um modode canal LFE, o número de bandas de parâmetros (chamado"bsOttBands") aplicadas ao canal LFE do conversor OTT podeser representado usando um número fixo de bits. No exemplomostrado na FIG. 8A, 5 bits são alocados para o campo"bsOttBands" 801.Se um conversor OTT não tem um modo de ca-nal LFE, o número total de bandas de parâmetro (numBands)pode ser aplicado a um canal do conversor OTT.
A FIG. 8B ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicadas a um conversor OTTpor um número variável de bits de acordo com uma modalidadeda presente invenção. A FIG. 8B, que é similar à FIG. 8A,difere da FIG. 8A já que o campo "bsOttBands" 802 mostradona FIG. 8B é representado por um número variável de bits. Emparticular, o campo "bsOttbands" 802, que tem um valor igualou menor do que "numBands", pode ser representado por um nú-mero variável de bits usando "numBands".
Se o "numBands" está em uma faixa igual ou maiordo que 2Λ(η-1) e menor do que 2A (η) , o campo "bsOttBands"802 pode ser representado por η bits variáveis.
Por exemplo: (a) se o "numBands é 40, o campo"bsOttBands" 802 é representado por 6 bits; (b) se o "num-Bands" é 28 ou 20, o campo "bsOttBands" 802 é representadopor 5 bits; (c) se o "numBands" é 14 ou 10, o campo "bsOtt-Bands" 802 é representado por 4 bits; e (d) se o "numBands"é 7, 5 ou 4, o campo "bsOttBands" 8 02 é representado por 3bits.
Se o "numBands" está em uma faixa maior do que2ˆ(η-1) e igual ou menor a 2ˆ(η), o campo "bsOttBands" 802pode ser representado por η bits variáveis.
Por exemplo: (a) se o "numBands é 40, o campo"bsOttBands" 802 é representado por 6 bits; (b) se o "num-Bands" é 28 ou 20, o campo "bsOttBands" 802 é representadopor 5 bits; (c) se o "numBands" é 14 ou 10, o campo "bsOtt-Bands" 802 é representado por 4 bits; (d) se o "numBands" é7 ou 5, o campo "bsOttBands" 8 02 é representado por 3 bits;e (e) se o "numBands" é 4, o campo "bsOttBands" 8 02 é repre-sentado por 2 bits.
O campo "bsOttBands" 802 pode ser representado porum número variável de bits apesar de uma função (chamada"função teto") de arredondamento para cima para um inteiromais próximo tomando o "numBands" como uma variável.
Em particular, i) no caso de 0 < bsOttBands < num-Bands ou 0 ≤ bsOttBands < numBands, o campo "bsOttBands" 802é representado por um número de bits correspondente a um va-lor de teto{Iog2 (numBands)} ou ii) no caso de 0 < bsOttBandsnumBands, o campo "bsOttBands" 802 pode ser representadopor teto(Iog2(numBands+1) bits.
Se um valor igual ou menor a "numBands" (chamado"numberbands") é arbitrariamente determinado, o campo"bsOttBands" 802 pode ser representado por um número variá-vel de bits através da função teto tomando-se o "number-Bands" como uma variável.
Em particular, i) no caso de 0 < bsOttBands < nura-berBands ou 0 < bsOttBands < numberBands, o campo "bsOtt-Bands" 802 é representado por teto (log2 (numberBands) ) bitsou ii) no caso de 0 < bsOttBands < numberBands, o campo"bsOttBands" 802 pode ser representado por te-to (log2 (numberBands + 1) bits.
Se mais do que um conversor OTT é usado, uma cora-binação dos "bsOttBands" pode ser expressa pela Fórmula 1abaixo:
<formula>formula see original document page 27</formula>
onde, bsOttBandsi indica um i2 "bsOttbands". Porexemplo, assume-se que há três conversores OTT e três valo-res (N=3) para o campo "bsOttBands" 802. Neste exemplo, ostrês valores do campo "bsOttBands" 802 (chamados al, a2, a3,respectivamente) aplicados aos três conversores OTT, respec-tivamente, podem ser representados por 2 bits cada. Portan-to, um total de 6 bits é necessário para expressar os valo-res al, a2 e a3. Ainda, se os valores al, a2 e a3 são repre-sentados como um grupo, então 27 (= 3*3*3) casos podem ocor-rer, que podem ser representados por 5 bits, economizando umbit. Se o "numBands" é 3 e um valor de grupo representadopor 5 bits é 15, o valor de grupo pode ser representado como15 = Ix(3A2) + 2* (3A1) + 0*(3Λ0). Portanto, um decodificadorpode determinar a partir do valor de grupo 15 que os trêsvalores al, a2 e a3 do campo "bsOttBands" 802 são 1, 2 e 0,respectivamente, aplicando-se o inverso da Fórmula 1.No caso de múltiplos conversores OTT, a combinaçãode "bsOttBands" pode ser representada como uma das Fórmulas2 a 4 (definida abaixo) usando o "numberbands". Já que a re-presentação de "bsOttBands" usando o "numberBands" é similarà representação usando o "numBands" na Fórmula 1, uma expli-cação detalhada deve ser omitida e somente as fórmulas sãoapresentadas abaixo.
[Fórmula 2]
<formula>formula see original document page 28</formula>
[Fórmula 3]
<formula>formula see original document page 28</formula>
[Fórmula 4]
<formula>formula see original document page 28</formula>
A FIG. 9A ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicadas a um conversor TTTpor um número fixo de bits de acordo com uma modalidade dapresente invenção. Com relação às FIGs. 7A e 9A, um valor deΛί' tem um valor de zero para numTttBoxes-1, onde ^numTttBo-xes' é um número de todos os conversores TTT. Ou seja, o va-Ior de λί' indica cada conversor TTT. Um número de bandas deparâmetros aplicadas a cada conversor TTT é representado deacordo com o valor de λί'. Em algumas modalidades, o conver-sor TTT pode ser dividido em uma faixa de banda de baixafreqüência e uma faixa de banda de alta freqüência, e dife-rentes processos podem ser aplicados às faixas de banda debaixa e alta freqüência. Outras divisões são possíveis.
Um campo "bsTttDualMode" 901 indica se um dadoconversor TTT opera em diferentes modos (chamado "modo du-al") para uma faixa de banda baixa e uma faixa de banda al-ta, respectivamente. Por exemplo, se um valor do campo"bsTttDualMode" 901 é zero, então um modo é usado para afaixa de banda inteira sem discriminar entre uma faixa debanda baixa e uma faixa de banda alta. Se um valor do campo"bsTttDualMode" é 1, então diferentes modos podem ser usadospara a faixa de banda baixa e a faixa de banda alta, respec-tivamente .
Um campo "bsTttModeLow" 902 indica um modo de ope-ração de um dado conversor TTT, que pode ter vários modos deoperação. Por exemplo, o conversor TTT pode ter um modo depredição que usa, por exemplo, parâmetros CPC e ICC, um modobaseado em enerqia que usa, por exemplo, parâmetros CLD,etc. Se um conversor TTT tem um modo dual, informação adi-cional para uma faixa de banda alta pode ser necessária.
Um campo "bsTttModeHigh" 903 indica um modo de o-peração da faixa de banda alta, no caso de o conversor TTTter um modo dual.
Um campo "bsTttBandsLow" 904 indica um número debandas de parâmetros aplicadas ao conversor TTT.
Um campo "bsTttBandsHigh" 905 tem "numBands".
Se um conversor TTT tem um modo dual, uma faixa debanda baixa pode ser igual ou maior do que zero e menor doque "bsTttBandsLow", enquanto uma faixa de banda alta podeser igual ou maior do que "bsTttBandsLow" e menor do que"bsTttBandsHigh".
Se um conversor TTT não tem um modo dual, um núme-ro de bandas de parâmetros aplicadas ao conversor TTT podeser igual ou maior a zero e menor do que "numBands" (907).
O campo "bsTttBandsLow" 904 pode ser representadopor um número fixo de bits. Por exemplo, como mostrado naFIG. 9A, 5 bits podem ser alocados para representar o campo"bsTttBandsLow" 904.
A FIG. 9B ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicadas a um conversor TTTpor um número variável de bits de acordo com uma modalidadeda presente invenção. A FIG. 9B é similar à FIG. 9A, mas di-fere desta em representar um campo "bsTttBandsLow" 907 daFIG. 9B por um número variável de bits enquanto representan-do um campo "bsTttBandsLow" 904 da FIG. 9A por um número fi-xo de bits. Em particular, já que o campo "bsTttBandsLow"907 tem um valor igual ou menor do que "numBands", o campo"bsTttBands" 907 pode ser representado por um número variá-vel de bits usando "numBands".
Em particular, no caso em que o "numBands" é igualou maior do que 2A(n-l) e menor do que 2A (η) , o campo"bsTttBandsLow" 907 pode ser representado por η bits.
Por exemplo: (i) se o "numBands é 40, o campo"bsTttBandsLow" 907 é representado por 6 bits; (ii) se o"numBands" é 28 ou 20, o campo "bsTttBandsLow" 907 é repre-sentado por 5 bits; (iii) se o "numBands" é 14 ou 10, o cam-po "bsTttBandsLow" 907 é representado por 4 bits; e (iv) seo "numBands" é 7, 5 ou 4, o campo "bsTttBandsLow" 907 é re-presentado por 3 bits.
Se o "numBands" está em uma faixa maior do que2Λ(η-1) e igual ou menor a 2Λ(η), então o campo "bsTttBands-Low" 907 pode ser representado por η bits.
Por exemplo: (i) se o "numBands é 40, o campo"bsTttBandsLow" 907 é representado por 6 bits; (ii) se o"numBands" é 28 ou 20, o campo "bsTttBandsLow" 907 é repre-sentado por 5 bits; (iii) se o "numBands" é 14 ou 10, o cam-po "bsTttBandsLow" 907 é representado por 4 bits; (iv) se o"numBands" é 7 ou 5, o campo "bsTttBandsLow" 907 é represen-tado por 3 bits; e (v) se o "numBands" é 4, o campo "bsTtt-BandsLow" 907 é representado por 2 bits.
O campo "bsTttBandsLow" 907 pode ser representadopor um número de bits decidido por uma função teto tomando-se o "numBands" como uma variável.
Por exemplo: i) no caso de 0 < bsTttBandsLow <numBands ou 0 < bsTttBandsLow < numBands, o campo "bsTtt-BandsLow" 907 é representado por um número de bits corres-pondente a um valor de teto (log2 (numBands) ) ou ii) no casode 0 < bsTttBandsLow < numBands, o campo "bsTttBandsLow" 907pode ser representado por teto (Iog2 (numBands+1) bits.
Se um valor igual ou menor a "numBands", isto é,"numberBands" é arbitrariamente determinado, o campo "bsTtt-BandsLow" 907 pode ser representado por um número variávelde bits usando o "numberBands".
Em particular, i) no caso de 0 < bsTttBandsLow <numberBands ou 0 < bsTttBandsLow < numberBands, o campo"bsTttBandsLow" 907 é representado por um número de bitscorrespondente a um valor de teto (Iog2 (numberBands) ) ou ii)no caso de 0 < bsTttBandsLow < numberBands, o campo "bsTtt-BandsLow" 907 pode ser representado por um número de bitscorrespondente a um valor de teto (log2 (numberBands + 1) .
Se no caso de múltiplos conversores TTT, uma com-binação dos "bsTttBandsLow" pode ser expressa como a Fórmuladefinida abaixo.
[Fórmula 5]
<formula>formula see original document page 32</formula>
Neste caso, bsTttBandsLowi indica um i2 "bsTtt-BandsLow". Como a Fórmula 5 é idêntica à Fórmula 1, uma ex-plicação detalhada da Fórmula 5 é omitida na seguinte des-crição .
No caso de múltiplos conversores TTT, a combinaçãode "bsTttBandsLow" pode ser representada como uma das Fórmu-las 6 a 8 usando o "numberbands". Como o significado dasFórmulas 6 a 8 é idêntico ao das Fórmulas 2 a 4, uma expli-cação detalhada das Fórmulas 6 a 8 será omitida na seguintedescrição.
[Fórmula 6]
<formula>formula see original document page 32</formula>
[Fórmula 7]
<formula>formula see original document page 32</formula>
[Fórmula 8]
<formula>formula see original document page 32</formula>
Um número de bandas de parâmetros aplicadas ao mó-dulo de conversão de canal (por exemplo, conversor OTT e/ouconversor TTT) pode ser representado como um valor de divi-são dos "numBands". Nesse caso, o valor de divisão usa ummeio valor do "numBands" ou um valor resultante da divisãodos "numBands" por um valor especifico.
Uma vez que um número de bandas de parâmetros a-plicadas ao conversor OTT e/ou TTT é determinado, conjuntosde parâmetros podem ser determinados, os quais podem ser a-plicados a cada conversor OTT e/ou a cada conversor TTT emuma faixa de número de bandas de parâmetros. Cada um dosconjuntos de parâmetros pode ser aplicado a cada conversorOTT e/ou a cada conversor TTT pela unidade de canal de divi-são de tempo. Ou seja, um conjunto de parâmetro pode ser a-plicado a um canal de divisão de tempo.
Como mencionado na descrição anterior, um quadroespacial pode incluir uma pluralidade de canais de divisãode tempo. Se o quadro espacial é um tipo de quadro fixo, en-tão um conjunto de parâmetros pode ser aplicado a uma plura-lidade de canais de divisão de tempo com um intervalo igual.Se o quadro é um tipo de quadro variável, a informação deposição do canal de divisão de tempo ao qual o conjunto deparâmetros é aplicado é necessária. Isso será explicado maisdetalhadamente com relação às FIGs. 13A a 13C.
A FIG. 10A ilustra uma sintaxe para informação deconfiguração de extensão espacial para um quadro de extensãoespacial de acordo com uma modalidade da presente invenção.A informação de configuração de extensão espacial pode in-cluir um campo "bsSacExtType" 1001, um campo "bsSacExtLen"1002, um campo "bsSacExtLenAdd" 1003, um campo "bsSacExtLe-nAddAdd" 1004 e um campo "bsFillBits" 1007. Outros campossão possíveis.
0 campo "bsSacExtType" 1001 indica um tipo de da-dos de um quadro de extensão espacial. Por exemplo, o quadrode extensão espacial pode ser preenchido com zeros, dados desinal residual, dados de sinal residual de mistura descen-dente arbitrários ou dados de árvore arbitrários.
O campo "bsSacExtLen" 1002 indica um número de by-tes da informação de configuração de extensão espacial.
O campo "bsSacExtLenAdd" 1003 indica um número a-dicional de bytes de informação de configuração de extensãoespacial se um número de bytes da informação de extensão es-pacial se torna igual ou maior do que, por exemplo, 15.
O campo "bsSacExtLenAddAdd" 1004 indica um númeroadicional de bytes de informação de configuração de extensãoespacial se um número de bytes da informação de configuraçãode extensão espacial se torna igual ou maior do que, por e-xemplo, 270.
Depois dos respectivos campos terem sido determi-nados/extraídos em um codificador/decodificador, a informa-ção de configuração para um tipo de dados incluído no quadrode extensão espacial é determinada (1005).
Gomo mencionado na descrição anterior, dados desinal residual, dados de sinal residual de mistura descen-dente arbitrários, dados de configuração de árvore ou seussimilares podem ser incluídos no quadro de extensão espacial.
Subseqüentemente, um número de bits não usados deum comprimento da informação de configuração de extensão es-pacial é calculado 1006.O campo "bsFillBits" 1007 indica um número de bitsde dados que podem ser desprezados para preencher os bitsnão usados.
As FIGs. 10B e 10C ilustram sintaxes para informa-ção de configuração de extensão espacial para um sinal resi-dual no caso em que o sinal residual está incluído em umquadro de extensão espacial de acordo com uma modalidade dapresente invenção.
Com relação à FIG. 10B, um campo "bsResidualSam-plingFrequencylndex" 1008 indica uma freqüência de amostra-gem de um sinal residual.
Um campo "bsResidualFramesPerSpatialFrame" 1009indica um número de quadros residuais por um quadro espaci-al. Por exemplo, 1, 2, 3 ou 4 quadros residuais podem serincluídos em um quadro espacial.
Um bloco "ResidualConfig" 1010 indica um número debandas de parâmetros para um sinal residual aplicado a cadaconversor OTT e/ou conversor TTT.
Com relação à FIG. 10C, um campo "bsResidualPre-sent" 1011 indica se um sinal residual é aplicado a cadaconversor OTT e/ou TTT.
Um campo "bsResidualBands" 1012 indica um númerode bandas de parâmetros do sinal residual existentes em cadaconversor OTT e/ou TTT se o sinal residual existe em cadaconversor OTT e/ou TTT. Um número de bandas de parâmetros dosinal residual pode ser representado por um número fixo debits ou um número variável de bits. No caso em que o númerode bandas de parâmetros é representado por um número fixo debits, o sinal residual é capaz de ter um valor igual ou me-nor a um número total de bandas de parâmetro de um sinal deáudio. Assim, um número de bits (por exemplo, 5 bits na FIG.10C) necessário para representar um número de todas as ban-das de parâmetros pode ser alocado.
A FIG. IOD ilustra uma sintaxe para representar umnúmero de bandas de parâmetros de um sinal residual por umnúmero variável de bits de acordo com uma modalidade da pre-sente invenção. Um campo "bsResidualBands" 1014 pode ser re-presentado por um número variável de bits usando "numBands".Se o numBands é igual ou maior do que 2A(n-l) e menor do que2Λ(η), o campo "bsResidualBands" 1014 pode ser representadopor η bits.
Por exemplo: (i) se o "numBands é 40, o campo "bs-ResidualBands" 1004 é representado por 6 bits; (ii) se o"numBands" é 28 ou 20, o campo "bsResidualBands" 1004 é re-presentado por 5 bits; (iii) se o "numBands" é 14 ou 10, ocampo "bsResidualBands" 1004 é representado por 4 bits; e(iv) se o "numBands" é 7, 5 ou 4, o campo "bsResidualBands"1004 é representado por 3 bits.
Se o numBands é maior do que 2A (n-1) e igual oumenor do que 2A(η), então o número de bandas de parâmetro dosinal residual pode ser representado por η bits.
Por exemplo: (i) se o "numBands é 40, o campo "bs-ResidualBands" 1004 é representado por 6 bits; (ii) se o"numBands" é 28 ou 20, o campo "bsResidualBands" 1004 é re-presentado por 5 bits; (iii) se o "numBands" é 14 ou 10, ocampo "bsResidualBands" 1004 é representado por 4 bits; (iv)se o "numBands" é 7 ou 5, o campo "bsResidualBands" 1004 érepresentado por 3 bits; e (v) se o "numBands" é 4, o campo"bsResidualBands" 1004 é representado por 2 bits.
Além disso, o campo "bsResidualBands" 1014 podeser representado por um número de bits decidido por uma fun-ção teto de arredondar para cima para um inteiro mais próxi-mo tomando-se o "numBands" como uma variável.
Em particular, i) no caso de 0 < bsResidualBands <numBands ou 0 < bsResidualBands < numBands, o campo "bsResi-dualBands" 1014 é representado por teto {Iog2 (numBands) } bitsou ii) no caso de 0 < bsResidualBands < numBands, o campo"bsResidualBands" 1014 pode ser representado por te-to{Iog2(numBands+1} bits.
Em algumas modalidades, o campo "bsResidualBands"1014 pode ser representado usando um valor (numberbands) i-gual ou menor ao numBands.
Em particular, i) no caso de 0 < bsResidualBands <numberBands ou 0 < bsResidualBands < numberBands, o campo"bsResidualBands" 1014 é representado por te-to { Iog2 (numberBands ) } bits ou ii) no caso de 0 < bsResidual-Bands < numberBands, o campo "bsResidualBands" 1014 pode serrepresentado por teto{Iog2(numberBands+1} bits.
Se uma pluralidade de sinais residuais (N) existe,uma combinação do "bsResidualBands" pode ser expressa comomostrado na Fórmula 9 abaixo.
[Fórmula 9]
<formula>formula see original document page 37</formula>
Neste caso, bsResidualBandsi indica um i2 "bsResi-dualBands". Como o significado da Fórmula 9 é idêntico ao daFórmula 1, uma explicação detalhada da Fórmula 9 é omitidana seguinte descrição.
Se há múltiplos sinais residuais, a combinação de"bsResidualBands" pode ser representada como uma das Fórmu-las 10 a 12 usando o "numberbands". Como a representação de"bsResidualBands" usando o "numberBands" é idêntica à repre-sentação das Fórmulas 2 a 4, sua explicação detalhada deveser omitida na seguinte descrição.
<formula>formula see original document page 38</formula>
Um número de bandas de parâmetros do sinal residu-al pode ser representado como um valor de divisão dos "num-Bands". Nesse caso, o valor de divisão usa um meio valor do"numBands" ou um valor resultante da divisão dos "numBands"por um valor especifico.
O sinal residual pode ser incluído em um fluxo debits de um sinal de áudio junto com um sinal de mistura des-cendente e um sinal de informação espacial, e o fluxo debits pode ser transferido para um decodificador. O decodifi-cador pode extrair o sinal de mistura descendente, o sinalde informação espacial e o sinal residual do fluxo de bits.
Subseqüentemente, o sinal de mistura descendente émistura de forma ascendente usando a informação espacial.Enquanto isso, o sinal residual é aplicado ao sinal de mis-tura descendente no curso da mistura ascendente. Em particu-lar, o sinal de mistura descendente é mistura de forma as-cendente em uma pluralidade de módulos de conversão de canalusando a informação espacial. Fazendo isso, o sinal residualé aplicado ao módulo de conversão de canal. Como mencionadona descrição anterior, o módulo de conversão de canal tem umnúmero de bandas de parâmetro e um conjunto de parâmetros éaplicado ao módulo de conversão de canal por uma unidade decanal de divisão de tempo. Quando o sinal residual é aplica-do ao módulo de conversão de canal, o sinal residual podeser necessário para atualizar a informação de correlação in-tercanal do sinal de áudio ao qual o sinal residual é apli-cado. Então, a informação de correlação intercanal atualiza-da é usada em um processo de mistura ascendente.
A FIG. IlA é um diagrama de bloco de um decodifi-cador para codificação não guiada de acordo com uma modali-dade da presente invenção. Codificação não guiada significaque informação espacial não está incluída em um fluxo debits de um sinal de áudio.
Em algumas modalidades, o decodificador inclui umbanco de filtros de análise 1102, uma unidade de análise1104, uma unidade de síntese espacial 1106 e um banco defiltros síntese 1108. Embora um sinal de mistura descendenteem um tipo de sinal estéreo seja mostrado na FIG. 11A, ou-tros tipos de sinais de mistura descendente podem ser usa-dos .Em operação, o decodificador recebe um sinal demistura descendente 1101 e o banco de filtros de análise1102 o converte em um sinal no domínio da freqüência 1103. Aunidade de analise 1104 gera informação espacial a partir dosinal de mistura descendente convertido 1103. A unidade deanálise 1104 executa um processamento por uma unidade de ca-nal e a informação espacial 1105 pode ser gerada por umapluralidade de canais. Nesse caso, o canal inclui um canalde divisão de tempo.
A informação espacial pode ser gerada em duas eta-pas. Primeiro, um parâmetro de mistura descendente é geradoa partir do sinal de mistura descendente. Segundo, o parâme-tro de mistura descendente é convertido em informação espa-cial, tal como o parâmetro espacial. Em algumas modalidades,o parâmetro de mistura descendente pode ser gerado atravésde um cálculo de matriz do sinal de mistura descendente.
A unidade de síntese espacial 1106 gera um sinalde áudio multicanal 1107 sintetizando a informação espacialgerada 1105 com o sinal de mistura descendente 1103. O sinalde áudio multicanal gerado 1107 passa através do banco defiltros de síntese 1108 a ser convertido em um sinal de áu-dio no domínio do tempo 1109.
A informação espacial pode ser gerada em posiçõesde canal pré-determinadas. A distância entre as posições po-de ser igual (isto é, eqüidistante). Por exemplo, a informa-ção espacial pode ser gerada por 4 canais. A informação es-pacial pode também ser gerada em posições de canal variá-veis. Nesse caso, a informação de posição de canal a partirda qual a informação espacial é gerada pode ser extraída dofluxo de bits. A informação de posição pode ser representadapor um número variável de bits. A informação de posição podeser representada como um valor absoluto e um valor de dife-rença de uma informação de posição de canal anterior.
No caso de usar a codificação não guiada, um núme-ro de bandas de parâmetros (chamadas "bsNumguidedBlind-Bands") para cada canal de um sinal de áudio pode ser repre-sentado por um número fixo de bits. 0 "bsNumguideBlindBands"pode ser representado por um número variável de bits usando"numBands". Por exemplo, se o "numBands" é igual ou maior doque 2A(n-l) e menor do que 2A(η), o "bsNumguideBlindBands"pode ser representado por η bits variáveis.
Em particular, (a) se o "numBands é 40, o campo"bsNumguideBlindBands" é representado por 6 bits; (b) se o"numBands" é 28 ou 20, o campo "bsNumguideBlindBands" é re-presentado por 5 bits; (c) se o "numBands" é 14 ou 10, ocampo "bsNumguideBlindBands" é representado por 4 bits; e(d) se o "numBands" é 7, 5 ou 4, o campo "bsNumguideBlind-Bands" é representado por 3 bits.
Se o "numBands" é maior do que 2Λ(η-1) e igual oumenor do que 2A (η) , o "bsNumguideBlindBands" pode ser repre-sentado por η bits variáveis.
Por exemplo: (a) se o "numBands é 40, o campo "bs-NumguideBlindBands" é representado por 6 bits; (b) se o"numBands" é 28 ou 20, o campo "bsNumguideBlindBands" é re-presentado por 5 bits; (c) se o "numBands" é 14 ou 10, ocampo "bsNumguideBlindBands" é representado por 4 bits; (d)se o "numBands" é 7 ou 5, o campo "bsNumguideBlindBands" érepresentado por 3 bits; e (e) se o "numBands" é 4, o campo"bsNumguideBlindBands" é representado por 2 bits.
Além disso, "bsNumguideBlindBands" pode ser repre-sentado por um número variável de bits usando a função tetotomando "numBands" como uma variável.
Por exemplo, i) no caso de 0 < bsNumguideBlind-Bands < numBands ou 0 < bsNumguideBlindBands < numBands, ocampo "bsNumguideBlindBands" é representado por te-to{Iog2 (numBands) } bits ou ii) no caso de 0 < bsNumguide-BlindBands < numBands, o campo "bsNumguideBlindBands" podeser representado por teto {Iog2 (numBands + 1) } bits.
Se um valor igual ou menor do que "numBands", istoé, "numberBands" é arbitrariamente determinado, o campo "bs-NumguideBlindBands" pode ser representado como segue.
Em particular, i) no caso de 0 < bsNumguideBlind-Bands < numberBands ou 0 < bsNumguideBlindBands < number-Bands, o campo "bsNumguideBlindBands" é representado por te-to { Iog2 (numberBands ) } bits ou ii) no caso de O < bsNumguide-BlindBands < numberBands, o campo "bsNumguideBlindBands" po-de ser representado por teto{Iog2 (numberBands+1) } bits.
Se um número de canais (N) existe, uma combinaçãodo "bsNumguideBlindBands" pode ser expressa como mostrado naFórmula 13.
[Fórmula 13]
<formula>formula see original document page 42</formula>
Neste caso, bsNumguideBlindBandSi indica um i- "bsNumguide-BlindBands". Como o significado da Fórmula 13 é idêntico aoda Fórmula 1, uma explicação detalhada da Fórmula 13 é omi-tida na seguinte descrição.
Se há múltiplos canais, "bsNumguideBlindBands" po-de ser representado como uma das Fórmulas 14 a 16 usando o"numberbands". Como a representação de "bsNumguideBlind-Bands" usando o "numberBands" é idêntica à representação dasFórmulas 2 a 4, a explicação detalhada das Fórmulas 14 a 16será omitida na seguinte descrição.
[Fórmula 14]
<formula>formula see original document page 43</formula>
[Fórmula 15]
<formula>formula see original document page 43</formula>
[Fórmula 16]
<formula>formula see original document page 43</formula>
A FIG. IlB é um diagrama para um método de representar umnúmero de bandas de parâmetros como um grupo de acordo comuma modalidade da presente invenção. Um número de bandas deparâmetros inclui informação de número de bandas de parâme-tros aplicadas a um módulo de conversão de canal, informaçãode número de.bandas de parâmetros aplicadas a um sinal resi-dual e informação de número de bandas de parâmetros para ca-da canal de um sinal de áudio no caso de usar codificaçãonão guiada. No caso de que há uma pluralidade de informaçãode número de bandas de parâmetros, a pluralidade de informa-ção de número (por exemplo, "bsOttBands", "bsTttBands", "bs-ResidualBands" e/ou "bsNumguideBlindBands") pode ser repre-sentada como pelo menos um ou mais grupos.Com relação à FIG. 11B, se há (kN+L) informação denúmero de bandas de parâmetros e se Q bits são necessáriospara representar cada informação de número de bandas de pa-râmetros, uma pluralidade de informação de número de bandasde parâmetros pode ser representada como um grupo seguinte.Nesse caso, Ak' e λΝ' são inteiros arbitrários não nulos e1L' é um inteiro arbitrário na faixa 0 < L < N.
Um método de agrupamento inclui as etapas de gerark grupos ligando-se informação de número N de bandas de pa-râmetros e gerar um último grupo ligando-se a última infor-mação de número L de bandas de parâmetros. Os k grupos podemser representados como M bits e o último grupo pode ser re-presentado como ρ bits. Nesse caso, os M bits são preferen-cialmente menos do que N*Q bits usados no caso de represen-tar cada informação de número de bandas de parâmetros semagrupá-las.
Por exemplo, assume-se que duas informações de nú-mero de bandas de parâmetros são bl e b2, respectivamente.Se cada uma de bl e b2 é capaz de ter cinco valores, 3 bitssão necessários para representar cada uma de bl e b2. Nessecaso, mesmo se os 3 bits são capazes de representar oito va-lores, cinco valores são substancialmente necessários. As-sim, cada uma de bl e bl tem três redundâncias. Ainda, nocaso de representar bl e b2 como um grupo ligando-se bl e b2juntos, 5 bits podem ser usados ao invés de 6 bits (= 3 bits+ 3 bits). Em particular, como todas as combinações de bl eb2 incluem 25 (=5*5) tipos, um grupo de bl e b2 pode ser re-presentado como 5 bits. Como os 5 bits são capazes de repre-sentar 32 valores, sete redundâncias são geradas no caso darepresentação de agrupamento. Ainda, no caso de uma repre-sentação agrupando-se bl e b2, a redundância é menor do queaquela de um caso de representar cada um de bl e b2 como 3bits. Um método de representar uma pluralidade de informaçãode número de bandas de parâmetros como grupos pode ser im-plementado de várias formas como segue.
Se uma pluralidade de informação de número de ban-das de parâmetros tem 40 tipos de valores cada, k grupos sãogerados usando 2, 3, 4, 5 ou 6 como o N. Os k grupos podemser representados como 11, 16, 22, 27 e 32 bits, respectiva-mente. Alternativamente, os k grupos são representados com-binando-se os respectivos casos.
Se uma pluralidade de informações de número debandas de parâmetros tem 28 tipos de valores cada, k grupossão gerados usando 6 como o N, e os k grupos podem ser re-presentados como 29 bits.
Se uma pluralidade de informações de número debandas de parâmetros tem 20 tipos de valores cada, k grupossão gerados usando 2, 3, 4, 5, 6 ou 7 como o N. Os k grupospodem ser representados como 9, 13, 18, 22, 16 e 31 bits,respectivamente. Alternativamente, os k grupos podem ser re-presentados combinando-se os respectivos casos.
Se uma pluralidade de informações de número debandas de parâmetros tem 14 tipos de valores cada, k grupossão gerados usando 6 como o N. Os k grupos podem ser repre-sentados como 23 bits.
Se uma pluralidade de informações de número debandas de parâmetros tem 10 tipos de valores cada, k grupossão gerados usando 2, 3, 4, 5, 6, 7, 8 ou 9 como o N. Os kgrupos podem ser representados como 7, 10, 14, 17, 20, 24,27 e 30 bits, respectivamente. Alternativamente, os k grupospodem ser representados combinando-se os respectivos casos.
Se uma pluralidade de informações de número debandas de parâmetros tem 7 tipos de valores cada, k grupossão gerados usando 6, 7, 8, 9, 10 ou 11 como o N. Os k gru-pos podem ser representados como 17, 20, 23, 26, 29 e 31bits, respectivamente. Alternativamente, os k grupos podemser representados combinando-se os respectivos casos.
Se uma pluralidade de informações de número debandas de parâmetros tem 5 tipos de valores cada, k grupossão gerados usando 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 ou 13como o N. Os k grupos podem ser representados como 5, 7, 10,12, 14, 17, 19, 21, 24, 26, 28 e 31 bits, respectivamente.Alternativamente, os k grupos podem ser representados combi-nando-se os respectivos casos.
Além disso, uma pluralidade de informações de nú-mero de bandas de parâmetros pode ser configurada para serrepresentada como os grupos descritos acima, ou para serconsecutivamente representada tornando cada informação denúmero de bandas de parâmetros em uma seqüência de bits in-dependente.
A FIG. 12 ilustra sintaxe que representa informa-ção de configuração de um quadro espacial de acordo com umamodalidade da presente invenção. Um quadro espacial incluium bloco "Framinglnfo" 1201, um campo "bsIndependencyFlag"1202, um bloco wOttData" 1203, um bloco "TttData" 1204, umbloco "SmgData" 1205 e um bloco "tempShapeData" 1206.
0 bloco "Framinglnfo" 1201 inclui informação paraum número de conjuntos de parâmetros e informação para canalde divisão de tempo ao qual cada conjunto de parâmetros éaplicado. O bloco "Framinglnfo" 1201 é explicado em detalhesna FIG. 13A.
O campo "bsIndependencyFlag" 1202 indica se umquadro atual pode ser decodificado sem conhecimento de umquadro anterior.
O bloco "OttData" 1203 inclui toda a informação deparâmetro espacial para todos os conversores OTT.
O bloco "TttData" 1204 inclui toda a informação deparâmetro espacial para todos os conversores TTT.
O bloco "SmgData" 1205 inclui informação para sua-vização temporal aplicada a um parâmetro espacial desquanti-zado.
O bloco "TempShapeData" 1206 inclui informação pa-ra ajuste de envelope temporal aplicado a um sinal descorre-lacionado.
A FIG. 13A ilustra uma sintaxe para representarinformação de posição de canal de divisão de tempo, ao qualum conjunto de parâmetros é aplicado, de acordo com uma mo-dalidade da presente invenção. 0 campo "bsFramingType" 1301indica se um quadro espacial de um sinal de áudio é um tipode quadro fixo ou um tipo de quadro variável. Um quadro fixosignifica um quadro que um conjunto de parâmetro é aplicadoa um canal de divisão de tempo pré-estabelecido. Por exem-pio, um conjunto de parâmetros é aplicado a um canal de di-visão de tempo pré-estabelecido com um intervalo igual. 0quadro variável significa um quadro que separadamente recebeinformação de posição de um canal de divisão de tempo aoqual um conjunto de parâmetros é aplicado.
Um campo "bsNumParamSets" 1302 indica um número deconjuntos de parâmetros em um quadro espacial (chamado "num-ParamSets"), e uma relação de "numParamSets = bsNumParamSets+ 1" existe entre o "numParamSets" e o "bsNumParamSets".
Como, por exemplo, 3 bits são alocados para o cam-po "bsNumParamSets" 1302 na FIG. 13A, um máximo de oito con-juntos de parâmetros pode ser fornecido em um quadro espaci-al. Como não há limite do número de bits alocados, mais con-juntos de parâmetros podem ser fornecidos em um quadro espa-ciai.
Se um quadro espacial é um tipo de quadro fixo,informação de posição de um canal de divisão de tempo aoqual um conjunto de parâmetros é aplicado pode ser decididade acordo com uma regra pré-estabelecida, e informação deposição adicional de um canal de divisão de tempo ao qual umconjunto de parâmetros é aplicado é desnecessária. Entretan-to, se o quadro espacial é um tipo de quadro variável, a in-formação de posição de um canal de divisão de tempo ao qualum conjunto de parâmetros é aplicado é necessária.
Um campo "bsParamSlot" 1303 indica informação deposição de um canal de divisão de tempo ao qual um conjuntode parâmetros é aplicado. 0 campo "bsParamSlot" 1303 podeser representado por um número variável de bits usando o nú-mero de canais de divisão de tempo em um quadro espacial,isto é, "numSlots". Em particular, no caso em que o "numS-lots" é igual ou maior do que 2A(n-l) e menor do que 2Λ(η),o campo "bsParamSlot" 1103 pode ser representado por η bits.
Por exemplo: (i) se o "numSlots" está em uma faixaentre 64 e 127, o campo "bsParamSlot" 1303 pode ser repre-sentado por 7 bits; (ii) se o "numSlots" está em uma faixaentre 32 e 63, o campo "bsParamSlot" 1303 pode ser represen-tado por 6 bits; (iii) se o "numSlots" está em uma faixa en-tre 16 e 31, o campo "bsParamSlot" 1303 pode ser representa-do por 5 bits; (iv) se o "numSlots" está em uma faixa entre8 e 15, o campo "bsParamSlot" 1303 pode ser representado por4 bits; (v) se o "numSlots" está em uma faixa entre 4 e 7, ocampo "bsParamSlot" 1303 pode ser representado por 3 bits;(vi) se o "numSlots" está em uma faixa entre 2 e 3, o campo"bsParamSlot" 1303 pode ser representado por 2 bits; (vii)se o "numSlots" é 1, o campo "bsParamSlot" 1303 pode ser re-presentado por 1 bit; e (viii) se o "numSlots" é 0, o campo"bsParamSlot" 1303 pode ser representado por 0 bit. Igual-mente, se o "numSlots" está em uma faixa entre 64 e 127, ocampo "bsParamSlot" 1303 pode ser representado por 7 bits.
Se há múltiplos conjuntos de parâmetros (N), umacombinação do "bsParamSlot" pode ser representada de acordocom a Fórmula 9.
[Fórmula 9]
<formula>formula see original document page 49</formula>
caso, bsParamSlotSi indica um canal de divisão de tempo aoqual o i2 parâmetro é aplicado. Por exemplo, assume-se que o"numSlots" é 3 e que o campo "bsParamSlot" 1303 pode ter dezvalores. Nesse caso, três informações (chamadas cl, c2, ec3, respectivamente) para o campo "bsParamSlot" 1303 são ne-cessárias. Como 4 bits são necessários para representar cadauma de cl, c2 e c3, 12 bits totais (= 4*3) são necessários.No caso de representar cl, c2 e c3 como um grupo ligando-osjuntos, 1.000 (= 10*10*10) casos podem ocorrer, que podemser representados como 10 bits, assim economizando 2 bits.Se o "numSlots" é 3 e se o valor lido como 5 bits é 31, ovalor pode ser representado como 31 = 1χ(3Λ2) + 5*(3Λ1) +7*(3Λ0). Um aparelho decodificador pode determinar que cl,c2 e c3 são 1, 5 e 7, respectivamente, aplicando-se o inver-so da Fórmula 9.
A FIG. 13B ilustra uma sintaxe para representarinformação de posição de um canal de divisão de tempo aoqual um conjunto de parâmetros é aplicado como um valor ab-soluto e um valor de diferença de acordo com uma modalidadeda presente invenção. Se um quadro espacial é um tipo dequadro variável, o campo "bsParamSlot" 1303 na FIG. 13A podeser representado como um valor absoluto e um valor de dife-rença usando um fato de que a informação "bsParamSlot" au-menta monotonamente.
Por exemplo: (i) uma posição de um canal de divi-são de tempo ao qual um primeiro conjunto de parâmetros éaplicado pode ser gerada em um valor absoluto, isto é, "bs-ParamSlot [ 0 ]" ; e (ii) uma posição de um canal de divisão detempo ao qual um segundo conjunto de parâmetros ou maior éaplicado pode ser gerada em um valor de diferença, isto é,"valor de diferença" entre "bsParamSlot[ps]" e "bsParamS-lot[ps-l]" ou "valor de diferença - 1" (chamado "bsDiffPa-ramSlot[ps]").
0 campo "bsParamSlot[0]" 1304 pode ser representa-do por um número de bits (chamado "nBitsParamSlot(0)") cal-culado usando o "numSlots" e o "numParamSets".
0 campo "bsDiffParamSlot[ps]" 1305 pode ser repre-sentado por um número de bits (chamado "nBitParamSlot(ps)")calculado usando o "numSlots", o "numParamSets" e uma posi-ção de um canal de divisão de tempo ao qual um conjunto deparâmetros anterior é aplicado, isto é, "bsParamSlot[ps-1]".
Em particular, para representar "bsParamSlot[ps]"por um número máximo de bits, um número de bits para repre-sentar o "bsParamSlot[ps]" pode ser decidido baseado nas se-guintes regras: (i) uma pluralidade do "bsParamSlot[ps]" au-menta em uma série ascendente (bsParamSlot[ps] > bsParamS-lot [ps-1]); (ii) um valor máximo do "bsParamSlot[0]" é"numSlots - NumParamSets"; e (iii) no caso de 0 < ps < num-ParamSets, "bsParamSlot[ps]" pode ter um valor entre "bsPa-ramSlot[ps-1] + 1" e "numSlots - numParamSets + ps" somente.
Por exemplo, se o "numSlots" é 10 e se o "numPa-ramSets" é 3, como o "bsParamSlot [ps]" aumenta em uma sérieascendente, um valor máximo do "bsParamSlot[0]" se torna"10-3=7". Ou seja, o "bsParamSlot[0]" deveria ser seleciona-do a partir dos valores de 0 a 7. Isso ocorre porque um nú-mero de canais de divisão de tempo para o resto dos conjun-tos de parâmetros (por exemplo, se ps é 1 ou 2) é insufici-ente se o "bsParamSlot[0]" tem um valor maior do que 7.Se "bsParamSlot[0]" é 5, uma posição de canal dedivisão de tempo bsParamSlot[1] para um segundo conjunto deparâmetros deveria ser selecionada a partir de valores entre"5+1=6" e "10-3+1=8".
Se "bsParamSlot[1]" é 7, "bsParamSlot[2] " pode setornar 8 ou 9. Se "bsParamSlot[1]" é 8, "bsParamSlot[2]" po-de se tornar 9.
Portanto, o "bsParamSlot[ps]" pode ser representa-do como um número de bits variável usando as característicasacima ao invés de ser representado como bits fixos.
Configurando o "bsParamSlot[ps]" em um fluxo debits, se o "ps" é 0, o "bsParamSlot[0]" pode ser representa-do como um valor absoluto por um número de bits correspon-dentes a "nBitsParamSlot[0]". Se o "ps" é maior do que 0, o"bsParamSlot[ps]" pode ser representado como um valor de di-ferença por um número de bits correspondente a "nBitsParamS-lot [ps]". Lendo-se o "bsParamSlot[ps]" acima configurado apartir de um fluxo de bits, um comprimento de um fluxo debits para cada dado, isto é, "nBitsParamSlot [ps]" pode serencontrado usando a Fórmula 10.
<table>table see original document page 52</column></row><table>
Em particular, o "nBitsParamSlot[ps]" pode ser en-contrado como nBitsParamSlot[0] = fb(numSlots - numParamSets+ 1) . Se 0 < ps CnumParamSets, o "nBitsParamSlot [ps]" podeser encontrado como nBitsParamSlot[ps] = fb(numSlots - num-ParamSets +ps - bsParamSlot[ps-1]). O "nBitsParamSlot[ps]"pode ser determinado usando a Fórmula 11, que estende a Fór-mula 10 até 7 bits.
Um exemplo da função fb(x) é explicado a seguir.Se "numSlots" é 15 e se "numParamSets" é 3, a função podeser avaliada como nBitsParamSlot [0] = fb(15-3+l) = 4 bits.Se o "bsParamSlot[0]" representado por 4 bits é 7,
a função pode ser avaliada como nBitsParamSlot[1] = fb(15—3 + 1-7) = 3 bits. Nesse caso, o campo "bsDiffParamSlot [1]"1305 pode ser representado por 3 bits.
Se o valor representado pelos 3 bits é 3, "bsPa-ramSlot[1]" se torna 7+3 = 10. Portanto, se torna nBitsPa-ramSlot [2] = fb(15-3+2-10) = 2 bits. Nesse caso, o campo"bsDiffParamSlot[2]" pode ser representado por 2 bits. Se onúmero de canais de divisão de tempo restantes é igual a umnúmero de um conjunto de parâmetros restantes, 0 bit podeser alocado para o campo "bsDiffParamSlot[ps]". Em outraspalavras, nenhuma informação adicional é necessária para re-presentar a posição do canal de divisão de tempo ao qual oconjunto de parâmetros é aplicado.
Assim, um número de bits para "bsParamSlot[ps]"pode ser variavelmente decidido. 0 número de bits para "bs-ParamSlot [ps]" pode ser lido a partir de um fluxo de bitsusando a função fb(x) em um decodificador. Em algumas moda-lidades, a função fb(x) pode incluir a função teto{log2 (x) } .
Lendo informação para "bsParamSlot[ps]" represen-tado como o valor absoluto e o valor de diferença a partirde um fluxo de bits em um decodif icador, primeiro o "bsPa-ramSlot [0]" pode ser lido a partir do fluxo de bits e entãoo "bsDiffParamSlot [ps]" pode ser lido para 0 < ps < numPa-ramSets. 0 "bsParamSlot[ps]" pode então ser encontrado para um intervalo 0 < ps < numParamSets usando o "bsParamSlot[0]"e o "bsDiffParamSlot[ps]". Por exemplo, como mostrado naFIG. 13B, um "bsParamSlot[ps]" pode ser encontrado adicio-nando-se um "bsParamSlot[ps-1]" a um "bsDiffParamS-Iot[ps]+1".
A FIG. 13C ilustra uma sintaxe para representarinformação de posição de um canal de divisão de tempo aoqual um conjunto de parâmetros é aplicado como um grupo deacordo com uma modalidade da presente invenção. No caso emque uma pluralidade de conjuntos de parâmetros existe, umapluralidade de "bsParamSlots" 1307 para uma pluralidade deconjuntos de parâmetros pode ser representada como pelo me-nos um ou mais grupos.
Se um número dos "bsParamSlots" 1307 é (kN+L) e seQ bits são necessários para representar cada "bsParamSlots"1307, os "bsParamSlots" 1307 podem ser representados como umgrupo seguinte. Nesse caso, e ΛΝ' são inteiros arbitrá-rios não nulos e xL' é um inteiro arbitrário na faixa 0 < L < N.
Um método de agrupamento pode incluir as etapas degerar k grupos ligando-se N "bsParamSlots" 1307 cada e gerarum último grupo ligando-se o último L "bsParamSlots" 1307.Os k grupos podem ser representados como M bits e o últimogrupo pode ser representado por ρ bits. Nesse caso, os Mbits são preferencialmente menos do que N*Q bits usados nocaso de representar cada um dos "bsParamSlots" 1307 sem a-grupá-los.
Por exemplo, assume-se que um par de "bsParamS-lots" 1307 para dois conjuntos de parâmetros é dl e d2, res-pectivamente. Se cada um de dl e d2 é capaz de ter cinco va-lores, 3 bits são necessários para representar cada um de dle d2. Nesse caso, mesmo se os 3 bits são capazes de repre-sentar oito valores, cinco valores são substancialmente ne-cessários. Assim, cada uma de dl e dl tem três redundâncias.
Ainda, no caso de representar dl e d2 como um grupo ligando-se dl e d2 juntos, 5 bits podem ser usados ao invés de 6bits (= 3 bits + 3 bits) . Em particular, como todas as com-binações de dl e d2 incluem 25 (=5*5) tipos, um grupo de dle d2 pode ser representado como 5 bits somente. Como os 5bits são capazes de representar 32 valores, sete redundân-cias são geradas no caso da representação de agrupamento.
Ainda, no caso de uma representação agrupando-se dl e d2, aredundância é menor do que aquela de um caso de representarcada um de dl e d2 como 3 bits.
Configurando o grupo, dados para o grupo podem serconfigurados usando "bsParamSlot[0]" para um valor inicial eum valor de diferença entre pares do "bsParamSlot[ps]" paraum segundo valor ou maior.
Configurando o grupo, bits podem ser diretamentealocados sem agrupamento se um número de conjunto de parâme-tros é 1 e bits podem ser alocados depois do termino do a-grupamento se um número de conjuntos de parâmetros é igualou maior do que 2.
A FIG. 14 é um fluxograma de um método de codifi-cação de acordo com uma modalidade da presente invenção. Ummétodo de codificar um sinal de áudio e uma operação de umcodificador de acordo com a presente invenção são explicadosa seguir.
Primeiro, um número total de canais de divisão detempo (numSlots) em um quadro espacial e um número total debandas de parâmetros (numBands) de um sinal de áudio são de-terminados (S1401).
Então, um número de bandas de parâmetro aplicadasa um módulo de conversão de canal (conversor OTT e/ou con-versor TTT) e/ou um sinal residual são determinados (S1402) .
Se o conversor OTT tem um modo de canal LFE, o nú-mero de bandas de parâmetros aplicadas ao conversor OTT éseparadamente determinado.
Se o conversor OTT não tem o modo de canal LFE,"numBands" é usado como um número dos parâmetros aplicadosao conversor OTT.
Subseqüentemente, um tipo de um quadro espacial édeterminado. Nesse caso, o quadro espacial pode ser classi-ficado em um tipo de quadro fixo e um tipo de quadro variável.
Se o quadro espacial é o tipo de quadro variável(S14 03), um número de conjuntos de parâmetros usados em umquadro espacial é determinado (S1406). Nesse caso, o conjun-to de parâmetros pode ser aplicado ao módulo de conversão decanal por uma unidade de canal de divisão de tempo.
Subseqüentemente, uma posição do canal de divisãode tempo ao qual o conjunto de parâmetros é aplicado é de-terminada (S1407). Nesse caso, a posição do canal de divisãode tempo ao qual o conjunto de parâmetros é aplicado podeser representada como um valor absoluto e um valor de dife-rença. Por exemplo, uma posição de um canal de divisão detempo ao qual um primeiro conjunto de parâmetros é aplicadopode ser representada como um valor absoluto, e uma posiçãodo canal de divisão de tempo ao qual um segundo conjunto deparâmetros ou maior é aplicado pode ser representada como umvalor de diferença a partir de uma posição de um canal dedivisão de tempo anterior. Nesse caso, a posição de um canalde divisão de tempo ao qual o conjunto de parâmetros é apli-cado pode ser representada por um número variável de bits.
Em particular, uma posição do canal de divisão detempo ao qual um primeiro conjunto de parâmetros é aplicadopode ser representada por um número de bits calculado usandoum número total de canais de divisão de tempo e um númerototal de conjuntos de parâmetros. Uma posição de um canal dedivisão de tempo ao qual um segundo conjunto de parâmetrosou maior é aplicado pode ser representada por um número debits calculado usando um número total de canais de divisãode tempo, um número total de conjuntos de parâmetros e umaposição de um canal de divisão de tempo ao qual um conjuntode parâmetros anterior é aplicado.
Se o quadro espacial é um tipo de quadro fixo, umnúmero de conjuntos de parâmetros usado em um quadro espaci-al é determinado (S1404). Nesse caso, uma posição de um ca-nal de divisão de tempo ao qual o conjunto de parâmetros éaplicado é decidida usando uma regra pré-estabelecida. Porexemplo, uma posição de um canal de divisão de tempo ao qualum conjunto de parâmetros é aplicado pode ser decidida comotendo um intervalo igual a partir de uma posição de um canalde divisão de tempo ao qual um conjunto de parâmetros ante-rior é aplicado (S1405).
Subseqüentemente, uma unidade de mistura descen-dente e uma unidade de geração de informação espacial geramum sinal de mistura descendente e de informação espacial,respectivamente, usando o número total acima determinado decanais de divisão de tempo, um número total de bandas de pa-râmetros, um número de bandas de parâmetros a serem aplica-das à unidade de conversão de canal, um número total de con-juntos de parâmetros em um quadro espacial e informação deposição do canal de divisão de tempo ao qual um conjunto deparâmetros é aplicado (S1408).
Finalmente, uma unidade de multiplexação gera umfluxo de bits incluindo o sinal de mistura descendente e in-formação espacial (S1409) e então transfere o fluxo de bitsgerado a um decodificador (S1409).
A FIG. 15 é um fluxograma de um método de decodi-ficação de acordo com uma modalidade da presente invenção.Um método de decodificar um sinal de áudio e uma operação deum decodificador de acordo com uma modalidade da presenteinvenção são explicados a seguir.
Primeiro, um decodificador recebe um fluxo de bitsde um sinal de áudio (S1501). Uma unidade de demultiplexaçãosepara um sinal de mistura descendente e um sinal de infor-mação espacial do fluxo de bits recebido (S1502). Subseqüen-temente, uma unidade de decodificação de sinal de informaçãoespacial extrai informação para um número total de canais dedivisão de tempo em um quadro espacial, um número total debandas de parâmetro e um número de bandas de parâmetro apli-cadas a um módulo de conversão de canal a partir da informa-ção de configuração do sinal de informação espacial (S1503).
Se o quadro espacial é um tipo de quadro variável(S1504), um número de conjuntos de parâmetros em um quadroespacial e informação de posição de um canal de divisão detempo ao qual o conjunto de parâmetros é aplicado são extra-ídos do quadro espacial (S1505). A informação de posição docanal de divisão de tempo pode ser representada por um núme-ro fixo ou variável de bits. Nesse caso, a informação de po-sição do canal de divisão de tempo ao qual um primeiro con-junto de parâmetros é aplicado pode ser representada como umvalor absoluto e a informação de posição de canais de divi-são de tempo aos quais o segundo conjunto de parâmetros oumaior é aplicado pode ser representada como um valor de di-ferença. A informação de posição real de canais de divisãode tempo aos quais o segundo conjunto de parâmetros ou maioré aplicado pode ser encontrada adicionando-se o valor de di-ferença à informação de posição do canal de divisão de tempoao qual um conjunto de parâmetros anterior é aplicado.
Finalmente, o sinal de mistura descendente é con-vertido em um sinal de áudio multicanal usando a informaçãoextraída (S1506).
As modalidades descritas acima fornecem váriasvantagens sobre esquemas de codificação de áudio convencio-nais.
Primeiro, em codificação de um sinal de áudio mul-ticanal representando-se uma posição de um canal de divisãode tempo ao qual um conjunto de parâmetros é aplicado por umnúmero variável de bits, as modalidades descritas são capa-zes de reduzir uma quantidade de dados transferidos.
Segundo, representando-se uma posição de um canalde divisão de tempo ao qual um primeiro conjunto de parâme-tros é aplicado como um valor absoluto, e representando-seposições de canais de divisão de tempo aos quais um segundoconjunto de parâmetros ou maior é aplicado como um valor dediferença, as modalidades descritas podem reduzir uma quan-tidade de dados transferidos.
Terceiro, representando-se um número de bandas deparâmetros aplicadas a tal módulo de conversão de canal comoum conversor OTT e/ou um conversor TTT por um número fixo ouvariável de bits, as modalidades descritas podem reduzir umaquantidade de dados transferidos. Nesse caso, as posições decanais de divisão de tempo aos quais os conjuntos de parâme-tros são aplicados podem ser representadas usando o princi-pio dito acima, onde os conjuntos de parâmetros podem exis-tir na faixa de um número de bandas de parâmetros.
A FIG. 16 é um diagrama de bloco de uma arquitetu-ra de dispositivo exemplificada 1600 para implementar o co-dificador/decodificador de áudio, como descrito com relaçãoàs FIGs. 1-15. A arquitetura de dispositivo 1600 é aplicávela uma variedade de dispositivos, incluindo, mas não limitadoa: computadores pessoais, computadores servidores, disposi-tivos eletrônicos de consumo, telefones móveis, assistentespessoais digitais (PDAs), tablets eletrônicas, sistemas detelevisão, dispositivos de conexão à internet via TV, conso-les de jogos, reprodutores de midia, reprodutores de música,sistemas de navegação, e qualquer outro dispositivo capaz dedecodificar sinais de áudio. Alguns desses dispositivos po-dem implementar uma arquitetura modificada usando uma combi-nação de hardware e software.
A arquitetura 1600 inclui um ou mais processadores1602 (por exemplo, Powerpc®, Intel Pentium® 4, etc.), um oumais dispositivos de exibição 1604 (por exemplo, CRT, LCD) ,um sub-sistema de áudio 1606 (por exemplo, hardware/softwarede áudio), uma ou mais interfaces de rede 1608 (por exemplo,Ethernet, FireWire®, USB, etc.), dispositivos de entrada1610 (por exemplo, teclado, mouse, etc.), e um ou mais meioslegíveis por computador 1612 (por exemplo, RAM, ROM, SDRAM,disco rígido, disco óptico, memória rápida, etc.)· Essescomponentes podem trocar comunicações e dados via um ou maisbarramentos 1614 (por exemplo, EISA, PCI, PCI Express,etc.)·
0 termo "meio legível por computador" refere-se aqualquer meio que participa em fornecer instruções a um pro-cessador 1602 para execução, incluindo sem limitação, meiosnão voláteis (por exemplo, discos ópticos ou magnéticos) ,meios voláteis (por exemplo, memória) e meios de transmis-são. Os meios de transmissão incluem, sem limitação, caboscoaxiais, fio de cobre e fibras ópticas. Os meios de trans-missão podem também tomar a forma de ondas acústicas, de luzou de radiofreqüência.
Os meios legíveis por computador 1612 adicional-mente incluem um sistema operacional 1616 (por exemplo, MacOS®, Windows®, Linux, etc.), um módulo de comunicação de re-de 1618, um codec de áudio 1620 e um ou mais aplicativos1622.
0 sistema operacional 1616 pode ser de multiusuá-rios, multiprocessamento, multitarefa, multiencadeamento, emtempo real e seus similares. 0 sistema operacional 1616 exe-cuta tarefas básicas, incluindo, mas não limitado a: reco-nhecer entrada a partir dos dispositivos de entrada 1610;enviar saída a dispositivos de exibição 1604 e o sub-sistemade áudio 1606; rastreio de arquivos e diretórios em meioslegíveis por computador 1612 (por exemplo, memória ou umdispositivo de armazenamento); controlar dispositivos peri-féricos (por exemplo, unidades de disco, impressoras, etc.);e gerenciar tráfego em um ou mais barramentos 1614.
O módulo de comunicações de rede 1618 inclui vá-rios componentes para estabelecer e manter conexões de rede(por exemplo, software para implementar protocolos de comu-nicação, tal como TCP/IP, HTTP, Ethernet, etc.). 0 módulo decomunicações de rede 1618 pode incluir um navegador para ha-bilitar que operadores da arquitetura de dispositivo 1600procurem em uma rede (por exemplo, Internet) por informação(por exemplo, conteúdo de áudio).
O codec de áudio 1620 é responsável por implemen-tar todos os processos de codificação e/ou decodificação ouuma parte desses descritos com relação às FIGs. 1-15. Em al-gumas modalidades, o codec de áudio trabalha em conjunto comhardware (por exemplo, processador(es) 1602, sub-sistema deáudio 1606) para processar sinais de áudio, incluindo sinaisde áudio de codificação e/ou decodificação de acordo com apresente invenção descrita aqui.
Os aplicativos 1622 podem incluir qualquer aplica-tivo de software relacionado a conteúdo de áudio e/ou ondeconteúdo de áudio é codificado e/ou decodificado, incluindo,mas não limitado a reprodutores de midia, reprodutores demúsica (por exemplo, reprodutores de MP3), aplicativos detelefone móvel, PDAs, sistemas de televisão, dispositivos deconexão à internet via TV, etc. Em uma modalidade, o codecde áudio pode ser usado por um provedor de serviço de apli-cativo para fornecer serviços de codificação/decodificaçãopor uma rede (por exemplo, a Internet).
Na descrição acima, para propósitos de explicação,numerosos detalhes específicos são apresentados de modo afornecer um entendimento completo da invenção. Estará apa-rente, entretanto, a um versado na técnica que a invençãopode ser praticada sem esses detalhes específicos. Em outrasocorrências, estruturas e dispositivos são mostrados na for-ma de diagrama de bloco de modo a evitar obscurecer a inven-ção .
Em particular, um versado na técnica reconheceráque outras arquiteturas e ambientes gráficos podem ser usa-dos, e que a presente invenção pode ser implementada usandoferramentas gráficas e produtos além daqueles descritos aci-ma. Em particular, a aproximação cliente/servidor é meramen-te um exemplo de uma arquitetura para fornecer a funcionali-dade de painel da presente invenção; um versado na técnicareconhecerá que outras aproximações não cliente/servidor po-dem também ser usadas.
Algumas partes da descrição detalhada são apresen-tadas em termos de algoritmos e representações simbólicas deoperações em bits de dados em uma memória de computador. Es-sas descrições algorítmicas e representações são os meiosusados por aqueles versados na técnica de processamento dedados para conduzir mais efetivamente' a substância de seutrabalho a outros versados na técnica. As etapas são aquelasque exigem manipulações físicas de quantidades físicas. Usu-almente, apesar de não necessariamente, essas quantidadestomam a forma de sinais elétricos ou magnéticos capazes deserem armazenados, transferidos, combinados, comparados, ede outra forma manipulados. Tem se tornado conveniente àsvezes, principalmente por razoes de uso comum, referir-se aesses sinais como bits, valores, elementos, símbolos, carac-teres, termos, números, ou seu similar.
Aplicabilidade Industrial
Deveria ser trazido em mente, entretanto, que to-dos esses termos e termos similares estão associados com asquantidades físicas apropriadas e são meramente rótulos con-venientes aplicados a essas quantidades. A menos que especi-ficamente determinado de outra forma como aparente a partirda discussão, é apreciado que por toda a descrição, discus-sões utilizando termos tais como "processar" ou "computar"ou "calcular" ou "determinar" ou "exibir" ou seu similar,referem-se à ação e processos de um sistema de computador,ou dispositivo de computação eletrônico similar, que manipu-Ia e transforma dados representados como quantidades físicas(eletrônicas) nos registros e memórias do sistema de compu-tador em outros dados similarmente representados como quan-tidades físicas nas memórias e registros do sistema de com-putador ou outros tais dispositivos de armazenamento de in-formação, transmissão ou exibição.
A presente invenção também se refere a um aparelhopara executar as operações. Esse aparelho pode ser especial-mente construído para os propósitos exigidos, ou pode com-preender um computador de propósito geral ativado ou re-configurado por um programa de computador armazenado no com-putador. Tal programa de computador pode ser armazenado emum meio de armazenamento legível por computador, tal como,mas não limitado a, qualquer tipo de disco incluindo discosflexíveis, discos ópticos, CD-ROMs, e discos ópticos magné-ticos, memórias somente de leitura (ROMs), memórias de aces-so aleatório (RAMs), EPROMs, EEPROMs, cartões magnéticos ouópticos, ou qualquer tipo de meio adequado para armazenarinstruções eletrônicas, e cada um acoplado a um barramentode sistema de computador.
Os algoritmos e módulos apresentados aqui não es-tão inerentemente relacionados a qualquer computador parti-cular ou outro aparelho. Vários sistemas de propósito geralpodem ser usados com programas de acordo com os ensinamentosaqui, ou podem se provar convenientes para construir apare-lhos mais especializados em executar as etapas de método. Aestrutura exigida para uma variedade desses sistemas apare-cerá a partir da descrição acima. Em adição, a presente in-venção não é descrita com relação a qualquer linguagem deprogramação. Será apreciado que uma variedade de linguagensde programação pode ser usada para implementar os ensinamen-tos da invenção como descrito aqui. Além disso, como estaráaparente a um versado na técnica relevante, os módulos, ca-racterísticas, atributos, metodologias, e outros aspectos dainvenção podem ser implementados como software, hardware,suporte lógico inalterável ou qualquer combinação dos três.É claro, sempre que um componente da presente invenção é im-plementado como software, o componente pode ser implementadocomo um programa autônomo, como parte de um programa maior,como uma pluralidade de programas separados, como uma bibli-oteca estatisticamente ou dinamicamente ligada, como um mó-dulo kernel carregável, como um acionador de dispositivo,e/ou em cada forma conhecida agora ou no futuro àqueles ver-sados na técnica de programação de computador. Adicionalmen-te, a presente invenção não é de nenhuma forma limitada àimplementação em qualquer sistema ou ambiente operacionalespecifico.
Aqueles versados na técnica estarão cientes de quevárias modificações e variações podem ser feitas às modali-dades descritas sem abandonar o espirito ou escopo da inven-ção. Assim, pretende-se que a presente invenção cubra todastais modificações e variações das modalidades descritas,fornecido que tais modificações e variações estão no escopodas reivindicações em anexo e seus equivalentes.

Claims (20)

1. Método de codificar um sinal de áudio,CARACTERIZADO pelo fato de que compreende:determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros, os conjuntos de pa-râmetros incluem um ou mais parâmetros;gerar informação que indica uma posição de no mí-nimo um canal de divisão de tempo em um conjunto ordenado decanais de divisão de tempo ao qual um conjunto de parâmetrosé aplicado;codificar o sinal de áudio como um fluxo de bitsincluindo um quadro, o quadro inclui o conjunto ordenado decanais de divisão de tempo; einserir um número variável de bits no · fluxo debits que representa a posição do canal de divisão de tempono conjunto ordenado de canais de divisão de tempo, onde onúmero variável de bits é determinado pela posição do canalde divisão de tempo.
2. Método de codificar um sinal de áudio,CARACTERIZADO pelo . fato de que compreende:receber um fluxo de bits que representa um sinalde áudio, o fluxo de bits tem um quadro;determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros do fluxo de bits, osconjuntos de parâmetros incluem um ou mais parâmetros;determinar a informação de posição do fluxo debits, a qual indica a posição de um canal de divisão de tem-po em um conjunto ordenado de canais de divisão de tempo aoqual o conjunto de parâmetros é aplicado, onde o conjuntoordenado de canais de tempo está incluído no quadro; edecodificar o sinal de áudio baseado no número decanais de divisão de tempo, o número de conjuntos de parâme-tros e a informação de posição,onde a informação de posição é representada por umnúmero variável de bits baseados na posição do canal de di-visão de tempo.
3. Método, de acordo com a reivindicação 2,CARACTERIZADO pelo fato de que o número variável de bits édeterminado usando o número de canais de divisão de tempo.
4. Método, de acordo com a reivindicação 2,CARACTERIZADO adicionalmente pelo fato de que compreende:se o número de canais de divisão de tempo a seremdecodificados é igual a um número de conjuntos de parâmetrosa serem aplicados, não determinar a informação de posição docanal de divisão de tempo ao qual um conjunto de parâmetrosé aplicado.
5. Método, de acordo com a reivindicação 4,CARACTERIZADO pelo fato de que se o número de canais de di-visão de tempo é igual ou maior do que 2Λ(η-1) e menor doque 2Λ(η), o número variável de bits é determinado como ηbits.
6. Método, de acordo com a reivindicação 4,CARACTERIZADO pelo fato de que se o número de canais de di-visão de tempo é maior do que 2Λ(η-1) e igual ou menor doque 2Λ(η), o número variável de bits é determinado como ηbits.
7. Método, de acordo com a reivindicação 3,CARACTERIZADO pelo fato de que a informação de posição é re-presentada como a soma de uma valor anterior e um valor dediferença, onde o valor anterior indica a informação de po-sição do canal de divisão de tempo ao qual um primeiro con-junto de parâmetros é aplicado e o valor de diferença indicaa informação de posição do canal de divisão de tempo ao qualum segundo conjunto de parâmetros é aplicado.
8. Método, de acordo com a reivindicação 7,CARACTERIZADO pelo fato de que o valor anterior é represen-tado por um número variável de bits determinados usando nomínimo um do número de canais de divisão de tempo e o númerode conjuntos de parâmetros.
9. Método, de acordo com a reivindicação 8,CARACTERIZADO pelo fato de que o número variável de bits édeterminado usando uma diferença entre o número de canais dedivisão de tempo e o número de conjuntos de parâmetros.
10. Método, de acordo com a reivindicação 7,CARACTERIZADO pelo fato de que o valor de diferença é repre-sentado por um número variável de bits determinado usando nomínimo um do número de canais de divisão de tempo, do númerode conjuntos de parâmetros e de uma informação de posição docanal de divisão de tempo ao qual um conjunto de parâmetrosanteriores é aplicado.
11. Método, de acordo com a reivindicação 10,CARACTERIZADO pelo fato de que o número variável de bits édeterminado usando uma diferença entre o número de canais dedivisão de tempo e no mínimo um do número de conjuntos deparâmetros e da informação de posição do canal de divisão detempo ao qual o conjunto de parâmetros anteriores é aplicado.
12. Método, de acordo com a reivindicação 3,CARACTERIZADO pelo fato de que se o número de conjuntos deparâmetros é N, a informação de posição do canal de divisãode tempo ao qual o conjunto de parâmetros é aplicado, é re-presentada como uma combinação usando uma fórmula como se-gue :<formula>formula see original document page 71</formula>onde numSlots e bsParamSloti indicam o número decanais de divisão de tempo e a informação de posição do ca-nal de divisão de tempo aos quais um ith conjunto de parâme-tros é aplicado, respectivamente.
13. Método, de acordo com a reivindicação 3,CARACTERIZADO pelo fato de que se uma pluralidade de conjun-tos de parâmetros existe, uma pluralidade dos conjuntos deparâmetros é dividida como um grupo e a informação de posi-ção do canal de divisão de tempo à qual o conjunto de parâ-metros é aplicado, é representada pelo grupo.
14. Método, de acordo com a reivindicação 12,CARACTERIZADO pelo fato de que se o número dos conjuntos deparâmetros é (KN+L), o grupo é gerado ligando-se N dos con-juntos de parâmetros juntos e é representado por M bits, eum último grupo é gerado ligando-se L dos conjuntos de parâ-metros juntos e é representado por P bits.
15. Aparelho para codificar um sinal de áudio,CARACTERIZADO pelo fato de que compreende um codificadorconfigurado para:determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros, os conjuntos de pa-râmetros incluem um ou mais parâmetros; gerar informação que indica uma posição de no mí-nimo um canal de divisão de tempo em um conjunto ordenado decanais de divisão de tempo ao qual um parâmetro é aplicado;codificar o sinal de áudio como um fluxo de bitsque inclui um quadro, o quadro inclui um conjunto ordenadode canais de divisão de tempo; einserir um número variável de bits no fluxo debits que representa a posição do canal de divisão de tempono conjunto ordenado de canais de divisão de tempo, onde onúmero variável de bits é determinado a partir da posição docanal de divisão de tempo.
16. Aparelho para decodificar um sinal de áudio,CARACTERIZADO pelo fato de que compreende um decodificadorconfigurado para:receber um fluxo de bits que representa um sinalde áudio, o fluxo de bits tem um quadro;determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros do fluxo de bits, osconjuntos de parâmetros incluem um ou mais parâmetros;determinar a informação de posição do fluxo debits, a informação de posição indica uma posição de um canalde divisão de tempo em um conjunto ordenado de canais de di-visão de tempo incluídos no quadro ao qual o conjunto de pa-râmetros é aplicado; edecodificar o sinal de áudio baseado no número decanais de divisão de tempo, no número de conjuntos de parâ-metros e na informação de posição,onde a informação de posição é representada por umnúmero variável de bits baseados na posição do canal de di-visão de tempo.
17. Estrutura de dados para inclusão em um fluxode bits que representa um sinal de áudio, CARACTERIZADA pelofato de que compreende:um primeiro campo que inclui um número de canaisde divisão de tempo;um segundo campo que inclui um número de conjuntosde parâmetros; eum terceiro campo que inclui a informação de posi-ção para determinar uma posição de um canal de divisão detempo ao qual um conjunto de parâmetros é aplicado, onde ainformação de posição é representada por um número variávelde bits baseados na posição do canal de divisão de tempo.
18. Meio legível por computador, CARACTERIZADO pe-Io fato de que compreende instruções armazenadas neste que,quando executadas por um processador, levam o processador aexecutar as operações de:receber um fluxo de bits que representa um sinalde áudio, o fluxo de bits tem um quadro;determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros do fluxo de bits, osconjuntos de parâmetros incluem um ou mais parâmetros;determinar a informação de posição do fluxo debits, a informação de posição indica uma posição de um canalde divisão de tempo em um conjunto ordenado de canais de di-visão de tempo incluídos no quadro ao qual o conjunto de pa-râmetros é aplicado; edecodificar o sinal de áudio baseado no número decanais de divisão de tempo, no número de conjuntos de parâ-metros e na informação de posição,onde a informação de posição é representada por umnúmero de variável de bits baseados na posição do canal dedivisão de tempo.
19. Sistema, CARACTERIZADO pelo fato de que com-preende:um processador;um meio legível por computador acoplado ao proces-sador e que.inclui instruções, que quando executadas por umprocessador, levam o processador a executar as operações de:receber um fluxo de bits que representa um sinalde áudio, o fluxo de bits tem um quadro;determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros do fluxo de bits, osconjuntos de parâmetros incluem um ou mais parâmetros;determinar a informação de posição do fluxo debits, a informação de posição indica uma posição de um canalde divisão de tempo em um conjunto ordenado de canais de di-visão de tempo incluídos no quadro ao qual o conjunto de pa-râmetros é aplicado; edecodificar o sinal de áudio baseado no número decanais de divisão de tempo, no número de conjuntos de parâ-metros e na informação de posição,onde a informação de posição é representada por umnúmero variável de bits baseados na posição do canal de di-visão de tempo.
20. Sistema, CARACTERIZADO pelo fato de que com-preende:dispositivos para receber um fluxo de bits que re-presenta um sinal de áudio, o fluxo de bits tem um quadro;dispositivos para determinar um número de canaisde divisão de tempo e um número de conjuntos de parâmetrosdo fluxo de bits, os conjuntos de parâmetros incluem um oumais parâmetros;dispositivos para determinar a informação de posi-ção do fluxo de bits, a informação de posição indica uma po-sição de um canal de divisão de tempo em um conjunto ordena-do de canais de tempo incluídos no quadro ao qual o conjun-tos de parâmetros é aplicado; edispositivos para decodificar o sinal de áudio ba-seados no número de canais de divisão de tempo, no número deconjuntos de parâmetros e na informação de posição,onde a informação de posição é representada por umnúmero variável de bits baseados na posição do canal de di-visão de tempo.
BRPI0615114-0A 2005-08-30 2006-08-30 aparelho e método para codificar e decodificar sinal de áudio BRPI0615114A2 (pt)

Applications Claiming Priority (19)

Application Number Priority Date Filing Date Title
US71211905P 2005-08-30 2005-08-30
US60/712.119 2005-08-30
US71920205P 2005-09-22 2005-09-22
US60/719.202 2005-09-22
US72300705P 2005-10-04 2005-10-04
US60/723.007 2005-10-04
US72622805P 2005-10-14 2005-10-14
US60/726.228 2005-10-14
US72922505P 2005-10-24 2005-10-24
US60/729.225 2005-10-24
KR10-2006-0004051 2006-01-13
KR10-2006-0004055 2006-01-13
KR20060004055 2006-01-13
KR10-2006-00 2006-01-13
KR20060004065 2006-01-13
KR1020060004063A KR20070025907A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 채널변환모듈에 적용될파라미터 밴드 수 비트스트림 구성방법
KR10-2006-0004065 2006-01-13
KR1020060004051A KR20070025903A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의파라미터 밴드 수 비트스트림 구성방법
PCT/KR2006/003420 WO2007027050A1 (en) 2005-08-30 2006-08-30 Apparatus for encoding and decoding audio signal and method thereof

Publications (1)

Publication Number Publication Date
BRPI0615114A2 true BRPI0615114A2 (pt) 2011-05-03

Family

ID=43927883

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0615114-0A BRPI0615114A2 (pt) 2005-08-30 2006-08-30 aparelho e método para codificar e decodificar sinal de áudio

Country Status (9)

Country Link
US (12) US7822616B2 (pt)
EP (7) EP1938663A4 (pt)
JP (7) JP5108767B2 (pt)
AT (2) ATE453908T1 (pt)
AU (1) AU2006285538B2 (pt)
BR (1) BRPI0615114A2 (pt)
CA (1) CA2620627C (pt)
TW (2) TWI425843B (pt)
WO (7) WO2007055464A1 (pt)

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2649240A (en) * 1947-10-13 1953-08-18 Clyde L Gilbert Blank for box production
US8577686B2 (en) * 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2007055464A1 (en) * 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
WO2007046659A1 (en) * 2005-10-20 2007-04-26 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
WO2007078254A2 (en) * 2006-01-05 2007-07-12 Telefonaktiebolaget Lm Ericsson (Publ) Personalized decoding of multi-channel surround sound
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
WO2007083953A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for processing a media signal
US8296156B2 (en) * 2006-02-07 2012-10-23 Lg Electronics, Inc. Apparatus and method for encoding/decoding signal
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
CN101518103B (zh) * 2006-09-14 2016-03-23 皇家飞利浦电子股份有限公司 多通道信号的甜点操纵
ATE539434T1 (de) * 2006-10-16 2012-01-15 Fraunhofer Ges Forschung Vorrichtung und verfahren für mehrkanalparameterumwandlung
PL2068307T3 (pl) * 2006-10-16 2012-07-31 Dolby Int Ab Udoskonalony sposób kodowania i odtwarzania parametrów w wielokanałowym kodowaniu obiektów poddanych procesowi downmiksu
US8571875B2 (en) * 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
KR20080082917A (ko) 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
JP5541928B2 (ja) * 2007-03-09 2014-07-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP5355387B2 (ja) * 2007-03-30 2013-11-27 パナソニック株式会社 符号化装置および符号化方法
JP5220840B2 (ja) * 2007-03-30 2013-06-26 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法
CA2699004C (en) 2007-09-06 2014-02-11 Lg Electronics Inc. A method and an apparatus of decoding an audio signal
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
KR100942142B1 (ko) * 2007-10-11 2010-02-16 한국전자통신연구원 객체기반 오디오 콘텐츠 송수신 방법 및 그 장치
WO2009050896A1 (ja) * 2007-10-16 2009-04-23 Panasonic Corporation ストリーム合成装置、復号装置、方法
WO2009093866A2 (en) * 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing an audio signal
WO2009093867A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing audio signal
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US8645400B1 (en) * 2008-08-01 2014-02-04 Marvell International Ltd. Flexible bit field search method
TWI475896B (zh) 2008-09-25 2015-03-01 Dolby Lab Licensing Corp 單音相容性及揚聲器相容性之立體聲濾波器
KR20100115215A (ko) * 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
KR101692394B1 (ko) * 2009-08-27 2017-01-04 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
CN102696070B (zh) 2010-01-06 2015-05-20 Lg电子株式会社 处理音频信号的设备及其方法
ES2810824T3 (es) 2010-04-09 2021-03-09 Dolby Int Ab Sistema decodificador, método de decodificación y programa informático respectivo
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
WO2013186344A2 (en) 2012-06-14 2013-12-19 Dolby International Ab Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
EP2875510A4 (en) * 2012-07-19 2016-04-13 Nokia Technologies Oy STEREO AUDIO SIGNAL ENCODER
KR102131810B1 (ko) 2012-07-19 2020-07-08 돌비 인터네셔널 에이비 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스
KR20240055146A (ko) 2013-01-21 2024-04-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
TWI618051B (zh) * 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
CN104981867B (zh) 2013-02-14 2018-03-30 杜比实验室特许公司 用于控制上混音频信号的通道间相干性的方法
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
BR112015029129B1 (pt) * 2013-05-24 2022-05-31 Dolby International Ab Método para codificar objetos de áudio em um fluxo de dados, meio legível por computador, método em um decodificador para decodificar um fluxo de dados e decodificador para decodificar um fluxo de dados incluindo objetos de áudio codificados
US9136233B2 (en) * 2013-06-06 2015-09-15 STMicroelctronis (Crolles 2) SAS Process for fabricating a three-dimensional integrated structure with improved heat dissipation, and corresponding three-dimensional integrated structure
US9140959B2 (en) * 2013-07-12 2015-09-22 Canon Kabushiki Kaisha Dissipative soliton mode fiber based optical parametric oscillator
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
CN110648674B (zh) 2013-09-12 2023-09-22 杜比国际公司 多声道音频内容的编码
TWI713018B (zh) 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
EP3074970B1 (en) 2013-10-21 2018-02-21 Dolby International AB Audio encoder and decoder
BR112016008817B1 (pt) * 2013-10-21 2022-03-22 Dolby International Ab Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio
US11205305B2 (en) 2014-09-22 2021-12-21 Samsung Electronics Company, Ltd. Presentation of three-dimensional video
US10313656B2 (en) * 2014-09-22 2019-06-04 Samsung Electronics Company Ltd. Image stitching for three-dimensional video
US9774974B2 (en) 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
KR20160081844A (ko) 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
WO2016108655A1 (ko) 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
EP3281196A1 (en) * 2015-04-10 2018-02-14 Thomson Licensing Method and device for encoding multiple audio signals, and method and device for decoding a mixture of multiple audio signals with improved separation
US10725248B2 (en) * 2017-01-30 2020-07-28 Senko Advanced Components, Inc. Fiber optic receptacle with integrated device therein incorporating a behind-the-wall fiber optic receptacle
TWI752166B (zh) 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
KR102425411B1 (ko) * 2017-06-09 2022-07-26 구글 엘엘씨 오디오 기반 컴퓨터 프로그램 출력의 수정
US10652170B2 (en) 2017-06-09 2020-05-12 Google Llc Modification of audio-based computer program output
US11049218B2 (en) 2017-08-11 2021-06-29 Samsung Electronics Company, Ltd. Seamless image stitching
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
KR102799690B1 (ko) * 2019-06-14 2025-04-23 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 매개변수 인코딩 및 디코딩
CN112954581B (zh) * 2021-02-04 2022-07-01 广州橙行智动汽车科技有限公司 一种音频播放方法、系统及装置

Family Cites Families (159)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6096079A (ja) 1983-10-31 1985-05-29 Matsushita Electric Ind Co Ltd 多値画像の符号化方法
US4661862A (en) 1984-04-27 1987-04-28 Rca Corporation Differential PCM video transmission system employing horizontally offset five pixel groups and delta signals having plural non-linear encoding functions
US4621862A (en) 1984-10-22 1986-11-11 The Coca-Cola Company Closing means for trucks
JPS6294090A (ja) 1985-10-21 1987-04-30 Hitachi Ltd 符号化装置
US4725885A (en) 1986-12-22 1988-02-16 International Business Machines Corporation Adaptive graylevel image compression system
JPH0793584B2 (ja) 1987-09-25 1995-10-09 株式会社日立製作所 符号化装置
NL8901032A (nl) 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5243686A (en) * 1988-12-09 1993-09-07 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis method for feature extraction from acoustic signals
US5221232A (en) * 1989-01-12 1993-06-22 Zero-Max, Inc. Flexible disc-like coupling element
JP2811369B2 (ja) 1989-01-27 1998-10-15 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 高品質オーディオ用短時間遅延変換コーダ、デコーダ、及びエンコーダ・デコーダ
DE3943880B4 (de) 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US6289308B1 (en) 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
GB8921320D0 (en) 1989-09-21 1989-11-08 British Broadcasting Corp Digital video coding
JPH03250931A (ja) * 1990-02-28 1991-11-08 Iwatsu Electric Co Ltd 移動体通信の時間分割通信方法
JP3449715B2 (ja) * 1991-01-08 2003-09-22 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 多次元音場のための符号器・復号器
CA2075156A1 (en) 1991-08-02 1993-02-03 Kenzo Akagiri Digital encoder with dynamic quantization bit allocation
JPH05219582A (ja) * 1992-02-06 1993-08-27 Nec Corp ディジタル音声交換装置
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP3104400B2 (ja) 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
JP3123286B2 (ja) 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
US5481643A (en) * 1993-03-18 1996-01-02 U.S. Philips Corporation Transmitter, receiver and record carrier for transmitting/receiving at least a first and a second signal component
US5563661A (en) * 1993-04-05 1996-10-08 Canon Kabushiki Kaisha Image processing apparatus
US6125398A (en) * 1993-11-24 2000-09-26 Intel Corporation Communications subsystem for computer-based conferencing system using both ISDN B channels for transmission
US5488570A (en) * 1993-11-24 1996-01-30 Intel Corporation Encoding and decoding video signals using adaptive filter switching criteria
US5640159A (en) * 1994-01-03 1997-06-17 International Business Machines Corporation Quantization method for image data compression employing context modeling algorithm
RU2158970C2 (ru) 1994-03-01 2000-11-10 Сони Корпорейшн Способ кодирования цифрового сигнала и устройство для его осуществления, носитель записи цифрового сигнала, способ декодирования цифрового сигнала и устройство для его осуществления
JP3498375B2 (ja) * 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置
US6549666B1 (en) 1994-09-21 2003-04-15 Ricoh Company, Ltd Reversible embedded wavelet system implementation
JPH08123494A (ja) 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JPH08130649A (ja) 1994-11-01 1996-05-21 Canon Inc データ処理装置
KR100209877B1 (ko) * 1994-11-26 1999-07-15 윤종용 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치
JP3371590B2 (ja) 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
JP3484832B2 (ja) 1995-08-02 2004-01-06 ソニー株式会社 記録装置、記録方法、再生装置及び再生方法
KR100219217B1 (ko) 1995-08-31 1999-09-01 전주범 무손실 부호화 장치
US5723495A (en) * 1995-11-16 1998-03-03 The University Of North Carolina At Chapel Hill Benzamidoxime prodrugs as antipneumocystic agents
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3088319B2 (ja) 1996-02-07 2000-09-18 松下電器産業株式会社 デコード装置およびデコード方法
US6047027A (en) 1996-02-07 2000-04-04 Matsushita Electric Industrial Co., Ltd. Packetized data stream decoder using timing information extraction and insertion
GB9603454D0 (en) 1996-02-19 1996-04-17 Ea Tech Ltd Electric motor starting circuit
US6399760B1 (en) * 1996-04-12 2002-06-04 Millennium Pharmaceuticals, Inc. RP compositions and therapeutic and diagnostic uses therefor
GB9609282D0 (en) * 1996-05-03 1996-07-10 Cambridge Display Tech Ltd Protective thin oxide layer
EP0827312A3 (de) 1996-08-22 2003-10-01 Marconi Communications GmbH Verfahren zur Änderung der Konfiguration von Datenpaketen
US5912636A (en) 1996-09-26 1999-06-15 Ricoh Company, Ltd. Apparatus and method for performing m-ary finite state machine entropy coding
US5893066A (en) 1996-10-15 1999-04-06 Samsung Electronics Co. Ltd. Fast requantization apparatus and method for MPEG audio decoding
TW429700B (en) 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6639945B2 (en) 1997-03-14 2003-10-28 Microsoft Corporation Method and apparatus for implementing motion detection in video compression
TW405328B (en) 1997-04-11 2000-09-11 Matsushita Electric Industrial Co Ltd Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
CN1137487C (zh) * 1997-09-17 2004-02-04 松下电器产业株式会社 将视频数据记录在光盘的设备和方法
US6130418A (en) 1997-10-06 2000-10-10 U.S. Philips Corporation Optical scanning unit having a main lens and an auxiliary lens
US5966688A (en) 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
JP2005063655A (ja) 1997-11-28 2005-03-10 Victor Co Of Japan Ltd オーディオ信号のエンコード方法及びデコード方法
JP3022462B2 (ja) 1998-01-13 2000-03-21 興和株式会社 振動波の符号化方法及び復号化方法
ES2247741T3 (es) 1998-01-22 2006-03-01 Deutsche Telekom Ag Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio.
JPH11282496A (ja) 1998-03-30 1999-10-15 Matsushita Electric Ind Co Ltd 復号装置
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
US6339760B1 (en) 1998-04-28 2002-01-15 Hitachi, Ltd. Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data
JPH11330980A (ja) 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体
PL338952A1 (en) * 1998-06-10 2000-12-04 Koninkl Philips Electronics Nv Method of recording centred sound data using higher-level sound files and lower-level files indicating sound fragments, apparatus for recording and/or replaying such dataand recording medium therefor
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
MY118961A (en) * 1998-09-03 2005-02-28 Sony Corp Beam irradiation apparatus, optical apparatus having beam irradiation apparatus for information recording medium, method for manufacturing original disk for information recording medium, and method for manufacturing information recording medium
US6298071B1 (en) 1998-09-03 2001-10-02 Diva Systems Corporation Method and apparatus for processing variable bit rate information in an information distribution system
US6148283A (en) * 1998-09-23 2000-11-14 Qualcomm Inc. Method and apparatus using multi-path multi-stage vector quantizer
US6284759B1 (en) * 1998-09-30 2001-09-04 Neurogen Corporation 2-piperazinoalkylaminobenzo-azole derivatives: dopamine receptor subtype specific ligands
US6553147B2 (en) 1998-10-05 2003-04-22 Sarnoff Corporation Apparatus and method for data partitioning to improving error resilience
US6556685B1 (en) 1998-11-06 2003-04-29 Harman Music Group Companding noise reduction system with simultaneous encode and decode
JP3346556B2 (ja) 1998-11-16 2002-11-18 日本ビクター株式会社 音声符号化方法及び音声復号方法
US6757659B1 (en) 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6195024B1 (en) 1998-12-11 2001-02-27 Realtime Data, Llc Content independent data compression method and system
US6208276B1 (en) 1998-12-30 2001-03-27 At&T Corporation Method and apparatus for sample rate pre- and post-processing to achieve maximal coding gain for transform-based audio encoding and decoding
US6631352B1 (en) 1999-01-08 2003-10-07 Matushita Electric Industrial Co. Ltd. Decoding circuit and reproduction apparatus which mutes audio after header parameter changes
US6378101B1 (en) * 1999-01-27 2002-04-23 Agere Systems Guardian Corp. Multiple program decoding for digital audio broadcasting and other applications
US6522342B1 (en) * 1999-01-27 2003-02-18 Hughes Electronics Corporation Graphical tuning bar for a multi-program data stream
US6384756B1 (en) * 1999-02-17 2002-05-07 Advantest Corporation High-speed waveform digitizer with a phase correcting means and a method therefor
EP1173925B1 (en) * 1999-04-07 2003-12-03 Dolby Laboratories Licensing Corporation Matrixing for lossless encoding and decoding of multichannels audio signals
JP3323175B2 (ja) 1999-04-20 2002-09-09 松下電器産業株式会社 符号化装置
US6421467B1 (en) 1999-05-28 2002-07-16 Texas Tech University Adaptive vector quantization/quantizer
KR100307596B1 (ko) 1999-06-10 2001-11-01 윤종용 디지털 오디오 데이터의 무손실 부호화 및 복호화장치
JP2001006291A (ja) * 1999-06-21 2001-01-12 Fuji Film Microdevices Co Ltd オーディオ信号の符号化方式判定装置、及びオーディオ信号の符号化方式判定方法
KR20010001991U (ko) 1999-06-30 2001-01-26 정몽규 토잉 브라켓과 토잉 후크의 결합구조
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
JP3762579B2 (ja) 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
GB2359967B (en) * 2000-02-29 2004-05-12 Virata Ltd Qamd
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US6937592B1 (en) * 2000-09-01 2005-08-30 Intel Corporation Wireless communications system that supports multiple modes of operation
US20020049586A1 (en) 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US6636830B1 (en) 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US20040244056A1 (en) * 2001-02-21 2004-12-02 Lorenz Kim E. System and method for providing direct, context-sensitive customer support in an interactive television system
JP4008244B2 (ja) 2001-03-02 2007-11-14 松下電器産業株式会社 符号化装置および復号化装置
JP3566220B2 (ja) 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
JP2002335230A (ja) 2001-05-11 2002-11-22 Victor Co Of Japan Ltd 音声符号化信号の復号方法、及び音声符号化信号復号装置
US20020183010A1 (en) * 2001-06-05 2002-12-05 Catreux Severine E. Wireless communication systems with adaptive channelization and link adaptation
JP2003005797A (ja) 2001-06-21 2003-01-08 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
GB0119569D0 (en) * 2001-08-13 2001-10-03 Radioscape Ltd Data hiding in digital audio broadcasting (DAB)
EP1308931A1 (de) * 2001-10-23 2003-05-07 Deutsche Thomson-Brandt Gmbh Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist
EP1451809A1 (en) 2001-11-23 2004-09-01 Koninklijke Philips Electronics N.V. Perceptual noise substitution
KR100480787B1 (ko) 2001-11-27 2005-04-07 삼성전자주식회사 좌표 인터폴레이터의 키 값 데이터 부호화/복호화 방법 및 장치
CN1312663C (zh) 2001-11-30 2007-04-25 皇家飞利浦电子股份有限公司 一种信号编码、解码的方法和装置
TW510142B (en) * 2001-12-14 2002-11-11 C Media Electronics Inc Rear-channel sound effect compensation device
TW569550B (en) 2001-12-28 2004-01-01 Univ Nat Central Method of inverse-modified discrete cosine transform and overlap-add for MPEG layer 3 voice signal decoding and apparatus thereof
KR20060107863A (ko) 2002-01-18 2006-10-16 가부시끼가이샤 도시바 동화상 부호화방법 및 장치와 동화상 복호화방법 및 장치
JP2003233395A (ja) 2002-02-07 2003-08-22 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
JP4039086B2 (ja) * 2002-03-05 2008-01-30 ソニー株式会社 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
WO2003077425A1 (en) 2002-03-08 2003-09-18 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
US8284844B2 (en) * 2002-04-01 2012-10-09 Broadcom Corporation Video decoding system supporting multiple standards
EP1493146B1 (en) * 2002-04-11 2006-08-02 Matsushita Electric Industrial Co., Ltd. Encoding and decoding devices, methods and programs
US7275036B2 (en) * 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
DE10217297A1 (de) 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
US7428440B2 (en) * 2002-04-23 2008-09-23 Realnetworks, Inc. Method and apparatus for preserving matrix surround information in encoded audio/video
EP1523862B1 (en) 2002-07-12 2007-10-31 Koninklijke Philips Electronics N.V. Audio coding
BR0305555A (pt) 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado
CN1328707C (zh) 2002-07-19 2007-07-25 日本电气株式会社 音频解码设备以及解码方法
BRPI0305746B1 (pt) 2002-08-07 2018-03-20 Dolby Laboratories Licensing Corporation Tradução espacial de canal de áudio
JP2004120217A (ja) 2002-08-30 2004-04-15 Canon Inc 画像処理装置、画像処理方法、プログラムおよび記録媒体
US7536305B2 (en) 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
TW567466B (en) 2002-09-13 2003-12-21 Inventec Besta Co Ltd Method using computer to compress and encode audio data
EP1604528A2 (en) 2002-09-17 2005-12-14 Ceperkovic, Vladimir Fast codec with high compression ratio and minimum required resources
TW549550U (en) 2002-11-18 2003-08-21 Asustek Comp Inc Key stroke mechanism with two-stage touching feeling
JP4084990B2 (ja) 2002-11-19 2008-04-30 株式会社ケンウッド エンコード装置、デコード装置、エンコード方法およびデコード方法
US7293217B2 (en) * 2002-12-16 2007-11-06 Interdigital Technology Corporation Detection, avoidance and/or correction of problematic puncturing patterns in parity bit streams used when implementing turbo codes
US6873559B2 (en) 2003-01-13 2005-03-29 Micron Technology, Inc. Method and apparatus for enhanced sensing of low voltage memory
JP2004220743A (ja) 2003-01-17 2004-08-05 Sony Corp 情報記録装置及び情報記録制御方法、並びに情報再生装置及び情報再生制御方法
ES2273216T3 (es) 2003-02-11 2007-05-01 Koninklijke Philips Electronics N.V. Codificacion de audio.
EP1611772A1 (en) 2003-03-04 2006-01-04 Nokia Corporation Support of a multichannel audio extension
US20040199276A1 (en) * 2003-04-03 2004-10-07 Wai-Leong Poon Method and apparatus for audio synchronization
ES2282860T3 (es) * 2003-04-17 2007-10-16 Koninklijke Philips Electronics N.V. Generacion de señal de audio.
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
JP4019015B2 (ja) 2003-05-09 2007-12-05 三井金属鉱業株式会社 ドアロック装置
JP2005086486A (ja) 2003-09-09 2005-03-31 Alpine Electronics Inc オーディオ装置およびオーディオ処理方法
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
WO2005043511A1 (en) * 2003-10-30 2005-05-12 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
US20050137729A1 (en) * 2003-12-18 2005-06-23 Atsuhiro Sakurai Time-scale modification stereo audio signals
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
JP2005202248A (ja) 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20050174269A1 (en) 2004-02-05 2005-08-11 Broadcom Corporation Huffman decoder used for decoding both advanced audio coding (AAC) and MP3 audio
US7392195B2 (en) 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
JP4579237B2 (ja) 2004-04-22 2010-11-10 三菱電機株式会社 画像符号化装置及び画像復号装置
JP2005332449A (ja) 2004-05-18 2005-12-02 Sony Corp 光学ピックアップ装置、光記録再生装置及びチルト制御方法
TWM257575U (en) 2004-05-26 2005-02-21 Aimtron Technology Corp Encoder and decoder for audio and video information
SE0401408D0 (sv) * 2004-06-02 2004-06-02 Astrazeneca Ab Diameter measuring device
JP2006012301A (ja) 2004-06-25 2006-01-12 Sony Corp 光記録再生方法、光ピックアップ装置、光記録再生装置、光記録媒体とその製造方法及び半導体レーザ装置
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
JP2006120247A (ja) 2004-10-21 2006-05-11 Sony Corp 集光レンズ及びその製造方法、これを用いた露光装置、光学ピックアップ装置及び光記録再生装置
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7991610B2 (en) 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
KR20070025905A (ko) 2005-08-30 2007-03-08 엘지전자 주식회사 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법
WO2007055464A1 (en) 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP4876574B2 (ja) 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体

Also Published As

Publication number Publication date
JP2009506374A (ja) 2009-02-12
ATE455348T1 (de) 2010-01-15
US7761303B2 (en) 2010-07-20
US20110085670A1 (en) 2011-04-14
JP2009506376A (ja) 2009-02-12
ATE453908T1 (de) 2010-01-15
JP5111374B2 (ja) 2013-01-09
US8082158B2 (en) 2011-12-20
JP5111375B2 (ja) 2013-01-09
EP1949759A4 (en) 2010-11-17
WO2007055460A1 (en) 2007-05-18
TWI405475B (zh) 2013-08-11
TWI425843B (zh) 2014-02-01
US20070203697A1 (en) 2007-08-30
US8060374B2 (en) 2011-11-15
EP1949759A1 (en) 2008-07-30
US7765104B2 (en) 2010-07-27
EP1938663A1 (en) 2008-07-02
WO2007055463A1 (en) 2007-05-18
US7831435B2 (en) 2010-11-09
US20070201514A1 (en) 2007-08-30
US7822616B2 (en) 2010-10-26
US7783493B2 (en) 2010-08-24
JP2009506371A (ja) 2009-02-12
JP2009506373A (ja) 2009-02-12
US8103514B2 (en) 2012-01-24
US20070071247A1 (en) 2007-03-29
US20070094036A1 (en) 2007-04-26
CA2620627A1 (en) 2007-03-08
EP1941497A4 (en) 2013-01-30
US8103513B2 (en) 2012-01-24
WO2007027051A1 (en) 2007-03-08
TW200715900A (en) 2007-04-16
US20070094037A1 (en) 2007-04-26
JP5108767B2 (ja) 2012-12-26
US20110044458A1 (en) 2011-02-24
WO2007055462A1 (en) 2007-05-18
EP1941497A1 (en) 2008-07-09
US7792668B2 (en) 2010-09-07
AU2006285538A1 (en) 2007-03-08
EP1941497B1 (en) 2019-01-16
US20110022397A1 (en) 2011-01-27
EP1920635A1 (en) 2008-05-14
EP1938662B1 (en) 2016-09-28
EP1938663A4 (en) 2010-11-17
JP5111376B2 (ja) 2013-01-09
US7783494B2 (en) 2010-08-24
JP2009506372A (ja) 2009-02-12
US20070078550A1 (en) 2007-04-05
JP5231225B2 (ja) 2013-07-10
TW201129968A (en) 2011-09-01
EP1938311B1 (en) 2018-05-02
WO2007055464A1 (en) 2007-05-18
WO2007027050A1 (en) 2007-03-08
CA2620627C (en) 2011-03-15
WO2007055461A1 (en) 2007-05-18
US8165889B2 (en) 2012-04-24
EP1920636A1 (en) 2008-05-14
EP1938662A4 (en) 2010-11-17
US20070091938A1 (en) 2007-04-26
JP2009506375A (ja) 2009-02-12
EP1938662A1 (en) 2008-07-02
EP1920635B1 (en) 2010-01-13
EP1938311A1 (en) 2008-07-02
JP5108768B2 (ja) 2012-12-26
AU2006285538B2 (en) 2011-03-24
EP1938311A4 (en) 2013-02-13
US20110022401A1 (en) 2011-01-27
EP1920636B1 (en) 2009-12-30
JP2009506377A (ja) 2009-02-12
US20110044459A1 (en) 2011-02-24

Similar Documents

Publication Publication Date Title
BRPI0615114A2 (pt) aparelho e método para codificar e decodificar sinal de áudio
CN101253809B (zh) 用于编码和解码音频信号的装置及其方法
RU2376656C1 (ru) Способ кодирования и декодирования аудиосигнала и устройство для его осуществления
KR100880644B1 (ko) 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
HK1124681B (en) Apparatus for encoding and decoding audio signal and method thereof

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]
B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2477 DE 26-06-2018 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.