BRPI0615114A2

BRPI0615114A2 - aparelho e método para codificar e decodificar sinal de áudio

Info

Publication number: BRPI0615114A2
Application number: BRPI0615114-0A
Authority: BR
Inventors: Hee Suk Pang; Hyeon O Oh; Dong Soo Kim; Jae Hyun Lim; Yang Won Jung
Original assignee: Lg Electronics Inc
Priority date: 2005-08-30
Filing date: 2006-08-30
Publication date: 2011-05-03
Also published as: JP2009506374A; ATE455348T1; US7761303B2; US20110085670A1; JP2009506376A; ATE453908T1; JP5111374B2; US8082158B2; JP5111375B2; EP1949759A4; WO2007055460A1; TWI405475B; TWI425843B; US20070203697A1; US8060374B2; EP1949759A1; US7765104B2; EP1938663A1; WO2007055463A1; US7831435B2

Abstract

APARELHO E MéTODO PARA CODIFICAR E DECODIFICAR SINAL DE áUDIO. A informação espacial associada com um sinal de áudio é codificada em um fluxo de bits, que pode ser transmitido a um decodificador ou gravado em uma mídia de armazenamento. O fluxo de bits pode incluir diferentes sintaxes relacionadas ao tempo, frequência e domínios espaciais. Em algumas modalidades, o fluxo de bits inclui uma ou mais estruturas de dados (por exemplo, quadros) que contêm conjuntos ordenados de canais aos quais parâmetros podem ser aplicados. As estruturas de dados podem ser fixas ou variáveis. Um indicador de tipo de estrutura de dados pode ser inserido no fluxo de bits para habilitar um decodificador a determinar o tipo de estrutura de dados e para invocar um processo de decodificação apropriado. A estrutura de dados pode incluir a informação de posição que pode ser usada por um decodificador para identificar o canal correto ao qual um dado conjunto de parâmetros é aplicado. A informação de posição do canal pode ser codificada com ou um número fixo de bits ou um número variável de bits baseados no tipo de estrutura de dados como indicado pelo indicador de tipo de estrutura de dados. Para tipos de estrutura de dados variáveis, a informação de posição do canal pode ser codificada com um número variável de bits baseados na posição do canal no conjunto ordenado de canais.

Description

"APARELHO E MÉTODO PARA CODIFICAR E DECODIFICARSINAL DE ÁUDIO"

Campo da Invenção

O assunto desse pedido refere-se geralmente a pro-cessamento de sinal de áudio.

Fundamentos da Invenção

Esforços estão a caminho para pesquisar e desen-volver novas aproximações em codificação perceptiva de áudiomulticanal, comumente referida como Codificação de Áudio Es-pacial (SAC). A SAC permite a transmissão de áudio multica-nal em baixas taxas de bits, tornando a SAC disponível paramuitas aplicações de áudio populares (por exemplo, transmis-são contínua de Internet, transferência de musicas).

Ao invés de executar uma codificação discreta decanais de entrada de áudio individuais, a SAC captura a ima-gem espacial de um sinal de áudio multicanal em um conjuntocompacto de parâmetros. Os parâmetros podem ser transmitidosa um decodificador onde eles são usados para síntese ou re-construção das propriedades espaciais do sinal de áudio.

Em algumas aplicações SAC, os parâmetros espaciaissão transmitidos a um decodif icador como parte de um fluxode bits. O fluxo de bits inclui quadros espaciais que contêmconjuntos ordenados de canais de divisão de tempo aos quaisos conjuntos de parâmetros espaciais podem ser aplicados. 0fluxo de bits também inclui informação de posição que podeser usada por um decodificador para identificar o canal dedivisão de tempo correto ao qual um dado conjunto de parâme-tros é aplicado.Algumas aplicações SAC fazem uso de elementos con-ceituais nos caminhos de codificação/decodificação. Um ele-mento é comumente referido como um Um-para-Dois (OTT) e umoutro elemento é comumente referido como Dois-para-Três(TTT), onde os nomes implicam no número de canais de entradae saida de um elemento decodificador correspondente, respec-tivamente. 0 elemento codificador OTT extrai dois parâmetrosespaciais e cria um sinal de mistura descendente e sinal re-sidual. 0 elemento TTT mistura de forma descendente três si-nais de áudio em um sinal de mistura descendente estéreomais um sinal residual. Esses elementos podem ser combinadospara fornecer uma variedade de configurações de um ambientede áudio espacial (por exemplo, som ambiente).

Algumas aplicações SAC podem operar em um modo deoperação não guiado, onde somente um sinal de mistura des-cendente estéreo é transmitido de um codificador a um deco-dificador sem uma necessidade por transmissão de parâmetroespacial. 0 decodificador sintetiza parâmetros espaciais dosinal de mistura descendente e usa esses parâmetros paraproduzir um sinal de áudio multicanal.

Sumário da Invenção

Informação espacial associada com um sinal de áu-dio é codificada em um fluxo de bits, que pode ser transmi-tido a um decodif icador ou gravada em um meio de armazena-mento. 0 fluxo de bits pode incluir diferente sintaxe rela-cionada aos domínios do tempo, freqüência e espacial. Em al-gumas modalidades, o fluxo de bits inclui uma ou mais estru-turas de dados (por exemplo, quadros) que contêm conjuntosordenados de canais aos quais os parâmetros podem ser apli-cados. As estruturas de dados podem ser fixas ou variáveis.

Um indicador de tipo de estrutura de dados pode ser inseridono fluxo de bits para habilitar um decodificador a determi-nar o tipo de estrutura de dados e para invocar um processode decodificação apropriado. A estrutura de dados pode in-cluir a informação de posição que pode ser usada por um de-codificador para identificar o canal correto ao qual um dadoconjunto de parâmetros é aplicado. A informação de posiçãodo canal pode ser codificada com ou um número fixo de bitsou um número variável de bits baseados no tipo de estruturade dados como indicado pelo indicador de tipo de estruturade dados. Para tipos de estrutura de dados variáveis, a in-formação de posição do canal pode ser codificada com um nú-mero variável de bits baseados na posição do canal no con-junto ordenado de canais.

Em uma implementação, um método de codificar umsinal de áudio inclui: determinar um número de canais de di-visão de tempo e um número de conjuntos de parâmetros, osconjuntos de parâmetros incluem um ou mais parâmetros; gerarinformação que indica uma posição de no mínimo um canal dedivisão de tempo em um conjunto ordenado de canais de divi-são de tempo ao qual um conjunto de parâmetros é aplicado;codificar o sinal de áudio como um fluxo de bits incluindoum quadro, o quadro inclui o conjunto ordenado de canais dedivisão de tempo; e inserir um número variável de bits nofluxo de bits que representa a posição do canal de divisãode tempo no conjunto ordenado de canais de divisão de tempo,onde o número variável de bits é determinado pela posição docanal de divisão de tempo.

Em algumas modalidades, um método de decodificarum sinal de áudio inclui: receber um fluxo de bits que re-presenta um sinal de áudio, o fluxo de bits tem um quadro;determinar um número de canais de divisão de tempo e um nú-mero de conjuntos de parâmetros do fluxo de bits, os conjun-tos de parâmetros incluem um ou mais parâmetros; determinara informação de posição do fluxo de bits, a qual indica aposição de um canal de divisão de tempo em um conjunto orde-nado de canais de divisão de tempo ao qual o conjunto de pa-râmetros é aplicado, onde o conjunto ordenado de canais detempo está incluído no quadro; e decodificar o sinal de áu-dio baseado no número de canais de divisão de tempo, no nú-mero de conjuntos de parâmetros e na informação de posição,onde a informação de posição é representada por um númerovariável de bits baseados na posição do canal de divisão detempo.

Outras modalidades de codificação de posição decanal de divisão de tempo são descritas, as quais são dire-cionadas a sistemas, a métodos, a aparelhos e estruturas dedados e a meios legíveis por computador.

É entendido que ambas a descrição geral anterior ea seguinte descrição detalhada das modalidades são exempli-ficadas e explanatórias e não pretendem fornecer explicaçãoadicional da invenção como reivindicado.

Breve Descrição dos Desenhos

Os desenhos em anexo, que estão incluídos parafornecer um entendimento adicional da invenção e são incor-porados e constituem parte desse pedido, ilustram modalida-de (s) da invenção, e juntos com a descrição, servem para ex-plicar o principio da invenção. Nos desenhos:

A FIG. 1 é um diagrama que ilustra um principio degerar informação espacial de acordo com uma modalidade dapresente invenção;

A FIG. 2 é um diagrama de bloco de um codificadorpara codificar um sinal de áudio de acordo com uma modalida-de da presente invenção;

A FIG. 3 é um diagrama de bloco de um decodifica-dor para decodificar um sinal de áudio de acordo com uma mo-dalidade da presente invenção;

A FIG. 4 é um diagrama de bloco de um módulo deconversão de canal incluído em uma unidade de mistura ascen-dente de um decodificador de acordo com uma modalidade dapresente invenção;

A FIG. 5 é um diagrama para explicar um método deconfigurar um fluxo de bits de um sinal de áudio de acordocom uma modalidade da presente invenção;

As FIGs. 6A e 6B são um diagrama e um gráfico detempo/freqüência, respectivamente, para explicar relaçõesentre um conjunto de parâmetros, canais de divisão de tempoe bandas de parâmetros de acordo com uma modalidade da pre-sente invenção;

A FIG. 7A ilustra uma sintaxe para representar in-formação de configuração de um sinal de informação espacialde acordo com uma modalidade da presente invenção;A FIG. 7Β é uma tabela para um número de bandas deparâmetros de um sinal de informação espacial de acordo comuma modalidade da presente invenção;

A FIG. 8A ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicados a um conversor OTTcomo um número fixo de bits de acordo com uma modalidade dapresente invenção;

A FIG. 8B ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicados a um conversor OTTpor um número variável de bits de acordo com uma modalidadeda presente invenção;

A FIG. 9A ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicados a um conversor TTTpor um número fixo de bits de acordo com uma modalidade dapresente invenção;

A FIG. 9B ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicados a um conversor TTTpor um número variável de bits de acordo com uma modalidadeda presente invenção;

A FIG. IOA ilustra uma sintaxe de informação deconfiguração de extensão espacial para um quadro de extensãoespacial de acordo com uma modalidade da presente invenção;

As FIGs. IOB e IOC ilustram sintaxe de informaçãode configuração de extensão espacial para um sinal residualno caso em que este está incluído em um quadro de extensãoespacial de acordo com uma modalidade da presente invenção;

A FIG. 10D ilustra uma sintaxe para um método derepresentar um número de bandas de parâmetros para um sinalresidual de acordo com uma modalidade da presente invenção;

A FIG. IlA é um diagrama de bloco de um aparelhode decodificação usando codificação não guiada de acordo comuma modalidade da presente invenção;

A FIG. IlB é um diagrama para um método de repre-sentar um número de bandas de parâmetros como um grupo deacordo com uma modalidade da presente invenção;

A FIG. 12 ilustra uma sintaxe de informação deconfiguração de um quadro espacial de acordo com uma modali-dade da presente invenção;

A FIG. 13A ilustra uma sintaxe de informação deposição de um canal de divisão de tempo ao qual um conjuntode parâmetros é aplicado de acordo com uma modalidade dapresente invenção;

A FIG. 13B ilustra uma sintaxe para representarinformação de posição de um canal de divisão de tempo aoqual um conjunto de parâmetros é aplicado como um valor ab-soluto e um valor de diferença de acordo com uma modalidadeda presente invenção;

A FIG. 13C é um diagrama para representar uma plu-ralidade de informação de posição de canais de divisão detempo ao qual conjuntos de parâmetros são aplicados como umgrupo de acordo com uma modalidade da presente invenção;

A FIG. 14 é um fluxograma de um método de codifi-cação de acordo com uma modalidade da presente invenção;

A FIG. 15 é um fluxograma de um método de decodi-ficação de acordo com uma modalidade da presente invenção;

A FIG. 16 é um diagrama de bloco de uma arquitetu-ra de dispositivo para implementar os processos de codifica-ção e decodificação descritos com relação às FIGs. 1-15.

Descrição Detalhada da Invenção

A FIG. 1 é um diagrama que ilustra um principio degerar informação espacial de acordo com uma modalidade dapresente invenção. Esquemas de codificação perceptivos parasinais de áudio multicanal são baseados em um fato de quehumanos podem perceber sinais de áudio através do espaçotridimensional. 0 espaço tridimensional de um sinal de áudiopode ser representado usando informação espacial, incluindo,mas não limitado aos seguintes parâmetros espaciais conheci-dos: Diferenças de Nivel de Canal (CLD), Coerên-cia/Correlação Intercanal (ICC), Diferença de Tempo de Canal(CTD), Coeficientes de Predição de Canal (CPC), etc. O parâ-metro CLD descreve as diferenças (nivel) de energia entredois canais de áudio, o parâmetro ICC descreve a quantidadede correlação ou coerência entre dois canais de áudio e oparâmetro CTD descreve a diferença de tempo entre dois ca-nais de áudio.

A geração de parâmetros CTD e CLD é ilustrada naFIG. 1. Uma primeira onda sonora direta 103 a partir de umafonte de som remota 101 chega em um ouvido humano esquerdo107 e uma segunda onda sonora direta 102 é difratada em tor-no de uma cabeça humana para alcançar um ouvido humano di-reito 106. As ondas sonoras diretas 102 e 103 diferem uma daoutra em tempo de chegada e nivel de energia. Os parâmetrosCTD e CLD podem ser gerados baseados nas diferenças de tempode chegada e nivel de energia das ondas sonoras 102 e 103,respectivamente. Em adição, as ondas sonoras refletidas 104e 105 chegam nos ouvidos 106 e 107, respectivamente, e nãotêm correlações mútuas. Um parâmetro ICC pode ser gerado ba-seado na correlação entre as ondas sonoras 104 e 105.

No codificador, a informação espacial (por exem-plo, parâmetros espaciais) é extraída de um sinal de entradade áudio multicanal e um sinal de mistura descendente é ge-rado. 0 sinal de mistura descendente e os parâmetros espaci-ais são transferidos a um decodificador. Qualquer número decanais de áudio pode ser usado para o sinal de mistura des-cendente, incluindo, mas não limitado a: um sinal mono, umsinal estéreo, ou um sinal de áudio multicanal. No decodifi-cador, um sinal de mistura ascendente multicanal é criado apartir do sinal de mistura descendente e dos parâmetros es-paciais.

A FIG. 2 é um diagrama de bloco de um codificadorpara codificar um sinal de áudio de acordo com uma modalida-de da presente invenção. 0 codificador inclui uma unidade demistura descendente 202, uma unidade de geração de informa-ção espacial 203, uma unidade de codificação de sinal demistura descendente 207 e uma unidade de multiplexação 209.

Outras configurações de um codificador são possíveis. Os co-dificadores podem ser implementados em hardware, software ouuma combinação de ambos hardware e software. Os codificado-res podem ser implementados em placas de circuito integrado,conjuntos de chips, sistema integrado em um chip (SoC), pro-cessadores de sinal digital, processadores de propósito ge-ral e vários dispositivos digitais e analógicos.A unidade de mistura descendente 202 gera um sinalde mistura descendente 204 a partir do sinal de áudio multi-canal 201. Na FIG. 2, X1, ..., xn indicam canais de áudio deentrada. Como mencionado anteriormente, o sinal de misturadescendente 204 pode ser um sinal mono, um sinal estéreo ouum sinal de áudio multicanal. No exemplo mostrado, Xf1, ...,x'm indicam números de canais do sinal de mistura descenden-te 204. Em algumas modalidades, o codificador processa umsinal de mistura descendente fornecido externamente 205 (porexemplo, uma mistura descendente artística) ao invés do si-nal de mistura descendente 204.

A unidade de geração de informação espacial 203extrai informação espacial do sinal de áudio multicanal 201.Nesse caso, "informação espacial" significa informação rela-cionada aos canais de sinal de áudio usados na mistura as-cendente do sinal de mistura descendente 204 para um sinalde áudio multicanal no decodificador. O sinal de misturadescendente 204 é gerado misturando-se de forma descendenteo sinal de áudio multicanal. A informação espacial é codifi-cada para fornecer um sinal de informação espacial codifica-da 206.

A unidade de codificação de sinal de mistura des-cendente 207 gera um sinal de mistura descendente codificado208 codificando-se o sinal de mistura descendente 204 geradoa partir da unidade de mistura descendente 202.

A unidade de multiplexação 209 gera um fluxo debits 210 incluindo o sinal de mistura descendente codificado208 e o sinal de informação espacial codificado 206. O fluxode bits 210 pode ser transferido a um decodificador de mis-tura descendente e/ou gravado em um meio de armazenamento.

A FIG. 3 é um diagrama de bloco de um decodif ica-dor para decodificar um sinal de áudio codificado de acordocom uma modalidade da presente invenção. 0 decodificador in-clui uma unidade de demultiplexação 302, uma unidade de de-codificação de sinal de mistura descendente 305, uma unidadede decodificação de informação espacial 307 e uma unidade demistura ascendente 309. Os decodificadores podem ser imple-mentados em hardware, software ou uma combinação de amboshardware e software. Os decodificadores podem ser implemen-tados em placas de circuito integrado, conjuntos de chips,sistemas integrados em um chip (SoC), processadores de sinaldigital, processadores de propósito geral e vários disposi-tivos digitais e analógicos.

Em algumas modalidades, a unidade de demultiplexa-ção 302 recebe um fluxo de bits 301 representando um sinalde áudio e então separa um sinal de mistura descendente co-dificado 303 e . um sinal de informação espacial codificado304 do fluxo de bits 301. Na FIG. 3, x'i, ..., x'm indicamos canais do sinal de mistura descendente 303. A unidade dedecodificação de sinal de mistura descendente 305 emite umsinal de mistura descendente decodificado 306 decodificando-se o sinal de mistura descendente codificado 303. Se o deco-dificador é incapaz de emitir um sinal de áudio multicanal,a unidade de decodificação de sinal de mistura descendente305 pode diretamente emitir o sinal de mistura descendente306. Na FIG. 3, y'i, ·.., y'm indicam canais de saida diretada unidade de decodificação de sinal de mistura descendente 305.

A unidade de decodificação de sinal de informaçãoespacial 307 extrai informação de configuração do sinal deinformação espacial a partir do sinal de informação espacialcodificado 304 e então decodifica o sinal de informação es-pacial 304 usando a informação de configuração extraída.

A unidade de mistura ascendente 309 pode misturarde forma ascendente o sinal de mistura descendente 30 6 em um -sinal de áudio multicanal 310 usando a informação espacialextraída 308. Na FIG. 3, yi, yn indicam um número decanais de saída da unidade de mistura ascendente 309.

A FIG. 4 é um diagrama de bloco de um módulo deconversão de canal que pode ser incluído na unidade de mis-tura ascendente 309 do decodificador mostrado na FIG. 3. Emalgumas modalidades, a unidade de mistura ascendente 309 po-de inclui uma pluralidade de módulos de conversão de canal.0 módulo de conversão de canal é um dispositivo conceituaique pode diferenciar um número de canais de entrada e um nú-mero de canais de saída uns dos outros usando informação es-pecífica.

Em algumas modalidades, o módulo de conversão decanal pode inclui um conversor OTT (um para dois) para. con-verter um canal em dois canais e vice-versa, e um conversorTTT (dois para três) para converter dois canais em três ca-nais e vice-versa. Os conversores OTT e/ou TTT podem ser ar-ranjados em uma variedade de configurações úteis. Por exem-plo, a unidade de mistura ascendente 309 mostrada na FIG. 3pode inclui uma configuração 5-1-5, uma configuração 5-2-5,uma configuração 7-2-7, uma configuração 7-5-7, etc. Em umaconfiguração 5-1-5, um sinal de mistura descendente tendo umcanal é gerado misturando-se de forma descendente cinco ca-nais em um canal, que pode então ser misturado de forma as-cendente em cinco canais. Outras configurações podem sercriadas da mesma maneira usando várias combinações de con-versores OTT e TTT.

Com relação à FIG. 4, uma configuração 5-2-5 exem-plificada para uma unidade de mistura ascendente 400 é mos-trada. Em uma configuração 5-2-5, um sinal de mistura des-cendente 401 tendo dois canais é inserido na unidade de mis-tura ascendente 400. No exemplo mostrado, um canal esquerdo(L) e um canal direito (R) são fornecidos como entrada naunidade de mistura ascendente 400. Nessa modalidade, a uni-dade de mistura ascendente 400 inclui um conversor TTT 402 etrês conversores OTT 406, 407 e 408. 0 sinal de mistura des-cendente 401 tendo dois canais é fornecido como entrada parao conversor TTT (TTTo) 402, que processa o sinal de misturadescendente 401 e fornece como saida, três canais 403, 404 e405. Um ou mais parâmetros espaciais (por exemplo, CPC, CLD,ICC) podem ser fornecidos como entrada para o conversor TTT402, e são usados para processar o sinal de mistura descen-dente 401, como descrito abaixo. Em algumas modalidades, umsinal residual pode ser seletivamente fornecido como entradapara o conversor TTT 402. Em tal caso, o CPC pode ser des-crito como um coeficiente de predição para gerar três canaisa partir de dois canais.O canal 403 que é fornecido como saída a partir doconversor TTT 402 é fornecido como entrada para o conversorOTT 406 que gera dois canais de saída usando um ou mais pa-râmetros espaciais. No exemplo mostrado, os dois canais desaída representam posições de alto-falante esquerdo frontal(FL) e esquerdo traseiro (BL) em, por exemplo, um ambientede som ambiente. 0 canal 404 é fornecido como entrada para oconversor OTT 407, que gera dois canais de saída usando umou mais parâmetros espaciais. No exemplo mostrado, os doiscanais de saída representam posições de alto falante frontaldireito (FR) e traseiro direito (BR). 0 canal 405 é forneci-do como entrada para o conversor OTT 4 08, que gera dois ca-nais de saída. No exemplo mostrado, os dois canais de saídarepresentam uma posição de alto-falante central (C) e canalde efeitos de baixa freqüência (LFE). Nesse caso, informaçãoespacial (por exemplo, CLD, ICC) pode ser fornecida como en-trada para cada um dos conversores OTT. Em algumas modali.da-des, sinais residuais (Resl, Res2) podem ser fornecidos comoentradas para os conversores OTT 406 e 407. Em tal modalida-de, um sinal residual pode não ser fornecido como entradapara o conversor OTT 408 que emite um canal central e um ca-nal LFE.

A configuração mostrada na FIG. 4 é um exemplo deuma configuração para um módulo de conversão de canal. Ou-tras configurações para um módulo de conversão de canal sãopossíveis, incluindo várias combinações de conversores OTT eTTT. Já que cada um dos módulos de conversão de canal podeoperar em um domínio de freqüência, um número de bandas deparâmetros aplicados a cada um dos módulos de conversão decanal pode ser definido. Uma banda de parâmetro significapelo menos uma banda de freqüência aplicável a um parâmetro.0 número de bandas de parâmetros é descrito com relação à FIG. 6B.

A FIG. 5 é um diagrama que ilustra um método deconfigurar um fluxo de bits de um sinal de áudio de acordocom uma modalidade da presente invenção. A FIG. 5(a) ilustraum fluxo de bits de um sinal de áudio incluindo um sinal deinformação espacial somente, e as FIGs. 5(b) e 5(c) ilustramum fluxo de bits de um sinal de áudio incluindo um sinal demistura descendente e um sinal de informação espacial.

Com relação à FIG. 5 (a) , um fluxo de bits de umsinal de áudio pode incluir informação de configuração 501 eum quadro 503. 0 quadro 503 pode ser repetido no fluxo debits e em algumas modalidades inclui um único quadro espaci-al 502 contendo informação de áudio espacial.

Em algumas modalidades, a informação de configura-ção 501 inclui informação que descreve um número total decanais de divisão de tempo em um quadro espacial 502, um nú-mero total de bandas de parâmetro expandindo uma faixa defreqüência do sinal de áudio, um número de bandas de parâme-tros em um conversor OTT, um número de bandas de parâmetrosem um conversor TTT e um número de bandas de parâmetros emum sinal residual. Outra informação pode estar incluída nainformação de configuração 501 se desejado.

Em algumas modalidades, o quadro espacial 502 in-clui um ou mais parâmetros espaciais (por exemplo, CLD,ICC) , um tipo de quadro, um número de conjuntos de parâme-tros em um quadro e canais de divisão de tempo ao quais osconjuntos de parâmetros podem ser aplicados. Outra informa-ção pode ser incluída no quadro espacial 502 se desejado. Osignificado e uso da informação de configuração 501 e a in-formação contida no quadro espacial 502 serão explicados comrelação às FIGs. 6 a 10.

Com relação à FIG. 5 (b) , um fluxo de bits de umsinal de áudio pode incluir informação de configuração 504,um sinal de mistura descendente 505, e um quadro espacial506. Nesse caso, um quadro 507 pode incluir o sinal de mis-tura descendente 505 e o quadro espacial 506, e o quadro 507pode ser repetido no fluxo de bits.

Com relação à FIG. 5 (c) , um fluxo de bits de umsinal de áudio pode incluir um sinal de mistura descendente508, informação de configuração 509 e um quadro espacial510. Nesse caso, um quadro 511 pode incluir a informação deconfiguração 509 e o quadro espacial 510, e o quadro 511 po-de ser repetido no fluxo de bits. Se a informação de confi-guração 509 é inserida em cada quadro 511, o sinal de áudiopode ser reproduzido por um dispositivo de reprodução em umaposição arbitrária.

Embora a FIG. 5 (c) ilustre que a informação deconfiguração 509 está inserida no fluxo de bits pelo quadro511, deveria estar aparente que a informação de configuração509 pode ser inserida no fluxo de bits por uma pluralidadede quadros que repetem periodicamente ou não periodicamente.

As FIGs. 6A e 6B são diagramas que ilustram rela-ções entre um conjunto de parâmetros, canais de divisão detempo e bandas de parâmetros de acordo com uma modalidade dapresente invenção. Um conjunto de parâmetros significa um oumais parâmetros espaciais aplicados a um canal de divisão detempo. Os parâmetros espaciais podem incluir informação es-pacial, tal como CDL, ICC, CPC, etc. Um canal de divisão detempo significa um intervalo de tempo de um sinal de áudioao qual os parâmetros espaciais podem ser aplicados. Um qua-dro espacial pode incluir um ou mais canais de divisão detempo.

Com relação à FIG. 6A, um número de conjuntos deparâmetros 1, ..., P pode ser usado em um quadro espacial, ecada conjunto de parâmetros pode incluir um ou mais camposde dados 1, ..., Q-I. Um conjunto de parâmetros pode ser a-plicado a uma faixa inteira de freqüências de um sinal deáudio, e cada parâmetro espacial no conjunto de parâmetrospode ser aplicado a uma ou mais partes da banda de freqüên-cias. Por exemplo, se um conjunto de parâmetros inclui 20parâmetros espaciais, a banda inteira de freqüências de umsinal de áudio pode ser dividida em 20 zonas (referidas como"bandas de parâmetros") e os 20 parâmetros espaciais do con-junto de parâmetros podem ser aplicados às 20 bandas de pa-râmetros. Os parâmetros podem ser aplicados às bandas de pa-râmetros como desejado. Por exemplo, os parâmetros espaciaispodem ser densamente aplicados a bandas de parâmetros debaixa freqüência e esparsamente aplicados a bandas de parâ-metros de alta freqüência.

Com relação à FIG. 6B, um gráfico de tem-po/freqüência mostra a relação entre os conjuntos de parâme-tros e os canais de divisão de tempo. No exemplo mostrado,três conjuntos de parâmetros (conjunto de parâmetros 1, con-junto de parâmetros 2, conjunto de parâmetros 3) são aplica-dos a um conjunto ordenado de 12 canais de divisão de tempoem um único quadro espacial. Nesse caso, uma faixa inteirade freqüência de um sinal de áudio é dividida em 9 bandas deparâmetros. Assim, o eixo horizontal indica o número de ca-nais de divisão de tempo e o eixo vertical indica o númerode bandas de parâmetros. Cada um dos três conjuntos de parâ-metros é aplicado a um canal de divisão de tempo especifico.Por exemplo, um primeiro conjunto de parâmetros (conjunto deparâmetros 1) é aplicado a um canal de divisão de tempo #1,um segundo conjunto de parâmetros (conjunto de parâmetros 2)é aplicado a um canal de divisão de tempo #5, e um terceiroconjunto de parâmetros (conjunto de parâmetros 3) é aplicadoa um canal de divisão de tempo #9. Os conjuntos de parâme-tros podem ser aplicados a outros canais de divisão de tempointerpolando-se e/ou copiando-se os conjuntos de parâmetrospara aqueles canais de divisão de tempo. Geralmente, o núme-ro de conjuntos de parâmetros pode ser igual ou menor ao nú-mero de canais de divisão de tempo, e o número de bandas deparâmetros pode ser igual ou menor ao número de bandas defreqüência do sinal de áudio. Codificando-se informação es-pacial para partes do domínio do tempo-freqüência de um si-nal de áudio ao invés do domínio inteiro de tempo-freqüênciado sinal de áudio, é possível reduzir a quantidade de infor-mação espacial enviada a partir de um codificador a um deco-dificador. Essa redução de dados é possível desde que infor-mação esparsa no domínio de tempo-freqüência seja freqüente-mente suficiente para a percepção auditiva humana de acordocom princípios conhecidos de codificação de áudio perceptivo.

Uma característica importante das modalidades des-critas é a codificação e decodificação de posições de canaisde divisão de tempo aos quais os conjuntos de parâmetros sãoaplicados usando um número fixo ou variável de bits. 0 núme-ro de bandas de parâmetros pode também ser representado comum número fixo de bits ou um número variável de bits. 0 es-quema de codificação de bits variáveis pode também ser apli-cado a outra informação usada em codificação de áudio espa-cial, incluindo, mas não limitada à informação associada comos domínios de tempo, espacial e/ou da freqüência (por exem-pio, aplicado a um número de sub-bandas de freqüência emiti-das a partir de um banco de filtros).

A FIG. 7A ilustra uma sintaxe para representar in-formação de configuração de um sinal de informação espacialde acordo com uma modalidade da presente invenção. A infor-mação de configuração inclui uma pluralidade de campos 701 a718 aos quais um número de bits pode ser atribuído.

Um campo "bsSamplingFrequencylndex" 701 indica umafreqüência de amostragem obtida a partir de um processo deamostragem de um sinal de áudio. Para representar a freqüên-cia de amostragem, 4 bits são alocados ao campo "bsSampling-Frequencylndex" 701. Se um valor do campo "bsSamplingFre-quencylndex" 701 é 15, isto é, um número binário de 1111, umcampo "bsSamplingFrequency" 702 é adicionado para represen-tar a freqüência de amostragem. Nesse caso, 24 bits são alo-cados ao campo "bsSamplingFrequency" 702.

Um campo "bsFrameLength" 703 indica um número to-tal de canais de divisão de tempo (chamado "numSlots") em umquadro espacial, e uma relação de numSlots = bsFrameLength+1 pode existir entre "numSlots" e o campo "bsFrameLength"703.

Um campo "bsFreqRes" 7 04 indica um número total debandas de parâmetros expandindo um domínio inteiro de fre-qüência de um sinal de áudio. O campo "bsFreqRes" 705 indicainformação para uma configuração em árvore incluindo umapluralidade de módulos de conversão de canal, tal como des-crito com relação à FIG. 4. A informação para a configuraçãoem árvore inclui tal informação como um tipo de módulo deconversão de canal, um número de módulos de conversão de ca-nal, um tipo de informação espacial usada no módulo de con-versão de canal, um número de canais de entrada/saída de umsinal de áudio, etc.

A configuração em árvore pode ter uma de uma con-figuração 5-1-5, uma configuração 5-2-5, uma configuração 7-2-7, uma configuração 7-5-7 e seus similares, de acordo comum tipo de um módulo de conversão de canal ou um número decanais. A configuração 5-2-5 da configuração em árvore émostrada na FIG. 4.

Um campo "bsQuantMode" 706 indica informação demodo de quantização de informação espacial.

Um campo "bsOnelcc" 707 indica se um sub-conjuntode parâmetros ICC é usado para todos os conversores OTT.Nesse caso, o sub-conjunto de parâmetros significa um con-junto de parâmetros aplicado a um canal de divisão de tempoespecifico e um módulo de conversão de canal especifico.

Um campo "bsArbitraryDownmix" 708 indica uma pre-sença ou não presença de um ganho de mistura descendente ar-bitrário.

Um campo "bsFixedGainSur" 709 indica um ganho a-plicado a um canal ambiente, por exemplo, LS (ambiente es-querdo) e RS (ambiente direito).

Um campo "bsFixedGainLF" 710 indica um ganho apli-

cado a um canal LFE.Um campo "bsFixedGainDM" 711 indica um ganho apli-cado a um sinal de mistura descendente.

Um campo "bsMatrixMode" 712 indica se um sinal demistura descendente estéreo compatível com matriz é gerado apartir de um codificador.

Um campo "bsTempShapeConfig" 713 indica um modo deoperação de moldagem temporal (por exemplo, TES (ajuste deenvelope temporal) e/ou TP (ajuste temporal)) em um decodi-ficador.

O campo "bsDecorrConfig" 714 indica um modo de o-peração de um decorrelator de um decodificador.

Ε, o campo "bs3DaudioMode" 715 indica se um sinalde mistura descendente é codificado em um sinal 3D e se umprocessamento HRTF inverso é usado.

Depois que informação de cada um dos campos foideterminada/extraída em um codificador/decodificador, infor-mação para um número de bandas de parâmetros aplicadas a ummódulo de conversão de canal é determinado/extraído no codi-ficador/decodificador. Um número de bandas de parâmetros a-plicadas a um conversor OTT é primeiro determinado/extraído(716) e um número de bandas de parâmetros aplicado a um con-versor TTT é então determinado/extraído (717). O número debandas de parâmetros para o conversor OTT e/ou conversor TTTserá descrito em detalhes com relação às FIGs. 8A a 9B.

No caso em que um quadro de extensão existe, umbloco "spatialExtensionConfig" 718 inclui informação de con-figuração para o quadro de extensão. A informação incluídano bloco "spatialExtensionConfig" 718 será descrita com re-lação às FIGs. IOA a 10D.

A FIG. 7B é uma tabela para um número de bandas deparâmetros de um sinal de informação espacial de acordo comuma modalidade da presente invenção. Um "numBands" indica umnúmero de bandas de parâmetros para um domínio inteiro defreqüência de um sinal de áudio e "bsFreqRes" indica infor-mação de índice para o número de bandas de parâmetros. Porexemplo, o domínio inteiro de freqüência de um sinal de áu-dio pode ser dividido por um número de bandas de parâmetroscomo desejado (por exemplo, 4, 5, 7, 10, 14, 20, 28, etc.).

Em algumas modalidades, um parâmetro pode ser a-plicado a cada banda de parâmetro. Por exemplo, se o "nura-Bands" é 28, então o domínio inteiro de freqüência de um si-nal de áudio é dividido em 28 bandas de parâmetro e cada umdos 28 parâmetros pode ser aplicado a cada um das 28 bandasde parâmetros. Em um outro exemplo, se o "numBands" é 4, en-tão o domínio inteiro de freqüência de um dado sinal de áu-dio é dividido em 4 bandas de parâmetro e cada um dos 4 pa-râmetros pode ser aplicado a cada uma das 4 bandas de parâ-metros. Na FIG. 7B, o termo "Reservado" significa que um nú-mero de bandas de parâmetros para o domínio inteiro de fre-qüência de um dado sinal de áudio não é determinado.

Dever-se-ia notar que um órgão auditivo humano nãoé sensível ao número de bandas de parâmetro usadas no esque-ma de codificação. Assim, usar um pequeno número de bandasde parâmetro pode fornecer efeito de áudio espacial similara um ouvinte do que se um grande número de bandas de parâme-tros fosse usado.

Diferente do "numBands", o "numSlots" representadopelo campo "bsFrameLength" 7 03 mostrado na FIG. 7A pode re-presentar todos os valores. Os valores de "numSlots" podemser limitados, entretanto, se o número de amostras em umquadro espacial é exatamente divisível pelo "numSlots". As-sim, se um valor máximo do "numSlots" a ser substancialmenterepresentado é , cada valor do campo "bsFrameLength" 703pode ser representado por bit(s) teto{log2 (b) } . Nesse caso,Ateto(x)' significa um inteiro mínio maior ou igual ao valorλχ' . Por exemplo, se um quadro espacial inclui 72 canais dedivisão de tempo, então teto{log2 (72) } = 7 bits pode ser a-locado ao campo "bsFrameLength" 703, e o número de bandas deparâmetros aplicadas a um módulo de conversão de canal podeser decidido no "numBands".

A FIG. 8A ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicadas a um conversor OTTpor um número fixo de bits de acordo com uma modalidade dapresente invenção. Com relação às FIGs. 7A e 8A, um valor deλί' tem um valor de zero para numOttBoxes-1, onde AnumOttBo-xes' é o número total de conversores OTT. Ou seja, o valorde indica cada conversor OTT, e um número e bandas deparâmetros aplicadas a cada conversor OTT é representado deacordo com o valor de Λί'. Se um conversor OTT tem um modode canal LFE, o número de bandas de parâmetros (chamado"bsOttBands") aplicadas ao canal LFE do conversor OTT podeser representado usando um número fixo de bits. No exemplomostrado na FIG. 8A, 5 bits são alocados para o campo"bsOttBands" 801.Se um conversor OTT não tem um modo de ca-nal LFE, o número total de bandas de parâmetro (numBands)pode ser aplicado a um canal do conversor OTT.

A FIG. 8B ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicadas a um conversor OTTpor um número variável de bits de acordo com uma modalidadeda presente invenção. A FIG. 8B, que é similar à FIG. 8A,difere da FIG. 8A já que o campo "bsOttBands" 802 mostradona FIG. 8B é representado por um número variável de bits. Emparticular, o campo "bsOttbands" 802, que tem um valor igualou menor do que "numBands", pode ser representado por um nú-mero variável de bits usando "numBands".

Se o "numBands" está em uma faixa igual ou maiordo que 2Λ(η-1) e menor do que 2A (η) , o campo "bsOttBands"802 pode ser representado por η bits variáveis.

Por exemplo: (a) se o "numBands é 40, o campo"bsOttBands" 802 é representado por 6 bits; (b) se o "num-Bands" é 28 ou 20, o campo "bsOttBands" 802 é representadopor 5 bits; (c) se o "numBands" é 14 ou 10, o campo "bsOtt-Bands" 802 é representado por 4 bits; e (d) se o "numBands"é 7, 5 ou 4, o campo "bsOttBands" 8 02 é representado por 3bits.

Se o "numBands" está em uma faixa maior do que2ˆ(η-1) e igual ou menor a 2ˆ(η), o campo "bsOttBands" 802pode ser representado por η bits variáveis.

Por exemplo: (a) se o "numBands é 40, o campo"bsOttBands" 802 é representado por 6 bits; (b) se o "num-Bands" é 28 ou 20, o campo "bsOttBands" 802 é representadopor 5 bits; (c) se o "numBands" é 14 ou 10, o campo "bsOtt-Bands" 802 é representado por 4 bits; (d) se o "numBands" é7 ou 5, o campo "bsOttBands" 8 02 é representado por 3 bits;e (e) se o "numBands" é 4, o campo "bsOttBands" 8 02 é repre-sentado por 2 bits.

O campo "bsOttBands" 802 pode ser representado porum número variável de bits apesar de uma função (chamada"função teto") de arredondamento para cima para um inteiromais próximo tomando o "numBands" como uma variável.

Em particular, i) no caso de 0 < bsOttBands < num-Bands ou 0 ≤ bsOttBands < numBands, o campo "bsOttBands" 802é representado por um número de bits correspondente a um va-lor de teto{Iog2 (numBands)} ou ii) no caso de 0 < bsOttBandsnumBands, o campo "bsOttBands" 802 pode ser representadopor teto(Iog2(numBands+1) bits.

Se um valor igual ou menor a "numBands" (chamado"numberbands") é arbitrariamente determinado, o campo"bsOttBands" 802 pode ser representado por um número variá-vel de bits através da função teto tomando-se o "number-Bands" como uma variável.

Em particular, i) no caso de 0 < bsOttBands < nura-berBands ou 0 < bsOttBands < numberBands, o campo "bsOtt-Bands" 802 é representado por teto (log2 (numberBands) ) bitsou ii) no caso de 0 < bsOttBands < numberBands, o campo"bsOttBands" 802 pode ser representado por te-to (log2 (numberBands + 1) bits.

Se mais do que um conversor OTT é usado, uma cora-binação dos "bsOttBands" pode ser expressa pela Fórmula 1abaixo:

<formula>formula see original document page 27</formula>

onde, bsOttBandsi indica um i2 "bsOttbands". Porexemplo, assume-se que há três conversores OTT e três valo-res (N=3) para o campo "bsOttBands" 802. Neste exemplo, ostrês valores do campo "bsOttBands" 802 (chamados al, a2, a3,respectivamente) aplicados aos três conversores OTT, respec-tivamente, podem ser representados por 2 bits cada. Portan-to, um total de 6 bits é necessário para expressar os valo-res al, a2 e a3. Ainda, se os valores al, a2 e a3 são repre-sentados como um grupo, então 27 (= 3*3*3) casos podem ocor-rer, que podem ser representados por 5 bits, economizando umbit. Se o "numBands" é 3 e um valor de grupo representadopor 5 bits é 15, o valor de grupo pode ser representado como15 = Ix(3A2) + 2* (3A1) + 0*(3Λ0). Portanto, um decodificadorpode determinar a partir do valor de grupo 15 que os trêsvalores al, a2 e a3 do campo "bsOttBands" 802 são 1, 2 e 0,respectivamente, aplicando-se o inverso da Fórmula 1.No caso de múltiplos conversores OTT, a combinaçãode "bsOttBands" pode ser representada como uma das Fórmulas2 a 4 (definida abaixo) usando o "numberbands". Já que a re-presentação de "bsOttBands" usando o "numberBands" é similarà representação usando o "numBands" na Fórmula 1, uma expli-cação detalhada deve ser omitida e somente as fórmulas sãoapresentadas abaixo.

[Fórmula 2]

<formula>formula see original document page 28</formula>

[Fórmula 3]

<formula>formula see original document page 28</formula>

[Fórmula 4]

<formula>formula see original document page 28</formula>

A FIG. 9A ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicadas a um conversor TTTpor um número fixo de bits de acordo com uma modalidade dapresente invenção. Com relação às FIGs. 7A e 9A, um valor deΛί' tem um valor de zero para numTttBoxes-1, onde ^numTttBo-xes' é um número de todos os conversores TTT. Ou seja, o va-Ior de λί' indica cada conversor TTT. Um número de bandas deparâmetros aplicadas a cada conversor TTT é representado deacordo com o valor de λί'. Em algumas modalidades, o conver-sor TTT pode ser dividido em uma faixa de banda de baixafreqüência e uma faixa de banda de alta freqüência, e dife-rentes processos podem ser aplicados às faixas de banda debaixa e alta freqüência. Outras divisões são possíveis.

Um campo "bsTttDualMode" 901 indica se um dadoconversor TTT opera em diferentes modos (chamado "modo du-al") para uma faixa de banda baixa e uma faixa de banda al-ta, respectivamente. Por exemplo, se um valor do campo"bsTttDualMode" 901 é zero, então um modo é usado para afaixa de banda inteira sem discriminar entre uma faixa debanda baixa e uma faixa de banda alta. Se um valor do campo"bsTttDualMode" é 1, então diferentes modos podem ser usadospara a faixa de banda baixa e a faixa de banda alta, respec-tivamente .

Um campo "bsTttModeLow" 902 indica um modo de ope-ração de um dado conversor TTT, que pode ter vários modos deoperação. Por exemplo, o conversor TTT pode ter um modo depredição que usa, por exemplo, parâmetros CPC e ICC, um modobaseado em enerqia que usa, por exemplo, parâmetros CLD,etc. Se um conversor TTT tem um modo dual, informação adi-cional para uma faixa de banda alta pode ser necessária.

Um campo "bsTttModeHigh" 903 indica um modo de o-peração da faixa de banda alta, no caso de o conversor TTTter um modo dual.

Um campo "bsTttBandsLow" 904 indica um número debandas de parâmetros aplicadas ao conversor TTT.

Um campo "bsTttBandsHigh" 905 tem "numBands".

Se um conversor TTT tem um modo dual, uma faixa debanda baixa pode ser igual ou maior do que zero e menor doque "bsTttBandsLow", enquanto uma faixa de banda alta podeser igual ou maior do que "bsTttBandsLow" e menor do que"bsTttBandsHigh".

Se um conversor TTT não tem um modo dual, um núme-ro de bandas de parâmetros aplicadas ao conversor TTT podeser igual ou maior a zero e menor do que "numBands" (907).

O campo "bsTttBandsLow" 904 pode ser representadopor um número fixo de bits. Por exemplo, como mostrado naFIG. 9A, 5 bits podem ser alocados para representar o campo"bsTttBandsLow" 904.

A FIG. 9B ilustra uma sintaxe para representar umnúmero de bandas de parâmetros aplicadas a um conversor TTTpor um número variável de bits de acordo com uma modalidadeda presente invenção. A FIG. 9B é similar à FIG. 9A, mas di-fere desta em representar um campo "bsTttBandsLow" 907 daFIG. 9B por um número variável de bits enquanto representan-do um campo "bsTttBandsLow" 904 da FIG. 9A por um número fi-xo de bits. Em particular, já que o campo "bsTttBandsLow"907 tem um valor igual ou menor do que "numBands", o campo"bsTttBands" 907 pode ser representado por um número variá-vel de bits usando "numBands".

Em particular, no caso em que o "numBands" é igualou maior do que 2A(n-l) e menor do que 2A (η) , o campo"bsTttBandsLow" 907 pode ser representado por η bits.

Por exemplo: (i) se o "numBands é 40, o campo"bsTttBandsLow" 907 é representado por 6 bits; (ii) se o"numBands" é 28 ou 20, o campo "bsTttBandsLow" 907 é repre-sentado por 5 bits; (iii) se o "numBands" é 14 ou 10, o cam-po "bsTttBandsLow" 907 é representado por 4 bits; e (iv) seo "numBands" é 7, 5 ou 4, o campo "bsTttBandsLow" 907 é re-presentado por 3 bits.

Se o "numBands" está em uma faixa maior do que2Λ(η-1) e igual ou menor a 2Λ(η), então o campo "bsTttBands-Low" 907 pode ser representado por η bits.

Por exemplo: (i) se o "numBands é 40, o campo"bsTttBandsLow" 907 é representado por 6 bits; (ii) se o"numBands" é 28 ou 20, o campo "bsTttBandsLow" 907 é repre-sentado por 5 bits; (iii) se o "numBands" é 14 ou 10, o cam-po "bsTttBandsLow" 907 é representado por 4 bits; (iv) se o"numBands" é 7 ou 5, o campo "bsTttBandsLow" 907 é represen-tado por 3 bits; e (v) se o "numBands" é 4, o campo "bsTtt-BandsLow" 907 é representado por 2 bits.

O campo "bsTttBandsLow" 907 pode ser representadopor um número de bits decidido por uma função teto tomando-se o "numBands" como uma variável.

Por exemplo: i) no caso de 0 < bsTttBandsLow <numBands ou 0 < bsTttBandsLow < numBands, o campo "bsTtt-BandsLow" 907 é representado por um número de bits corres-pondente a um valor de teto (log2 (numBands) ) ou ii) no casode 0 < bsTttBandsLow < numBands, o campo "bsTttBandsLow" 907pode ser representado por teto (Iog2 (numBands+1) bits.

Se um valor igual ou menor a "numBands", isto é,"numberBands" é arbitrariamente determinado, o campo "bsTtt-BandsLow" 907 pode ser representado por um número variávelde bits usando o "numberBands".

Em particular, i) no caso de 0 < bsTttBandsLow <numberBands ou 0 < bsTttBandsLow < numberBands, o campo"bsTttBandsLow" 907 é representado por um número de bitscorrespondente a um valor de teto (Iog2 (numberBands) ) ou ii)no caso de 0 < bsTttBandsLow < numberBands, o campo "bsTtt-BandsLow" 907 pode ser representado por um número de bitscorrespondente a um valor de teto (log2 (numberBands + 1) .

Se no caso de múltiplos conversores TTT, uma com-binação dos "bsTttBandsLow" pode ser expressa como a Fórmuladefinida abaixo.

[Fórmula 5]

<formula>formula see original document page 32</formula>

Neste caso, bsTttBandsLowi indica um i2 "bsTtt-BandsLow". Como a Fórmula 5 é idêntica à Fórmula 1, uma ex-plicação detalhada da Fórmula 5 é omitida na seguinte des-crição .

No caso de múltiplos conversores TTT, a combinaçãode "bsTttBandsLow" pode ser representada como uma das Fórmu-las 6 a 8 usando o "numberbands". Como o significado dasFórmulas 6 a 8 é idêntico ao das Fórmulas 2 a 4, uma expli-cação detalhada das Fórmulas 6 a 8 será omitida na seguintedescrição.

[Fórmula 6]

<formula>formula see original document page 32</formula>

[Fórmula 7]

<formula>formula see original document page 32</formula>

[Fórmula 8]

<formula>formula see original document page 32</formula>

Um número de bandas de parâmetros aplicadas ao mó-dulo de conversão de canal (por exemplo, conversor OTT e/ouconversor TTT) pode ser representado como um valor de divi-são dos "numBands". Nesse caso, o valor de divisão usa ummeio valor do "numBands" ou um valor resultante da divisãodos "numBands" por um valor especifico.

Uma vez que um número de bandas de parâmetros a-plicadas ao conversor OTT e/ou TTT é determinado, conjuntosde parâmetros podem ser determinados, os quais podem ser a-plicados a cada conversor OTT e/ou a cada conversor TTT emuma faixa de número de bandas de parâmetros. Cada um dosconjuntos de parâmetros pode ser aplicado a cada conversorOTT e/ou a cada conversor TTT pela unidade de canal de divi-são de tempo. Ou seja, um conjunto de parâmetro pode ser a-plicado a um canal de divisão de tempo.

Como mencionado na descrição anterior, um quadroespacial pode incluir uma pluralidade de canais de divisãode tempo. Se o quadro espacial é um tipo de quadro fixo, en-tão um conjunto de parâmetros pode ser aplicado a uma plura-lidade de canais de divisão de tempo com um intervalo igual.Se o quadro é um tipo de quadro variável, a informação deposição do canal de divisão de tempo ao qual o conjunto deparâmetros é aplicado é necessária. Isso será explicado maisdetalhadamente com relação às FIGs. 13A a 13C.

A FIG. 10A ilustra uma sintaxe para informação deconfiguração de extensão espacial para um quadro de extensãoespacial de acordo com uma modalidade da presente invenção.A informação de configuração de extensão espacial pode in-cluir um campo "bsSacExtType" 1001, um campo "bsSacExtLen"1002, um campo "bsSacExtLenAdd" 1003, um campo "bsSacExtLe-nAddAdd" 1004 e um campo "bsFillBits" 1007. Outros campossão possíveis.

0 campo "bsSacExtType" 1001 indica um tipo de da-dos de um quadro de extensão espacial. Por exemplo, o quadrode extensão espacial pode ser preenchido com zeros, dados desinal residual, dados de sinal residual de mistura descen-dente arbitrários ou dados de árvore arbitrários.

O campo "bsSacExtLen" 1002 indica um número de by-tes da informação de configuração de extensão espacial.

O campo "bsSacExtLenAdd" 1003 indica um número a-dicional de bytes de informação de configuração de extensãoespacial se um número de bytes da informação de extensão es-pacial se torna igual ou maior do que, por exemplo, 15.

O campo "bsSacExtLenAddAdd" 1004 indica um númeroadicional de bytes de informação de configuração de extensãoespacial se um número de bytes da informação de configuraçãode extensão espacial se torna igual ou maior do que, por e-xemplo, 270.

Depois dos respectivos campos terem sido determi-nados/extraídos em um codificador/decodificador, a informa-ção de configuração para um tipo de dados incluído no quadrode extensão espacial é determinada (1005).

Gomo mencionado na descrição anterior, dados desinal residual, dados de sinal residual de mistura descen-dente arbitrários, dados de configuração de árvore ou seussimilares podem ser incluídos no quadro de extensão espacial.

Subseqüentemente, um número de bits não usados deum comprimento da informação de configuração de extensão es-pacial é calculado 1006.O campo "bsFillBits" 1007 indica um número de bitsde dados que podem ser desprezados para preencher os bitsnão usados.

As FIGs. 10B e 10C ilustram sintaxes para informa-ção de configuração de extensão espacial para um sinal resi-dual no caso em que o sinal residual está incluído em umquadro de extensão espacial de acordo com uma modalidade dapresente invenção.

Com relação à FIG. 10B, um campo "bsResidualSam-plingFrequencylndex" 1008 indica uma freqüência de amostra-gem de um sinal residual.

Um campo "bsResidualFramesPerSpatialFrame" 1009indica um número de quadros residuais por um quadro espaci-al. Por exemplo, 1, 2, 3 ou 4 quadros residuais podem serincluídos em um quadro espacial.

Um bloco "ResidualConfig" 1010 indica um número debandas de parâmetros para um sinal residual aplicado a cadaconversor OTT e/ou conversor TTT.

Com relação à FIG. 10C, um campo "bsResidualPre-sent" 1011 indica se um sinal residual é aplicado a cadaconversor OTT e/ou TTT.

Um campo "bsResidualBands" 1012 indica um númerode bandas de parâmetros do sinal residual existentes em cadaconversor OTT e/ou TTT se o sinal residual existe em cadaconversor OTT e/ou TTT. Um número de bandas de parâmetros dosinal residual pode ser representado por um número fixo debits ou um número variável de bits. No caso em que o númerode bandas de parâmetros é representado por um número fixo debits, o sinal residual é capaz de ter um valor igual ou me-nor a um número total de bandas de parâmetro de um sinal deáudio. Assim, um número de bits (por exemplo, 5 bits na FIG.10C) necessário para representar um número de todas as ban-das de parâmetros pode ser alocado.

A FIG. IOD ilustra uma sintaxe para representar umnúmero de bandas de parâmetros de um sinal residual por umnúmero variável de bits de acordo com uma modalidade da pre-sente invenção. Um campo "bsResidualBands" 1014 pode ser re-presentado por um número variável de bits usando "numBands".Se o numBands é igual ou maior do que 2A(n-l) e menor do que2Λ(η), o campo "bsResidualBands" 1014 pode ser representadopor η bits.

Por exemplo: (i) se o "numBands é 40, o campo "bs-ResidualBands" 1004 é representado por 6 bits; (ii) se o"numBands" é 28 ou 20, o campo "bsResidualBands" 1004 é re-presentado por 5 bits; (iii) se o "numBands" é 14 ou 10, ocampo "bsResidualBands" 1004 é representado por 4 bits; e(iv) se o "numBands" é 7, 5 ou 4, o campo "bsResidualBands"1004 é representado por 3 bits.

Se o numBands é maior do que 2A (n-1) e igual oumenor do que 2A(η), então o número de bandas de parâmetro dosinal residual pode ser representado por η bits.

Por exemplo: (i) se o "numBands é 40, o campo "bs-ResidualBands" 1004 é representado por 6 bits; (ii) se o"numBands" é 28 ou 20, o campo "bsResidualBands" 1004 é re-presentado por 5 bits; (iii) se o "numBands" é 14 ou 10, ocampo "bsResidualBands" 1004 é representado por 4 bits; (iv)se o "numBands" é 7 ou 5, o campo "bsResidualBands" 1004 érepresentado por 3 bits; e (v) se o "numBands" é 4, o campo"bsResidualBands" 1004 é representado por 2 bits.

Além disso, o campo "bsResidualBands" 1014 podeser representado por um número de bits decidido por uma fun-ção teto de arredondar para cima para um inteiro mais próxi-mo tomando-se o "numBands" como uma variável.

Em particular, i) no caso de 0 < bsResidualBands <numBands ou 0 < bsResidualBands < numBands, o campo "bsResi-dualBands" 1014 é representado por teto {Iog2 (numBands) } bitsou ii) no caso de 0 < bsResidualBands < numBands, o campo"bsResidualBands" 1014 pode ser representado por te-to{Iog2(numBands+1} bits.

Em algumas modalidades, o campo "bsResidualBands"1014 pode ser representado usando um valor (numberbands) i-gual ou menor ao numBands.

Em particular, i) no caso de 0 < bsResidualBands <numberBands ou 0 < bsResidualBands < numberBands, o campo"bsResidualBands" 1014 é representado por te-to { Iog2 (numberBands ) } bits ou ii) no caso de 0 < bsResidual-Bands < numberBands, o campo "bsResidualBands" 1014 pode serrepresentado por teto{Iog2(numberBands+1} bits.

Se uma pluralidade de sinais residuais (N) existe,uma combinação do "bsResidualBands" pode ser expressa comomostrado na Fórmula 9 abaixo.

[Fórmula 9]

<formula>formula see original document page 37</formula>

Neste caso, bsResidualBandsi indica um i2 "bsResi-dualBands". Como o significado da Fórmula 9 é idêntico ao daFórmula 1, uma explicação detalhada da Fórmula 9 é omitidana seguinte descrição.

Se há múltiplos sinais residuais, a combinação de"bsResidualBands" pode ser representada como uma das Fórmu-las 10 a 12 usando o "numberbands". Como a representação de"bsResidualBands" usando o "numberBands" é idêntica à repre-sentação das Fórmulas 2 a 4, sua explicação detalhada deveser omitida na seguinte descrição.

<formula>formula see original document page 38</formula>

Um número de bandas de parâmetros do sinal residu-al pode ser representado como um valor de divisão dos "num-Bands". Nesse caso, o valor de divisão usa um meio valor do"numBands" ou um valor resultante da divisão dos "numBands"por um valor especifico.

O sinal residual pode ser incluído em um fluxo debits de um sinal de áudio junto com um sinal de mistura des-cendente e um sinal de informação espacial, e o fluxo debits pode ser transferido para um decodificador. O decodifi-cador pode extrair o sinal de mistura descendente, o sinalde informação espacial e o sinal residual do fluxo de bits.

Subseqüentemente, o sinal de mistura descendente émistura de forma ascendente usando a informação espacial.Enquanto isso, o sinal residual é aplicado ao sinal de mis-tura descendente no curso da mistura ascendente. Em particu-lar, o sinal de mistura descendente é mistura de forma as-cendente em uma pluralidade de módulos de conversão de canalusando a informação espacial. Fazendo isso, o sinal residualé aplicado ao módulo de conversão de canal. Como mencionadona descrição anterior, o módulo de conversão de canal tem umnúmero de bandas de parâmetro e um conjunto de parâmetros éaplicado ao módulo de conversão de canal por uma unidade decanal de divisão de tempo. Quando o sinal residual é aplica-do ao módulo de conversão de canal, o sinal residual podeser necessário para atualizar a informação de correlação in-tercanal do sinal de áudio ao qual o sinal residual é apli-cado. Então, a informação de correlação intercanal atualiza-da é usada em um processo de mistura ascendente.

A FIG. IlA é um diagrama de bloco de um decodifi-cador para codificação não guiada de acordo com uma modali-dade da presente invenção. Codificação não guiada significaque informação espacial não está incluída em um fluxo debits de um sinal de áudio.

Em algumas modalidades, o decodificador inclui umbanco de filtros de análise 1102, uma unidade de análise1104, uma unidade de síntese espacial 1106 e um banco defiltros síntese 1108. Embora um sinal de mistura descendenteem um tipo de sinal estéreo seja mostrado na FIG. 11A, ou-tros tipos de sinais de mistura descendente podem ser usa-dos .Em operação, o decodificador recebe um sinal demistura descendente 1101 e o banco de filtros de análise1102 o converte em um sinal no domínio da freqüência 1103. Aunidade de analise 1104 gera informação espacial a partir dosinal de mistura descendente convertido 1103. A unidade deanálise 1104 executa um processamento por uma unidade de ca-nal e a informação espacial 1105 pode ser gerada por umapluralidade de canais. Nesse caso, o canal inclui um canalde divisão de tempo.

A informação espacial pode ser gerada em duas eta-pas. Primeiro, um parâmetro de mistura descendente é geradoa partir do sinal de mistura descendente. Segundo, o parâme-tro de mistura descendente é convertido em informação espa-cial, tal como o parâmetro espacial. Em algumas modalidades,o parâmetro de mistura descendente pode ser gerado atravésde um cálculo de matriz do sinal de mistura descendente.

A unidade de síntese espacial 1106 gera um sinalde áudio multicanal 1107 sintetizando a informação espacialgerada 1105 com o sinal de mistura descendente 1103. O sinalde áudio multicanal gerado 1107 passa através do banco defiltros de síntese 1108 a ser convertido em um sinal de áu-dio no domínio do tempo 1109.

A informação espacial pode ser gerada em posiçõesde canal pré-determinadas. A distância entre as posições po-de ser igual (isto é, eqüidistante). Por exemplo, a informa-ção espacial pode ser gerada por 4 canais. A informação es-pacial pode também ser gerada em posições de canal variá-veis. Nesse caso, a informação de posição de canal a partirda qual a informação espacial é gerada pode ser extraída dofluxo de bits. A informação de posição pode ser representadapor um número variável de bits. A informação de posição podeser representada como um valor absoluto e um valor de dife-rença de uma informação de posição de canal anterior.

No caso de usar a codificação não guiada, um núme-ro de bandas de parâmetros (chamadas "bsNumguidedBlind-Bands") para cada canal de um sinal de áudio pode ser repre-sentado por um número fixo de bits. 0 "bsNumguideBlindBands"pode ser representado por um número variável de bits usando"numBands". Por exemplo, se o "numBands" é igual ou maior doque 2A(n-l) e menor do que 2A(η), o "bsNumguideBlindBands"pode ser representado por η bits variáveis.

Em particular, (a) se o "numBands é 40, o campo"bsNumguideBlindBands" é representado por 6 bits; (b) se o"numBands" é 28 ou 20, o campo "bsNumguideBlindBands" é re-presentado por 5 bits; (c) se o "numBands" é 14 ou 10, ocampo "bsNumguideBlindBands" é representado por 4 bits; e(d) se o "numBands" é 7, 5 ou 4, o campo "bsNumguideBlind-Bands" é representado por 3 bits.

Se o "numBands" é maior do que 2Λ(η-1) e igual oumenor do que 2A (η) , o "bsNumguideBlindBands" pode ser repre-sentado por η bits variáveis.

Por exemplo: (a) se o "numBands é 40, o campo "bs-NumguideBlindBands" é representado por 6 bits; (b) se o"numBands" é 28 ou 20, o campo "bsNumguideBlindBands" é re-presentado por 5 bits; (c) se o "numBands" é 14 ou 10, ocampo "bsNumguideBlindBands" é representado por 4 bits; (d)se o "numBands" é 7 ou 5, o campo "bsNumguideBlindBands" érepresentado por 3 bits; e (e) se o "numBands" é 4, o campo"bsNumguideBlindBands" é representado por 2 bits.

Além disso, "bsNumguideBlindBands" pode ser repre-sentado por um número variável de bits usando a função tetotomando "numBands" como uma variável.

Por exemplo, i) no caso de 0 < bsNumguideBlind-Bands < numBands ou 0 < bsNumguideBlindBands < numBands, ocampo "bsNumguideBlindBands" é representado por te-to{Iog2 (numBands) } bits ou ii) no caso de 0 < bsNumguide-BlindBands < numBands, o campo "bsNumguideBlindBands" podeser representado por teto {Iog2 (numBands + 1) } bits.

Se um valor igual ou menor do que "numBands", istoé, "numberBands" é arbitrariamente determinado, o campo "bs-NumguideBlindBands" pode ser representado como segue.

Em particular, i) no caso de 0 < bsNumguideBlind-Bands < numberBands ou 0 < bsNumguideBlindBands < number-Bands, o campo "bsNumguideBlindBands" é representado por te-to { Iog2 (numberBands ) } bits ou ii) no caso de O < bsNumguide-BlindBands < numberBands, o campo "bsNumguideBlindBands" po-de ser representado por teto{Iog2 (numberBands+1) } bits.

Se um número de canais (N) existe, uma combinaçãodo "bsNumguideBlindBands" pode ser expressa como mostrado naFórmula 13.

[Fórmula 13]

<formula>formula see original document page 42</formula>

Neste caso, bsNumguideBlindBandSi indica um i- "bsNumguide-BlindBands". Como o significado da Fórmula 13 é idêntico aoda Fórmula 1, uma explicação detalhada da Fórmula 13 é omi-tida na seguinte descrição.

Se há múltiplos canais, "bsNumguideBlindBands" po-de ser representado como uma das Fórmulas 14 a 16 usando o"numberbands". Como a representação de "bsNumguideBlind-Bands" usando o "numberBands" é idêntica à representação dasFórmulas 2 a 4, a explicação detalhada das Fórmulas 14 a 16será omitida na seguinte descrição.

[Fórmula 14]

<formula>formula see original document page 43</formula>

[Fórmula 15]

<formula>formula see original document page 43</formula>

[Fórmula 16]

<formula>formula see original document page 43</formula>

A FIG. IlB é um diagrama para um método de representar umnúmero de bandas de parâmetros como um grupo de acordo comuma modalidade da presente invenção. Um número de bandas deparâmetros inclui informação de número de bandas de parâme-tros aplicadas a um módulo de conversão de canal, informaçãode número de.bandas de parâmetros aplicadas a um sinal resi-dual e informação de número de bandas de parâmetros para ca-da canal de um sinal de áudio no caso de usar codificaçãonão guiada. No caso de que há uma pluralidade de informaçãode número de bandas de parâmetros, a pluralidade de informa-ção de número (por exemplo, "bsOttBands", "bsTttBands", "bs-ResidualBands" e/ou "bsNumguideBlindBands") pode ser repre-sentada como pelo menos um ou mais grupos.Com relação à FIG. 11B, se há (kN+L) informação denúmero de bandas de parâmetros e se Q bits são necessáriospara representar cada informação de número de bandas de pa-râmetros, uma pluralidade de informação de número de bandasde parâmetros pode ser representada como um grupo seguinte.Nesse caso, Ak' e λΝ' são inteiros arbitrários não nulos e1L' é um inteiro arbitrário na faixa 0 < L < N.

Um método de agrupamento inclui as etapas de gerark grupos ligando-se informação de número N de bandas de pa-râmetros e gerar um último grupo ligando-se a última infor-mação de número L de bandas de parâmetros. Os k grupos podemser representados como M bits e o último grupo pode ser re-presentado como ρ bits. Nesse caso, os M bits são preferen-cialmente menos do que N*Q bits usados no caso de represen-tar cada informação de número de bandas de parâmetros semagrupá-las.

Por exemplo, assume-se que duas informações de nú-mero de bandas de parâmetros são bl e b2, respectivamente.Se cada uma de bl e b2 é capaz de ter cinco valores, 3 bitssão necessários para representar cada uma de bl e b2. Nessecaso, mesmo se os 3 bits são capazes de representar oito va-lores, cinco valores são substancialmente necessários. As-sim, cada uma de bl e bl tem três redundâncias. Ainda, nocaso de representar bl e b2 como um grupo ligando-se bl e b2juntos, 5 bits podem ser usados ao invés de 6 bits (= 3 bits+ 3 bits). Em particular, como todas as combinações de bl eb2 incluem 25 (=5*5) tipos, um grupo de bl e b2 pode ser re-presentado como 5 bits. Como os 5 bits são capazes de repre-sentar 32 valores, sete redundâncias são geradas no caso darepresentação de agrupamento. Ainda, no caso de uma repre-sentação agrupando-se bl e b2, a redundância é menor do queaquela de um caso de representar cada um de bl e b2 como 3bits. Um método de representar uma pluralidade de informaçãode número de bandas de parâmetros como grupos pode ser im-plementado de várias formas como segue.

Se uma pluralidade de informação de número de ban-das de parâmetros tem 40 tipos de valores cada, k grupos sãogerados usando 2, 3, 4, 5 ou 6 como o N. Os k grupos podemser representados como 11, 16, 22, 27 e 32 bits, respectiva-mente. Alternativamente, os k grupos são representados com-binando-se os respectivos casos.

Se uma pluralidade de informações de número debandas de parâmetros tem 28 tipos de valores cada, k grupossão gerados usando 6 como o N, e os k grupos podem ser re-presentados como 29 bits.

Se uma pluralidade de informações de número debandas de parâmetros tem 20 tipos de valores cada, k grupossão gerados usando 2, 3, 4, 5, 6 ou 7 como o N. Os k grupospodem ser representados como 9, 13, 18, 22, 16 e 31 bits,respectivamente. Alternativamente, os k grupos podem ser re-presentados combinando-se os respectivos casos.

Se uma pluralidade de informações de número debandas de parâmetros tem 14 tipos de valores cada, k grupossão gerados usando 6 como o N. Os k grupos podem ser repre-sentados como 23 bits.

Se uma pluralidade de informações de número debandas de parâmetros tem 10 tipos de valores cada, k grupossão gerados usando 2, 3, 4, 5, 6, 7, 8 ou 9 como o N. Os kgrupos podem ser representados como 7, 10, 14, 17, 20, 24,27 e 30 bits, respectivamente. Alternativamente, os k grupospodem ser representados combinando-se os respectivos casos.

Se uma pluralidade de informações de número debandas de parâmetros tem 7 tipos de valores cada, k grupossão gerados usando 6, 7, 8, 9, 10 ou 11 como o N. Os k gru-pos podem ser representados como 17, 20, 23, 26, 29 e 31bits, respectivamente. Alternativamente, os k grupos podemser representados combinando-se os respectivos casos.

Se uma pluralidade de informações de número debandas de parâmetros tem 5 tipos de valores cada, k grupossão gerados usando 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 ou 13como o N. Os k grupos podem ser representados como 5, 7, 10,12, 14, 17, 19, 21, 24, 26, 28 e 31 bits, respectivamente.Alternativamente, os k grupos podem ser representados combi-nando-se os respectivos casos.

Além disso, uma pluralidade de informações de nú-mero de bandas de parâmetros pode ser configurada para serrepresentada como os grupos descritos acima, ou para serconsecutivamente representada tornando cada informação denúmero de bandas de parâmetros em uma seqüência de bits in-dependente.

A FIG. 12 ilustra sintaxe que representa informa-ção de configuração de um quadro espacial de acordo com umamodalidade da presente invenção. Um quadro espacial incluium bloco "Framinglnfo" 1201, um campo "bsIndependencyFlag"1202, um bloco wOttData" 1203, um bloco "TttData" 1204, umbloco "SmgData" 1205 e um bloco "tempShapeData" 1206.

0 bloco "Framinglnfo" 1201 inclui informação paraum número de conjuntos de parâmetros e informação para canalde divisão de tempo ao qual cada conjunto de parâmetros éaplicado. O bloco "Framinglnfo" 1201 é explicado em detalhesna FIG. 13A.

O campo "bsIndependencyFlag" 1202 indica se umquadro atual pode ser decodificado sem conhecimento de umquadro anterior.

O bloco "OttData" 1203 inclui toda a informação deparâmetro espacial para todos os conversores OTT.

O bloco "TttData" 1204 inclui toda a informação deparâmetro espacial para todos os conversores TTT.

O bloco "SmgData" 1205 inclui informação para sua-vização temporal aplicada a um parâmetro espacial desquanti-zado.

O bloco "TempShapeData" 1206 inclui informação pa-ra ajuste de envelope temporal aplicado a um sinal descorre-lacionado.

A FIG. 13A ilustra uma sintaxe para representarinformação de posição de canal de divisão de tempo, ao qualum conjunto de parâmetros é aplicado, de acordo com uma mo-dalidade da presente invenção. 0 campo "bsFramingType" 1301indica se um quadro espacial de um sinal de áudio é um tipode quadro fixo ou um tipo de quadro variável. Um quadro fixosignifica um quadro que um conjunto de parâmetro é aplicadoa um canal de divisão de tempo pré-estabelecido. Por exem-pio, um conjunto de parâmetros é aplicado a um canal de di-visão de tempo pré-estabelecido com um intervalo igual. 0quadro variável significa um quadro que separadamente recebeinformação de posição de um canal de divisão de tempo aoqual um conjunto de parâmetros é aplicado.

Um campo "bsNumParamSets" 1302 indica um número deconjuntos de parâmetros em um quadro espacial (chamado "num-ParamSets"), e uma relação de "numParamSets = bsNumParamSets+ 1" existe entre o "numParamSets" e o "bsNumParamSets".

Como, por exemplo, 3 bits são alocados para o cam-po "bsNumParamSets" 1302 na FIG. 13A, um máximo de oito con-juntos de parâmetros pode ser fornecido em um quadro espaci-al. Como não há limite do número de bits alocados, mais con-juntos de parâmetros podem ser fornecidos em um quadro espa-ciai.

Se um quadro espacial é um tipo de quadro fixo,informação de posição de um canal de divisão de tempo aoqual um conjunto de parâmetros é aplicado pode ser decididade acordo com uma regra pré-estabelecida, e informação deposição adicional de um canal de divisão de tempo ao qual umconjunto de parâmetros é aplicado é desnecessária. Entretan-to, se o quadro espacial é um tipo de quadro variável, a in-formação de posição de um canal de divisão de tempo ao qualum conjunto de parâmetros é aplicado é necessária.

Um campo "bsParamSlot" 1303 indica informação deposição de um canal de divisão de tempo ao qual um conjuntode parâmetros é aplicado. 0 campo "bsParamSlot" 1303 podeser representado por um número variável de bits usando o nú-mero de canais de divisão de tempo em um quadro espacial,isto é, "numSlots". Em particular, no caso em que o "numS-lots" é igual ou maior do que 2A(n-l) e menor do que 2Λ(η),o campo "bsParamSlot" 1103 pode ser representado por η bits.

Por exemplo: (i) se o "numSlots" está em uma faixaentre 64 e 127, o campo "bsParamSlot" 1303 pode ser repre-sentado por 7 bits; (ii) se o "numSlots" está em uma faixaentre 32 e 63, o campo "bsParamSlot" 1303 pode ser represen-tado por 6 bits; (iii) se o "numSlots" está em uma faixa en-tre 16 e 31, o campo "bsParamSlot" 1303 pode ser representa-do por 5 bits; (iv) se o "numSlots" está em uma faixa entre8 e 15, o campo "bsParamSlot" 1303 pode ser representado por4 bits; (v) se o "numSlots" está em uma faixa entre 4 e 7, ocampo "bsParamSlot" 1303 pode ser representado por 3 bits;(vi) se o "numSlots" está em uma faixa entre 2 e 3, o campo"bsParamSlot" 1303 pode ser representado por 2 bits; (vii)se o "numSlots" é 1, o campo "bsParamSlot" 1303 pode ser re-presentado por 1 bit; e (viii) se o "numSlots" é 0, o campo"bsParamSlot" 1303 pode ser representado por 0 bit. Igual-mente, se o "numSlots" está em uma faixa entre 64 e 127, ocampo "bsParamSlot" 1303 pode ser representado por 7 bits.

Se há múltiplos conjuntos de parâmetros (N), umacombinação do "bsParamSlot" pode ser representada de acordocom a Fórmula 9.

[Fórmula 9]

<formula>formula see original document page 49</formula>

caso, bsParamSlotSi indica um canal de divisão de tempo aoqual o i2 parâmetro é aplicado. Por exemplo, assume-se que o"numSlots" é 3 e que o campo "bsParamSlot" 1303 pode ter dezvalores. Nesse caso, três informações (chamadas cl, c2, ec3, respectivamente) para o campo "bsParamSlot" 1303 são ne-cessárias. Como 4 bits são necessários para representar cadauma de cl, c2 e c3, 12 bits totais (= 4*3) são necessários.No caso de representar cl, c2 e c3 como um grupo ligando-osjuntos, 1.000 (= 10*10*10) casos podem ocorrer, que podemser representados como 10 bits, assim economizando 2 bits.Se o "numSlots" é 3 e se o valor lido como 5 bits é 31, ovalor pode ser representado como 31 = 1χ(3Λ2) + 5*(3Λ1) +7*(3Λ0). Um aparelho decodificador pode determinar que cl,c2 e c3 são 1, 5 e 7, respectivamente, aplicando-se o inver-so da Fórmula 9.

A FIG. 13B ilustra uma sintaxe para representarinformação de posição de um canal de divisão de tempo aoqual um conjunto de parâmetros é aplicado como um valor ab-soluto e um valor de diferença de acordo com uma modalidadeda presente invenção. Se um quadro espacial é um tipo dequadro variável, o campo "bsParamSlot" 1303 na FIG. 13A podeser representado como um valor absoluto e um valor de dife-rença usando um fato de que a informação "bsParamSlot" au-menta monotonamente.

Por exemplo: (i) uma posição de um canal de divi-são de tempo ao qual um primeiro conjunto de parâmetros éaplicado pode ser gerada em um valor absoluto, isto é, "bs-ParamSlot [ 0 ]" ; e (ii) uma posição de um canal de divisão detempo ao qual um segundo conjunto de parâmetros ou maior éaplicado pode ser gerada em um valor de diferença, isto é,"valor de diferença" entre "bsParamSlot[ps]" e "bsParamS-lot[ps-l]" ou "valor de diferença - 1" (chamado "bsDiffPa-ramSlot[ps]").

0 campo "bsParamSlot[0]" 1304 pode ser representa-do por um número de bits (chamado "nBitsParamSlot(0)") cal-culado usando o "numSlots" e o "numParamSets".

0 campo "bsDiffParamSlot[ps]" 1305 pode ser repre-sentado por um número de bits (chamado "nBitParamSlot(ps)")calculado usando o "numSlots", o "numParamSets" e uma posi-ção de um canal de divisão de tempo ao qual um conjunto deparâmetros anterior é aplicado, isto é, "bsParamSlot[ps-1]".

Em particular, para representar "bsParamSlot[ps]"por um número máximo de bits, um número de bits para repre-sentar o "bsParamSlot[ps]" pode ser decidido baseado nas se-guintes regras: (i) uma pluralidade do "bsParamSlot[ps]" au-menta em uma série ascendente (bsParamSlot[ps] > bsParamS-lot [ps-1]); (ii) um valor máximo do "bsParamSlot[0]" é"numSlots - NumParamSets"; e (iii) no caso de 0 < ps < num-ParamSets, "bsParamSlot[ps]" pode ter um valor entre "bsPa-ramSlot[ps-1] + 1" e "numSlots - numParamSets + ps" somente.

Por exemplo, se o "numSlots" é 10 e se o "numPa-ramSets" é 3, como o "bsParamSlot [ps]" aumenta em uma sérieascendente, um valor máximo do "bsParamSlot[0]" se torna"10-3=7". Ou seja, o "bsParamSlot[0]" deveria ser seleciona-do a partir dos valores de 0 a 7. Isso ocorre porque um nú-mero de canais de divisão de tempo para o resto dos conjun-tos de parâmetros (por exemplo, se ps é 1 ou 2) é insufici-ente se o "bsParamSlot[0]" tem um valor maior do que 7.Se "bsParamSlot[0]" é 5, uma posição de canal dedivisão de tempo bsParamSlot[1] para um segundo conjunto deparâmetros deveria ser selecionada a partir de valores entre"5+1=6" e "10-3+1=8".

Se "bsParamSlot[1]" é 7, "bsParamSlot[2] " pode setornar 8 ou 9. Se "bsParamSlot[1]" é 8, "bsParamSlot[2]" po-de se tornar 9.

Portanto, o "bsParamSlot[ps]" pode ser representa-do como um número de bits variável usando as característicasacima ao invés de ser representado como bits fixos.

Configurando o "bsParamSlot[ps]" em um fluxo debits, se o "ps" é 0, o "bsParamSlot[0]" pode ser representa-do como um valor absoluto por um número de bits correspon-dentes a "nBitsParamSlot[0]". Se o "ps" é maior do que 0, o"bsParamSlot[ps]" pode ser representado como um valor de di-ferença por um número de bits correspondente a "nBitsParamS-lot [ps]". Lendo-se o "bsParamSlot[ps]" acima configurado apartir de um fluxo de bits, um comprimento de um fluxo debits para cada dado, isto é, "nBitsParamSlot [ps]" pode serencontrado usando a Fórmula 10.

<table>table see original document page 52</column></row><table>

Em particular, o "nBitsParamSlot[ps]" pode ser en-contrado como nBitsParamSlot[0] = fb(numSlots - numParamSets+ 1) . Se 0 < ps CnumParamSets, o "nBitsParamSlot [ps]" podeser encontrado como nBitsParamSlot[ps] = fb(numSlots - num-ParamSets +ps - bsParamSlot[ps-1]). O "nBitsParamSlot[ps]"pode ser determinado usando a Fórmula 11, que estende a Fór-mula 10 até 7 bits.

Um exemplo da função fb(x) é explicado a seguir.Se "numSlots" é 15 e se "numParamSets" é 3, a função podeser avaliada como nBitsParamSlot [0] = fb(15-3+l) = 4 bits.Se o "bsParamSlot[0]" representado por 4 bits é 7,

a função pode ser avaliada como nBitsParamSlot[1] = fb(15—3 + 1-7) = 3 bits. Nesse caso, o campo "bsDiffParamSlot [1]"1305 pode ser representado por 3 bits.

Se o valor representado pelos 3 bits é 3, "bsPa-ramSlot[1]" se torna 7+3 = 10. Portanto, se torna nBitsPa-ramSlot [2] = fb(15-3+2-10) = 2 bits. Nesse caso, o campo"bsDiffParamSlot[2]" pode ser representado por 2 bits. Se onúmero de canais de divisão de tempo restantes é igual a umnúmero de um conjunto de parâmetros restantes, 0 bit podeser alocado para o campo "bsDiffParamSlot[ps]". Em outraspalavras, nenhuma informação adicional é necessária para re-presentar a posição do canal de divisão de tempo ao qual oconjunto de parâmetros é aplicado.

Assim, um número de bits para "bsParamSlot[ps]"pode ser variavelmente decidido. 0 número de bits para "bs-ParamSlot [ps]" pode ser lido a partir de um fluxo de bitsusando a função fb(x) em um decodificador. Em algumas moda-lidades, a função fb(x) pode incluir a função teto{log2 (x) } .

Lendo informação para "bsParamSlot[ps]" represen-tado como o valor absoluto e o valor de diferença a partirde um fluxo de bits em um decodif icador, primeiro o "bsPa-ramSlot [0]" pode ser lido a partir do fluxo de bits e entãoo "bsDiffParamSlot [ps]" pode ser lido para 0 < ps < numPa-ramSets. 0 "bsParamSlot[ps]" pode então ser encontrado para um intervalo 0 < ps < numParamSets usando o "bsParamSlot[0]"e o "bsDiffParamSlot[ps]". Por exemplo, como mostrado naFIG. 13B, um "bsParamSlot[ps]" pode ser encontrado adicio-nando-se um "bsParamSlot[ps-1]" a um "bsDiffParamS-Iot[ps]+1".

A FIG. 13C ilustra uma sintaxe para representarinformação de posição de um canal de divisão de tempo aoqual um conjunto de parâmetros é aplicado como um grupo deacordo com uma modalidade da presente invenção. No caso emque uma pluralidade de conjuntos de parâmetros existe, umapluralidade de "bsParamSlots" 1307 para uma pluralidade deconjuntos de parâmetros pode ser representada como pelo me-nos um ou mais grupos.

Se um número dos "bsParamSlots" 1307 é (kN+L) e seQ bits são necessários para representar cada "bsParamSlots"1307, os "bsParamSlots" 1307 podem ser representados como umgrupo seguinte. Nesse caso, e ΛΝ' são inteiros arbitrá-rios não nulos e xL' é um inteiro arbitrário na faixa 0 < L < N.

Um método de agrupamento pode incluir as etapas degerar k grupos ligando-se N "bsParamSlots" 1307 cada e gerarum último grupo ligando-se o último L "bsParamSlots" 1307.Os k grupos podem ser representados como M bits e o últimogrupo pode ser representado por ρ bits. Nesse caso, os Mbits são preferencialmente menos do que N*Q bits usados nocaso de representar cada um dos "bsParamSlots" 1307 sem a-grupá-los.

Por exemplo, assume-se que um par de "bsParamS-lots" 1307 para dois conjuntos de parâmetros é dl e d2, res-pectivamente. Se cada um de dl e d2 é capaz de ter cinco va-lores, 3 bits são necessários para representar cada um de dle d2. Nesse caso, mesmo se os 3 bits são capazes de repre-sentar oito valores, cinco valores são substancialmente ne-cessários. Assim, cada uma de dl e dl tem três redundâncias.

Ainda, no caso de representar dl e d2 como um grupo ligando-se dl e d2 juntos, 5 bits podem ser usados ao invés de 6bits (= 3 bits + 3 bits) . Em particular, como todas as com-binações de dl e d2 incluem 25 (=5*5) tipos, um grupo de dle d2 pode ser representado como 5 bits somente. Como os 5bits são capazes de representar 32 valores, sete redundân-cias são geradas no caso da representação de agrupamento.

Ainda, no caso de uma representação agrupando-se dl e d2, aredundância é menor do que aquela de um caso de representarcada um de dl e d2 como 3 bits.

Configurando o grupo, dados para o grupo podem serconfigurados usando "bsParamSlot[0]" para um valor inicial eum valor de diferença entre pares do "bsParamSlot[ps]" paraum segundo valor ou maior.

Configurando o grupo, bits podem ser diretamentealocados sem agrupamento se um número de conjunto de parâme-tros é 1 e bits podem ser alocados depois do termino do a-grupamento se um número de conjuntos de parâmetros é igualou maior do que 2.

A FIG. 14 é um fluxograma de um método de codifi-cação de acordo com uma modalidade da presente invenção. Ummétodo de codificar um sinal de áudio e uma operação de umcodificador de acordo com a presente invenção são explicadosa seguir.

Primeiro, um número total de canais de divisão detempo (numSlots) em um quadro espacial e um número total debandas de parâmetros (numBands) de um sinal de áudio são de-terminados (S1401).

Então, um número de bandas de parâmetro aplicadasa um módulo de conversão de canal (conversor OTT e/ou con-versor TTT) e/ou um sinal residual são determinados (S1402) .

Se o conversor OTT tem um modo de canal LFE, o nú-mero de bandas de parâmetros aplicadas ao conversor OTT éseparadamente determinado.

Se o conversor OTT não tem o modo de canal LFE,"numBands" é usado como um número dos parâmetros aplicadosao conversor OTT.

Subseqüentemente, um tipo de um quadro espacial édeterminado. Nesse caso, o quadro espacial pode ser classi-ficado em um tipo de quadro fixo e um tipo de quadro variável.

Se o quadro espacial é o tipo de quadro variável(S14 03), um número de conjuntos de parâmetros usados em umquadro espacial é determinado (S1406). Nesse caso, o conjun-to de parâmetros pode ser aplicado ao módulo de conversão decanal por uma unidade de canal de divisão de tempo.

Subseqüentemente, uma posição do canal de divisãode tempo ao qual o conjunto de parâmetros é aplicado é de-terminada (S1407). Nesse caso, a posição do canal de divisãode tempo ao qual o conjunto de parâmetros é aplicado podeser representada como um valor absoluto e um valor de dife-rença. Por exemplo, uma posição de um canal de divisão detempo ao qual um primeiro conjunto de parâmetros é aplicadopode ser representada como um valor absoluto, e uma posiçãodo canal de divisão de tempo ao qual um segundo conjunto deparâmetros ou maior é aplicado pode ser representada como umvalor de diferença a partir de uma posição de um canal dedivisão de tempo anterior. Nesse caso, a posição de um canalde divisão de tempo ao qual o conjunto de parâmetros é apli-cado pode ser representada por um número variável de bits.

Em particular, uma posição do canal de divisão detempo ao qual um primeiro conjunto de parâmetros é aplicadopode ser representada por um número de bits calculado usandoum número total de canais de divisão de tempo e um númerototal de conjuntos de parâmetros. Uma posição de um canal dedivisão de tempo ao qual um segundo conjunto de parâmetrosou maior é aplicado pode ser representada por um número debits calculado usando um número total de canais de divisãode tempo, um número total de conjuntos de parâmetros e umaposição de um canal de divisão de tempo ao qual um conjuntode parâmetros anterior é aplicado.

Se o quadro espacial é um tipo de quadro fixo, umnúmero de conjuntos de parâmetros usado em um quadro espaci-al é determinado (S1404). Nesse caso, uma posição de um ca-nal de divisão de tempo ao qual o conjunto de parâmetros éaplicado é decidida usando uma regra pré-estabelecida. Porexemplo, uma posição de um canal de divisão de tempo ao qualum conjunto de parâmetros é aplicado pode ser decidida comotendo um intervalo igual a partir de uma posição de um canalde divisão de tempo ao qual um conjunto de parâmetros ante-rior é aplicado (S1405).

Subseqüentemente, uma unidade de mistura descen-dente e uma unidade de geração de informação espacial geramum sinal de mistura descendente e de informação espacial,respectivamente, usando o número total acima determinado decanais de divisão de tempo, um número total de bandas de pa-râmetros, um número de bandas de parâmetros a serem aplica-das à unidade de conversão de canal, um número total de con-juntos de parâmetros em um quadro espacial e informação deposição do canal de divisão de tempo ao qual um conjunto deparâmetros é aplicado (S1408).

Finalmente, uma unidade de multiplexação gera umfluxo de bits incluindo o sinal de mistura descendente e in-formação espacial (S1409) e então transfere o fluxo de bitsgerado a um decodificador (S1409).

A FIG. 15 é um fluxograma de um método de decodi-ficação de acordo com uma modalidade da presente invenção.Um método de decodificar um sinal de áudio e uma operação deum decodificador de acordo com uma modalidade da presenteinvenção são explicados a seguir.

Primeiro, um decodificador recebe um fluxo de bitsde um sinal de áudio (S1501). Uma unidade de demultiplexaçãosepara um sinal de mistura descendente e um sinal de infor-mação espacial do fluxo de bits recebido (S1502). Subseqüen-temente, uma unidade de decodificação de sinal de informaçãoespacial extrai informação para um número total de canais dedivisão de tempo em um quadro espacial, um número total debandas de parâmetro e um número de bandas de parâmetro apli-cadas a um módulo de conversão de canal a partir da informa-ção de configuração do sinal de informação espacial (S1503).

Se o quadro espacial é um tipo de quadro variável(S1504), um número de conjuntos de parâmetros em um quadroespacial e informação de posição de um canal de divisão detempo ao qual o conjunto de parâmetros é aplicado são extra-ídos do quadro espacial (S1505). A informação de posição docanal de divisão de tempo pode ser representada por um núme-ro fixo ou variável de bits. Nesse caso, a informação de po-sição do canal de divisão de tempo ao qual um primeiro con-junto de parâmetros é aplicado pode ser representada como umvalor absoluto e a informação de posição de canais de divi-são de tempo aos quais o segundo conjunto de parâmetros oumaior é aplicado pode ser representada como um valor de di-ferença. A informação de posição real de canais de divisãode tempo aos quais o segundo conjunto de parâmetros ou maioré aplicado pode ser encontrada adicionando-se o valor de di-ferença à informação de posição do canal de divisão de tempoao qual um conjunto de parâmetros anterior é aplicado.

Finalmente, o sinal de mistura descendente é con-vertido em um sinal de áudio multicanal usando a informaçãoextraída (S1506).

As modalidades descritas acima fornecem váriasvantagens sobre esquemas de codificação de áudio convencio-nais.

Primeiro, em codificação de um sinal de áudio mul-ticanal representando-se uma posição de um canal de divisãode tempo ao qual um conjunto de parâmetros é aplicado por umnúmero variável de bits, as modalidades descritas são capa-zes de reduzir uma quantidade de dados transferidos.

Segundo, representando-se uma posição de um canalde divisão de tempo ao qual um primeiro conjunto de parâme-tros é aplicado como um valor absoluto, e representando-seposições de canais de divisão de tempo aos quais um segundoconjunto de parâmetros ou maior é aplicado como um valor dediferença, as modalidades descritas podem reduzir uma quan-tidade de dados transferidos.

Terceiro, representando-se um número de bandas deparâmetros aplicadas a tal módulo de conversão de canal comoum conversor OTT e/ou um conversor TTT por um número fixo ouvariável de bits, as modalidades descritas podem reduzir umaquantidade de dados transferidos. Nesse caso, as posições decanais de divisão de tempo aos quais os conjuntos de parâme-tros são aplicados podem ser representadas usando o princi-pio dito acima, onde os conjuntos de parâmetros podem exis-tir na faixa de um número de bandas de parâmetros.

A FIG. 16 é um diagrama de bloco de uma arquitetu-ra de dispositivo exemplificada 1600 para implementar o co-dificador/decodificador de áudio, como descrito com relaçãoàs FIGs. 1-15. A arquitetura de dispositivo 1600 é aplicávela uma variedade de dispositivos, incluindo, mas não limitadoa: computadores pessoais, computadores servidores, disposi-tivos eletrônicos de consumo, telefones móveis, assistentespessoais digitais (PDAs), tablets eletrônicas, sistemas detelevisão, dispositivos de conexão à internet via TV, conso-les de jogos, reprodutores de midia, reprodutores de música,sistemas de navegação, e qualquer outro dispositivo capaz dedecodificar sinais de áudio. Alguns desses dispositivos po-dem implementar uma arquitetura modificada usando uma combi-nação de hardware e software.

A arquitetura 1600 inclui um ou mais processadores1602 (por exemplo, Powerpc®, Intel Pentium® 4, etc.), um oumais dispositivos de exibição 1604 (por exemplo, CRT, LCD) ,um sub-sistema de áudio 1606 (por exemplo, hardware/softwarede áudio), uma ou mais interfaces de rede 1608 (por exemplo,Ethernet, FireWire®, USB, etc.), dispositivos de entrada1610 (por exemplo, teclado, mouse, etc.), e um ou mais meioslegíveis por computador 1612 (por exemplo, RAM, ROM, SDRAM,disco rígido, disco óptico, memória rápida, etc.)· Essescomponentes podem trocar comunicações e dados via um ou maisbarramentos 1614 (por exemplo, EISA, PCI, PCI Express,etc.)·

0 termo "meio legível por computador" refere-se aqualquer meio que participa em fornecer instruções a um pro-cessador 1602 para execução, incluindo sem limitação, meiosnão voláteis (por exemplo, discos ópticos ou magnéticos) ,meios voláteis (por exemplo, memória) e meios de transmis-são. Os meios de transmissão incluem, sem limitação, caboscoaxiais, fio de cobre e fibras ópticas. Os meios de trans-missão podem também tomar a forma de ondas acústicas, de luzou de radiofreqüência.

Os meios legíveis por computador 1612 adicional-mente incluem um sistema operacional 1616 (por exemplo, MacOS®, Windows®, Linux, etc.), um módulo de comunicação de re-de 1618, um codec de áudio 1620 e um ou mais aplicativos1622.

0 sistema operacional 1616 pode ser de multiusuá-rios, multiprocessamento, multitarefa, multiencadeamento, emtempo real e seus similares. 0 sistema operacional 1616 exe-cuta tarefas básicas, incluindo, mas não limitado a: reco-nhecer entrada a partir dos dispositivos de entrada 1610;enviar saída a dispositivos de exibição 1604 e o sub-sistemade áudio 1606; rastreio de arquivos e diretórios em meioslegíveis por computador 1612 (por exemplo, memória ou umdispositivo de armazenamento); controlar dispositivos peri-féricos (por exemplo, unidades de disco, impressoras, etc.);e gerenciar tráfego em um ou mais barramentos 1614.

O módulo de comunicações de rede 1618 inclui vá-rios componentes para estabelecer e manter conexões de rede(por exemplo, software para implementar protocolos de comu-nicação, tal como TCP/IP, HTTP, Ethernet, etc.). 0 módulo decomunicações de rede 1618 pode incluir um navegador para ha-bilitar que operadores da arquitetura de dispositivo 1600procurem em uma rede (por exemplo, Internet) por informação(por exemplo, conteúdo de áudio).

O codec de áudio 1620 é responsável por implemen-tar todos os processos de codificação e/ou decodificação ouuma parte desses descritos com relação às FIGs. 1-15. Em al-gumas modalidades, o codec de áudio trabalha em conjunto comhardware (por exemplo, processador(es) 1602, sub-sistema deáudio 1606) para processar sinais de áudio, incluindo sinaisde áudio de codificação e/ou decodificação de acordo com apresente invenção descrita aqui.

Os aplicativos 1622 podem incluir qualquer aplica-tivo de software relacionado a conteúdo de áudio e/ou ondeconteúdo de áudio é codificado e/ou decodificado, incluindo,mas não limitado a reprodutores de midia, reprodutores demúsica (por exemplo, reprodutores de MP3), aplicativos detelefone móvel, PDAs, sistemas de televisão, dispositivos deconexão à internet via TV, etc. Em uma modalidade, o codecde áudio pode ser usado por um provedor de serviço de apli-cativo para fornecer serviços de codificação/decodificaçãopor uma rede (por exemplo, a Internet).

Na descrição acima, para propósitos de explicação,numerosos detalhes específicos são apresentados de modo afornecer um entendimento completo da invenção. Estará apa-rente, entretanto, a um versado na técnica que a invençãopode ser praticada sem esses detalhes específicos. Em outrasocorrências, estruturas e dispositivos são mostrados na for-ma de diagrama de bloco de modo a evitar obscurecer a inven-ção .

Em particular, um versado na técnica reconheceráque outras arquiteturas e ambientes gráficos podem ser usa-dos, e que a presente invenção pode ser implementada usandoferramentas gráficas e produtos além daqueles descritos aci-ma. Em particular, a aproximação cliente/servidor é meramen-te um exemplo de uma arquitetura para fornecer a funcionali-dade de painel da presente invenção; um versado na técnicareconhecerá que outras aproximações não cliente/servidor po-dem também ser usadas.

Algumas partes da descrição detalhada são apresen-tadas em termos de algoritmos e representações simbólicas deoperações em bits de dados em uma memória de computador. Es-sas descrições algorítmicas e representações são os meiosusados por aqueles versados na técnica de processamento dedados para conduzir mais efetivamente' a substância de seutrabalho a outros versados na técnica. As etapas são aquelasque exigem manipulações físicas de quantidades físicas. Usu-almente, apesar de não necessariamente, essas quantidadestomam a forma de sinais elétricos ou magnéticos capazes deserem armazenados, transferidos, combinados, comparados, ede outra forma manipulados. Tem se tornado conveniente àsvezes, principalmente por razoes de uso comum, referir-se aesses sinais como bits, valores, elementos, símbolos, carac-teres, termos, números, ou seu similar.

Aplicabilidade Industrial

Deveria ser trazido em mente, entretanto, que to-dos esses termos e termos similares estão associados com asquantidades físicas apropriadas e são meramente rótulos con-venientes aplicados a essas quantidades. A menos que especi-ficamente determinado de outra forma como aparente a partirda discussão, é apreciado que por toda a descrição, discus-sões utilizando termos tais como "processar" ou "computar"ou "calcular" ou "determinar" ou "exibir" ou seu similar,referem-se à ação e processos de um sistema de computador,ou dispositivo de computação eletrônico similar, que manipu-Ia e transforma dados representados como quantidades físicas(eletrônicas) nos registros e memórias do sistema de compu-tador em outros dados similarmente representados como quan-tidades físicas nas memórias e registros do sistema de com-putador ou outros tais dispositivos de armazenamento de in-formação, transmissão ou exibição.

A presente invenção também se refere a um aparelhopara executar as operações. Esse aparelho pode ser especial-mente construído para os propósitos exigidos, ou pode com-preender um computador de propósito geral ativado ou re-configurado por um programa de computador armazenado no com-putador. Tal programa de computador pode ser armazenado emum meio de armazenamento legível por computador, tal como,mas não limitado a, qualquer tipo de disco incluindo discosflexíveis, discos ópticos, CD-ROMs, e discos ópticos magné-ticos, memórias somente de leitura (ROMs), memórias de aces-so aleatório (RAMs), EPROMs, EEPROMs, cartões magnéticos ouópticos, ou qualquer tipo de meio adequado para armazenarinstruções eletrônicas, e cada um acoplado a um barramentode sistema de computador.

Os algoritmos e módulos apresentados aqui não es-tão inerentemente relacionados a qualquer computador parti-cular ou outro aparelho. Vários sistemas de propósito geralpodem ser usados com programas de acordo com os ensinamentosaqui, ou podem se provar convenientes para construir apare-lhos mais especializados em executar as etapas de método. Aestrutura exigida para uma variedade desses sistemas apare-cerá a partir da descrição acima. Em adição, a presente in-venção não é descrita com relação a qualquer linguagem deprogramação. Será apreciado que uma variedade de linguagensde programação pode ser usada para implementar os ensinamen-tos da invenção como descrito aqui. Além disso, como estaráaparente a um versado na técnica relevante, os módulos, ca-racterísticas, atributos, metodologias, e outros aspectos dainvenção podem ser implementados como software, hardware,suporte lógico inalterável ou qualquer combinação dos três.É claro, sempre que um componente da presente invenção é im-plementado como software, o componente pode ser implementadocomo um programa autônomo, como parte de um programa maior,como uma pluralidade de programas separados, como uma bibli-oteca estatisticamente ou dinamicamente ligada, como um mó-dulo kernel carregável, como um acionador de dispositivo,e/ou em cada forma conhecida agora ou no futuro àqueles ver-sados na técnica de programação de computador. Adicionalmen-te, a presente invenção não é de nenhuma forma limitada àimplementação em qualquer sistema ou ambiente operacionalespecifico.

Aqueles versados na técnica estarão cientes de quevárias modificações e variações podem ser feitas às modali-dades descritas sem abandonar o espirito ou escopo da inven-ção. Assim, pretende-se que a presente invenção cubra todastais modificações e variações das modalidades descritas,fornecido que tais modificações e variações estão no escopodas reivindicações em anexo e seus equivalentes.

Claims

1. Método de codificar um sinal de áudio,CARACTERIZADO pelo fato de que compreende:determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros, os conjuntos de pa-râmetros incluem um ou mais parâmetros;gerar informação que indica uma posição de no mí-nimo um canal de divisão de tempo em um conjunto ordenado decanais de divisão de tempo ao qual um conjunto de parâmetrosé aplicado;codificar o sinal de áudio como um fluxo de bitsincluindo um quadro, o quadro inclui o conjunto ordenado decanais de divisão de tempo; einserir um número variável de bits no · fluxo debits que representa a posição do canal de divisão de tempono conjunto ordenado de canais de divisão de tempo, onde onúmero variável de bits é determinado pela posição do canalde divisão de tempo.

2. Método de codificar um sinal de áudio,CARACTERIZADO pelo . fato de que compreende:receber um fluxo de bits que representa um sinalde áudio, o fluxo de bits tem um quadro;determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros do fluxo de bits, osconjuntos de parâmetros incluem um ou mais parâmetros;determinar a informação de posição do fluxo debits, a qual indica a posição de um canal de divisão de tem-po em um conjunto ordenado de canais de divisão de tempo aoqual o conjunto de parâmetros é aplicado, onde o conjuntoordenado de canais de tempo está incluído no quadro; edecodificar o sinal de áudio baseado no número decanais de divisão de tempo, o número de conjuntos de parâme-tros e a informação de posição,onde a informação de posição é representada por umnúmero variável de bits baseados na posição do canal de di-visão de tempo.

3. Método, de acordo com a reivindicação 2,CARACTERIZADO pelo fato de que o número variável de bits édeterminado usando o número de canais de divisão de tempo.

4. Método, de acordo com a reivindicação 2,CARACTERIZADO adicionalmente pelo fato de que compreende:se o número de canais de divisão de tempo a seremdecodificados é igual a um número de conjuntos de parâmetrosa serem aplicados, não determinar a informação de posição docanal de divisão de tempo ao qual um conjunto de parâmetrosé aplicado.

5. Método, de acordo com a reivindicação 4,CARACTERIZADO pelo fato de que se o número de canais de di-visão de tempo é igual ou maior do que 2Λ(η-1) e menor doque 2Λ(η), o número variável de bits é determinado como ηbits.

6. Método, de acordo com a reivindicação 4,CARACTERIZADO pelo fato de que se o número de canais de di-visão de tempo é maior do que 2Λ(η-1) e igual ou menor doque 2Λ(η), o número variável de bits é determinado como ηbits.

7. Método, de acordo com a reivindicação 3,CARACTERIZADO pelo fato de que a informação de posição é re-presentada como a soma de uma valor anterior e um valor dediferença, onde o valor anterior indica a informação de po-sição do canal de divisão de tempo ao qual um primeiro con-junto de parâmetros é aplicado e o valor de diferença indicaa informação de posição do canal de divisão de tempo ao qualum segundo conjunto de parâmetros é aplicado.

8. Método, de acordo com a reivindicação 7,CARACTERIZADO pelo fato de que o valor anterior é represen-tado por um número variável de bits determinados usando nomínimo um do número de canais de divisão de tempo e o númerode conjuntos de parâmetros.

9. Método, de acordo com a reivindicação 8,CARACTERIZADO pelo fato de que o número variável de bits édeterminado usando uma diferença entre o número de canais dedivisão de tempo e o número de conjuntos de parâmetros.

10. Método, de acordo com a reivindicação 7,CARACTERIZADO pelo fato de que o valor de diferença é repre-sentado por um número variável de bits determinado usando nomínimo um do número de canais de divisão de tempo, do númerode conjuntos de parâmetros e de uma informação de posição docanal de divisão de tempo ao qual um conjunto de parâmetrosanteriores é aplicado.

11. Método, de acordo com a reivindicação 10,CARACTERIZADO pelo fato de que o número variável de bits édeterminado usando uma diferença entre o número de canais dedivisão de tempo e no mínimo um do número de conjuntos deparâmetros e da informação de posição do canal de divisão detempo ao qual o conjunto de parâmetros anteriores é aplicado.

12. Método, de acordo com a reivindicação 3,CARACTERIZADO pelo fato de que se o número de conjuntos deparâmetros é N, a informação de posição do canal de divisãode tempo ao qual o conjunto de parâmetros é aplicado, é re-presentada como uma combinação usando uma fórmula como se-gue :<formula>formula see original document page 71</formula>onde numSlots e bsParamSloti indicam o número decanais de divisão de tempo e a informação de posição do ca-nal de divisão de tempo aos quais um ith conjunto de parâme-tros é aplicado, respectivamente.

13. Método, de acordo com a reivindicação 3,CARACTERIZADO pelo fato de que se uma pluralidade de conjun-tos de parâmetros existe, uma pluralidade dos conjuntos deparâmetros é dividida como um grupo e a informação de posi-ção do canal de divisão de tempo à qual o conjunto de parâ-metros é aplicado, é representada pelo grupo.

14. Método, de acordo com a reivindicação 12,CARACTERIZADO pelo fato de que se o número dos conjuntos deparâmetros é (KN+L), o grupo é gerado ligando-se N dos con-juntos de parâmetros juntos e é representado por M bits, eum último grupo é gerado ligando-se L dos conjuntos de parâ-metros juntos e é representado por P bits.

15. Aparelho para codificar um sinal de áudio,CARACTERIZADO pelo fato de que compreende um codificadorconfigurado para:determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros, os conjuntos de pa-râmetros incluem um ou mais parâmetros; gerar informação que indica uma posição de no mí-nimo um canal de divisão de tempo em um conjunto ordenado decanais de divisão de tempo ao qual um parâmetro é aplicado;codificar o sinal de áudio como um fluxo de bitsque inclui um quadro, o quadro inclui um conjunto ordenadode canais de divisão de tempo; einserir um número variável de bits no fluxo debits que representa a posição do canal de divisão de tempono conjunto ordenado de canais de divisão de tempo, onde onúmero variável de bits é determinado a partir da posição docanal de divisão de tempo.

16. Aparelho para decodificar um sinal de áudio,CARACTERIZADO pelo fato de que compreende um decodificadorconfigurado para:receber um fluxo de bits que representa um sinalde áudio, o fluxo de bits tem um quadro;determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros do fluxo de bits, osconjuntos de parâmetros incluem um ou mais parâmetros;determinar a informação de posição do fluxo debits, a informação de posição indica uma posição de um canalde divisão de tempo em um conjunto ordenado de canais de di-visão de tempo incluídos no quadro ao qual o conjunto de pa-râmetros é aplicado; edecodificar o sinal de áudio baseado no número decanais de divisão de tempo, no número de conjuntos de parâ-metros e na informação de posição,onde a informação de posição é representada por umnúmero variável de bits baseados na posição do canal de di-visão de tempo.

17. Estrutura de dados para inclusão em um fluxode bits que representa um sinal de áudio, CARACTERIZADA pelofato de que compreende:um primeiro campo que inclui um número de canaisde divisão de tempo;um segundo campo que inclui um número de conjuntosde parâmetros; eum terceiro campo que inclui a informação de posi-ção para determinar uma posição de um canal de divisão detempo ao qual um conjunto de parâmetros é aplicado, onde ainformação de posição é representada por um número variávelde bits baseados na posição do canal de divisão de tempo.

18. Meio legível por computador, CARACTERIZADO pe-Io fato de que compreende instruções armazenadas neste que,quando executadas por um processador, levam o processador aexecutar as operações de:receber um fluxo de bits que representa um sinalde áudio, o fluxo de bits tem um quadro;determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros do fluxo de bits, osconjuntos de parâmetros incluem um ou mais parâmetros;determinar a informação de posição do fluxo debits, a informação de posição indica uma posição de um canalde divisão de tempo em um conjunto ordenado de canais de di-visão de tempo incluídos no quadro ao qual o conjunto de pa-râmetros é aplicado; edecodificar o sinal de áudio baseado no número decanais de divisão de tempo, no número de conjuntos de parâ-metros e na informação de posição,onde a informação de posição é representada por umnúmero de variável de bits baseados na posição do canal dedivisão de tempo.

19. Sistema, CARACTERIZADO pelo fato de que com-preende:um processador;um meio legível por computador acoplado ao proces-sador e que.inclui instruções, que quando executadas por umprocessador, levam o processador a executar as operações de:receber um fluxo de bits que representa um sinalde áudio, o fluxo de bits tem um quadro;determinar um número de canais de divisão de tempoe um número de conjuntos de parâmetros do fluxo de bits, osconjuntos de parâmetros incluem um ou mais parâmetros;determinar a informação de posição do fluxo debits, a informação de posição indica uma posição de um canalde divisão de tempo em um conjunto ordenado de canais de di-visão de tempo incluídos no quadro ao qual o conjunto de pa-râmetros é aplicado; edecodificar o sinal de áudio baseado no número decanais de divisão de tempo, no número de conjuntos de parâ-metros e na informação de posição,onde a informação de posição é representada por umnúmero variável de bits baseados na posição do canal de di-visão de tempo.

20. Sistema, CARACTERIZADO pelo fato de que com-preende:dispositivos para receber um fluxo de bits que re-presenta um sinal de áudio, o fluxo de bits tem um quadro;dispositivos para determinar um número de canaisde divisão de tempo e um número de conjuntos de parâmetrosdo fluxo de bits, os conjuntos de parâmetros incluem um oumais parâmetros;dispositivos para determinar a informação de posi-ção do fluxo de bits, a informação de posição indica uma po-sição de um canal de divisão de tempo em um conjunto ordena-do de canais de tempo incluídos no quadro ao qual o conjun-tos de parâmetros é aplicado; edispositivos para decodificar o sinal de áudio ba-seados no número de canais de divisão de tempo, no número deconjuntos de parâmetros e na informação de posição,onde a informação de posição é representada por umnúmero variável de bits baseados na posição do canal de di-visão de tempo.