TWI488177B

TWI488177B - 使用頻譜域雜訊整形之基於線性預測的編碼方案

Info

Publication number: TWI488177B
Application number: TW101104673A
Authority: TW
Inventors: Goran Markovic; Guillaume Fuchs; Nikolaus Rettelbach; Christian Helmrich; Benjamin Schubert
Original assignee: Fraunhofer Ges Forschung
Priority date: 2011-02-14
Filing date: 2012-02-14
Publication date: 2015-06-11
Also published as: BR112013020592B1; KR101617816B1; MY165853A; CA2827277C; TW201246189A; AR085794A1; AU2012217156A1; EP2676266B1; KR20130133848A; RU2013142133A; CN103477387B; BR112013020592A2; US9595262B2; BR112013020587A2; RU2575993C2; EP2676266A1; ES2534972T3; BR112013020587B1; PL2676266T3; JP2014510306A

Description

使用頻譜域雜訊整形之基於線性預測的編碼方案

本發明有關於使用頻域雜訊整形，諸如得知於USAC的TCX模式之基於線性預測的音訊編解碼器。

作為一相對較新的音訊編解碼器，USAC最近已經完成。USAC是一種支援在若干編碼模式間切換的編解碼器，該等編碼模式諸如一類AAC編碼模式，一使用線性預測編碼的時域編碼模式，即ACELP，及一形成中間編碼模式的轉換編碼激勵編碼，頻譜域整形依據該中間編碼模式利用經由資料流所發送之線性預測係數被控制。在WO 2011147950中，提議藉由排除類AAC編碼模式的可用性且將編碼模式僅局限於ACELP及TCX而使USAC編碼方案更適於低延遲應用。而且，還建議減少訊框長度。

然而，有利的是將有可能減少使用頻譜域整形之一基於線性預測的編碼方案的複雜性同時實現近似的編碼效率，例如就比率/失真比而言。

因此，本發明之目的-提供此一使用頻譜域整形之基於線性預測的編碼方案，允許在類似或甚至增加的編碼效率下降低複雜性。

此目的藉由審查中之獨立申請專利範圍之技術標的來實現。

本發明之基本概念是倘若音訊輸入信號頻譜分解成包含一頻譜序列之一譜圖是被使用於線性預測係數計算以及基於線性預測係數之一頻譜域整形的輸入兩者，則基於線性預測且使用頻譜域雜訊整形的編碼概念在一類似編碼效率之下，例如就比率/失真比而言，得以具有較低的複雜性。

在這一方面，已發現，即使此一重疊轉換使用於頻譜分解導致混疊，且混疊消除，諸如嚴格取樣之重疊轉換，諸如MDCT需要時間，編碼效率也保持不變。

本發明之層面之有利實施態樣是依附申請專利範圍之主題。

圖式簡單說明

詳言之，本申請案之較佳實施例相關於諸圖而被描述，其中：第1圖繪示依據一比較或實施例的一音訊編碼器的一方塊圖；第2圖繪示依據本申請案之一實施例的一音訊編碼器；第3圖繪示適合於第2圖之音訊編碼器的一可實行的音訊解碼器的一方塊圖；以及第4圖繪示依據本申請案之一實施例的一替代音訊編碼器的一方塊圖。

為了便於理解在下文中進一步描述的本發明之實施例的主要層面及優勢，首先參照第1圖，其繪示使用頻譜域雜訊整形之基於線性預測的音訊編碼器。

詳言之，第1圖之音訊編碼器包含一頻譜分解器10，用以將一輸入音訊信號12頻譜分解成由一頻譜序列組成的一譜圖，如第1圖中的14所指示者。如第1圖中所示者，頻譜分解器10可使用一MDCT以將輸入音訊信號10由時域轉換到頻譜域。詳言之，一視窗程式16在頻譜分解器10之MDCT模組18之前，以視窗化輸入音訊信號12之互相重疊部分，其視窗化部分在MDCT模組18中單獨接受各自的轉換以獲得譜圖14之頻譜序列之頻譜。然而，頻譜分解器10可替換地使用任何其他導致混疊的重疊轉換，諸如任何其他嚴格取樣的重疊轉換。

而且，第1圖之音訊編碼器包含一線性預測分析器20，用以分析輸入音訊信號12以由此導出線性預測係數。第1圖之音訊編碼器之一頻譜域整形器22被配置成基於由線性預測分析器20所提供之線性預測係數來對譜圖14之頻譜序列之一當前頻譜頻譜整形。詳言之，頻譜域整形器22被配置成依據對應於一線性預測分析濾波器傳送函數的一傳送函數來對進入頻譜域整形器22的一當前頻譜進行頻譜整形，此係藉由將來自分析器20的線性預測係數轉換成頻譜加權值且應用加權值作為除數以頻譜形成或整形該當前頻譜。整形後之頻譜在第1圖之音訊編碼器之一量子化器24中量子化。由於頻譜域整形器22中的整形，在解碼器端對量子化頻譜進行去整形時所產生的量子化雜訊被轉移而被隱藏，即編碼盡可能的是感知透明的。

僅為了完整起見，應指出的是，一時間雜訊整形模組26可以選擇性地使自頻譜分解器10轉發至頻譜域整形器22 之頻譜接受時間雜訊整形，且一低頻加重模組28可以在量子化24之前適應性地過濾由頻譜域整形器22所輸出的每一整形後頻譜。

量子化且頻譜整形後之頻譜連同關於頻譜整形中所使用的線性預測係數的資訊被插入到資料流30中，使得在解碼端，去整形及去量子化可被執行。

除TNS模組26之外，第1圖中所示之音訊編解碼器之絕大部分，例如是在新音訊編解碼器USAC中，且特別是在其TCX模式內被實現及描述。因此，詳情請參照示範性的USAC標準，例如[1]。

然而，下文中更著重於描述線性預測分析器20。如第1圖中所示者，線性預測分析器20直接對輸入音訊信號12運作。一預加重模組32諸如，舉例而言，藉由FIR濾波而對輸入音訊信號12預濾波，且之後，一自相關藉由級聯之一視窗程式34、自相關器36及滯後視窗程式38而被連續導出。視窗程式34從預濾波輸入音訊信號中形成視窗化部分，該視窗化部分可能在時間上互相重疊。自相關器36計算由視窗程式34所輸出的每一視窗化部分的一自相關，且滯後視窗程式38被選擇性地提供，以對自相關應用一滯後視窗函數，以使自相關更加適於下述線性預測參數估計演算法。詳言之，一線性預測參數估計器40接收滯後視窗輸出，且對視窗化自相關執行，例如維納-列文遜-杜賓或其他適合的演算法以導出每一自相關的線性預測係數。在頻譜域整形器22內，所產生的線性預測係數通過一模組鏈42、44、46 及48。模組42負責將關於資料流30內之線性預測係數的資訊傳送到解碼端。如第1圖中所示者，線性預測係數資料流插入器42可被配置成執行線性預測係數之量子化，該線性預測係數是由線性預測分析器20以一線譜對或線譜頻域所決定的，同時將量子化之係數編碼到資料流30中且再次將量子化之預測值重新轉換成LPC係數。可自由選擇地，某種內插可被使用，以降低有關線性預測係數的資訊在資料流30內輸送的更新率。因此，負責使關於進入頻譜域整形器22之當前頻譜的線性預測係數接受某種加權程序的後續模組44可以近用線性預測係數，因為它們也可在解碼端獲得，即近用量子化之線性預測係數。其後的一模組46將加權之線性預測係數轉換成頻譜權重，該等頻譜權重接著由頻域雜訊整形器模組48來應用，以對接收當前頻譜進行頻譜整形。

由上述討論可清楚看出，由分析器20所執行之線性預測分析導致冗餘工作，該冗餘工作完全地增加到方塊10及22中所執行的頻譜分解及頻譜域整形上，且因此，計算冗餘工作是相當大的。

第2图繪示依據本申請案之一實施例的一音訊編碼器，該音訊編碼器提供相當的編碼效率，但是編碼複雜性降低。

簡言之，在代表本申請案之一實施例的第2圖之音訊編碼器中，第1圖之線性預測分析器由一被串連在頻譜分解器10與頻譜域整形器22之間、一級聯之一自相關電腦50及一線性預測係數電腦52所取代。由第1圖修改成第2圖的動機及揭示模組50及52之詳細功能的數學解釋將在下文中提供。然而，顯而易見的是，鑒于自相關電腦50涉及的計算與自相關及自相關前之視窗化的一系列計算相比較不複雜，第2圖之音訊編碼器之計算冗餘工作較第1圖之音訊編碼器降低。

在描述第2圖之實施例之詳細的數學架構之前，第2圖之音訊編碼器之結構被簡短地描述。詳言之，使用參考符號60概示的第2圖之音訊編碼器包含用以接收輸入音訊信號12的一輸入62及用以輸出資料流30的一輸出64，音訊編碼器將輸入音訊信號12編碼到資料流30中。頻譜分解器10、時間雜訊整形器26、頻譜域整形器22、低頻加重器28及量子化器24在輸入62與輸出64之間以提到的順序串連。時間雜訊整形器26及低頻加重器28是可自由選擇的模組，且依據一替代實施例可被省略。若存在的話，時間雜訊整形器26可被配置成可適應性地啟動，即藉由時間雜訊整形器26進行的時間雜訊整形例如可視輸入音訊信號的特性而啟動或停用，決策之結果例如是經由資料流30被傳送至解碼端，這將在下文中更加詳細地說明。

如第1圖中所示者，第2圖之頻譜域整形器22的內部如同已相關於第1圖所描述地被構建。然而，第2圖之內部結構並不欲被理解為一關鍵點且頻譜域整形器22之內部結構也可能是與第2圖中所示之確實結構不同的。

第2圖之線性預測係數電腦52包含串連在自相關電腦 50與頻譜域整形器22之間的滯後視窗程式38及線性預測係數估計器40。應指出的是，滯後視窗程式，舉例而言，也是一可自由選擇的特徵。若存在的話，由滯後視窗程式38對由自相關電腦50所提供之個別自相關所應用的視窗可以是一高斯或二項分布形狀視窗。有關線性預測係數估計器40，應指出的是，其不一定使用維納-列文遜-杜賓演算法。而是可使用一不同的演算法以計算線性預測係數。

自相關電腦50內部包含一功率譜電腦54，後接一標度扭曲器/頻譜加權器56，其復後接一反轉換器58的一序列。模組54至58之序列之細節及重要性將在下文中更加詳細地加以描述。

為了理解為什麽分解器10之頻譜分解可共同用於整形器22內之頻譜域雜訊整形以及線性預測係數計算，應該考量維納-辛欽定理，該定理表明一自相關可使用一DFT來算出：其中 k =0,...,N -1m =0,...,N -1

因此，R_m 是DFT是X_k 時，信號部分x_n 之自相關之自相關係數。

因此，若頻譜分解器10將使用一DFT以實施重疊轉換並產生輸入音訊信號12之頻譜序列，則自相關計算器50將能夠僅藉由遵照上文概述之維納-辛欽定理在其輸出執行一較快的自相關計算。

若需要自相關之所有滯後m的值，則頻譜分解器10之DFT可使用一FFT而被執行，且一反FFT可在自相關電腦50內使用，以使用剛才提到之公式由此導出自相關。然而，當僅需要M<<N個滯後時，使用一FFT來頻譜分解將更迅速，且直接應用一反DFT以獲得相關的自相關係數。

當上文提到之DFT被一ODFT，即奇頻DFT所取代時，也是這樣，其中一時間序列x之一般化DFT被定義為：且對ODFT(奇頻DFT)設定

然而，若一MDCT而非一DFT或FFT被用在第2圖之實施例中，則情況不同。MDCT包括一IV型離散餘弦轉換且僅揭示一實值頻譜。也就是說，相位資訊因此一轉換而失去。MDCT可被寫作：其中x_n ，n=0...2N-1，定義由視窗程式16所輸出的輸入音訊信號12之一當前視窗化部分，且X_k 相應地是對於此視窗化部分所產生的頻譜之第k個頻譜係數。

功率譜電腦54依據下式藉由求每一轉換係數X_k 的平方由MDCT之輸出來計算功率譜：S _k =|X _k |² k =0,...,N -1

由X_k 所定義的一MDCT頻譜與一ODFT譜X_k ^ODFT 之間的關係可被寫成：

這意味著自相關電腦50使用MDCT而非一ODFT作為輸入來執行MDCT之自相關程序，等效於使用以下之一頻譜加權由ODFT所獲得的自相關：

然而，所決定的自相關之此一失真對解碼端是透通的，因為整形器22內之頻譜域整形在與頻譜分解器10中之一完全相同的頻譜域，即MDCT中進行。換言之，由於藉由第2圖之頻域雜訊整形器48之頻域雜訊整形被應用在MDCT域中，這實際上意指當MDCT被一ODFT所取代時，頻譜加權f _k ^mdct 與MDCT之調變互相抵消且產生如第1圖中所示之一習知LPC的相似結果。

因此，在自相關電腦50中，反轉換器58執行一反ODFT且一對稱的實數輸入之一反ODFT等於一DCT II型：

因此，由於藉反ODFT在反轉換器58之輸出所決定的自相關僅需要較少的計算步驟，諸如上文所概述之求平方，及功率譜電腦54與反轉換器58中的反ODFT，而得到相對較低的計算成本，這允許第2圖之自相關電腦50中之基於MDCT的LPC之一快速計算。

關於標度扭曲器/頻譜加權器56的細節還未被描述。詳言之，此模組是可自由選擇的且可被省略或被一頻域抽取濾波器所取代。關於由模組56所執行之可能的量測的細節在下文中描述。然而，在此之前，關於第2圖中所示之某些其他元件的某些細節被概述。關於滯後視窗程式38，例如，應指出的是，同可執行一白雜訊補償以改良由估計器40所執行之線性預測係數估計之調節。模組44中所執行的LPC加權是可自由選擇的，但是，若存在的話，其可被執行以實現一實際的頻寬擴展。也就是說，LPC的極點以一依據下式的常數因子移向原點，例如，

因此，所執行之LPC加權接近同步遮罩。一常數γ=0.92或0.85到0.95之間，包含二端值的一常數產生良好結果。

關於模組42，應指出的是，可變位元率編碼某一其他熵編碼方案可被使用，以將關於線性預測係數的資訊編碼到資料流30中。如上文所提到者，量子化可在LSP/LSF域中執行，但是ISP/ISF域也是可行的。

關於LPC對MDCT模組46，其將LPC轉換成頻譜加權值，該頻譜加權值在MDCT域情況下，於下文中例如在詳細說明此轉換提到USAC編解碼器時稱為MDCT增益。簡言之，LPC係數可接受一ODFT，以獲得MDCT增益，其倒數則可被使用作權重以藉由對各自的頻譜帶應用所產生的權重對模組48中的頻譜整形。例如，16個LPC係數被轉換成MDCT增益。當然，在解碼器端是用使用非倒數形式的MDCT增益加權，而非使用倒數加權，以獲得類似一LPC合成濾波器的一傳送函數，俾使形成上文所提到的量子化雜訊。因此，摘要而言，在模組46中，匯總FDNS 48所使用的增益是使用一ODFT由線性預測係數而獲得的，且在使用MDCT的情況下稱作MDCT增益。

為了完整起見，第3圖繪示可用以由資料流30再次重建音訊信號的一音訊解碼器的一可能的實施態樣。第3圖之解碼器包含一可自由選擇的低頻去加重器80，一頻譜域去整形器82，一同為可自由選擇的時間雜訊去整形器84，及一頻譜域對時域轉換器86，它們被串連在資料流30進入音訊解碼器之一資料流輸入88與重建音訊信號被輸出的音訊解碼器之一輸出90之間。低頻去加重器自資料流30接收量子化且頻譜整形後之頻譜且對其執行一濾波，其是第2圖之低頻加重器之傳送函數的反函數。然而，如先前所提到者，去加重器80是可自由選擇的。

頻譜域去整形器82具有一與第2圖之頻譜域整形器22結構非常類似的結構。詳言之，內部同樣包含一級聯的LPC抽取器92、與LPC加權器44等同的LPC加權器94，一同樣與第2圖之模組46相同的LPC對MDCT轉換器96，及一頻域雜訊整形器98，與第2圖之FDNS 48相反地，頻域雜訊整形器98藉由乘法而非除法對接收(去加重)頻譜應用MDCT增益，以獲得一對應於由LPC抽取器92自資料流30所抽取之線性預測係數之一線性預測合成濾波器的一傳送函數。LPC抽取器92可在一對應的量子化域諸如LSP/LSF或ISP/ISF中執行上文所提到之再轉換，以獲得被編碼至欲被重建的音訊信號之連續相互重疊部分的資料流30中的個別頻譜的線性預測係數。

時域雜訊整形器84逆轉第2圖之模組26之濾波，且這些模組之可能實施態樣在下文中被更加詳細地描述。然而，無論如何，第3圖之TNS模組84都是可自由選擇的，且也可如相關於第2圖之TNS模組26所提到的被省略。

頻譜組合器86內部包含一反轉換器100，例如可用以對接收去整形頻譜個別執行一IMDCT，後接一混疊消除器，諸如一重疊相加相加器102，其被配置成正確地暫時寄存由再轉換器100輸出之重建視窗版本以執行時間混疊消除，且在輸出90輸出重建音訊信號。

如上文所提到者，由於頻譜域整形22依據對應於由在資料流30內傳送的LPC係數所定義的一LPC分析濾波器的一傳送函數，例如具有一頻譜白雜訊之量子化器24中的量子化由頻譜域去整形器82在一解碼端以隱藏於遮罩閾值下的方式被整形。

在解碼器及其逆轉，即模組84中有實施TNS模組26的不同可能性。時間雜訊整形是用以整形由所提到的頻譜域整形器頻譜形成個別頻譜的時間部分內的時間意義上雜訊。在暫態存在於所指涉當前頻譜的各別時間部分內的情況下時間雜訊整形是特別有用的。依據一特定實施例，時間雜訊整形器26被配置成一頻譜預測器，其被配置成預測性地過濾由頻譜分解器10沿一頻譜維度所輸出之當前頻譜或頻譜序列。也就是說，頻譜預測器26也可決定可插入到資料流30中的預測濾波器係數。這由第2圖中的一虛線繪示。結果，時間雜訊濾波頻譜沿頻譜維度而被平坦化，且由於頻譜域與時域之間的關係，時域雜訊去整形器84內的反濾波與資料流30內發送的時域雜訊整形預測濾波器一致，去整形導致起音或暫態發生時刻的雜訊隱藏或壓縮。所謂的預回音從而被避免。

換言之，藉由在時域雜訊整形器26中預測性地過濾當前頻譜，時域雜訊整形器26獲得頻譜提醒項目，即被轉發至頻譜域整形器22的預測性濾波之頻譜，其中對應的預測係數被插入到資料流30中。時域雜訊去整形器84復自頻譜域去整形器82接收去整形後之頻譜且藉由依據自資料流所接收，或自資料流30所抽取之預測濾波器來反濾波此一頻譜而沿頻譜域逆轉時域濾波。換言之，時域雜訊整形器26使用一分析預測濾波器，諸如線性預測濾波器，而時域雜訊去整形器84使用基於相同預測係數的一對應的合成濾波器。

如先前所提到者，音訊編碼器可被配置成依濾波器預測增益或音訊輸入信號12的一音調或瞬態特性來決定致能或去能在對應於當前頻譜之各自的時間部分的時間雜訊整形。同樣，關於決策的各別資訊被插入到資料流30中。

在下文中，自相關電腦50被配置成如第2圖中所示，由預測性濾波，即頻譜之TNS濾波版本而非未濾波頻譜來計算自相關的可能性被討論。存在兩種可能性：TNS被應用，或以一方式，例如基於欲編碼之輸入音訊信號12之特性而被音訊編碼器選擇時，TNS濾波頻譜即可被使用。因此，第4圖之音訊編碼器與第2圖之音訊編碼器不同之處在於自相關電腦50之輸入被連接至頻譜分解器10之輸出以及TNS模組26之輸出。

如剛才所述，由頻譜分解器10所輸出之TNS濾波之MDCT頻譜可被用作電腦50內之自相關計算的一輸入或基礎。如剛才所述，當TNS被應用，或音訊編碼器在使用未濾波頻譜或TNS濾波頻譜之間可決定TNS應用於頻譜時，TNS濾波頻譜即可被使用。如上所述者，可依音訊輸入信號之特性做決策。但決筞對於解碼器可能是通透的，該解碼器僅對頻域去整形應用LPC係數資訊。另一可能性是音訊編碼器在TNS所應用之頻譜的TNS濾波頻譜與非濾波頻譜之間切換，即依頻譜分解器10所選擇的轉換長度在這些頻譜的二選項間做決定。

更準確地說，第4圖中的分解器10可被配置成在頻譜分解音訊輸入信號時在不同的轉換長度之間切換，使得由頻譜分解器10所輸出之頻譜將具有不同的頻譜解析度。也就是說，頻譜分解器10例如將使用一重疊轉換，諸如MDCT，以將不同長度之互相重疊時間部分轉換成為轉換版本或同樣具有不同長度之頻譜，其中頻譜之轉換長度對應於對應的重疊時間部分之長度。在此情況下，若當前頻譜之一頻譜解析度滿足一預定準則，則自相關電腦50可被配置成由預測性濾波或TNS濾波之當前頻譜來計算自相關，或若當前頻譜之頻譜解析度不滿足預定準則，則由未預測性濾波，即未濾波之當前頻譜來計算自相關。預定準則例如可以是當前頻譜之頻譜解析度超過某一閾值。例如，將由TNS模組26所輸出之TNS濾波頻譜使用於自相關計算對較長訊框(時間部分)，諸如15ms以上訊框是有利的，但是對較短訊框(時間部分)，例如15ms以下者可能不利，且因此，對於較長訊框，自相關電腦50的輸入可以是TNS濾波之MDCT頻譜，而對於較短訊框，由分解器10所輸出之MDCT頻譜可被直接使用。

迄今還未描述哪些感知相關修改可在模組56內之功率譜上執行。現在，各種量測被說明，且它們可被個別或組合應用於到目前為止所述的所有實施例及變異形式。詳言之，一頻譜加權可藉由模組56應用於由功率譜電腦54所輸出之功率譜。頻譜加權可以是：其中S_k 是上文所提到的功率譜之係數。

頻譜加權可被使用作為一機制以供依據心理聲學方面來分配量子化雜訊。對應於第1圖之意義的一預加重的頻譜加權可藉由下式來定義：

此外，標度扭曲可在模組56內使用。完整的頻譜例如可被分割為對應於樣本長度為l₁ 的訊框或時間部分的頻譜之M個頻帶，及對應於樣本長度為l₂ 的訊框之時間部分的頻譜之2M個頻帶，其中l₂ 可能是l₁ 的兩倍，其中l₁ 可以是64、128或256。詳言之，分割可遵照：

頻帶分割可包括頻率依據下式扭曲成巴克頻譜(Bark scale)的一近似值：

可選擇地，頻帶可均等分配以形成依據下式的一線性標度：

對於長度為例如l₁ 的訊框之頻譜，頻帶數目可能在20到40之間，且對於長度為l₂ 的訊框之頻譜，在48到72之間，其中32個頻帶對應於長度為l₁ 的訊框之頻譜，且64個頻帶對應於長度為l₂ 的訊框之頻譜是較佳的。

由可自由選擇的模組56選擇性執行之頻譜加權及頻率扭曲可被視為一位元分配(量子化雜訊整形)手段。對應於預加重的一線性標度中的頻譜加權可使用一常數μ=0.9或位於0.8到0.95之間的一常數來執行，使得對應的預加重將接近對應於巴克標度扭曲。

模組56內的功率譜之修改可包括功率譜之擴展，模型化同步遮罩，且因此取代LPC加權模組44及94。

若一線性標度被使用，且對應於預加重的頻譜加權被應用，則在解碼端，即在第3圖之音訊解碼器之輸出所獲得的第4圖之音訊編碼器的結果，在感知上非常類似於依據第1圖之實施例所獲得的習知的重建結果。

某些聽力測試結果已使用上文所確認之實施例而被執行。由該等測試，結果證明第1圖中所示之習知的LPC分析及基於線性標度MDCT之LPC分析產生感知相等結果，當．基於MDCT之LPC分析中的頻譜加權對應於習知的LPC分析中的預加重，．同一視窗化被使用在頻譜分解內，諸如低重疊正弦視窗，及．線性標度被用在基於MDCT之LPC分析中。

習知的LPC分析與基於線性標度MDCT之LPC分析之間的可忽略差異可能源於LPC被用於量子化雜訊整形，以及在48 kbit/s下有足夠的位元來充分精確地編碼MDCT係數。

而且，結果證明在模組56內藉由應用標度扭曲而使用巴克標度或非線性標度產生編碼效率或聽力測試的結果，依據該結果，對於測試音訊片段Applause、Fatboy、RockYou、Waiting、bohemian、fuguepremikres、kraftwerk、lesvoleurs、teardrop，巴克標度勝過線性標度。

巴克標度對hockey及linchpin非常失敗。在巴克標度中有問題的另一項目是bibilolo，但是因其呈現具有特定頻譜結構的一實驗音樂而並不包括在測試內。某些聽眾也表示對bibilolo項目的強烈反感。

然而，第2及4圖之音訊編碼器可以在不同的標度之間切換。也就是說，模組56可依音訊信號之特性，諸如瞬態特性或音調對不同的頻譜應用不同的標度，或使用不同的頻率標度來產生多個量子化信號及一決定哪一量子化信號是感知最佳者的量度。結果證明，標度切換在有暫態，諸如RockYou及linchpin中的暫態存在下產生與非切換版本(巴克及線性標度)相較之下的改良結果。

應提到的是，上文概述之實施例可被用作一多模式音訊編解碼器，諸如支援ACELP的編解碼器中的TCX模式，且上文概述之實施例為一類TCX模式。在成框上，一恆定長度，諸如20ms之訊框可被使用。以此方式，一種USAC編解碼器的低延遲版本可被獲得而非常高效率。在TNS上，來自AAC-ELD的TNS可被使用。為了減少旁側資訊所使用的位元的數目，濾波器的數目可被固定成兩個，一個在600Hz到4500Hz之間運作，且第二個在4500Hz到核心編碼器頻譜之末端間運作。濾波器可獨立地切換成打開及關閉。濾波器可使用偏相關係數以一格點被應用並發送。一濾波器的最大階數可被設定成八且每一濾波器係數可使用四個位元。霍夫曼編碼可用以減少使用於一濾波器之階數及其係數之位元的數目。

儘管有些層面已就一裝置而被描述，但是應清楚的是，這些層面還代表對應方法之說明，其中一方塊或裝置對應於一方法步驟或一方法步驟之一特徵。類似地，就一方法步驟而描述的層面也代表一對應裝置之對應方塊或項目或特徵的說明。某些或全部方法步驟可由一硬體裝置來執行(或使用)，像例如微處理器、可程式電腦或電子電路。在某些實施例中，某一個或多個最重要的方法步驟可由此一裝置來執行。

視某些實施要求而定，本發明實施例可以硬體或以軟體來實施。該實施可使用一數位儲存媒體來執行，例如其上儲存有電子可讀取控制信號的軟碟、DVD、藍光光碟、CD、ROM、PROM、EPROM、EEPROM或FLASH記憶體，該等電子可讀取控制信號與一可程式電腦系統協作(或能夠與之協作)，使得各別方法得以執行。因此，數位儲存媒體可能是電腦可讀的。

依據本發明的某些實施例包含具有電子可讀取控制信號的一資料載體，該等電子可讀取控制信號能夠與一可程式電腦系統協作，使得本文所述諸方法中的一者得以執行。

一般而言，本發明實施例可被實施為具有一程式碼的一電腦程式產品，當該電腦程式產品在一電腦上運行時，該程式碼可操作以執行該等方法中的一者。該程式碼可以，例如儲存在一機器可讀取載體上。

其他實施例包含儲存在一機器可讀取載體上，用以執行本文所述諸方法中的一者的電腦程式。

因此，換言之，本發明方法的一實施例是具有一程式碼的一電腦程式，當該電腦程式在一電腦上運行時，該程式碼用以執行本文所述諸方法中的一者。

因此，本發明方法的另一實施例是包含記錄在其上用以執行本文所述諸方法中的一者的電腦程式的一資料載體(或一數位儲存媒體，或一電腦可讀取媒體)。該資料載體、該數位儲存媒體或記錄媒體典型地是有實體的及/或非變遷的。

因此，本發明方法的又一實施例是代表用以執行本文所述諸方法中之一者的電腦程式的一資料流或一信號序列。該資料流或信號序列例如可以被配置成經由一資料通訊連接，例如經由網際網路來傳送。

另一實施例包含一處理裝置，例如電腦，或一可程式邏輯裝置，其被配置成或適應於執行本文所述諸方法中的一者。

另一實施例包含安裝有用以執行本文所述諸方法中的一者的電腦程式的一電腦。

依據本發明的又一實施例包含一裝置或一系統，其被配置成傳送(例如，以電子或光學方式)一用以執行本文所述諸方法中之一者的電腦程式至一接收器。該接收器可以是，例如電腦、行動裝置、記憶體裝置等。該裝置或系統例如可包含用以將該電腦程式傳送至該接收器的一檔案伺服器。

在某些實施例中，一可程式邏輯裝置(例如現場可程式閘陣列)可用以執行本文所述方法的某些或全部功能。在某些實施例中，一現場可程式閘陣列可與一微處理器協作以執行本文所述諸方法中的一者。一般而言，該等方法較佳地由任一硬體裝置來執行。

上述實施例僅說明本發明的原理。應理解的是，本文所述配置及細節的修改及變化對熟於此技者將是顯而易見的。因此，意圖是僅受後附專利申請範圍之範圍的限制而並不受通過說明及解釋本文實施例所提出的特定細節的限制。

文獻：

[1]：USAC codec(Unified Speech and Audio Codec),ISO/IEC CD 23003-3，2010年9月24日

10‧‧‧頻譜分解器/分解器

12‧‧‧輸入音訊信號/音訊輸入信號

14‧‧‧譜圖

16‧‧‧視窗程式

18‧‧‧MDCT模組

20‧‧‧線性預測分析器/分析器

22‧‧‧頻譜域整形器/整形器/頻譜域整形

24‧‧‧量子化器/量子化

26‧‧‧時間雜訊整形模組/TNS模組/時間雜訊整形器/模組/時域雜訊整形器

28‧‧‧低頻加重模組/低頻加重器

30‧‧‧資料流

32‧‧‧預加重模組

34‧‧‧視窗程式

36‧‧‧自相關器

38‧‧‧滯後視窗程式

40‧‧‧線性預測參數估計器/線性預測係數估計器/估計器

42、44、46、48‧‧‧模組

42‧‧‧模組/線性預測係數資料流插入器

44‧‧‧模組/LPC加權器/LPC加權模組

46‧‧‧模組/LPC對MDCT模組

48‧‧‧模組/頻域雜訊整形器/FDNS

50‧‧‧自相關電腦/模組/自相關計算器/電腦

52‧‧‧線性預測係數電腦/模組

54‧‧‧功率譜電腦

56‧‧‧標度扭曲器/頻譜加權器/模組/可選擇的模組

58‧‧‧反轉換器

60‧‧‧參考符號

62‧‧‧輸入

64‧‧‧輸出

80‧‧‧低頻去加重器

82‧‧‧頻譜域去整形器

84‧‧‧時間雜訊去整形器/時域雜訊整形器/TNS模組/時域雜訊去整形器

86‧‧‧頻譜域到時域轉換器/頻譜組合器

88‧‧‧資料流輸入

90‧‧‧輸出

92‧‧‧LPC抽取器

94‧‧‧LPC加權器/LPC加權模組

96‧‧‧LPC對MDCT轉換器

98‧‧‧頻域雜訊整形器

100‧‧‧反轉換器/再轉換器

102‧‧‧重疊相加相加器

第1圖繪示依據一比較或實施例的一音訊編碼器的一方塊圖；第2圖繪示依據本申請案之一實施例的一音訊編碼器；第3圖繪示適合於第2圖之音訊編碼器的一可實行的音訊解碼器的一方塊圖；以及第4圖繪示依據本申請案之一實施例的一替代音訊編碼器的一方塊圖。