TWI469136B

TWI469136B - 在一頻譜域中用以處理已解碼音訊信號之裝置及方法

Info

Publication number: TWI469136B
Application number: TW101104349A
Authority: TW
Inventors: Guillaume Fuchs; Ralf Geiger; Markus Schnell; Emmanuel Ravelli; Stefan Doehla
Original assignee: Fraunhofer Ges Forschung
Priority date: 2011-02-14
Filing date: 2012-02-10
Publication date: 2015-01-11
Also published as: JP5666021B2; BR112013020482A2; US9583110B2; AU2012217269B2; EP2676268A1; EP2676268B1; PL2676268T3; TW201237848A; ZA201306838B; MY164797A; US20130332151A1; WO2012110415A1; MX2013009344A; CA2827249A1; ES2529025T3; CN103503061B; CN103503061A; AR085362A1; JP2014510301A; CA2827249C

Description

在一頻譜域中用以處理已解碼音訊信號之裝置及方法

本發明係有關於音訊處理，及更明確言之，係有關於用於品質提升的已解碼音訊信號之處理。

晚近已經達成有關切換式音訊編解碼器的進一步發展。高品質及低位元率的切換式音訊編解碼器乃統一語音與音訊編碼構思(USAC構思)。常見前處理/後處理包含：MPEG環繞(MPEGs)功能單元其處置立體聲或多聲道處理，及加強SBR(eSBR)單元其處理於輸入信號中較高音頻的參數表示型態。接著有二分支，一個分支包含高階音訊編碼(AAC)工具路徑，及另一個分支包含以線性預測編碼(LP或LPC定義域)為基礎的路徑，其又轉而成為LPC殘差之頻域表示型態或時域表示型態。於量化及算術編碼後，AAC及LPC二者的全部傳輸頻譜係表示於MDCT定義域。時域表示型態使用ACELP激勵編碼方案。編碼器及解碼器之方塊圖係給定於ISO/IEC CD 23003-3之第1.1圖及第1.2圖。

切換式音訊編解碼器之一額外實例為如3GPP TS 26.290 V10.0.0(2011-3)描述的擴充式適應多速率寬帶(AMR-WB+)編解碼器。AMR-WB+音訊編解碼器處理輸入訊框等於於內部取樣頻率F_s 為2048樣本。內部取樣頻率係限於12800至38400 Hz之範圍。2048樣本訊框係分裂成兩個臨界取樣的相等頻率頻帶。如此導致相對應於低頻(LF)頻帶及高頻(HF)頻帶的兩個1024樣本之超訊框。各個超訊框係劃分為四個256樣本訊框。於內部取樣率取樣係經由使用可變取樣變換方案獲得，該方案係重新取樣輸入信號。然後低頻信號及高頻信號使用兩個不同辦法編碼：低頻信號係使用「核心」編碼器/解碼器基於切換式ACELP及變換編碼激勵(TCX)編碼與解碼。於ACELP模式中，使用標準AMR-WB編解碼器。高頻信號係利用頻寬延長(BWE)方法以相當少的位元(每個訊框16位元)編碼。AMR-WB編碼器包括前處理功能、LPC分析、開放回路搜尋功能、適應性碼簿搜尋功能、創新性碼簿搜尋功能、及記憶體更新。ACELP解碼器包含數項功能，諸如解碼適應性碼簿、解碼增益、解碼創新性碼簿、解碼ISP、長期預測濾波器(LTP濾波器)、組成性激勵功能、四個子訊框之ISP之內插、後處理、合成濾波器、解除強調及升頻取樣方塊來最終獲得語音輸出的低頻帶部分。語音輸出的高頻帶部分係藉使用HB增益指數、VAD旗標、及16 kHz隨機激勵而產生。此外，HB合成濾波器的使用係接著帶通濾波器。進一步細節請參考G.722.2之第3圖。

此一方案於AMR-WB+已藉執行單聲道低帶信號之後處理而予提升。參考第7、8及9圖例示說明於AMR-WB+之功能。第7圖例示說明音準加強器700、低通濾波器702、高通濾波器704、音準追蹤階段706及加法器708。該等方塊係連結如第7圖所示及係饋以解碼信號。

於低頻音準加強中，使用二頻帶分解，及適應性濾波只應用至低頻帶。如此導致總後處理，大部分係鎖定目標於接近該合成語音信號之第一諧波之頻率。第7圖顯示二頻帶音準加強器之方塊圖。於較高分支中，解碼信號係藉高通濾波器704濾波來產生較高頻帶信號s_H 。於較低分支中，解碼信號首先係透過音準加強器700處理，及然後經由低通濾波器702濾波來獲得較低頻帶後處理信號(s_LEE )。後處理解碼信號係經由該較低頻帶後處理信號與該較高頻帶信號相加獲得。音準加強器之目的係減低於該解碼信號中之諧波間雜訊，該項目的係藉第9圖第一行指示的具有轉移函式H_E 之時變線性濾波器達成，及藉第9圖第二行之方程式描述。α乃控制諧波間衰減之係數。T為輸入信號(n )之音準週期，及s_LE (n)為音準加強器之輸出信號。參數T及α係隨著時間改變，且係藉音準追蹤階段706以數值α=1給定，藉第9圖第二行之方程式描述的濾波器增益於頻率1/(2T)、3/(2T)、5/(2T)等亦即於DC(0 Hz)與諧波頻率1/T、3/T、5/T等間之中點係恰為零。當α趨近於零時，如第9圖第二行定義的由濾波器所產生的諧波間之衰減減少。當α為零時，濾波器無效用，且為全通。為了將後處理限於低頻區，加強信號s_LE 係經低通濾波來產生信號s_LEF ，該信號加至高通濾波信號s_H 來獲得後處理合成信號s_E 。

相當於第7圖之例示說明的另一組態係例示說明於第8圖，第8圖之組態免除高通濾波的需要。此點係就第9圖針對s_E 的第三方程式解說。h_LP (n)為低通濾波器的脈衝響應，及h_HP (n)為互補高通濾波器的脈衝響應。然後，後處理信號s_E(n) 係由第9圖的第三方程式給定。如此，後處理係相當於從合成信號(n )扣除已定標低通濾波長期誤差信號α.e_LT (n)。長期預測濾波器的轉移函式係給定如第9圖之末行指示。此種交替後處理組態係例示說明於第8圖。數值T係藉於各個子訊框所接收的閉路音準滯後給定(分量音準滯後係捨入至最近的整數)。執行檢查音準加倍的簡單追蹤。若於延遲T/2的標準化音準相關性係大於0.95，則值T/2係用作為用於後處理的新音準滯後。因數α係藉α=0.5g_p 給定，限於α大於或等於零及小於或等於0.5。g_p 為以0及1為界限的解碼音準增益。於TCX模式中，α值係設定為零。具有25係數的線性相位有限脈衝響應(FIR)低通濾波器係以約500赫茲之截止頻率使用。濾波器延遲為12樣本。上分支須導入相對應於在下分支處理延遲的延遲，來維持在執行減法前兩個分支之信號的時間排齊。於AMR-WB+中Fs=2x核心之取樣率。核心取樣率係等於12800赫茲。故截止頻率係等於500赫茲。業已發現特別係針對低延遲應用，由線性相位FIR低通濾波器所導入的12樣本濾波器延遲促成編碼/解碼方案之總延遲。於編碼/解碼鏈中其它位置有其它系統性延遲來源，FIR濾波器延遲與其它來源累積。

本發明之一目的係提供改良之音訊信號處理構思，該構思係更適用於即時應用或多向通訊景況，諸如行動電話景況。

此項目的係藉如申請專利範圍第1項之處理已解碼音訊信號之設備、或如申請專利範圍第15項之處理已解碼音訊信號之方法、或如申請專利範圍第16項之電腦程式而予達成。

本發明係基於發現於已解碼信號之低音後濾波中的低通濾波器對總延遲的貢獻成問題而須減少。為了達成此項目的，已濾波音訊信號於時域係未經低通濾波，但於頻譜域經低通濾波，諸如QMF定義域或任何其它頻譜域，例如MDCT定義域、快速傅利葉變換(FFT)定義域等。業已發現從頻譜域變換至頻域，及例如變換至低解析度頻域，諸如QMF定義域可以低延遲執行，欲於頻譜域體現的濾波器之頻率選擇性，可藉只加權來自已濾波音訊信號之頻域表示型態的個別子帶信號而體現。因此頻率選擇特性之此種「影響」係經執行而無任何系統性延遲，原因在於子帶信號的乘法或加權運算不會遭致任何延遲。已濾波音訊信號及原先音訊信號之減法也係在頻譜域執行。又復，較佳係執行例如無論如何皆需要的額外操作，諸如頻譜帶複製解碼或立體聲或多聲道解碼係在一且同一QMF域額外地執行。頻時變換只在解碼鏈的末端執行來將最終產生的音訊信號帶回時域。如此，取決於應用用途，當不再要求於QMF域的額外處理操作時，藉減法器產生的結果音訊信號可就此變換回時域。但當解碼演算法於QMF域有額外處理操作時，則頻譜時間變換器並非連結至減法器輸出，反而係連結至最末頻域處理裝置之輸出。

較佳地，用以濾波已解碼音訊信號之濾波器為長期預測濾波器。又，較佳頻譜表示型態為QMF表示型態，額外地較佳頻率選擇性為低通特性。

但與長期預測濾波器相異的任何其它濾波器、與QMF表示型態相異的任何其它頻譜表示型態、或與低通特性相異的任何其它頻率選擇性可用來獲得已解碼音訊信號之低延遲後處理。

圖式簡單說明

後文將就附圖描述本發明之較佳實施例，附圖中：第1a圖為依據一實施例用以處理已解碼音訊信號之設備之方塊圖；第1b圖為用以處理已解碼音訊信號之設備之一較佳實施例之方塊圖；第2a圖顯示頻率選擇特性作為低通特性；第2b圖顯示加權係數及相聯結的子帶；第2c圖顯示時/頻變換器及隨後連結的用以施加加權係數至各個個別子帶信號之加權器之串級；第3圖顯示於第8圖例示說明之AMR-WB+中低通濾波器之頻率響應中的脈衝響應；第4圖顯示脈衝響應及頻率響應變換成QMF域；第5圖顯示用於32 QMF子帶實例之加權器的加權因數；第6圖顯示針對16 QMF頻帶之頻率響應及相聯結的16加權因數；第7圖顯示AMR-WB+之低頻音準加強器之方塊圖；第8圖顯示AMR-WB+之體現後處理組態；第9圖顯示第8圖之體現之推衍；及第10圖顯示依據一實施例之長期預測濾波器之低延遲體現。

第1a圖例示說明用以處理線上已解碼音訊信號100之設備。線上已解碼音訊信號100係輸入濾波器102用以濾波該已解碼音訊信號來獲得線上已濾波音訊信號104。濾波器102係連結至時間頻譜變換器階段106，例示說明為用於已濾波音訊信號之106a及用於線上已解碼音訊信號100之106b兩個個別時間頻譜變換器。時間頻譜變換器階段106係經組配來將該音訊信號及該已濾波音訊信號變換成各自有多個子密碼有效期的相對應頻譜表示型態。於第1a圖中此係以雙線表示，指示方塊106a、106b的輸出包含多個個別子帶信號而非單一信號，如針對方塊106a、106b的輸入例示說明。

處理設備額外包含加權器108，係用以對方塊106a輸出的已濾波音訊信號執行頻率選擇性加權，執行方式係將個別子帶信號乘以個別加權係數來獲得線上已加權已濾波音訊信號110。

此外，設置減法器112。減法器係經組配來執行已加權已濾波音訊信號與由方塊106b所產生的該音訊信號之頻譜表示型態間之逐一子帶減法。

此外，設置頻譜時間變換器114。由方塊114所執行的頻時變換使得藉減法器112所產生的結果音訊信號或從該結果音訊信號推衍得的信號係變換成時域表示型態而獲得線上已處理已解碼音訊信號116。

雖然第1a圖指示因時頻變換及加權的延遲係顯著低於因FIR濾波的延遲，但此點並非於全部情況下皆屬必要，原因在於其中QMF乃絕對地必要之情況下，可避免FIR濾波的延遲及QMF的延遲累加。因此當針對低音後濾波因時頻變換加權的延遲甚至高於FIR濾波的延遲時，本發明也有用。

第1b圖例示說明USAC解碼器或AMR-WB+解碼器之脈絡的本發明之較佳實施例。第1b圖例示說明之設備包含ACELP解碼器階段120、TCX解碼器階段122及連結點124，於該處連結解碼器120、122之輸出。連結點124始於兩個個別分支。第一分支包含濾波器102，濾波器102較佳地係經組配成藉音準滯後T設定的長期預測濾波器，接著為適應性增益α之放大器129。此外，第一分支包含時間頻譜變換器106a，其較佳係體現為QMF分析濾波器組。又復，第一分支包含加權器108，其係經組配來加權由QMF分析濾波器組106a所產生的子帶信號。

於第二分支中，已解碼音訊信號係藉QMF分析濾波器組106b而變換成頻譜域。

雖然個別QMF方塊106a、106b係例示說明為兩個分開元件，但須注意用於分析已濾波音訊信號及音訊信號，並非必要要求有兩個個別的QMF分析濾波器組。取而代之，當信號係逐一地變換時，單一QMF分析濾波器組及記憶體即足。但用於極低延遲體現，較佳係針對各個信號使用個別QMF分析濾波器組，讓單一QMF方塊不會形成演算法的瓶頸。

較佳地，變換成頻譜域及變換回時域係藉演算法執行，具有針對正向及反向變換之延遲係小於具有頻率選擇性特性的時域中濾波的延遲。因此，變換須具有總延遲係小於關注的濾波器之延遲。特別有用者為低解析度變換，諸如以QMF為基礎的變換，原因在於低頻率解析度結果導致需要小型變換窗，亦即導致縮小的系統性延遲。較佳應用用途只要求低解析度變換分解該信號成少於40個子帶，諸如32或只有16個子帶。但即便於時頻變換及加權導入比低通濾波器更高的延遲的應用中，由於下述事實而獲得優點，免除了其它處理程序所必然需要的低通濾波器與時間頻譜變換的延遲累加。

但針對由於其它處理操作諸如重新取樣、SBR或MPS而無論如何皆要求時頻變換的應用，與由時頻變換或頻時變換所遭致的延遲無關地，獲得延遲減少，原因在於將濾波器體現「含括」入頻譜域，可完全節省時域濾波器延遲，由於下述事實：執行逐一子帶加權而無任何系統性延遲。

適應性放大器129係藉控制器130控制。控制器130係經組配來當輸入信號為TCX解碼信號時，設定放大器129之增益α為零。典型地，於切換音訊編解碼器諸如USAC或AMR-WB+中，於連結點124的已解碼信號典型地係來自TCX解碼器122或來自ACELP解碼器120。因此有兩個解碼器120、122的已解碼輸出信號之時間多工。控制器130係經組配來針對目前時間瞬間，決定該輸出信號係來自TCX解碼信號或ACELP解碼信號。當決定有TCX信號時，適應性增益α係設定為零，使得由元件102、109、106a、108所組成的第一分支不具任何意義。此點係由於下述事實，用在AMR-WB+或USAC之特定種類的濾波只要求用在ACELP解碼信號。但當執行諧波濾波或音準加強以外的其它後濾波體現時，則取決於需求，可差異地設定可變增益α。

但當控制器130決定目前可用信號乃ACELP解碼信號時，放大器129之值係設定為α之正確值，典型地為0至0.5。於此種情況下，第一分支為有意義，減法器112之輸出信號實質上係與在連結點124的原先已解碼音訊信號有別。

用在解碼器120及放大器128的音準資訊(音準滯後及增益α)可來自該解碼器及/或專用音準追蹤器。較佳地，資訊係來自該解碼器，及然後透過專用音準追蹤器/該已解碼信號之長期預測分析而重新處理(精製)。

藉減法器112執行每帶或每子帶減法所產生的結果音訊信號並不立刻執行返回時域。取而代之，該信號係前傳至SBR解碼器模組128。模組128係連結至單聲-立體聲或單聲道-多聲道解碼器，諸如MPS解碼器131，於該處MPS表示MPEG環繞。

典型地，頻帶數目係藉頻譜帶寬複製解碼器提升，係藉在方塊128輸出的額外三行132指示。

又復，輸出數目係藉方塊131額外提升。方塊131從在方塊129輸出的單聲道信號產生例如五聲道信號或任何其它有二或更多聲道的信號。例示說明具有左聲道L、右聲道R、中聲道C、左環繞聲道L_s 及右環繞聲道R_s 的五聲道景況。因此針對各個個別聲道存在有頻譜時間變換器114，換言之，於第1b圖中存在有五倍，來將各個個別聲道信號從頻譜域，於第1b圖實例中為QMF域，變換回於方塊114輸出的時域。再度，並非必要為多個個別頻譜時間變換器。也可有單一頻譜時間變換器，其逐一地處理變換。但當要求極低延遲體現時，較佳係針對各個頻道使用個別頻譜時間變換器。

本發明之優點在於藉低音後濾波器所導入的延遲及更明確言之，由低通濾波器FIR濾波器所導入的延遲減少。因此任一種頻率選擇性濾波就QMF所要求的延遲，或概略言之，就時/頻變換而言不會導入額外延遲。

當無論如何要求QMF或一般而言要求時-頻變換時，本發明特別優異，例如於第1b圖之情況，於該處無論如何SBR功能及MPS功能係在頻譜域執行。於該處要求QMF之替代體現為當以已解碼信號執行重新取樣時的景況，及當為了重新取樣目的而要求具有不同濾波器組聲道數目的QMF分析濾波器組及QMF合成濾波器組時的景況。

此外，由於二信號亦即TCX及ACELP信號現在具有相同延遲，故ACELP與TCX間維持恆定訊框。

帶寬延展解碼器129之功能係以細節描述於ISO/IEC CD 23003-3章節6.5。多聲道解碼器131之功能係以細節描述於ISO/IEC CD 23003-3章節6.11。TCX解碼器及ACELP解碼器背後的功能係以細節描述於ISO/IEC CD 23003-3區塊6.12至6.17。

隨後，討論第2a至2c圖來例示說明示意實例。第2a圖例示說明示意低通濾波器之經頻率選擇的頻率響應。

第2b圖例示說明針對第2a圖所指子帶數目或子帶的加權指數。於第2a圖之示意情況下，子帶1至6具有等於1之加權係數，亦即無加權，而子帶7至10具有遞減的加權係數，及子帶11至11具有零之加權係數。

時間頻譜變換器諸如106a及隨後連接器加權器108之串級的相對應體現係例示說明於第2c圖。各個子帶1、2、...、14係輸入以W₁ 、W₂ 、...W₁₄ 指示的個別加權方塊內。加權器108藉該子帶信號之各次取樣乘以加權係數而施加第2b圖之該表的加權因數至各個個別子帶信號。然後，於加權器的輸出端，存在有已加權子帶信號，然後輸入第1a圖之減法器112，減法器112額外地執行於頻譜域的減法。

第3圖例示說明該AMR-WB+編碼器於第8圖之低通濾波器的脈衝響應及頻率響應。於時域的低通濾波器h_LP (n)係於AMR-WB+藉下列係數定義。

a[13]=[0.088250,0.086410,0.081074,0.072768,0.062294,0.050623,0.038774,0.027692,0.018130,0.010578,0.005221,0.001946,0.000385]；h_LP (n)=a(13-n)針對n為1至12 h_LP (n)=a(n-12)針對n為13至25第3圖例示說明的脈衝響應及頻率響應係針對一種情況，當濾波器係施加至12.8 kHz的時域信號樣本時。則所產生的延遲為12樣本延遲，亦即0.9375毫秒。

第3圖例示說明之濾波器具有於QMF域的頻率響應，於該處各個QMF具有400赫茲解析度。32 QMF頻帶涵蓋於12.8 kHz之信號樣本的帶寬。頻率響應及QMF域係例示說明於第4圖。

具有400赫茲解析度之幅值頻率響應形成當施加低通濾波器於QMF域時的權值。加權器108之權值係用於第5圖摘述之前述參數實例。

此等權值可計算如下：W=abs(DFT(h_LP (n),64))，於該處DFT(x,N)代表信號x之長度N的離散富利葉變換。若x係比N更短，則信號係以N減x個零的大小填塞。DFT之長度N係相對應於兩倍QMF子帶數目。因h_LP (n)乃實際係數信號，W顯示頻率0與尼奎斯特(Nysquist)頻率間的厄爾米辛(Hermitian)對稱及N/2頻率係數。

藉由分析濾波器係數的頻率響應，其係相對應於約2*pi*10/256之截止頻率。此點用來設計濾波器。為了節省若干ROM的耗用及有鑑於定點體現，然後該等係數經量化來以14位元寫成。

然後於QMF域的濾波執行如下：Y=於QMF域之後處理信號

X=於來自核心編碼器的QMF信號中之已解碼信號

E=於TD產生的欲從X移除的諧波間雜訊

Y(k)=X(k)-W(k).E(k)，針對k為1至32

第6圖例示說明又一實例，於該處QMF具有800赫茲解析度，故16頻帶涵蓋於12.8 kHz取樣的信號之全帶寬。然後係數W如第6圖指示於線圖下方。濾波係以就第6圖討論之相同方式進行，但k只有1至16。

於16頻帶QMF中的該濾波器之頻率響應係作圖為如第6圖之例示說明。

第10圖例示說明於第1b圖顯示於102的長期預測濾波器之更進一步加強。

更明確言之，針對低延遲體現，第9圖中第三行至末行的該項(n +T )有問題。原因在於相對於真實時間n，T樣本係在未來。因此為了解決此種情況，於該處因低延遲體現，尚未能獲得未來數值，故(n +T )係以置換，如第10圖指示。然後，長期預測濾波器估算先前技術之長期預測，但使用較少延遲或零延遲。業已發現估算為夠好，相對於減少延遲的增益係比音準加強的些微損耗更優異。

雖然已經以設備脈絡描述若干構面，但顯然此等構面也表示相對應方法的描述，於該處一方塊或一裝置係相對應於一方法步驟或一方法步驟之特徵。同理，以方法步驟之脈絡描述的構面也表示相對應設備之相對應方塊或項或特徵結構之描述。

取決於某些體現要求，本發明之實施例可於硬體或於軟體體現。體現可使用數位儲存媒體執行，例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體，具有可電子讀取控制信號儲存於其上，該等信號與(或可與)可程式規劃電腦系統協作，因而執行個別方法。

依據本發明之若干實施例包含具有可電子式讀取控制信號的非過渡資料載體，該等控制信號可與可程式規劃電腦系統協作，因而執行此處所述方法中之一者。

大致言之，本發明之實施例可體現為具有程式代碼的電腦程式產品，該程式代碼係當電腦程式產品在電腦上跑時可執行該等方法中之一者。該程式代碼例如可儲存在機器可讀取載體上。

其它實施例包含儲存在機器可讀取載體上的用以執行此處所述方法中之一者的電腦程式。

換言之，因此，本發明方法之實施例為一種具有一程式代碼之電腦程式，該程式代碼係當該電腦程式於一電腦上跑時用以執行此處所述方法中之一者。

因此，本發明方法之又一實施例為資料載體(或數位儲存媒體或電腦可讀取媒體)包含用以執行此處所述方法中之一者的電腦程式記錄於其上。

因此，本發明方法之又一實施例為表示用以執行此處所述方法中之一者的電腦程式的資料串流或信號序列。資料串流或信號序列例如可經組配來透過資料通訊連結，例如透過網際網路轉移。

又一實施例包含處理構件例如電腦或可程式規劃邏輯裝置，其係經組配來或適用於執行此處所述方法中之一者。

又一實施例包含一電腦，其上安裝有用以執行此處所述方法中之一者的電腦程式。

於若干實施例中，可程式規劃邏輯裝置(例如可現場程式規劃閘陣列)可用來執行此處描述之方法的部分或全部功能。於若干實施例中，可現場程式規劃閘陣列可與微處理器協作來執行此處所述方法中之一者。大致上該等方法較佳係藉任何硬體裝置執行。

前述實施例係僅供舉例說明本發明之原理。須瞭解此處所述配置及細節之修改及變化將為熟諳技藝人士顯然易知。因此，意圖僅受審查中之專利申請範圍所限而非受藉以描述及解說此處實施例所呈示之特定細節所限。

100‧‧‧線上已解碼音訊信號

102‧‧‧濾波器

104‧‧‧線上已濾波音訊信號

106‧‧‧時間頻譜變換器階段

106a-b‧‧‧時間頻譜變換器、方塊、QMF分析濾波器組

108‧‧‧加權器

110‧‧‧線上已加權已濾波音訊信號

112‧‧‧減法器

114‧‧‧頻譜時間變換器

116‧‧‧線上已處理已解碼音訊信號

120‧‧‧ACELP解碼器階段

122‧‧‧TCX解碼器階段

124‧‧‧連結點

128‧‧‧SBR解碼器模組、方塊

129‧‧‧放大器、方塊、帶寬延展解碼器

130‧‧‧控制器

131‧‧‧MPS解碼器、方塊、多聲道解碼器

132‧‧‧行

700‧‧‧音準加強器

702‧‧‧低通濾波器

704‧‧‧高通濾波器

706‧‧‧音準追蹤階段

708‧‧‧加法器

第1a圖為依據一實施例用以處理已解碼音訊信號之設備之方塊圖；第1b圖為用以處理已解碼音訊信號之設備之一較佳實施例之方塊圖；第2a圖顯示頻率選擇特性作為低通特性；第2b圖顯示加權係數及相聯結的子帶；第2c圖顯示時/頻變換器及隨後連結的用以施加加權係數至各個個別子帶信號之加權器之串級；第3圖顯示於第8圖例示說明之AMR-WB+中低通濾波器之頻率響應中的脈衝響應；第4圖顯示脈衝響應及頻率響應變換成QMF域；第5圖顯示用於32 QMF子帶實例之加權器的加權因數；第6圖顯示針對16 QMF頻帶之頻率響應及相聯結的16加權因數；第7圖顯示AMR-WB+之低頻音準加強器之方塊圖；第8圖顯示AMR-WB+之體現後處理組態；第9圖顯示第8圖之體現之推衍；及第10圖顯示依據一實施例之長期預測濾波器之低延遲體現。

100‧‧‧音訊信號

102‧‧‧濾波器

104‧‧‧線上已濾波音訊信號

106、106a-b‧‧‧時間頻譜變換器

108‧‧‧加權器

110‧‧‧線上已加權已濾波音訊信號

112‧‧‧減法器

114‧‧‧頻譜時間變換器

116‧‧‧已處理之已解碼音訊信號

Claims

一種用以處理已解碼音訊信號之設備，該設備係包含：用以濾波該已解碼音訊信號來獲得一已濾波音訊信號之一濾波器；用以將該已解碼音訊信號及該已濾波音訊信號變換成相對應頻譜表示型態之一時間頻譜變換器階段，各個頻譜表示型態具有多個子頻帶信號；用以執行該已濾波音訊信號之該頻譜表示型態之頻率選擇性加權之一加權器，該加權係藉將子頻帶信號乘以個別加權係數來獲得一已加權已濾波音訊信號；用以執行該已加權已濾波音訊信號與該已解碼音訊信號之該頻譜表示型態間之一逐一子頻帶減法以獲得一結果音訊信號之一減法器；及用以將該結果音訊信號或從該結果音訊信號推衍得的一信號變換成一時域表示型態來獲得一已處理已解碼音訊信號之一頻譜時間變換器。
如請求項1之設備，其係進一步包含一帶寬增強解碼器或一單聲-立體聲解碼器或一單聲道-多聲道解碼器來計算從該結果音訊信號推衍得的該信號，其中該頻譜時間變換器係組配來非將該結果音訊信號而是將從該結果音訊信號推衍得的該信號變換到時域，使得藉該帶寬增強解碼器或該單聲-立體聲或單聲道-多聲道解碼器進行的全部處理係於由該時間頻譜變換器階段所定義的相同頻譜域中執行。
如請求項1之設備，其中該已解碼音訊信號係為一代數碼簿激勵線性預測(ACELP)已解碼輸出信號，及其中該濾波器係為藉音準資訊控制的一長期預測濾波器。
如請求項1之設備，其中該加權器係組配來加權該已濾波音訊信號，使得相較於較高頻子頻帶，較低頻子頻帶係較少衰減或不衰減，致使該頻率選擇性加權將一低通特性加諸給該已濾波音訊信號。
如請求項1之設備，其中該時間頻譜變換器階段及該頻譜時間變換器係組配來分別地體現一正交鏡像濾波器組(QMF)分析濾波器組及一QMF合成濾波器組。
如請求項1之設備，其中該減法器係組配來從音訊信號之相對應子頻帶信號中扣除該已加權已濾波音訊信號之一子頻帶信號，來獲得該結果音訊信號之一子頻帶，該等子頻帶屬於相同濾波器組聲道。
如請求項1之設備，其中該濾波器係組配來執行該音訊信號與時間上位移一音準週期之至少該音訊信號之一加權組合。
如請求項7之設備，其中該濾波器係組配來藉由只組合該音訊信號與存在於較早時間瞬間之該音訊信號而執行該加權組合。
如請求項1之設備，其中該頻譜時間變換器相對於該時間頻譜變換器階段具有一不同數目的輸入聲道，致使獲得一樣品率變換，其中當輸入該頻譜時間變換器之輸入聲道數目係高於該時間頻譜變換器階段之輸出聲道數目時獲得一升頻取樣；及其中當輸入該頻譜時間變換器之該輸入聲道數目係小於該時間頻譜變換器階段之輸出聲道數目時獲得一降頻取樣。
如請求項1之設備，進一步包含：用以於一第一時間部分提供該已解碼音訊信號之一第一解碼器；用以於一不同的第二時間部分提供又一已解碼音訊信號之一第二解碼器；連結至該第一解碼器及該第二解碼器之一第一處理分支；連結至該第一解碼器及該第二解碼器之一第二處理分支；其中該第二處理分支包含該濾波器及該加權器，及額外地，包含一可控制式增益階段及一控制器，其中該控制器係組配來設定該增益階段之一增益至針對該第一時間部分之一第一值及至針對該第二時間部分之一第二值或設定至零，該第二值係低於該第一值。
如請求項1之設備，其係進一步包含一音準追蹤器用以提供一音準滯後及用以基於該音準滯後作為音準資訊而設定該濾波器。
如請求項10之設備，其中該第一解碼器係組配來提供該音準資訊或該音準資訊之一部分用以設定該濾波器。
如請求項10之設備，其中該第一處理分支之一輸出及該第二處理分支之一輸出係連結至該減法器之輸入。
如請求項1之設備，其中該已解碼音訊信號係由含括於該設備中之一ACELP解碼器提供，及其中該設備進一步包含體現為一變換編碼激勵(TCX)解碼器之又一解碼器。
一種處理已解碼音訊信號之方法，該方法係包含：濾波該已解碼音訊信號來獲得一已濾波音訊信號；將該已解碼音訊信號及該已濾波音訊信號變換成相對應頻譜表示型態，各個頻譜表示型態具有多個子頻帶信號；藉將子頻帶信號乘以個別加權係數來執行該已濾波音訊信號之頻率選擇性加權以獲得一已加權已濾波音訊信號；執行該已加權已濾波音訊信號與該已解碼音訊信號之該頻譜表示型態間之一逐一子頻帶減法以獲得一結果音訊信號；及將該結果音訊信號或從該結果音訊信號推衍得的一信號變換成一時域表示型態來獲得一已處理已解碼音訊信號。
一種具有程式代碼之電腦程式，當在一電腦上執行時，該程式代碼係用以執行如請求項15之處理已解碼音訊信號之方法。