TW201009812A

TW201009812A - Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs

Info

Publication number: TW201009812A
Application number: TW098123433A
Authority: TW
Inventors: Stefan Bayer; Sascha Disch; Ralf Geiger; Guillaume Fuchs; Max Neuendorf; Gerald Schuller; Bernd Edler
Original assignee: Fraunhofer Ges Forschung
Priority date: 2008-07-11
Filing date: 2009-07-10
Publication date: 2010-03-01
Also published as: EP2410522A1; KR20130090919A; CN103077722A; CA2836858C; CA2836871C; EP2410521A1; CN103000177A; RU2621965C2; CA2836862A1; PT2410521T; CN103000186B; JP5567191B2; JP5538382B2; ES2654433T3; CA2730239A1; HK1155551A1; HK1184903A1; CN102150201B; CA2836858A1; WO2010003618A3

Description

201009812 六、發明說明： C 明戶斤屬々員j 本發明係有關於音訊編碼及解碼，且特別針對具有一諧波或語音内容的音訊信號之編碼/解碼，該諧波或語音内容可受到一時間扭曲處理。 C先前技術3 在下文中，將給出時間扭曲音訊編碼之領域的一簡要說明，該編碼之概念町連同本發明一些實施例被應用。近年來，技術上的發展可將一音訊信號變換為一頻域表示，且例如考慮到感知遮蔽臨界值，有效地編碼該頻域表示。如果一組編碼頻谱係數被發送的塊長度很長，且如果僅相當小數目的頻譜係數遠在該整體遮蔽臨界值之上，同時一很大數目的頻譜係數在該整體遮蔽臨界附近或之下且可犯因此被忽略（或以最小碼長被編瑪）時，此一音訊信號編碼之概念特別有效。例如，基於餘弦或基於正弦的調處重疊變換通常由於它們的能量集中性質被用於源編碼之應用。即，對於帶有恒定基本頻率（基頻）的諧音而言，它們將信號能量集中於一小數目的頻譜成份(子頻帶），這產生—有效的信號表示。大體而言’一信號的（基本)基頻應被理解成可與該信號頻譜區別的最低主頻率。在普通語音模型中，該基頻是由人喉調處的激勵信號之頻率。如果僅—個單一基頻存在，該頻譜將極其簡單，僅包含該基本頻率及泛音。此一頻譜可被尚效地編碼。然而，對於具有變化基頻的信號，對應 201009812 每一諸波成份的能量分佈於數個變換係數’因此導致編碼效率的降低。爲了克服編碼效率的降低，要被編碼的音訊信號在一不均勻時間網格上被有效地重新取樣。在隨後的處理中，由不均勻重新取樣獲得的取樣位置如同它們表示一均勻時間網格上之值一般地被處理。該操作由詞組「時間扭曲」表不。取樣時間可依據該基頻的時間變化被有利地選擇，使件該音訊信號的時間扭曲版本中的一基頻變化小於該音。孔l號的原始版本（時間扭曲前）中的一基頻變化。該基頻變匕也可用顺「時間扭曲輪廓」表示。在該音黯說的時門扭曲之後’該音_號的時間㈣版本被轉換為頻域。 :依賴於基頻的時間扭曲具有如下效果：該時間扭曲音訊 ft㈣㈣典贱顯示—能f集巾纽小於該原始音 =號(未破時間扭曲)之__頻域表示的頻譜成份數目。回2解碼器端，該時間扭曲音訊信號的頻域表示被轉換 n /使传辦間扭曲音訊信號的—時域表示可在該解時:得到。然而’在解碼器端重建時間扭曲音訊信號的包^在 ^編碼11端輸人音訊信號的原始基頻變化不因此’藉由重騎樣㈣扭曲音訊信號之解碼 15端重建時域表示的另一時 ^ 媽器處的編竭器端於立曲被施用。爲了獲得該解 :=曲:至少近似對編碼器端時間扭曲= 取得=調:=的時間扭曲，需要有一可在料器處允斗調整該解碼器端時間扭曲的一資訊。 201009812 因為典型地需要將此一資訊從該音訊信號編碼器傳送至該曰aTUs號解碼器’需要保持該傳送所需的位元率小，同時仍允許所需之時間扭曲資訊在解碼器端可靠重建。鑑於上述討論，希望能建立一概念，該概念允許一音訊編碼器中時間杻曲概念的—位元率有效應用。【瘦^明内穷—】本發明之一目的是建立概念，基於可在一時間扭曲音訊信號編碼器或-時間扭曲音訊信號解竭器中利用之資訊改進由一編碼音訊信號所提供的聽覺印象。此目的藉由以下被實現··一依據申請專利範圍第1項的一時間扭曲致動信號提供器，基於一音訊信號之表示提供時間扭曲致動信號；一依據申請專利範圍第12項用於編碼一輸入音訊信號的音訊信號編碼器；一依據申請專利範圍第14項用於提供一時間扭曲致動信號的方法；一依據申峭專利範圍第15項用於提供一輸入音訊信號之一編碼表示的方法；或一依據申請專利範圍第16項的電腦程式。本發明之另一目的是提供一改進的音訊編碼/解碼方案，該方案提供一較高的品質或一較低的位元率。此目的由以下被實現：一依據申請專利範圍第17項、第26項、第32項、第37項的音訊編碼器、—依據申請專利範圍第20項的音訊解碼器、一依據申請專利範圍第23項、第30項、第35項或第37項的音訊編碼方法、一依據申請專利範圍第24項的解碼方法，或一依據申請專利範圍第25 項、第31項、第36項或第43項的電腦程式。 201009812 依據本發明之諸實施例係有關於一時間扭曲MDCT變換編碼器之方法。一些實施例係有關於僅編碼器工具。然而，其他實施例也有關於解碼器工具。本發明之一實施例建立一時間扭曲致動信號提供器，基於一音訊信號的一表示提供一時間扭曲致動信號。該時間扭曲致動信號提供器包含一能量集中資訊提供器，被設定組態以提供一能量集中資訊，該資訊描述該音訊信號之一時間扭曲變換頻譜表示中的一能量集中。該時間致動信號提供器也包含一比較器，被設定組態以將該能量集中資訊與一參考值相比較，且依據該比較之結果提供該時間扭曲致動信號。該實施例基於如下發現：如果該音訊信號的時間扭曲變換頻譜表示由於能量被集中於一個或多個頻譜區域（或頻譜線）而包含一充分集中的能量分佈，那麼從該編碼音訊信號的位元率降低的意義上來說，一音訊信號編碼器中一時間扭曲功能性的使用典型地帶來一改進。這是由於如下之事實：一成功的時間扭曲藉由將一模糊頻譜，例如一音訊框之模糊頻譜變換為具有一個或多個可辨別波峰，且因此具有比原始（未時間扭曲）音訊信號頻譜較高的能量集中頻譜，而帶來減少位元率的效果。關於此問題，應理解一音訊信號之基頻顯著地變化的音訊信號框包含-模__譜。該音訊信號之時間變化基頻具有如下效果.在4音信號框上被執行的—時域到頻域變換導致該信號能量在―，特定地在較高頻域上的—模 201009812 糊分佈。因此，此一原始（未時間扭曲）音訊信號之一頻譜表示包含一低能量集中，且典型地在該頻譜的一較高頻率部份未顯示頻譜波峰，或僅在頻譜中較高頻率部份顯示相當小的頻譜波峰。相比之下，如果時間扭曲成功（就提供該編碼效率的一改進而言），該原始音訊信號之時間扭曲產生具有一相對較高且清晰波峰之頻譜（尤其在該頻譜之較高頻譜部份中）的一時間扭曲音訊信號。這是由於以下事實：具有一時間變化基頻的一音訊信號被變換為具有一較小基頻變化或甚至一近似恒定基頻的一時間扭曲音訊信號。因此，該時間扭曲音訊信號之頻譜表示（其可被看做該音訊信號的一時間扭曲變換頻譜表示）包含一個或多個清晰頻譜波峰。換句話說，該原始音訊信號（具有在時間上變化的基頻)頻譜的模糊藉由一成功的時間扭曲操作被降低，使得該音訊信號之時間扭曲變換頻譜表示包含比原始音訊信號之頻譜較高的能量集中。然而，時間扭曲在改進編碼效率中並不總是成功。例如，如果輸入音訊信號包含很多的雜訊成份，或如果所擷取的時間扭曲輪廓不精確，那麼時間扭曲未改進編碼效率。鑑於此一情況，由能量集中資訊提供器提供的能量集中資訊就減少位元率而言是判定該時間扭曲是否成功的一有價值指標。本發明之一實施例建立一時間扭曲致動信號提供器，基於一音訊信號之一表示提供一時間扭曲致動信號。該時間扭曲致動提供器包含兩個時間扭曲表示提供器，被設定 7 201009812 組態以使用不同的時間扭曲輪廓資訊提供該相同音訊信號的兩個時間扭曲表示。因此，該等時間扭曲表示提供器可以相同的方式被設定組態（在結構上或功能上），且使用相同音訊信號但是不同的時間扭曲輪廓資訊。該時間扭曲致動信號提供器也包含兩個能量集中資訊提供器，被設定組態以基於該第一時間扭曲表示提供一第一能量集中資訊，且基於該第二時間扭曲表示提供一第二能量集中資訊。該等能量集中資訊提供器可以相同方式被設定組態以使用不同的時間扭曲表示。另外，該時間扭曲致動信號提供器包含一比較器，將兩個不同能量集中資訊進行比較，且提供相關於一比較結果的時間扭曲致動信號。在一較佳實施例中，該能量集中資訊提供器被設定組態以提供頻譜平坦度的一量度作為該能量集中資訊，該量度描述該音訊信號之時間扭曲變換頻譜表示。已發現如果時間扭曲將一輸入音訊信號變換為表示該輸入音訊信號的一時間扭曲版本的一較不平坦的時間扭曲頻譜時，就減少一位元率而言，時間扭曲是成功的。因此，頻譜平坦度之量度可被用以判定時間扭曲應被致動還是停用，而不需執行一全頻譜編碼處理。在一較佳實施例中，該能量集中資訊提供器被設定組態以計算該時間扭曲變換功率頻譜的一幾何平均與該時間扭曲變換功率頻譜的一算術平均之商，以獲得該頻譜平坦度之量度。已發現該商是非常適於描述由一時間扭曲可獲得的可能位元率節約之頻譜平坦度的一量度。 201009812 在另一較佳實施例中，該能量集中資訊提供器被設定組態以當與時間扭曲變換頻譜表示的一較低頻率部份相比時，強調時間扭曲變換頻譜表示的一較高頻率部份，以獲得該能量集中資訊。該概念基於如下發現：該時間扭曲在較高頻率範圍上典型地比在較低頻率範圍上具有更大的影響。因此，為使用一頻譜平坦度量測判定時間扭曲之有效性而主要評估該較高頻率範圍是適當的。另外，典型的音訊信號顯示一諧波内容（包含一基頻之諧波），其隨頻率之增加在強度上衰減。當與該時間扭曲變換頻譜表示的一較低頻率部份相比時，強調該時間扭曲變換頻譜表示的一較高頻譜部份也有助於補償該等頻譜線隨頻率增加的此一典型衰減。總而言之，該頻譜之較高頻率部份之被強調的考慮帶來能量集中資訊的一增加可靠性，且因此允許更可靠地提供該時間扭曲致動信號。在另一較佳實施例中，該能量集中資訊提供器被設定組態以提供頻譜平坦度之複數分頻段量度，且計算頻譜平坦度的複數分頻段量度的一平均，以獲得該能量集中資訊。已發現分頻段頻譜平坦度量度之考慮帶來一有關該時間扭曲是否可有效降低一編碼音訊信號位元率的特別可靠資訊。首先，該時間扭曲變換頻譜表示之編碼典型地以一分頻段方式被執行，使得頻譜平坦度之該等分頻段量度的一組合非常適於該編碼，且因此以良好精確度表示可獲得的位元率改進。另外，頻譜平坦度之量度的一分頻段計算實質上消除該能量集中資訊與一諧波分佈之相依性。例 9 201009812 如，即使一較高頻帶包含一相對小的能量（小於較低頻帶之能量），該較高頻帶可能仍然在感知上是相關的。然而，如果該頻譜平坦度量度不以一分頻段方式被計算，在該較高頻帶上的一時間扭曲之積極影響（從該等頻譜線之模糊的一降低的意義上說）可能僅因該較高頻帶上的能量小而被看成是微小的。相比之下，藉由施用該分頻段計算，該時間扭曲的一積極影響可以一適當的權重被考慮到，因為該等分頻段頻譜平坦度量度獨立於各自頻帶中的絕對能量之外。在另一較佳實施例中，該時間扭曲致動信號提供器包含一參考值計算器，被設定組態以計算頻譜平坦度之一量度，以獲得該參考值，該量度描述該音訊信號的一未時間扭曲的頻譜表示。因此，該時間扭曲致動信號可基於該輸入音訊信號的一未時間扭曲（或「未扭曲的」）版本之頻譜平坦度與該輸入音訊信號的一時間扭曲版本的一頻譜平坦度之比較而被提供。在另一較佳實施例中，該能量集中資訊提供器被設定組態以提供感知熵的一量度，作為該能量集中資訊，該量度描述該音訊信號之時間扭曲變換頻譜表示。此概念基於下述發現：該時間扭曲變換頻譜表示的感知熵是編碼該時間扭曲變換頻譜需要的位元數目（或一位元率）的一良好估計。因此，甚而由於如果使用時間扭曲一附加時間扭曲資訊必須被編碼，該時間扭曲變換頻譜表示的感知熵量度是位元率減少是否可藉由時間扭曲被預期的一良好量度。 201009812

在另一較佳實施例中，該能量集中資訊提供器被設定組態以提供—自相關量度作為該能量集巾資訊，該量度描述該音訊信號的一時間扭曲表示的一自相關。該概念基於如下發現：該時間扭曲之效率（就減少位元率而言）可基於一時間扭曲（或—不均勻重新取樣）的時域信號被量度（或至少被估計）。已發現如果該時間扭曲時域信號包含一由自相關量度反映相對高度的週期性’那麼時間扭曲是有效的週期性。相比之下，如果時間扭曲時域信號不包含一相當的週期性，可以推斷該時間杻曲無效。該發現基於如下事實：一有效時間扭曲將一變化頻率 (不包含-週期性）的—正弦信號的—部份變換為接近恒定頻率（包含一高度的週期性）的一正弦信號的一部份。相比之下，如果時間扭曲不能提供具有一高度週期，险的時域信號’那麼可預期時間扭曲也不提供_可證明其施用可行的重要位元率節約。在-較佳實施例中，該能量集中資訊提供器被設定組態以判定音訊信號之時間扭曲表示的-正規化自相關函數的絕對值總和（對多個滯後值），以獲得該能量集中資吼。已發現在估計該時間㈣之效率上衫要_計算複雜的自相關峰值欺。另外，已發現-（大)範圍的自相關滞後值上的自相關之一總評估也產生可靠的結果。這是由於如下事實：時間扭曲實際上將變化頻率的多個信號成份(例如，基頻及其諧波）變換為週期信號成份。因此，此一時間扭曲_ 號的自相關顯示多個自相關滞後值的峰值。因此，—纟· 11 201009812 形式是從自相關擷取能量集中資訊的一計算上高效率方式。在另一較佳實施例中，該時間扭曲致動信號提供器包含一參考值計算器，被設定組態以基於該音訊信號的一未時間扭曲頻譜表示，或基於該音訊信號的一未時間扭曲時域表示，計算該參考值。在此一情況中，該比較器典型地被設定組態以使用能量集中資訊及該參考值形成一比值，該能量集中資訊描述該音訊信號的一時間扭曲變換頻譜的能量集中。該比較器也被設定組態以將該比值與一個或多個臨界值進行比較，以獲得該時間扭曲致動信號。已發現一未時間扭曲情況中的一能量集中資訊與在時間扭曲情況中的能量集中資訊之比允許一計算上高效率但仍充分可靠的時間扭曲致動信號產生。本發明之另一較佳實施例建立一音訊信號編碼器用於編碼一輸入音訊信號，以獲得該輸入音訊信號的一編碼表示。該音訊信號編碼器包含一時間扭曲變壓器，被設定組態以基於該輸入音訊信號，提供一時間扭曲變換頻譜表示。該音訊信號編碼器也包含一時間扭曲致動信號提供器，如上所述。該時間扭曲致動信號提供器被設定組態以接收該輸入音訊信號，且提供該能量集中資訊，使得該能量集中資訊描述該輸入音訊信號的時間扭曲變換頻譜表示中之一能量集中。該音訊信號編碼器進一步包含一控制器，被設定組態以相關於該時間扭曲致動信號，向該時間扭曲變換器選擇性地提供一發現之非恒定（變化）時間扭曲 201009812 輪廓部份或時間扭曲資訊，或一標準恒定（不變）時間扭曲輪廓部份或時間扭曲資訊。以此方法，選擇性地接收或拒絕由該輸入音訊信號的編碼音訊信號表示導出中的一發現非恒定時間扭曲輪廓部份是可能的。該概念基於下述發現：將一時間扭曲資訊引入該輸入音訊信號的一編碼表示並不總是有效，因為編碼該時間扭曲資訊需要一相當可觀數目的位元被。另外，已發現由該時間扭曲致動信號提供器計算的能量集中資訊，是判定將該發現之變化（非恒定）時間扭曲估計部份抑或一標準（不變、恒定）時間扭曲輪廓提供至該時間扭曲變換器是否有利的一種計算上高效率量度。已注意到當該時間扭曲變換器包含一重疊變換時，一發現之時間扭曲輪廓部份可用在兩個或更多隨後的變換塊的計算中。特別地，已發現為能做出該時間扭曲是否允許位元率之一節約的判定並無必要使用新發現的變化時間扭曲輪廓部份完全編碼該輸入音訊信號的時間扭曲變換頻譜表示版本，及使用一標準（不變）時間扭曲輪廓部份完全編碼該輸入音訊信號的時間扭曲變換頻譜表示版本。已發現該輸入音訊信號的時間扭曲變換頻譜表示之能量集中的一評估形成該判定的一可靠基礎。因此，一必需的位元率可保持小。在又一較佳實施例中，該音訊信號編碼器包含一輸出介面，被設定組態以相關於該時間扭曲致動信號，選擇性地包括一時間扭曲輪廓資訊，該資訊將一發現之變化時間扭曲輪廓表示成該音訊信號編碼的表示。因此，一高效之 13 201009812 ，不管該輸入信號是否非常適合於音§孔彳S號編竭可被獲得時間扭曲。本發明之另—實_建立—種基於供一時間扭曲致動作骑唬k 方法實現該_扭曲致作號提功能，且可由本文中有關該時間扭曲致動 », ^所描述的任何特徵及功能補充。依據本發明之另—實施例建立一種用於編碼一輸入音訊信號，以獲得軸人音訊信制—編碼絲的方法。該

方法可由本对有關該音訊錢編碼料描述的任何特徵及功能補充。依據本發明之另—實施例建立一種用於執行本文所提到方法之電腦程式。

依據本發明之-第一層面，一種音訊信號分析，有關具有譜波特性抑或—語音特性的之-音訊輯分析被有利地用於控制編碼器端及/或解碼H端之雜訊注人處理。該音訊k號分析在—時間扭曲功能被使㈣系統中易於獲得’因為該時’曲功能上典型地包含-基頻追縱器及/或號分類1§ ’料區分語音與音樂，及/或區分有聲語音與無聲語音。因為該資訊可在此-場合帽取不需任何另外的成本，故可取用之資訊被有利地用於控制該雜訊注入特徵，使得尤其對於語音信號，諧波線之間的—雜訊注入可被降低’或特別是甚至消除語音信號間的雜訊注入。甚至在獲得一強譜波内容但是沒有被直接檢測到—語音的情況中’雜訊注入之降低仍然將產生一較高的感知品質。 14 201009812 雖然該特徵在至少執行該諧波/語音分析被的系統中特別有用’且因此該-資訊的取用不需任何附加成，甚至當一指定信號分析器必須被插人該祕中時，控制基於一信號具有-财抑或語音特性之㈣分㈣雜訊注人方案也有效益，因為品質被增強^位元率沒有增加，或換言之位元率減V ffijw $沒有損失’因為當可從__編碼器被發送到一解碼器的雜訊注人位準本身被降低時，用於編碼該雜訊注入位準所需之位元被減少。在本發明-進-步的層面中，該信號分析結果，即該仏號是-譜波信號抑或_語音信號，被用於控制一音訊編碼器的視窗功能處理。已發現在—語音信號或—諧波信號開始的情況中’-簡單編碼器將從長視窗切換至短視窗的可能性是很高的。然而料短視窗具有—對應地降低的頻譜解析度，另-方面，該頻率解析度將減少強諧波信號的編碼增益，且S此增加編碼此—信號部份所需的位元數目。鑑於此’當檢_卜語音或諧波㈣開始時，本發明在此-層面界定使用長於—短視窗的視窗。或者，具有一大體相似於該等長視窗的長度但具有_較選擇以有效地減少前回音。大體上，-音訊域的時框具有-諧波抑或-語音特_信號特性被用於選擇此一時框的一視窗功能。依據本發明之-進-步的層面，TNS(時域雜訊修整) 工具基於該基礎信絲於—時間扭曲操作抑或是在一線性域中而被控制。典型地，已藉由__時間扭曲操作處理的一 15 201009812 信號將具有一強諧波内容。否則，與—時間扭曲級相關聯的一基頻追蹤器不會輸出一有效基頻輪廓，且在缺少此— 有效基頻輪廓時，一時間扭曲功能會對該音訊信號的時框被停用。然而，通常諧波信號將不適於接受TNS處理。當由TNS級處理的信號具有一相當平坦的頻譜時，TNS處理特別有用且產生位元率/品質上的一重要增益。然而，當該信號之外觀是音調的，即非平坦的，如同在具有一諧波内容或有聲内容之頻譜的情況中，由TNS工具提供的品質/位元率上增益將被減少。因此，不使用該TNS工具之發明改良， ❽ 時間扭曲部份典型地不被TNS處理，但是會在不使用一TNS 濾波下被處理。另一方面，TNS的雜訊修整特徵仍然提供 - 改進的品質，特別是該信號在振幅/功率上變化的情況 _ 中在—諧波信號或語音信號之起始存在，及塊切換特徵被實施，使得長視窗或者至少長於短視窗的視窗、而非該起始被維持的情況中，該訊框的時域雜訊修整特徵之致動將I致圍繞該語音啟動之雜訊的一集中’這有效地減少前回音，該等前回音可能由於在一隨後的編碼器處理中之訊 © 框量化而在語音開始之前發生。依據本發明之另一層面，一可變數目之線在一音訊編碼》又備中由一量化器/熵編碼器處理以計入該可變帶寬該帶寬藉由以一可變時間扭曲特性/扭曲輪廓執行_時間扭曲操作而從訊框到訊框地被引入。當該時間扭曲操作導致包括在一時間扭曲訊框中的訊框時間（以線性）增加時，一早一頻率線之帶寬被減少，且，就一恒定總帶寬而言，要 16 201009812 被處理的頻譜線數目將在一非時間扭曲情況增加。另一方面，當該時間扭曲操作導致在該時間扭曲域中音訊信號的實際時間相對於在線性域中的音訊信號塊長度被減少時，一單一頻率線的頻率帶寬被增加，且因此由一源編碼器處理的線數目必須相對一非時間扭曲情況被減少，以具有一減少的帶寬變化或，最好沒有帶寬變化。圖式簡單說明 ❹ 第1圖繪示依據本發明一實施例的一時間扭曲致動信號提供器的一方塊示意圖；第2a圖繪示依據本發明一實施例的一音訊信號編碼器的一方塊示意圖；第2b圖繪示依據本發明一實施例的一時間扭曲致動信號提供器的另一方塊示意圖；第3a圖繪示一音訊信號的一未時間扭曲版本的一頻譜之圖解表示；第3b圖繪示該音訊信號的一時間扭曲版本的一頻譜之圖解表示；第3c圖繪示針對不同頻帶的頻譜平坦度量度的一個別計算之圖解表示；第3d圖繪示僅考慮該頻譜之較高頻帶的一頻譜平坦度量度的一計算之圖解表示；第3e圖繪示使用一頻譜表示的一頻譜平坦度量度的一計算之圖解表示，在該頻譜表示中，一較高頻率部份在一較低頻率部份上被強調； _ 17 201009812 第3f圖繪示依據本發明另一實施例的一能量集中資訊提供器的方塊示意圖；第3g圖繪示在該時域中具有一時間上可變基頻的一音訊信號之圖解表示；第3h圖繪示第3g圖音訊信號的一時間扭曲（不均勻重新取樣的）版本之圖解表不，第3i圖繪示依據第3g圖的音訊信號的一自相關函數之圖解表示；第3j圖繪示依據第3h圖的音訊信號的一自相關函數的圖解表示；第3k圖繪示依據本發明另一實施例的一能量集中資訊提供器的方塊示意圖；第4a圖繪示一種用於基於一音訊信號提供一時間扭曲致動信號的方法的流程圖；第4b圖繪示依據本發明一實施例，一種用於編碼一輸入音訊信號，以獲得該輸入音訊信號的一編碼表示的方法的流程圖；第5a圖繪示具有發明之層面的一音訊編碼器的一較佳實施例；第5b圖繪示具有發明之層面的一音訊解碼器的一較佳實施例；第6a圖繪示本發明之雜訊注入層面的一較佳實施例；第6b圖繪示界定由該雜訊注入位準調處器執行的控制操作的一表格； 18 201009812 第7a圖繪示依據本發明用於執行一基於時間扭曲的塊切換的較佳實施例；第7b圖繪示影響該視窗功能的一可供選擇的實施例；第7c圖繪示用於基於時間扭曲資訊說明該視窗功能的另一可供選擇的實施例；第7d圖繪示在一有聲啟動處的一正常AAC行為的一視窗順序；第7e圖繪示依據本發明之一較佳實施例獲得的可供選擇的視窗順序；第8a圖繪示TNS(時域雜訊整修)工具的一基於時間扭曲的控制的較佳實施例；第8b圖繪示界定第8a圖的臨界控制信號產生器中被執行的控制步驟的一表格；第9a-9e圖繪示不同的時間扭曲特性，及繼一解碼器端時間扭曲操作之後發生的相對應的音訊信號的帶寬上的影響；第10a圖繪示用於控制一編碼處理器中的線之數目的一控制器之一較佳實施例；第10b圖繪示要針對一取樣率被廢除/加入的線之數目之間的一依賴性；第11圖繪示一線性時間標度與一經扭曲時間標度之間的一比較；第12a圖繪示帶寬延伸在該内文中的一實施；及第12b圖繪示描繪在時間扭曲域中的局部取樣率與頻 19 201009812 譜係數的控制之間的依賴性的一表格。

【實施方式:J 第1圖繪示依據本發明之一實施例的時間扭曲致動信號提供器的一方塊示意圖。該時間扭曲致動信號提供器100 被設定組態以接收一音訊信號的一表示110，且基於該表示 110，提供一時間扭曲致動信號112。時間扭曲致動信號提供器100包含一能量集中資訊提供器120，被設定組態以提供一能量集中資訊122，該資訊122描述該音訊信號的一時間扭曲變換頻譜表示的能量之一集中。時間扭曲致動信號提供器100進一步包含一比較器130，被設定組態以將能量集中資訊122與一參考值132作比較，以依據該比較之結果提供時間扭曲致動信號112。如上所述，已發現能量集中資訊是允許一時間扭曲是否帶來一位元節約的計算上高效率評估的有價值的資訊。已發現一位元節約的存在與該時間扭曲是否導致一能量集中之問題密切相關。第2 a圖繪示依據本發明一實施例的一音訊信號編碼器 200的方塊示意圖。音訊信號編碼器200被設定組態以接收一輸入音訊信號210(也以a⑴標明），且基於該輸入音訊信號 210提供其之編碼表示212。音訊信號編碼器200包含一時間扭曲變換器220，被設定組態以接收輸入音訊信號21〇(可在一時域中被表示），且基於輸入音訊信號210提供其之一時間扭曲變換頻譜表示222。音訊信號編碼器200進一步包含一時間扭曲分析器284，被設定組態以分析輸入音訊信號 20 201009812 210，且基於其，提供一時間扭曲輪廓資訊286(例如絕對或相對時間扭曲輪廓資訊）。音訊信號編碼器200進一步包含一切換機制，例如以一受控開關240的形式’以判定找出之時間扭曲輪廓資訊286 抑或一標準時間扭曲輪廓資訊288被用於進一步的處理。因此’該切換機制240被設定組態以相關於一時間杻曲致動資訊，選擇性地將找出之時間扭曲輪廓資訊286或一標準時間 ❹ ❺ 扭曲輪廓資訊288作為一新時間扭曲輪廓資訊242，例如提供給時間扭曲變換器220用於一進一步的處理。應注意，時間扭曲變換器220例如可就一音訊訊框的時間扭曲使用新時間扭曲輪廓資訊242(例如一新時間扭曲輪廓部份），且另外使用一先前獲得的時間扭曲資訊(例如一個或多個先前獲得的時間扭曲輪廓部份）。該可任選頻譜後處理例如可包含-時域雜訊整修及/或-雜訊注人分析。音訊信號編碼器 200也包含-量化|§/編碼器260，被設定組態以接收頻譜表示2D(可選擇地由頻譜後處理挪處理），且量化及編碼^變換頻譜表示222。為此，#化器/編碼器細可與—感知模型職接，且從感知模型轉收—感知關物㈣，以考慮-感知雜且依據人軸知料同的料槽驢量化精確度。音訊信號編碼器2__步包含一輸出介面⑽，被設定組態以基於由量化器/編碼器咖提供的已量化且料頻i昝表不262，提供該音訊信號的編竭表示犯。音訊信號編碼器200進一步包含—時間扭曲致動传號提供器23G ’倾定組態以提供—曲致動信號232 Γ 21 201009812 時間扭曲致動信號232例如可，被用於控制切換機制240，以判定新發現時間扭曲輪廓資訊286抑或一標準時間扭曲輪廓資訊288被用於進一步的處理步驟中（例如藉由時間扭曲轉換器220)。另外，時間扭曲致動資訊232可被用於一開關280中，以判定已選擇新時間扭曲輪廓資訊242(從新發現時間扭曲輪廓資訊286及標準時間扭曲輪廓資訊中選擇)是否被包括在輸入音訊信號210的編碼表示212中。典型地，如果已選擇時間扭曲輪廓資訊描述一非恒定（變化）時間扭曲輪廓’那麼時間扭曲輪廓資訊僅被包括在該音訊信號的 ® 編碼表示212中。同樣，時間扭曲致動資訊232其本身可包括在編碼表示212中，例如以指示該時間扭曲致動或停用的一個一位元旗標的形式。 - 爲利於理解，應注意時間扭曲變換器220典型地包含一分析視窗器220a、一重新取樣器或「時間扭曲器」220b及一頻譜域變換器（或時間/頻率轉換器）22〇c。然而，視該實施而定’時間扭曲器220b可被放置於一以一信號處理方向一分析視窗器220a之前。然而，時間扭曲及時域到頻譜 ❹ 域變換在一些實施例中可被合併在一單一單元中。在下文中，關於時間扭曲致動信號提供器23〇之操作的細節將被描述。應注意時間扭曲致動信號提供器23〇可等同於時間扭曲致動信號提供器100。時間扭曲致動心號七供器23〇較佳地被設定組態以接收時域音訊信號表示210(也以a⑴標明）、新發現時間㈣輪廓資訊286 ’及標準時間扭曲輪廓資訊288。時間扭曲致動 22 201009812 信號提供器230也被設定組態以使用時域音訊信號210，獲得新發現時間扭曲輪廓資訊286及標準時間扭曲輪廓資訊 288 ’描述由於新發現時間扭曲輪廓資訊286之一能量集中的一能量集中資訊，且基於該能量集中資訊提供時間扭曲致動信號232。第2b圖繪示依據本發明之一實施例的一時間扭曲致動信號提供器234的方塊示意圖。時間扭曲致動信號提供器 234可發揮一些實施例中的時間扭曲致動信號提供器23〇的作用。時間扭曲致動信號提供器234被設定組態以接收一輸入音訊信號210，及兩個時間扭曲輪廓資訊286與288，且基於其提供一時間扭曲致動信號234p。時間扭曲致動信號 234p可發揮時間扭曲致動信號232的作用。時間扭曲致動信號提供器包含兩個相同時間扭曲表示提供器234a、234g，被設定組態以分別接收輸入音訊信號210及時間扭曲輪廓資訊286與288，且基於其分別提供兩個時間扭曲表示234e 及234k。時間扭曲致動信號提供器234進一步包含兩個相同能量集中資訊提供器234f及2341，被設定組態以分別接收時間扭曲表示234e及234k，且基於其分別提供能量集中資訊 234m及234r^時間扭曲致動信號提供器進一步包含一比較器234〇 ’被設定組態以接收能量集中資訊234πι及234η，且基於其提供時間扭曲致動信號234ρ。爲了利於理解，應注意時間扭曲表示提供器234a與 234g典型地包含(可選)相同的分析視窗器234b及234h、相同的重新取樣器或時間扭曲器234c及234i，及（可選)相同的頻 23 201009812 譜域變換器234d及234j。在下文中，用於獲得能量集中資訊的不同概念將被討論。事先將做一介紹以說明一典型音訊信號上之時間扭曲效果。在下文中，一音訊信號上時間扭曲之效果將參考第知圖及第3b圖被描述。第3a圖緣示—音訊信號的_頻譜的圖解表不。一橫座標301描述一頻率，一縱座標3〇2描述該音

訊信號之強度。一弧線303以頻率£的一函數描述未時間扭曲音訊信號的強度。

第3b圖繪不第3竭中表示的音訊信號的一時間扭曲版本的-頻f#之圖解麵，樣…橫座標獨描述一頻率， -縱座標3〇7描述該音補號之她錄本之強度。—狐線 308描述該音訊信號在頻率上的時間扭曲版本強度。從第3a 圖與第3b_圖解絲的__比較可看出，該音訊信號的未時間扭曲（未_」）版本包含—模糊頻譜，制在—較高頻域4目tb<下’該輸人音訊信號的時間扭曲版本包含具有月晰可區〃頻譜波峰的—頻譜，甚至在較高頻域中。另外’該等頻譜波峰的—中等銳化甚至可在該輸人音訊信號的時間扭曲版本的較低頻議域巾被看到。 -叫r所不的該輸入首訊彳§號的時間扭本之頻谱可’例如由量化器/編碼器260以比第3a圖所示扭曲輸\ a訊彳5號的頻譜較低的位元率被量化及編喝是由事實’·—模糊頻譜典型地包含-很大數目知相關頻譜係敖(即-相對很小數目的被量化為㈣ 24 201009812 化為很小值的頻譜係數），同時如第3圖所示的一「較不平坦」頻譜典型地包含一較大數目被量化為零或被量化為很小值的頻譜係數。被量化為零或被量化為很小值的頻譜係數可以比被量化為較高值的頻譜係數較少的位元被編碼，使得第3b圖的頻譜可使用比第3a圖的頻譜較少的位元被編碼。然而，也應注意到一時間扭曲的使用不總是產生該時間扭曲信號的編碼效率的一重要的改進。因此，在一些情況中，依據位元率，被需要用於該時間扭曲資訊(例如時間扭曲輪廓）之編碼的價格可能超出就位元率而言的節約，用於編碼時間扭曲變換頻譜（當較之於編碼未時間扭曲變換頻譜時）。在此情況中，較佳地，使用一標準（不變）時間扭曲輪廓提供該音訊信號之編碼表示，以控制該時間扭曲變換。因此，任何時間扭曲資訊（即時間扭曲輪廓資訊)之發送可被忽略(除指示該時間扭曲之停用的一旗標之外），由此保持該位元率很低。在下文中，用於一時間扭曲致動信號112、232、234p 的一可靠且計算上高效率的計算之不同概念將參考第 3c-3k圖被描述。然而，在這之前，所發明的概念之背景將被簡短概括。基本假定是以一變化基頻將時間扭曲施用於一諧波信號使該基頻恒定，且使該基頻恒定改進由一隨後的時間頻率變化獲得的頻譜之編碼，因為僅一有限數目的重要的線餘留（見第3b圖），而不是數個頻譜容量上不同諧波之模糊 25 201009812 (見第3a圖）。然而 “ ，甚至當一基頻變化被檢測到時，編碼增益上的改進(即所節在1(例如夕煜铷w 強雜訊’或如果該變化太小以至較高諧波解n _) ’或可少於需要將時間扭曲輪廓發送至該解碼态的位元夕金、 1，或可簡單地是錯的。在該等情況中，較佳地，拒絕由— 、時間扭曲輪廓編碼器產生的變化時間扭曲輪扉(例如286)，而相反使用—有效的— 一標準(不變)時間扭曲輪廓。

告、:發明，範圍包含一種判定一已獲得的時間扭曲輪廓 P伤疋否提供足夠的編碼增益(例如足以補償時間扭曲輪廓編碼所f要成本的編碼增益）时法之建立。 .所述，時間扭曲之最重要的層面是一較少數目線的頻°“b量集中（見第3a圖及第3b圖）。它們繪示—能量集中也相對應於-較「不平」_譜(見第關及第，因為該頻4之波峰與波谷之差被增加。誠量被集巾於少數線上，該等線在具有比之前較少的能量的線之間。

第3a圖與第3b圖繪示具有強諧波及基頻變化的一訊框的一未扭曲頻譜（第3a圖）與該相同訊框的時間扭曲版本的頻譜（第3b圖）的一示意性範例。考慮到該情況，已發現將頻譜平坦度量度用作該時間扭曲效率的—可能的量度是有利的。該頻譜平坦度可例如，由該功率頻譜之算術平均除功率頻譜之幾何平均被計算。例如，該頻譜平坦度(也以「平坦度」簡短地標明）可依據如下方程式被計算： 26 201009812

Flatness= 在上式中，x(n)表示一容量號碼n的大小。另外，在上式中’ N表示該頻譜平坦度量度之計算考慮到的頻譜容量之總數目。

在本發明之一實施例中，可用作一能量集中資訊的上述「平坦度」的計算可使用時間扭曲變換頻譜表示234e、 234k被執行’使得如下關係被保持： x(n)= | X | tw(n) 在此情況中，N可以等於由頻譜域變換器234d、234j 提供的頻譜線之數目，|x|tw(n)是一经時間扭曲變換頻譜表示 234e、234k。儘管該頻譜量度是用於該時間扭曲致動信號之提供的一有用的量，該頻譜平坦度量度的一個缺點，如信號對雜

汛比(SNR)量度，是如果被施用於整個頻譜，其以較高能量強調部份頻譜。通常，諧波頻譜具有一定頻譜傾斜，意指大部份該能量集中於前面的少數部份音調，且接著随增加的頻率而減少’導致該測量中較高部份的—代表性不足。這在一些實施例中是不想要的’由於希望改進此等較高部份的品質’因為它們變得最模糊（見第細）。在下文中，該頻譜平坦度量度之關聯性的改進之數個可選概念將被討論。在依據本發明一實施例中’ 一種與所謂的「分段式 27 2〇l〇〇98l2 量声j度相似的方法被選擇，產生—分頻段頻譜平括声別朗平坦度4度的—計算在許多頻帶中被(例如 1 具有相等:帶且寬主要::(7均)被採用。該等，樑度，如臨該等帶寬將跟隨1知編瑪，：頻帶，或相對應於，例如所謂的「先進音訊 ‘、、」也稱為AAC的量尺因子頻帶。

繪干:述概念將在下文參考第艾圖被簡短的解釋，第艽圖冋頻帶的頻譜平坦度量度的—個別計算的圖解表 :圖所不’ °亥頻5普可被分為不同的頻帶31卜312、313， =們可具有-相等的帶寬或可具有不同的帶寬。例如，一第—頻譜平坦度量度可針對第一頻帶3ιι，例如使用上文給出的「平坦度」方程式被計算。在該計算中，該第一頻帶的頻率槽可被考慮(遊動變量η可採用該第一頻帶的頻率槽的頻率槽減），且該第—頻帶3_寬度可被考慮（可變Ν I採用依據該第i帶的頻帶容㈣寬度）。因此，針對第一頻帶311的—平坦度量度被獲得。相似地，針對第二頻帶 3一12的—平坦度量度’可考慮到第二頻帶312的頻率槽及第頻帶的寬度而被计算。另外，附加頻帶如第三頻帶312的平坦度量度可以相同方法被計算。隨後’對不同頻帶3U、312、313的平坦度量度的一平均可破計算，且該平均可用作能量集中資訊。另方法（用於該時間扭曲致動信號的導出之改進)是將該頻譜平坦度量度僅施用於某1率。此—方法在第如圖中4月如圖所不’僅在頻譜的一高頻部份別中的頻率 28 201009812 槽針對該頻譜坦平度量度的計算被考慮。該頻譜的一低頻部份對於該頻講平坦度兩次的計算被忽略。高頻部份316對於該頻譜平坦度量度的計算可被考慮frequency-分頻段。可供選擇地，全部高頻部份316可針對該頻譜平坦度量度的計算在其整體中被考慮。综上所述，可以說頻譜平坦度的降低（由時間扭曲之施用產生）可被考慮為該時間扭曲的效果的一第一量度。例如，時間扭曲致動信號提供器100、230、234(或其〇比較器130、234〇)可使用一標準時間扭曲輪廓資訊，將時間扭曲變換頻譜表示234e的頻譜平坦度量度與時間扭曲變換頻譜表示234k的一頻譜平坦度量度進行比較，且基於該比較判定該施加扭曲致動信號是有效還是無效的。例如，當與沒有時間扭曲的情況相比時，如果該時間扭曲產生該頻譜平坦度量度的一充分的降低，那麼該時間扭曲藉由該時間扭曲致動信號的一適當的設定被致動。除上述方法以外，該頻譜的高頻部份可在低頻部份上 © 針對該頻譜平坦度的計算被強調（例如藉由一適當的定標）。第3e圖繪示一時間扭曲變換頻譜的圖解表示，在該時間扭曲變換頻譜中，一高頻部份在一低頻部份上被強調。因此’該頻譜中的高頻部份的一代表性不足被補償。因此，該平坦度度量度可在該被完整定標的頻譜中被計算，在該頻譜中高頻率槽在低頻率槽上被強調，如第3e圖所示。就位元節約而言，編碼效率的一典型量度將是感知熵’可以一種方式被界定，使得其與被需要以編碼在下述 29 201009812 文獻中描述的某一頻譜的位元之實際數目很好的聯繫起來：3GPP TS 26.403 V7.0.0: 3rd Generation Partnership Project; Technical Specification Group Services and System Aspects; General audio codec audio processing functions ； Enhanced aacPlus general audio codec ;Encoder specification AAC part: Section 5.6.1.1.3 Relation between bit demand and perceptual entropy。所以，該感知摘的減少是該時間扭曲之效率的另一量度。第3f圖繪示一能量集中資訊提供器325，可取代能量集中資訊提供器120、234f、2341，且可被用在時間扭曲致動信號提供器100、290、234中。能量集中資訊提供器325被設定組態以接收該音訊信號的一表示，例如，以一時間扭曲變換頻譜表示234e、234k的形式，也以|x|tw標明。能量集中資訊提供器325也被設定組態以提供一感知熵資訊 326，可取代能量集中資訊122、234m、234η。能量集中資訊提供器325包含一形式因子計算器327，被設定組態以接收時間扭曲變換頻譜表示234e、234k，且基於其提供一形式因子資訊328，該形式因子資訊328可與一頻帶相關聯。能量集中資訊提供器325也包含一頻帶能量計算器329，被設定組態以基於時間扭曲頻譜表示234e、 234k，計算一頻帶能量資訊en(n)(330)。能量集中資訊提供器325同樣包含許多線估計器331，被設定組態以對具有指數η的頻帶提供一經估計數目的線資訊nl(332)。另外，能量集中資訊提供器325包含一感知熵計算器333，被設定組態 201009812 以基於頻帶能量資訊330及該等經估計數目的線資訊332，計算感知熵資訊326。例如，形式因子計算器327可被設定組態以依據下述方程式計算形式因子： kOffset(n+\)~\ 伽⑻=Σ (η k=kOffset(n) ’ ❹

在上述方程式中，ffac(n)表示具有一頻帶指數n的頻帶之形式因子。k表示一遊動變量，在量尺因子頻帶（或頻帶化的頻譜容量指數上遊動。X(k)表示具有一頻譜容量指數（或一頻率槽指數)k的頻譜容量（或頻率槽）的一頻譜值。線估計器之數目可被設定組態以依據如下方程式估計非零線之數目，由nl表示： nl = (2) __ffacjn)_ (__) χθ.25 kOffset(n + 1)- kOffset(n) 在上述方程式中’en(n)表示具有指數n的頻帶或量尺因子頻帶的一能量。kOffset(n+l)-kOffset(n)表示一具頻譜容量的具指數η的頻帶或量尺因子頻帶的一寬度。另外，感知摘計算器332可被設定組態以依據如下方程式計算感知熵資訊sfbPe : sfbPe = nl * 1 ren\ ‘(tit) thr for log2(^-)>cl (c2 + c3 · log 2 ^0Γ 2 < c 1 (3) 在上文中，下述關係將被保持： cl = log2(8) c2 = log2(2.5) c3 = l-c2/cl (4) 一總的感知熵pe可被計算為多個頻帶或量尺因子頻帶 31 201009812 的感知熵之總和。如上所述，感知熵資訊326可被用作一能量集中資訊。對於關於感知熵之計算的進一步細節，參考國際標準「3GPPTS 26.403 V7.0.0(2006-06)」的第 5.6.1.1.3 節。在下文中，一概念將針對時域中的能量集中資訊之計算被描述。再看TW-MDCT(時間扭曲改良型離散餘弦轉換）是以一種方式改變該信號，以具有一個方塊中的一恒定或幾乎恒定基頻的基本觀念。如果一恒定基頻被實現，意味著一個處理塊的自相關之最大值增加。既然找到對於時間扭曲及未時間扭曲情況之相對應的自相關中的最大值沒有意義，正規化自相關的絕對值之總和可被用作該改進的一量度。該總和的一增加相對應於該能量集中的一增加。該概念將在下文中參考第3g圖、第3h圖、第3i圖、第 3j圖及第3k圖被詳細描述。第3g圖繪示時域中一未時間扭曲信號的一圖解表示。一橫座標350描繪時間，一縱座標351描繪該未時間扭曲時間信號的一位準a(t)。一弧線352描繪未時間扭曲時間信號的時間上的演變。假定由弧線352描繪的該未時間扭曲時間信號之頻率隨時間增加，如第3g圖所示。第3h圖繪示第3g圖的時間信號的一時間扭曲版本的圖解表示。一橫座標355繪示經扭曲時間（例如以一正規化的形式），一縱座標356繪示信號a⑴的時間扭曲版本a(tw)的位準。如第3h圖所示，未時間扭曲時間信號a(t)的時間扭曲版 32 201009812 本a(tw)包含（至少近似地)在經扭曲時域中一時間上恒定的頻率。換句話說，第3h圖續·示如下事實：_時間上變化的頻率的一時間信號藉由一適當的時間扭曲操作被變換為一時間上恒定頻率的一時間信號，該變換可包含一時間扭曲重新取樣。第3i圖繪示未扭曲時間信號a(t)的一自相關函數的一圖解表示。一橫座標360繪示一自相關滯後τ，一縱座標361繪示該自相關函數的一大小。標記362繪示自相關函數Ruw(T) 的一演變，作為自相關滯後τ的一函數。如第3i圖所示，未扭曲時間信號a(t)的自相關函數Ruw包含一 τ=〇的峰值（由信號a(t)的能量反映），且样〇時為很小值。第3j圖繪示時間扭曲施加信號a(tw)的自相關函數R…的圖解表示。如第3j圖所示，自相關函數Rtw包含τ=〇的—峰值’且也包含自相關滯後τ的其他值々、、A的峰值。此等 τι、τ2、&的附加峰值由時間扭曲之效果獲得，以增加時間扭曲時間h號a(tw)的週期性。當與自相關函數⑴相比時”玄週期性由自相關函數‘⑴的附力口波峰反映。因此， δ較之於原始曰δ凡彳§號的自相關函數時，時間扭曲音訊信號的自相關1^數之附加波峰（或波峰之增加的強度）的存在，可被用作時間扭曲的效能(就—位元率減少而言）的—指示。第处圖緣不一能量集中資訊提供器370的一方塊示意圖，其被設定組態以接收該音訊信號，例如時間扭曲信號 33 201009812 234e、234k的一時間扭曲時域表示（頻譜域變換234d、23喇及可選擇的分析視窗器234b及234h被忽略），且，基於其提供一能量集中資訊374,該資訊374可發揮能量集中資訊122 的作用。第3k圖的能量集中資訊提供器370包含一自相關計异器371，被設疋組態以計算時間扭曲信號a(tw)在離散值τ 的一預定範圍上的自相關函數Rtw(i:)。能量集中資訊提供器 370也包含一自相關加法器372 ’被設定組態以將自相關函數Rtw(T)的多個值(例如’在離散值τ的一預定範圍上)相加，且提供所獲得的總和作為能量集中資訊122、234m、。 © 因此’能莖集中資訊提供器370允許提供指示該時間扭曲效果的一可靠資訊，而不需實際上執行輸入音訊信號21〇的時間扭曲時域版本的頻譜域變換。因此，只要發現基於 - 由能量集中資訊提供器370提供的能量集中資訊122、 234m、234η ’時間扭曲實際產生一改進的編碼效率，則執行輸入音訊信號310之時間扭曲版本的一頻譜域變換即為可行。綜上所述’依據本發明之實施例建立用於最終品質檢〇測的一概念。一產生的基頻輪廓（用於一時間扭曲音訊信號編碼器中）依攄其編碼增益被評估，且被接收或拒絕。數個關於該頻譜之稀疏或編碼增益之量度可被該判定考慮，例如，一頻譜平坦度量度、一分頻段分段頻譜平坦度量度，及/或一感知熵。不同頻譜集中資訊的使用被討論’例如，一頻譜平坦度量度的使用，一感知烟量度的使用，及—時域自相關量 34 201009812 度的使用。然而，仍有顯示一時間扭曲頻譜中之一能量集中的其他量度。所有的該等量度可被使用。較佳地，對於所有該等量度而言，一未扭曲與一時間扭曲頻譜的量度之比被界定，且一臨界值對於該編碼器中的該比被設定，以判定已獲得的時間扭曲輪廓在編碼中是否有利。所有該等量度可被施用於一全訊框中，在該訊框中僅三分之一該基頻輪廓是新的（其中，例如，該基頻輪廓的三部份與該全訊框相關聯），或較佳地僅對於部份該信號，對於部份該信號，該新部份例如使用以位於該（各自）信號部份中心的一低重疊視窗的變換被獲得。自然，一單一量度或上述量度的一合併可被使用，如所希望的。第4a圖繪示一種用於基於一音訊信號提供一時間扭曲致動信號之方法的流程圖。第4a圖的方法400包含提供一能量集中資訊的一步驟410,該能量集中資訊描述該音訊信號的一時間扭曲變換頻譜表示中之一能量集中。方法400進一步包含將該能量集中資訊與一參考值相比較的一步驟 420。方法400也包含依據該比較之結果提供時間扭曲致動信號的一步驟430。方法400可由本文描述的任何特徵及功能關於該時間扭曲致動信號的提供而被補充。第4b圖繪示一種用於編碼一輸入音訊信號以獲得該輸入音訊信號的一編碼表示之方法的流程圖。方法450可選擇 35 201009812 地包含基於該輸入音訊信號提供一時間扭曲變換頻譜表示的一步驟460。方法450也包含提供一時間扭曲致動信號的一步驟470。步驟470可，例如包含方法4〇〇之功能。因此，該能量集中資訊可被提供’使得該能量集中資訊描述該輸入音訊信號的時間扭曲變換頻譜中之一能量集中。方法450 也包含一步驟480，依據該時間扭曲致動信號，使用一新發現時間扭曲輪廓資訊提供該輸入音訊信號的時間扭曲變換頻譜表示的一描述，或使用一標準（不變）時間扭曲輪廓資訊提供該輸入音訊信號的一未時間扭曲變換頻譜表示的描 ❹ 述，以包含在該輸入信號的編碼表示中。方法45 0可藉由本文討論的任何特徵及功能關於該輸 ' 入音訊信號之編瑪被補充。 - 第5圖繪示依據本發明的一音訊編碼器的一較佳實施例，其中本發明的數個層面被實施。一音訊信號被提供於一編碼器輸入500處。該音訊信號將典型地是一離散音訊信號，該離散音訊信號使用被稱作正常取樣率的一取樣率從一類比音訊信號被導出。該正常取樣率不同於在一時間扭 n 曲操作中產生的一局部取樣率，且輸入500處的音訊信號之正常取樣率是產生由一恒定時間部份分離的音訊樣本的恒定取樣率。該信號被輸入一分析視窗器502，在該實施例中’分析視窗器502被連接至一視窗功能控制器504。分析視窗器502被連接至一時間扭曲器506。然而，依據該實施，時間扭曲器506可被置於—以一信號處理方向—分析視窗器502之前。當一時間扭曲特性被需要用於方塊5〇2的分析 36 201009812 視窗化時，且當該時間扭曲操作要被執行於時間扭曲樣本上而非未扭曲樣本上時，該實施是較佳的。特別在國際專利申明案PCT/EP2009/002118 ’ Bernd Edler等人的「Time

Warped MDCT」所描述的基於mdct的時間扭曲之内文中。對於其他N•間扭曲施用諸如L.villemoes在2005年11月提出的國際專利申請案凡:丁/砂細⑽收牝彳耵⑽^^^

Transform Coding 〇f Audio Signals」中描述的，時間扭曲器 506與分析視窗器502之間的佈置可依據所需被設定。此外，一時間/頻率轉換器508被提供用於執行一時間扭曲音訊信號到一頻譜表示的一時間/頻率轉換。該頻譜表示可被輸入至一TNS(時域雜訊修整)級51〇，其提供TNS資訊作為一輸出51〇a，且提供頻譜殘餘值作為一輸出510b。輸出51〇b 被耦接至-量化器及編碼器塊512，該量化器及編碼器塊 512可由一感知模型514控制，用於量化一信號，使得該量化雜訊被隱藏在該音訊信號的感知遮蔽臨界值之下。此外，第5a圖繪示的編碼器包含一時間扭曲分析器 516，可作為一基頻追蹤器被實施，其在輸出518處提供— 時間扭曲資訊。線518上之信號可包含—時間扭曲特性、— 基頻特性、-基頻輪廓，或由時間扭曲分析器分析的信號疋-諧波信號抑或-非諧波信號的資訊。該時間扭曲分析器也可實祕财聲語音與無聲語音的魏。然而，依據該實施’及-信齡㈣5财碰實施，該有聲,無聲判定也可由信號分類器完成。在此情財，該時間扭曲分析器沒必要必須執行相同的功能。時間扭曲分析器輸出518 37 201009812 被連接至包含視窗功能控制器5〇4、時間扭曲器506、TNS 級510、量化器與編碼器512及一輸出介面522的功能組中的至少一個且較佳地多於一個的功能。類似地，信號分類器52〇的一輸出522可被連接至包含視窗功能控制器504、TNS級510、一雜訊注入分析器524或輸出介面522的功能組中的至少一個且較佳地多於一個的功能。此外，時間扭曲分析器輸出518也可被連接至雜訊注入分析器524。雖然第5a圖繪示分析視窗器輸入5〇〇上的該音訊信號 © 被輸入至時間扭曲分析器516及信號分類器520的情況，該等功能的輸入信號也可擷取自分析視窗器5〇2對於信號分類器之輸出，甚至可掏取自時間扭曲器5〇6、時間/頻率轉 · 換器508的輸出或TNS級510的輸出。除由量化器編碼器512在526處指示的一信號輸出外，輸出介面522接收TNS旁資訊510a、一感知模型旁資訊 528 ’其可包括編碼形式的置尺因子，針對較先進時間扭曲旁資遠如線518上之基頻輪廊及線522上之信號分類資气的時間扭曲指示資料。此外，雜訊注入分析器524也可將輸出530上的輸出雜訊注入資料輸出至輸出介面522中。輸出介面522被設定組態以在線532上產生編蜂音訊輸出資料，以發送至一解碼器，或儲存在一儲存裝置諸如記憶體裝置中。依據該實施’輸出資料532可包括到輪出介面522的所有輸入，或如果該資訊不被一相對應的具有一減少的功能的解碼器所需要’或如果該資訊由於經由_不同發送通道 38 201009812 的一發送已在該解碼器處可用時，可包含較少資訊。第5a圖繪示的編碼器可被實施成mpeg-4標準中所定義的，除第5圖中發明的編碼器中說明的，由較之於mpeg_4 標準，具有一先進功能的視窗功能控制器504、雜訊注入分析器524、量化器編碼器512及1^5級51〇所表示的功能之外。一進一步描述在AAC標準（國際標準13818-7)或3GPP TS 26.403 V7.0.0: Third generation partnership project; technical specification group services and system aspect; general audio codec audio processing functions; enhanced AAC plus general audio codec ° 隨後，第5b圖被討論，第5b圖繪示用於經由輸入540解碼一編碼的音訊信號的一音訊解碼器的一較佳實施例。該輸入介面540作用以處理該編碼的音訊信號，使得資訊的不同資訊項從線540上之信號被擷取。該資訊包含信號分類資訊541 '時間扭曲資訊542、雜訊注入資料543、量尺因子 544、TNS資料545及編碼頻譜資訊546。該編碼頻譜資訊被輸入至一熵解碼器547，熵解碼器547可包含一霍夫曼解碼器或一算術解瑪器，假如第5a圖的方塊512中的編碼器功能被實施成一相對應的編碼器，諸如一霍夫曼編碼器或—算術編碼器。該解碼頻譜資訊被輸入至,一重新量化器55〇中，該重新量化器550被連接至一雜訊注入器552。雜訊注入器 552的輸出被輸入至一反TNS級554中，反TNS級554另外接收線545上之TNS資料。依據該實施，雜訊注入器552及TNS 級554可以不同的順序被施用，使得雜訊注入器552操作於 39 201009812 入資料上。此外，一

TNS級554輸出資料上而不是在TNs輸頻率/時間轉換器556被提供，其饋送一信號處理鏈的輸出，較佳地執行—重? 視窗器被施用成在560處指示的。時 MDCT的編碼/解碼演算法n由於重疊/加人步驟從一個方塊到下-個的固有交叉淡入淡出操作被有利地用作該等處理鏈中最後的操作，使得所有的區塊效應被有效蘭 ❹ 此外，一雜訊注入分析器562被提供，被設定組態以控制雜訊注入器552，且接收時間扭曲資訊542及/或信號分類 · 資訊541及在重新量化頻譜上的資訊，依據可能的情況，作為一輸入。較佳地’此後所描述的全部功能被一起施用於一編碼音訊編碼器/解碼器方案中。然而，此後所描述的功能也可被獨立地施用於彼此，即，使得僅一個或一組但非全部該 © 等功能在某一編碼器/解碼器中被實施。隨後’本發明之雜訊注入層面被詳細地描述。在一實施例中，由第5a圖的時間扭曲/基頻輪廓工具516 提供的附加資訊被有利地用於控制其他編碼解碼工具，且特定地，由編碼器端雜訊注入分析器524實施及/或由解碼器端雜訊注入分析器562及雜訊注入器552實施的雜訊注入工具。 40 201009812 AAC結構中的數個編碼器工具諸如一雜訊注入工具由基頻輪廓分析收集的資訊及/或由信號分類器520提供的一信號分類的一附加知識被控制。一發現的基頻輪廓以一清晰諧波結構指示信號段，所以雜訊注入諧波線之間可能降低感知品質，特別是語音信號上的，因此當找出一基頻輪廓時，雜訊位準被降低。否則，在部份音調之間會有雜訊，此與對一模糊頻譜增加量化雜訊具有相同的效果。另外，雜訊位準降低量可藉由使用信號分類器資訊被進一步精化，所以，例如對於語音信號將不會有雜訊注入，且一中度雜訊注入將以一強諧波結構被施加於通用信號。大體上，在複數個零已從一編碼器被發送至一解碼器’即’第5a圖中的量化器512將頻譜線量化為零的情況，雜訊注入器552用於將頻譜線插入一解碼頻譜。當然，將頻譜線量化為零大大降低了已發送信號的位元率，且理論上’當該等頻譜線由感知模型514判定在感知遮蔽臨界值之下時，該等（小）頻譜線的消除是不可聽見的。然而，已發現可包括許多相鄰頻譜線的該等「頻譜孔」產生一相當不自然的聲音。因此’一雜訊注入工具被提供以在線由一編碼器端量化器量化為零的位置處插入頻譜線。該等頻譜線可具有一隨機振幅或相位，且該等解碼器端综合頻譜線使用如第5a圖所示在蝙碼器端被判定的一雜訊注入量度，或依第5b圖所示在解碼器端由可選方塊562判定的一量度而定被比例調整。因此，第5&圖中的雜訊注入分析器524被設定 41 201009812 組態以對於該音訊信號的一時框，估計被量化為零的音訊值的一能量之一雜訊注入量度。。在本發明之一實施例中，用於編碼-線5〇〇上之音訊信號的音訊編石馬器包括量化器512，被設定組態以量化音訊值此外量化器512被設定組態以將在一量化臨界值之下的曰訊值量化為零。該量化臨界值可以是一基於階的量化器的第-階，用於判定是否某—音訊信號被量化為零，即，被量化為一零的量化指數，抑或被量化為一，即，指示該音訊值在該第-臨界值以上之「―」的量化指數。雖㈣ © 5a圖的！化器被繪示成執行頻域值之量化，該量化器也可被用於在-可供選擇的實施例中量化時域值，在該實施例中，雜讯注入在時域而非在頻域中被執行。 · 雜訊注入分析器524被實施成一雜訊注入計算器，用於估^該音訊信號的一時框之由量化器512量化為零的音訊值的一能量之一雜訊注入量度。此外，該音訊編碼器包含第6a圖所示的—音訊信號分析器6〇〇，被設定組態以分析該音汛彳s號的時樞具有一諧波特性抑或一語音特性。信號分 © 析器600可’例如包含第&圖的方塊516或第化圖的方塊 520 ’或可包含用於分析一信號是一諧波信號抑或一語音信號的任何其他裝置。因為時間扭曲分析器516被實施以總是尋找一基頻輪廓，且因為一基頻輪廓的存在指示該信號的諧波結構，第6a圖中的信號分析器6〇〇可被實施成一基頻追蹤器或一時間扭曲分析器的一時間扭曲輪廓計算器。邊音訊編碼器另包含第6a圖所示的一雜訊注入位準調 42 201009812 處器602，其輸出一經調處雜訊注入量度/位準以被輸出至第5a圖的530處所指示的輸出介面522。雜訊注入量度調處器602被設定組態以依據該音訊信號的諧波或語音特性調處該雜訊注入量度。該音訊編碼器另包含輸出介面522用於產生一編碼信號供發送或儲存之用，該編碼信號包含由線 530上的方塊602輸出的經調處雜訊注入量度。該值相對應於由第5b圖所示的解碼器端實施中的方塊562輸出的值。如第5a圖及第5b圖所示，雜訊注入位準調處可在—編碼器中被實施或在一解碼器中被實施，或在該等兩個裝置中被實施。在一解碼器端實施中，用於解碼一編碼音訊信號的解碼器包含輸入介面539,用於處理該線540上編碼信號，以獲得一雜訊注入量度，即線543上雜訊注入資料，及線546上之編碼音訊資料。該解碼器另包含一解碼器547及重新量化器550用於產生一重新量化的資料。此外’該解碼器包含一信號分析器6〇〇(第6a圖），可在第5b圖雜訊注入分析器562中被實施成檢索該音訊資料的一時框具有一諧波抑或語音特性的資訊。另外，雜訊注入器552被提供以產生雜訊注入音訊資料，其中雜訊注入器552被設定組態以產生雜訊注入資料，以回應經由編碼信號發送且由線543上之輸入介面產生的雜訊注入量度，及由信號分析器516及/或550在編碼器端定義的或項562在解碼器端定義的，經由處理及解釋指示某— 時框是否受到一時間扭曲處理的時間扭曲資訊542的音訊資料的諧波或語音特性。 43 201009812 一此外，該解碼器包含一處理器，用於處理重新量化的貧料及雜訊注人音訊資料，以獲得__解碼音訊信號。該處理器可依據可能的情況包括第5b圖中的項554、556、558、 560。此外’依據該編碼器/解碼器演算法的特定實施該處理器可包括由，例如在-時域編碼器中，諸如AMR WB+ 編碼器或其他語音編料巾提㈣其他處理塊。囚此

赞月的雜訊注入調處可在該編碼器端僅藉由計算該簡單雜訊量度，及藉由基於—諧波/語音資訊調處該雜：量Ϊ ’及藉由發送已被正確調處’可接著由-解碼器以-簡早方式被施用的雜訊注人量度被實施。可供選擇 j該未調處雜訊注人量度可從-編碼器被發送至-解石馬器’且該解碼器將進而分析—音訊錢的實際時枢是否己 \ 肖即m皮抑或語音特性，使得該雜訊 /入度的實際調處在該解竭器端發生。隨後’第你®被討論以解釋⑽喊該雜訊位準估計的較佳實施例。

，衫-實施例中，當該信號不具有—職或語音特性時正常雜訊位準被施用。這是當沒有時間扭曲被施用 ^情二此外’當—信號分類器被提供時，那麼區分語音 ’、’、°°曰的“號提供器將指示該情況無語音，在該情況中時間扭曲無效，即，沒有基頻輪廊被發現。一然而，當時間扭曲有效時，即，當指示一諧波内容的基頻輪輪發現時’那麼該雜訊注人位準將被調處為低於正常以。當-附加錢分類器被提供時，那麼該信號 44 201009812 分類器指示語音，且同時當該時間扭曲資訊指示一基頻輪廓時，那麼一較低或甚至為零的雜訊注入位準被發信。因此’第6a圖的雜訊注入位準調處器6〇2將降低調處雜訊位準至零，或至少為低於第6b圖中指示的很低值的一值。較佳地，該信號分類器另具有第6b圖左邊指示的一有聲/無聲檢測器。在有聲語音的情況中，一很低的或零雜訊注入位準被發k /施用。然而，在無聲音訊的情況中，時間扭曲指示由於沒有基頻被發現而不指示一時間扭曲處理，但是信號分類器發信語音内容的情況中，該雜訊注入量度不被調處’但是一正常雜訊注入位準被施用。較佳地，該音訊信號分析器包含一基頻追蹤器用於產生該基頻的一指示，諸如一基頻輪廓或該音訊信號的一時框之一絕對基頻。接著，該調處器被設定組態以當—基頻被發現時，降低該雜訊注入量度，且當一基頻未被發現時不降低該雜訊注入量度。如第6a圖所示，一信號分析器6〇〇當被施用於該解碼器端時，不像一基頻追蹤器或一有聲/無聲檢測器那樣執行一實際信號分析，但是該信號分析器剖析該編碼音訊信號，以擷取一時間扭曲資訊或一信號分類資訊。因此，信號分析器600可在第5b圖解碼器的輸入介面539中被實施。本發明之一進一步的實施例將參考第7a-7e圖被隨後討論。對於一有聲語音部份在一相對安靜信號部份後開始的語音之起始點而言，塊切換演算法可將其分類成—起始 45 201009812 ❹ (attack) ’且可以具有—清晰諧波結構的一信益損失選擇該料訊框的料。因此，該基頻聲/無聲分難祕檢财聲絲，賴免賴姆^有指不圍繞該發現起始點的—㈣起始。該特徵也可盘評號分類料接㈣止語音錢上㈣切換，且允許對所有的其他信號。另外，該塊切換的—更精細控制可藉由不僅允許或不允許起始檢測，且亦使用—基於有聲起始及信號分類資訊的起始檢測可變臨界值被實施。另外，爷資訊可被用以檢測類似上述有聲起始的能量突升，而不= 換至短塊，使用仍是較佳頻譜解析度的具短重疊的長視窗，但是減少前後回音可產生的時間區域。第”圖繪示未匹配的典型行為，第7e圖繪示匹配的兩個不同可能性（防止及低重疊視窗）。

依據本發明一實施例的一音訊編碼器操作以產生一音訊信號，諸如由第5a圖的輸出介面522輸出的信號。該音訊編碼器包含一音訊信號分析器，諸如第5a圖的時間扭曲分析器516或一信號分類器520。大體上，該音訊信號分析器分析該音訊信號的一時框具有一諧波抑或語音特性。為此’第5a圖的信號分類器520可包括一有聲/無聲檢測器520a 或一語音/無語音檢測器520b。雖然未示於第7a圖，可包括一基頻追縱器的一時間扭曲分析器，諸如第5a圖的時間扭曲分析器516也可被提供以不用項520a及520b，或與該等功能一起被提供。此外，該音訊編碼器包含視窗功能控制器 504，用於依據由該音訊信號分析器判定的該音訊信號之一 46 201009812 6皆波或語音特性’選擇一視窗功能。視窗器5〇2進而視窗化該音訊信號’或依據該某一實施，使用已選擇視窗功能視囪化該時間扭曲音訊信號，以獲得一視窗型訊框。該視窗汛框接著進—步被—處理器處理，以獲得一編碼音訊信號。该處理器可包含第5a圖所示的項508、510、512，或習

知的音訊編碼器諸如基於變換音訊編碼器，或包含一LPC 慮波器’諸如語音編碼器及’特定地依據AMR-WB+標準被實施的語音編碼器的基於時域音訊編碼器之差不多的功能。在一較佳實施例中，視窗功能控制器504包含一暫態檢測器700 ’用於檢測該音訊信號中的一暫態，其中該視窗功月b控制器被設定組態以當一暫態被檢測到，i 一譜波或語音特性沒有被該音訊信號分析器發現時，將一長塊的一視由功能切換至一短塊的一視窗功能。然而，當一暫態被檢測到，且一諧波或語音特性被該音訊信號分析器發現時，那麼視窗魏控制^ 5G4不㈣視窗魏娜至短塊。指示沒有暫態賴得時的-長視t及—暫態被該暫態檢測器檢、J到時的一短視窗之視窗功能輸出如第以圖的7〇1及所不。由習知AAC編碼器執行的該正常步驟在第7(1中被說明。在财聲起始的位置上，暫態檢卿7婦剩能量從 —個訊框到下-訊框的増加，且因此，從一長視窗7胸換至短視窗712。爲了順應該切換’ 一長終止視窗714被使用，其具有-第-重疊部份714a、一非頻疊部份满、一第二較短重疊部份714e，及在由2_個樣本指示的時間轴上的 47 201009812 點與點之間延伸的一零值點716。接著，在712被指示的短視窗之順序被執行，接著由具有與未示於第7d圖中的下一個長視窗重疊的-長重叠部份718a的-長起始視窗718被另外，該視窗具有一非頻疊部份718b 胃叫，、f®节卜τ刀/ 、一夺迁室疊^ 伤718c及-在時間轴上在點之間延伸直到第點的一零值部份720。該部份是—零值部份。 L常至短視®的切換是有用的，以避免會在該暫越 ^間前在-訊財發生的前回音，航框是有聲起始，: 般而β ’疋該語音之開始或具有一譜波内容的一信號之開始的位置。大體上’當—基頻追蹤器判定—信號具有一基頻時’刻s號具有—譜波内容。可供選擇地，有其他纪證波量度諸如在某一最小位準之上的一音調量度與凸出波峰在-彼此的-諧波關係中的特性。多個進一步的技摘存在以判定一信號是否為諧波的。

短視由的-缺點是頻率解析度被降低，因為該時間飼析度被增加。對於語音，且特職有聲語音部份或具有一很強諧波内容的高品質編碼而已，-好的解析度被f 2因此在516、520或520a、5獅處所示的音訊信號分 :器操作以將—停用信號輸出至暫態檢測器700,使得當一 =語音段或具有~很_波特性的-信號段被檢測至， Μ::::的—切換被防止。這保證，對於編碼這樣纪音與另-方面對於被維持。這是—方面的㈣的基頻之高品質且高::號的基頻或—諧波非語音信餓析度編碼之間的一折中。已發現售 48 201009812 諧波頻譜較之於會發生的任何前回音沒有被精確地編碼時更加令人煩擾。爲了進一步降低前回音，一TNS處理有利於此一情況，該TNS處理將連同第8a圖與第8b圖被討論。在第7b圖所示的一可供選擇的實施例中，該音訊信號分析器包含一有聲/無聲及/或語音/非語音檢測器52〇&、 520b。然而，包括在該視窗功能控制器中的暫態檢測器7⑽ 如第7a圖所示被完全致能/去能，但是包括在該暫態檢測器中的臨界值使用一臨界值控制信號7〇4被控制。在該實施例中，暫態檢測器700被設定組態以判定該音訊信號的一定量特性’且將該定量特性與該可控的臨界值相比較，其中當該定量特性具有與該可控臨界值的一預定關係時，一暫態被檢測到。該定量特性可以是指示從一個方塊到下一個方塊的能量增加的一數字’且該臨界值可以是一一定臨界能量增加。當從一個方塊到下一個的能量增加高於該臨界值能量增加時，那麼一暫態被檢測到，使得，在這種情況中，該預定關係是一「高於」關係。在其他實施例中，該預定關係也可以是一「低於」關係，例如當該定量特性是一反月&量增加時。在第7b圖的實施例中’該可控臨界值被控制，使得當該音訊信號分析器已發現一諧波或語音特性時，一視窗功能到一短塊的切換之似然被降低。在該能量增加實施例中，臨界值控制信號704將產生該臨界值的一增加，使得到短塊的切換僅當從一個方塊到下一個的能量增加是一特別南的能量增加時發生。在一可供選擇地實施例中，來自有聲/無聲檢測器520a 49 201009812 或g /非曰檢測器520b的輸出信號也可被用以用如下方法控制視窗魏控制㈣4 ;職至長於該視f功能的的一視窗功能，而不是切換至一語音起始處的一短塊，因為該短塊被執行。該㈣功能紐比_短視窗功能較高的— 頻率解析度，但是具有一比長視窗功能較短的長度，使得一方面的前回音與另一方面的充分的頻率解析度之間的獲得一良好折衷。在一可供選擇的實施例中，到具有一較小重疊的視窗功能的一切換可如第7e圖中7〇6處的剖面綫所指示的被執行。視窗功能706具有如長塊的一 2〇48個樣本的 ❿ 長度，但是該視窗具有一零值部份7〇8及一非頻疊部份 710 ’使得從視窗706到一相對應視窗707的一短重疊長度 712被獲得。視窗功能707再具有區域712的左邊的一零值部 - 份，及區域712右邊的一非頻疊部份，與視窗功能71〇相似。該低重疊實施例，有效地產生一較短時間長度用於降低由於視窗706與707的零值部份的前回音，但是另一方面具有由於重疊部份714及非頻疊部份71〇的一充分的長度，使得一充足的頻率解析度被維持。 ◎ 在由AAC編碼器實施的較佳MDCT實施中，維持某一重疊提供如下附加優勢：在該解碼器端，一重疊/加入處理可被執行，這意味著塊之間的一種交又淡入淡出被執行。這有效地避免了區塊效應。此外，該重疊/加入特徵提供該交叉淡入淡出特性’而不增加位元率，即，一精密的經取樣交叉淡入淡出被獲得。在正對長視窗或短視窗中，該重整部份是由重疊部份714指示的一 50%的重憂。在視窗功育t 50 201009812 為2048個樣本長的實施例中，該重疊部份是5〇%，即ι〇24 個樣本。具有一較短重疊的視窗功能較佳地少於5〇%，且在第7e圖實施例巾，僅為128個樣本，是整個視窗長度的 1/16，該較短重疊被用於有效地視窗化一語音起始或一諧波信號的起始。較佳地，在全部視窗功能長度的1/4與1/32 之間的重疊部份被使用。

❹ 第7c圖繪示該實施例，其中一示範性有聲/無 520a控制包括在視窗功能控制器5〇4中的一視窗形狀選擇器’以用749處指示的一短重疊選擇一視窗形狀，或用如75〇處指示的-長重疊選擇一視窗形狀。當有聲，無聲檢測器 500a在751處發出-有聲檢測信號時，該等兩個形狀之—的選擇被實*，祕分析的音婦射叹帛㈣的輸入5〇〇處的曰訊信號，或是諸如一時間扭曲信號或已受到任何其他預處理功能的-音黯號的—預處理音訊信號。較佳地，當包括在該視窗功能控制器中的_暫態檢測器將檢測到-暫態，且如連同第7a圖所討論的將命令從_長視窗功能到-短視窗魏的切換時包括在“竭的㈣功能控制器504中的第7e圖中的視窗形狀選擇器5似僅使用产號 751。較佳地，該視窗功能切換實施例與連同“圖與^ 圖所討論的-時域雜訊整修實施例結合。然而，該彻(時域雜訊修整)實施例也可被實施，而不需要塊切換實包* 時間扭曲MDCT的頻譜能量集中性質也二^= 修整(TNS)工具，因為該TNS增益趨於減少時間才丑曲訊柩，尤其是一些語音信號。然而希望致動^^^ 以例如在不需 51 201009812 要塊切換，但是該語音信號的時間包絡顯示迅速改變的情況下減少有聲起始或偏移（參考塊切換匹配）的前回音。典型地，一編碼器使用某一量度以查看TNS對一特定訊框之應用’例如當應用至頻譜時TNS濾波器之預測增益是否有成效。所以一可變TNS增益臨界值是較佳地，其對具有一有效基頻輪廓的片段較低，因此確保TNS對這種類似有聲起始的重要信號部份更經常地有效。當用其他工具時，此亦可將信號分類計入考慮而被實施。依據本實施例用於產生一音訊信號的音訊編碼器包含 © 一可控時間扭曲，諸如扭曲5〇6用於時間扭曲該音訊信號，以獲得一時間扭曲音訊信號。此外，用於將至少一部份的時間扭曲音訊信號轉換至一頻譜表示的一時間/頻率轉換器508被提供。時間/頻率轉換器5〇8如從AAC編碼器習知的

實施-MDCT變換’但是該時間/頻率轉換器也可執行任何其他種類的變化，諸如一DCT、DST、DFT，FFT或MDST 變換，或可包含一濾波器組諸如一QMF濾波器組。此外’該編碼器包含一時域雜訊修整級510,用於依據 ❹ 該時域雜訊修整控制指令執行該頻譜表示的頻率上的一預測渡波’其中當該時域雜訊修整控制指令不存在時，該預測濾波不被執行。此外，°亥編竭器包含一時域雜訊修整控制器，用於基於該頻譜表示產生該時域雜訊修整控制指令。 :特疋地料域雜訊修整控制器被設定組態以當該頻是基；日夺間扭曲信號上時，增加該似然，用於執 52 201009812 行頻率上之預測濾波，或當該頻譜表示不是基於一時間扭曲信號上時，減少該似然，以執行頻率上之預測濾波。該時域雜訊修整控制器的說明連同第8圖被討論。該音訊編碼器另又包含一處理器，用於進一步處理頻率上之預測濾波的一結果’以獲得編碼的信號。在一實施例中，該處理器包含第5a圖中繪示的量化器編碼器級512。第5a圖中繪示的一 TNS級510在第8圖中被詳細說明。較佳地’包含在級510中的該時域雜訊修整控制器包含一 TNS增益計算器800、一隨後被連接的TNS判定器802及一臨界值控制信號產生器804。依據來自時間扭曲分析器516或信號分類器520或兩者的一信號，該臨界值控制信號產生器 804輸出一臨界值控制信號806至該TNS判定器。TNS判定器 802具有一可控臨界值，依據臨界值控制信號8〇6被增加或減少。在本實施例中’在TNS判定器802中的該臨界值是一 TNS增益臨界值。當由塊800輸出的實質上以計算的TNS增益超出該臨界值’接著該TNS控制指令需要一TNS處理作為輸出，而在其他情況中，當TNS增益在TNS增益臨界值之下時’沒有TNS指令被輪出’或沒有一指示該tnS處理沒用且在該特定時框中將不被執行的信號被輸出。 TNS增益計算器800接收從該時間扭曲信號導出的頻譜表示作為一輸入。典型地，一時間扭曲信號將具有一較低TNS增益，但是另一方面，由於時域中時域雜訊修整特徵的一 TNS處理疋該特定情況中的受益者，存在受到一時間扭曲操作的一有聲/諧波信號。另一方面，該TNS處理在 53 201009812 TNS增益很低的情況中没用，意指線51〇1)上的TNS殘餘信號具有與TNS級510之前的信號相同的或較高的能量。在線 510d上TNS殘餘信號的能力稍微低於TNS級51〇之前的能量的情況中’該TNS處理也可能不具優勢，因為由於量化器/ 烟編碼器級512高效地使用的信號中稍小的能量之位元減少小於由地5a圖中51〇a處指示的tns旁資訊的必要發送引入的位元增加。雖然一個實施例自動對所有的訊框在TNS 處理上切換，其中一時間扭曲信號是由來自塊516的基頻資訊或來自塊520的信號分類器資訊指示的輸入，一較佳實施例同樣維持停用TNS處理的可能性，但僅當該增益確實很低或至少低於沒有諸波/語音信號被處理的情況。第8b圖繪示不同的臨界值設定有臨界值控制信號產生器804/TNS判定器802實施的一實施。當一基頻輪廓不存在時’且當一信號分類器指示一無聲語音或沒有語音時，那麼該TNS判定臨界值被設定在需要一相對高的tNS增益用於致動TNS的一正常狀態中。然而，當一基頻輪廓被檢測到’但是該信號分類器指示沒有語音或該有聲/無聲檢測器檢測到一無聲語音時，那麼該TNS判定臨界值被設定至一較低位準’意指甚至當相對低的TNS增益被第8a圖的塊800 計算時，TNS處理仍被致動。在一有效基頻輪廓被檢測到且有聲語音被發現的情況中’那麼該TNS判定臨界值被設定為相同較低值，或被設定為一甚至更低的狀態，使得甚至很小TNS增益就足以致動一 TNS處理。 201009812 在-實施例中，當該音訊信號受到頻率上的預測遽波時，TNS增益控制器800被設定組態以在位- " 任位疋率或品質上估計一增益。一TNS判定器802將該估計拇Μ也 |曰減與一判定臨界值進行比較，且有利於該預測濾波的一— U控制資訊被塊802 輸出，當已估計增益與該狀臨界值為—科關係時，該預定關係可以是-「高於」關係’例如對於—反廳增益也可以是-「低於」。正如所討論的，該時域雜訊修整^制 e ο 器被進-步設定組態以較佳地使用臨界值控制信號改變該判疋6s界值，使得對於相同的已估計增益當該頻譜表示疋基於§亥時間扭曲音訊信號時，該預測慮波被致動，當該頻譜表示不是基於該時間扭曲音訊信號時，該預測濾波不被致動。通常，有聲語音將顯示一基頻輪廓，且無聲語音諸如摩擦音或齒音不被顯示一基頻輪廓。然而確實存在無語音信號，且因此強諧波内容具有一基頻輪廓，雖然該語音檢測器沒有檢測到語音。此外，存在音樂上是一定的語音或語音信號上的音樂，由該音訊信號分析器（例如第5a圖的 516)判定，以具有一諧波内容，但是沒有作為一語音信號被信號分類器520檢測到。在此一情況中，對於有聲語音信號的所有處理操作也可被施用，且也將產生一優勢。隨後，本發明關於用於編碼一音訊信號的一音訊編碼器的一進一步較佳實施例被描述。該音訊編碼器在帶寬延伸的内文中特別有用，且在獨立編碼器施用中也是有用的，在獨立編碼器施用中，該音訊編碼器被設定以編碼一 55 201009812 定數目的線，以獲得某一帶寬限制/低通濾波操作。在未時間扭曲施用中，藉由選擇一某一預定數目線的該帶寬限制將產生一恒定帶寬，因為該音訊信號之取樣頻率是恒定的。然而，在諸如藉由塊506的一時間扭曲處理被執行的情況中，依靠一固定數目線的一編碼器將產生一變化帶寬，該變化的帶寬引入不僅可由經過訓練的收聽者感知且可由未經訓練收聽者感知的很強的人工因子。該AAC核心編碼|§通常編碼一固定數目的線，將所有其他在最大線之上的設為零。在該未扭曲情況中，這產生 0 帶有一恒定截止頻率的一低通影響，且因此產生該解碼 AAC信號的一恒定帶寬。在時間扭曲的情況中，該帶寬由於該局部取樣頻率、局部時間扭曲估計的一函數的變化而 - 變化，產生可聞人工因子。該等人工因素可藉由適當地選擇線之數目一以該局部時間扭曲的一函數及其已獲得的平均取樣率被減少—以在該核心編碼器中依據該局部取樣頻率被編碼，使得-恒定平均帶寬在該解碼器中對所有訊框時間重新扭曲后被獲得…附加益處是該編碼H中的位A © 節約。依據該實施例的音訊編碼器包含時間扭曲器506，用於使用—可變時間扭曲特性將—音訊信號時間扭曲。此外，用於將—時間扭曲音訊信號轉換至具有若干頻譜係數的一頻譜表示的-時間/頻率轉換器被提供。此外用於處理一可變數目的頻譜係數以產生編碼音訊信號的一處理器被使用，該處理器包含第5a圖的量化器/編碼器塊512，被設 56 201009812 定組態以基於開訊框的時間扭曲特性，對該音訊信號的時框設定若干頻譜係數，使得由從訊框到訊框的已處理數目的頻譜係數表示的一帶寬變化被減少或消除。由塊512實施的該處理器包含一控制器1000,用於控制該等數目的線，控制器画的結果是，關於被編碼^有任何時間扭曲的一時框的情況所設定的許多線某化數目的線在該頻譜的上端被加入或被廢除。依據該實施， _ ㈣器10⑻可接收某-訊框膽中的-基頻輪廓資訊，及/ 或在1002處指示的訊框中的—局部平均取樣頻率。 . 在第9⑷圖至第(e)圖中，右邊圖片緣示在1框上的 . ㈣錢輪廓的某1紐況，在該訊框上的基頻輪摩針對時間扭曲被緣示於各自的左邊圖片中，且在時間扭曲後被繪示於中間圖片中，在此處一實質上恒定的基頻特性被獲得。時間扭曲功能的目標是，在時間扭曲後，該基頻特性盡可能的恒定。 Ο 帶寬刪繪不’當由第5a圖的—時間/頻率轉換器508輸出或由-TNS級510輪出的某—數目的線被採用時，且當一時間扭曲操作被執行時，即，當時間扭曲器506如由剖面綫 507所指示的被停用時，所獲得的帶寬。然而，當一非恒定時間扭曲輪廊被獲得，且當該時間扭曲輪庵被帶至引起一取樣率增加的-較高基頻時（第9⑻、⑷圖），該頻譜之帶寬關於正常’未時間接曲的情況被減少。這意指要對該訊框發送的線之數目必須被增加，以平衡該帶寬之損失。可供選擇地，將基頻帶至第9(b)圖或第9(d)圖所示的一 57 201009812 較低恒疋基頻中導致一取樣率的降低。該取樣率降低導致關於該線性標度的該訊框之頻譜的一帶寬增加，且該帶寬增加必須使用關於正常未時間扭曲情況的線之數目值的某一數目線的一删除或廢除而被平衡。第9(e)圖緣示-特定情況’其中—基頻輪廓被帶至一中間位準’使得-訊框巾的平均取樣頻率與沒有任何時間扭曲的取樣頻率相同，而不是執行該時間扭曲操作。因此，該信號之帶寬*受影響，且要針對正常情況使^不需要時間扭曲的該簡單數目之線可被處理，雖然該時間扭曲操作被執行。從第9圖，執行一時間扭曲操作沒必要影響該頻帶變得清晰’但是帶寬之影響取決於該基頻輪軌路線，該時間扭曲如何在—訊框中被執行。因此，較佳地使用一局部或平均取樣率作為控制值。該局部取樣率的決定繪示於第11圖巾。第11®的上部料具有等縣樣值的—時間部伤。-讯框包括’例如在較高目中由Tn指示的七個取樣值。較低圖繪示一時間扭曲操作之結果，其中—取樣率增強發生。這意指該時間扭曲訊框的時間長度小於未時間: 曲訊框的時間長度。然而，因為要被引人該時間/頰率轉換器的時間扭曲訊框的時間長度是固定的，一取樣率增加、情況導致不屬於由Τη指示的訊框的該時間信號的—附加呷份被引入該時間扭曲訊框，如線11〇〇所指示的。因此，時間扭曲訊框覆蓋有Tiin指示的音訊信號的一時間部份，τ 長於時机。如此看來，兩條頻譜線之間的有效距離或性域中的一單—線的頻率帶寬(是該解析i之相反值)減 58 201009812 少，且當乘以減少的頻率距離時，針對-未時間扭曲情況設定的該等數目的線^^導致一較小帶寬，即，—帶寬減小。未示於第11圖中，一取樣率減少由該時間扭曲器執行的其他情況，在時間扭曲域中的一訊框的有效時間長度小於該未時間扭曲域中的時間長度，使得一單一線的頻率帶寬或兩個頻率線之間的距離減少。現在對於正常情況，以線之數目Nn乘以增加的Af將導致由於兩個相鄰頻率係數之間的減少的頻率解析度/增加的頻率距離而增加的帶寬。苐11圖另又緣示·一平均取樣率fsR如何被計算。為此，兩個時間扭曲樣本之間的時間距離被判定且該相反值被採用，該相反值被定義為兩個時間扭曲樣本之間的局部取樣率。此一值可在每對相鄭樣本中被計算，且該算術平均值可被叶算，且該值最終產生該平均局部取樣率，該平均局部取樣率被較佳地用於被輸入至第10a圖的控制器1000令。第10b圖繪示指示多少線必須依據該局部取樣頻率被加入或廢除的圖表，其巾未扭㈣況的取樣解&與未時間扭曲情況的線之數目％界定該職的帶寬，對於一系列時間扭曲訊框或-系列時間扭曲級未時間扭曲訊框該帶寬應被盡可能的保持為恒定。第12b圖緣不連同第9[)圖、第丨關及第丨】圖所討論的不同參數之間的依賴。在根本上，當取樣率，即平均取樣率fSR關於未時間扭曲情況降低時，線必須被刪除，而當取樣率Μ於該线取樣率&增加時’線必須被加入’使得從訊框到訊框的帶寬被減少，或較佳地甚至盡可能地被消除。 59 201009812 由該等數目的線nn及取樣率fN產生帶寬較佳地對一音訊編碼器界定交又頻率為1200，該音訊編碼器除一源核心音訊編碼器外，具有一帶寬延伸編碼器（BWE編碼器）。如該該技藝中所習知的，一帶寬延伸編碼器僅以一高位元率編碼一頻譜直到該交又頻率，且以一低位元率編碼該高頻帶，即交叉頻率1200與頻率fMAX之間的頻譜，其中該低位元率典型地甚至低於一頻率〇與交叉頻率1200之間的低頻帶所需的位元率的1/10或更少。第12a圖進一步繪示一簡單 AAC音訊編碼器的帶寬BWAAC，其高於該交又頻率。因此， © 線不僅可被廢除，也可被加入。另外，對於一恒定數目線依據局部取樣率fSR的變化也被說明。較佳地，與正常情況的線之數目有關的要被加入或要被刪除的線之數目被設定’使得AAC進編碼資料的每一訊框具有盡可能接近交又頻率1200的一最大頻率。因此，由於一方面一帶寬減少，或由於一低頻帶編碼訊框中，在交又頻率之上的一頻率上發送資訊的一間接費用造成的任何頻譜孔被避免。這一方面增加解碼音訊信號的品質，且另一方面降低了位元率。 © 與線之一設定數目有關的實際加入線，或與該設定數目線有關的刪除線可在量化該等線之前，即，在塊512的輸入處被執行，或可在量化之後被執行，或依據特定熵編碼，也可在熵編碼後被執行。另外’較佳地，將該等帶寬變化達到一最小位準，且甚至消除該等帶寬變化，但是在其他實施例中，藉由依據該等時間扭曲特性判定線之數目的帶寬變化的一降低，較 60 201009812 之於一恒定數目線被施加而不管某一時間扭曲特性的情況，提局了該音訊品質，且減少了所需要的位元元率。雖然一些層面已在—設備的内文中被描述，很明顯，該等層面也表不相對應的方法之描述，其中一方塊或設備相對應於一方法步驟或—方法步驟的一特徵。類似地在 -方法步驟的内文中描述的層面也表示_相對應的方塊或項，或一相對應設備的特徵的一描述。 q 依據某些實施要求，本發明之實施例可在硬體或軟體中被實施。該實施可使用一數位儲存媒體，例如一磁片、 DVD CD > — ROM > — PR〇M' — EPROM' — EEPROM „ 或FLASH5己憶體被執行，該數位儲存媒體具有電子可讀控制信號被儲存於其上’該信號與（或能夠與)一可程式電腦系統配合，使得各自方法被執行。依據本發明的一些實施例包含-具有電子可讀控制信號的資料載體，該等信號能夠與一可程式電腦系統配合，使得本文描述的方法之一可 β 肖帛式碼以一電腦程式產品被實施，槽該電腦程式產品在-電腦上運行時，該程式碼操作以執行該等方法之一。該程式碼可，例如被儲存於一機器可讀載體上。其他實施例包含儲存於-機器可讀細上的電腦程式，驗執行本謂描述的方法之-。@此，換㈣說，贿明的方法的 I實施例是具有-程式碼的—電腦程式，當該電腦程式運订於-電腦上時’該程式碼用於執行本文所描述的方法之 -。因此’該發明的方法之-進—步的實施例是—資料載體（或一數位儲存媒體，或一電腦可讀媒體），其包含記錄於 61 201009812 其上的電腦程式，用於執杆 ^ 文所描述的該等方法之一。因此’該發明的方法之—逸— 1 ^Λ 步的實施例是表示該電腦程式的一貢料串流或—系列信號，用於執行本文所描述的該

等方法之料串流或料列錢可，例如被設定組態以經由-資料通信連接，例如經由網際網路被傳送。一進-步的實施例包含—處理H例如—㈣，或一可程式邏輯裝置’被設定組態以或適於執行本文所描述的方法之一。一進—步的實施例包含1腦，具有安裝於其上的電腦程式，用於執行本文所描述的方法之_。在一些實施例中，-可程式邏輯裝置(例如_現場可程式閘陣列)可被用於本文所描述的該等方法之_些或全部功能。在一些實施例中，一現場可程式閘陣列可與一微處理器配合，以執行本文所描述的該等方法之一。【圖式簡單說明的】第1圖繪示依據本發明一實施例的一時間扭曲致動信號提供器的一方塊示意圖；

第2a圖繪示依據本發明一實施例的一音訊信號編碼器的一方塊示意圖；第2b圖繪示依據本發明一實施例的一時間扭曲致動信號提供器的另一方塊示意圖；第3a圖繪示一音訊信號的一未時間扭曲版本的一頻譜之圖解表示；第3b圖繪示該音況#號的一時間扭曲版本的一頻譜之圖解表不， 62 201009812 第3c圖繪示針對不同頻帶的頻譜平坦度量度的一個別計算之圖解表示；第3d圖繪示僅考慮該頻譜之較高頻帶的一頻譜平坦度量度的一計算之圖解表示；第3e圖繪示使用一頻譜表示的一頻譜平坦度量度的一計算之圖解表示，在該頻譜表示中，一較高頻率部份在一較低頻率部份上被強調；第3f圖繪示依據本發明另一實施例的一能量集中資訊提供器的方塊示意圖；第3g圖繪示在該時域中具有一時間上可變基頻的一音訊信號之圖解表示；第3h圖繪示第3g圖音訊信號的一時間扭曲（不均勻重新取樣的）版本之圖解表示；第3i圖繪示依據第3g圖的音訊信號的一自相關函數之圖解表示；第3j圖繪示依據第3h圖的音訊信號的一自相關函數的圖解表示；第3k圖繪示依據本發明另一實施例的一能量集中資訊提供器的方塊示意圖；第4a圖繪示一種用於基於一音訊信號提供一時間扭曲致動信號的方法的流程圖；第4b圖繪示依據本發明一實施例，一種用於編碼一輸入音訊信號，以獲得該輸入音訊信號的一編碼表示的方法的流程圖； 63 201009812 第5a圖繪示具有發明之層面的一音訊編碼器的一較佳實施例；第5b圖繪示具有發明之層面的一音訊解碼器的一較佳實施例；第6a圖繪示本發明之雜訊注入層面的一較佳實施例；第6b圖繪示界定由該雜訊注入位準調處器執行的控制操作的一表格；第7a圖繪示依據本發明用於執行一基於時間扭曲的塊切換的較佳實施例；第7b圖繪示影響該視窗功能的一可供選擇的實施例；第7c圖繪示用於基於時間扭曲資訊說明該視窗功能的另一可供選擇的實施例；第7d圖繪示在一有聲啟動處的一正常AAC行為的一視窗順序；第7e圖繪示依據本發明之一較佳實施例獲得的可供選擇的視窗順序；第8a圖繪示TNS(時域雜訊整修）工具的一基於時間扭曲的控制的較佳實施例；第8b圖繪示界定第8a圖的臨界控制信號產生器中被執行的控制步驟的一表格；第9a-9e圖繪示不同的時間扭曲特性，及繼一解碼器端時間扭曲操作之後發生的相對應的音訊信號的帶寬上的影響；第10a圖繪示用於控制一編碼處理器中的線之數目的 64 201009812 一控制器之一較佳實施例；第10b圖繪示要針對一取樣率被廢除/加入的線之數目之間的一依賴性；第11圖繪示一線性時間標度與一經扭曲時間標度之間的一比較；

苐12a圖％示帶寬延伸在該内文中的一實施；及第12b圖繪示描繪在時間扭曲域中的局部取樣率與頻譜係數的控制之間的依賴性的一表格。【主要元件符號說明 100、230、234...時間扭曲致動信號提供器 110···音訊信號表示 112、232···時間扭曲致動信號 120、234f、2341、325…能量集中提供器 122、234m、234η、374…能量集中資訊 130、234〇…比較器 132···參考值 200…音訊信號編碼器 210…輸入音訊信號 212…編碼表示 234a、234g…時間扭曲表示提供器 1 234b、234h、220a…(可選)分析視窗器 234c、234i ' 220b…重新取樣器或時間扭曲器 234d、234j…(可選)頻譜域變換器 234e、234k…時間扭曲表示 234p…時間扭曲致動信號 220時間扭曲變換器 220c頻域變換器（時間/頻率轉換器例如MDCT) 222…時間扭曲頻譜表示 240…受控開關(切換機制） 242…新時間扭曲輪廓資訊 65 201009812 250···頻譜後處理 260…量化器/編碼器 262···已量化且編碼頻譜表示 270···感知模型 272···感知關聯資訊 280···輸出介面 284…時間扭曲分析器 286…時間扭曲輪廓資訊 288···標準時間扭曲輪廓資訊 301、 350、355、360…橫座標 302、 351、356、361·..縱座標 303、 308、352…弧線 31 卜 312、313...頻帶 316···高頻譜的一高頻部份 326…感知熵資訊 327…形式因子計算器 328···形式因子資訊 329…頻帶能量計算器 330…頻帶能量資訊en(n) 331···線估計器 332···經估計數目的線資訊ηι 333···感知熵計算器 362…標記 370···能量集中資訊提供器 371.··自相關計算器 372···自相關加法器 400、450·.·方法 410~430、460~480···步驟 500…編碼器輸入 502…分析視窗器 504…視窗功能(形狀)控制器 506…時間扭曲器 507…剖面殘 508、556...時間/頻率轉換器 510T...NS 級 510a、510b、526、528、530". 輸出 512···量化器及編碼器 514…感知模型 516···時間扭曲分析器 518···時間扭曲分析器輸出 520…信號分類器 520a···有聲/無聲檢測器 520b…語音/無語音檢測器 522…輸出介面 524、562…雜訊注入分析器 530…輸出 539…輸入介面

66 201009812

540…輸入 541···信號分類資訊 542…時間扭曲資訊 543…雜訊注入資料 544…量尺因子 545…TNS資料 546…編碼頻譜資訊 547…熵解碼器 550…重新量化器 552…雜訊注入器 554…反TNS級 558···時間解扭器 560…合成視窗器 564…音訊信號 600…信號分析器 602…雜訊注入位準調處器 700…暫態檢測器 70l·..長視窗功能(無暫態） 702…短視窗功能(暫態） 704…臨界值控制信號 706、707.·.視窗功能 708、720…零值部份 710·..長視窗 712…短視窗 714…長終止視窗 714a…第一重疊部份 714b、718b…非頻疊部份 714c…第二較短重疊部份 716···零值點 718···長起始視窗 718a…長重疊部份 718c…短重疊部份 749…具短重疊視窗形狀 750…具長重疊視窗形狀 751…信號 800…TNS增益計算器 802…TNS判定器 803…TNS控制資訊 804…臨界值控制信號產生器 806…臨界值控制信號 1000…控制器 1001、1002…訊框 1100…線 1200…交叉頻率 f…頻率 Η…高頻 L…低頻 67

Claims

201009812 七、申請專利範圍·· 1. 一種用於基於一音訊信號之表示提供一時間扭曲致動信號的時間扭曲致動信號提供器，該時間扭曲致動信號提供器包含：一能量集中資訊提供器，被設定組態以提供一能量集中資訊，該資訊描述該音訊信號的一時間扭曲變換頻譜表示中的一集中能量；及一比較器，被設定組態以將該能量集中資訊與一參考值相比較，且提供與該比較之結果有關的該時間扭曲致動信號。 2. 如申請專利範圍第1項所述之時間扭曲致動信號提供器，其中該能量集中資訊提供器被設定組態以提供一將該音訊信號的該時間扭曲變換頻譜表示描述成該能量集中資訊的一頻譜平坦度量度。 3. 如申請專利範圍第2項所述之時間扭曲致動信號提供器，其中該能量集中資訊提供器被設定組態以計算該音訊信號的該時間扭曲變換功率頻譜的一幾何平均與該音訊信號的該時間扭曲變換功率頻譜的一算術平均的商，以獲得該頻譜平坦度的量度。 4. 如申請專利範圍第1-3項中任一項所述之時間扭曲致動信號提供器，其中該能量集中資訊提供器被設定組態以強調與該時間扭曲變換頻譜表示的一較低頻率部份相較下該時間扭曲變換頻譜表示的一較高頻率部份，以獲得該能量集中資訊。 68 201009812 5. 如申請專利範圍第1-4項中任一項所述之時間扭曲致動信號提供器，其中該能量集中資訊提供器被設定組態以獲得頻譜平坦度的複數分頻段量度，且計算該等複數平坦度的分頻段量度的一平均，以獲得該能量集中資訊。 6. 如申請專利範圍第1項所述之時間扭曲致動信號提供器，其中該能力集中資訊提供器被設定組態以提供一將該音訊信號的時間扭曲變換頻譜表示描述成該能量集中資訊的感知熵量度。 7. 如申請專利範圍第6項所述之時間扭曲致動信號提供 . 器，其中該能量集中資訊提供器被設定組態以基於該量尺因子頻帶的一形式因子資訊(ffac(n))，計算該音訊信號的該時間扭曲變換頻譜表示的一個或多個量尺因子頻帶的估計非零線數目，且使用該估計非零線數目與考慮中之一量尺因子頻帶能量量度之一乘法計算考慮中之一量尺因子頻帶的感知嫡量度。 8. 如申請專利範圍第1項所述之時間扭曲致動信號提供器，其中該能量集中資訊提供器被設定組態以提供一將該音訊信號的一時間扭曲時域表示之一自相關描述成該能量集中資訊的一自相關量度。 9. 如申請專利範圍第8項所述之時間扭曲致動信號提供器，其中該能量集中資訊提供器被設定組態以判定該音訊信號的該時間扭曲表示的一正規化自相關函數的一絕對值總和，以獲得該能量集中資訊。 10. 如申請專利範圍第1-9項中任一項所述之時間扭曲致動 69 201009812 信號提供器，其中該時間扭曲致動信號提供器包含一參考值計算器，其被設定組態以基於該音訊信號的一未扭曲頻譜表示、或基於該音訊信號的一未扭曲時域表示，計算該參考值；及其中該比較器被設定組態以使用描述該音訊信號的一時間扭曲變換頻譜表示中之一能量集中的能量集中資訊以及該參考值形成一比值，且將該比值與一個或多個臨界值進行比較，以獲得作為比較結果的該時間扭曲致動信號。 11. 如申請專利範圍第1-9項中任一項所述之時間扭曲致動信號提供器，其中該時間扭曲致動信號提供器包含一參考值計算器，被設定組態以基於該輸入信號的一時間扭曲表示計算該參考值，利用一標準時間扭曲輪廓資訊使時間被扭曲；且其中該比較器被設定組態以使用描述該音訊信號的一時間扭曲表示中一能量集中的該能量集中資訊及該參考值形成一比值，且將該比值與一個或多個臨界值相比較，以獲得作為比較結果的該時間扭曲致動信號。 12. —種用於編碼一輸入音訊信號以獲得該輸入音訊信號的一編碼表示的音訊信號編碼器，該音訊信號編碼器包含：一時間扭曲變換器，被組態以基於該輸入音訊信號，使用一時間扭曲輪廓提供該時間扭曲變換頻譜表 · ， 70 201009812 如申請專利範圍第ι-ll項中任一項所述之一時間扭曲致動信號提供器，其中該時間扭曲致動信號提供器被設定組態以接收該輸入音訊信號，且提供該時間扭曲致動信號；及一控制器，被設定組態以選擇性地向該時間扭曲變換器提供與該時間扭曲致動信號相關的一描述一非恒定時間扭曲輪廓部份之新找到時間扭曲輪廓資訊，或一描述恒定時間扭曲執跡部份之一標準時間扭曲輪廓資 ❹ 訊，以描述由該時間扭曲變換器使用的該時間扭曲輪 . 廓。 13. 如申請專利範圍第12項所述之音訊信號編碼器，其中該音訊信號編碼器包含一輸出介面，被設定組態以將該時間扭曲變換頻譜表示包含在該音訊信號的該編碼表示中，且選擇性地相關於該時間扭曲致動信號將該時間扭 _ 曲輪扉資訊包含在該音訊信號的該編碼表示中。 ❹ 14. 一種基於一音訊信號提供一時間扭曲致動信號的方法，該方法包含：提供描述該音訊信號的一時間扭曲變換頻譜表示之一能量集中的一能量集中資訊；將該能量集中資訊與一參考值相比較；且相關於該比較之結果提供該時間扭曲致動信號。 15 · —種用於編碼一輸入音訊信號以獲得該輸入音訊信號的一編碼表示的方法，該方法包含： 71 201009812 依據申請專利範圍第14項提供一時間扭曲致動信號，其中該能量集中資訊描述該輸入音訊信號的一時間扭曲變換頻譜表示中之一能量集中；且相關於該時間扭曲致動信號，選擇性地提供該輸入音訊信號的該時間扭曲變換頻譜表示的一描述，或該輸入音訊信號的一未時間扭曲變換頻譜表示的描述以將該輸入音訊信號包括在該編碼表示中。 16. —種電腦程式，用於當該電腦程式運行於該電腦上時執行申請專利範圍第14項或第15項之方法。 17. —種用於編碼一音訊信號的音訊編碼器，包含：一量化器用於量化音訊值，其中該量化器被設定組態以量化音訊值至一量化臨界值之下；一雜訊注入計算器，用於對於該音訊信號的一時框估計被量化為零的音訊值的一能量的一量度；一音訊信號分析器，用於分析該音訊信號的時框是否具有一諧波或語音特性；一調處器，用於相關於該音訊信號的一諧波或一語音特性調處該雜訊注入量度，以獲得一調處的雜訊注入量度；及一輸出介面，用於產生一編碼信號用以發送或儲存，該編碼信號包含該調處的雜訊注入量度。 18. 如申請專利範圍第17項所述之音訊編碼器，其中該音訊信號分析器包含一基頻觸發器，用於當一基頻在該音訊信號的時框中被發現時，產生一基頻的 72 201009812 一指示，及其中該調處器被設定組態以當一基頻被發現時，降低該雜訊注入量度。 19. 如申請專利範圍第17或18項所述之音訊編碼器，其中該音訊信號分析器包含一有聲/無聲檢測器，用於檢測是否至少一部份時框是有聲的，其中當該部份被檢測為有聲時，該調處器被設定組態以降低該雜訊注入量度，或將該雜訊注入量度歸零，及其中該調處器被設定組態以當該部份被檢測為無聲時，不調處或調處該雜訊注入測量為一較小程度。 20. —種用於解碼一編碼音訊信號的解碼器，包含：一輸入介面，用於處理該編碼音訊信號，以獲得一雜訊注入量度及編碼音訊資料；一解碼器/重新量化器，用於產生重新量化資料；一信號分析器，用於檢索該音訊資料的一時框具有諧波抑或語音特性的資訊；及一雜訊注入器，用於產生雜訊注入音訊資料，其中該雜訊注入器被設定組態產生雜訊填充資料，以回應該雜訊填充量測及該音訊資料的該諧波或語音特性；及一處理器，用於處理該重新量化資料及該雜訊注入音訊資料，以獲得一解碼音訊信號。 21. 如申請專利範圍第20項所述之解碼器， 73 201009812 其中該編碼音訊信號包含指示該音訊資料的該時框具有一諧波抑或語音特性的資料，且其中該信號分析器被設定組態以分析該編碼音訊信號，以檢索指示該音訊資料的該時框具有一諧波抑或語音特性的一資料。 22. 如申請專利範圍第21項所述之解碼器，其中該資料是該時間部份已受到一時間扭曲處理的一指示，且其中該處理器包含一時間反扭曲器，用於使從雜訊注入資料與重新量化資料導出的一音訊信號時間反扭曲。 23. 用於編碼一音訊信號置之方法，包含：量化音訊值，其中該量化器被設定組態以將音訊值量化為一量化臨界值之下的零值；針對該音訊信號的一時框，估計被量化為零的音訊值的一能量的一量度；分析該音訊信號的該時框具有一譜波抑或語音特性；相關於該音訊信號的一諧波或語音特性，調處該雜訊注入量度，以獲得一調處雜訊注入量度；且產生一編碼信號用於發送或儲存，該編碼信號包含該調處雜訊注入量度。 24. 用於解碼一編碼音訊信號的方法，包含：處理該編碼音訊信號，以獲得一雜訊注入量度及編碼音訊資料； 74 201009812 產生重新量化資料；檢索該音訊資料的一時框具有諧波抑或語音特性的資訊；且產生雜訊注入音訊資料，以回應該雜訊注入量度及該音訊信號的該諧波或語音特性；且處理該量化資料及該雜訊注入音訊，以獲得一解碼音訊信號。 ❹ 25. —種電腦程式，具有一當運行於一電腦上時，執行申請專利範圍第23項之方法或申請專利範圍第24項之方法的程式碼。 26. —種用於產生一編碼音訊信號的音訊編碼器，包含：一音訊信號分析器，用於分析該音訊信號的一時框具有一諧波抑或語音特性；一視窗功能控制器，用於相關於該音訊信號的一諧波或語音特性選擇一視窗功能；一視窗器，用於使用該選擇視窗功能將該音訊信號視窗化，以獲得一視窗化訊框；及一處理器，用於進一步處理該視窗化訊框，以獲得該編碼音訊信號。 27. 如申請專利範圍第26項所述之音訊編碼器，其中該視窗功能控制器包含一用於檢測一暫態之暫態檢測器，其中該視窗功能控制器被設定組態以當一暫態被檢測到且一諧波或語音特性未被該音訊信號分析器發現時，從一長塊的一視窗功能切換至一短塊的一視窗功能，且當一 75 201009812 暫態被檢測到且一諧波或語音特性被該音訊信號分析器發現時，不切換至該短塊的視窗功能。 28. 如申請專利範圍第26或27項所述之音訊編碼器，其中該暫態檢測器被設定組態以檢測該音訊信號的一定量特性，且將該定量特性與一可控臨界值相比較，其中當該定量特性具有與該可控臨界值的一預定關係時，一暫態被檢測到，且其中該音訊信號分析器被設定組態以控制該可變臨界值，使得當該該音訊信號分析器已發現一諧波或語音特性時，一切換至一短塊之視窗功能的一似然降低。 29. 如申請專利範圍第27或28項所述之音訊編碼器，其中該視窗功能控制器被設定組態以當一暫態被檢測到且該信號具有一諧波或語音特性時，切換至一比一短塊之視窗功能為長的視窗功能，或切換至具有一比一長塊之視窗功能的重疊為短的一視窗功能。 30. —種用於產生一編碼音訊信號的方法，包含：分析該音訊信號的一時框具有一諧波抑或語音特性；選擇一相關於該音訊信號的一諧波或語音特性的視窗功能；使用該選擇視窗功能將該音訊信號視窗化，以獲得一視窗化訊框；且處理該視窗化訊框，以獲得該編碼音訊信號。 31. —種電腦程式，具有一當運行於一電腦上時，執行如申 76 2〇1〇〇98l2 32. 專利範圍第30項的該方法的程式碼。種用於產生—音訊信號的音訊編碼器，包含·· 以獲時間扭曲器’用於將該音訊信號二扭曲，復得—時間扭曲音訊信號；曲音:時Γ頻率轉換器，用於將至少—部份該時間扭號轉換為一頻譜表示；

令，^時域雜訊修整級，詩依據_時域雜訊修整指時域雜仃該頻譜表示的頻率上的—預職波，其中當該行訊修整控制指令不存在時，該預測據波不被執 —時域雜訊修整控制器 s亥時域雜訊修整控制指令，用於基於該頻譜表示產生 1其中該時域雜訊修整控制器被設定組態以當該頻譜表示是基於-時間扭曲音訊信號時，增加執行於該頻率上預測濾波的似然，或當該頻譜表示不是基於一時間

扭曲a⑽麟，降低執行頻率上之該糊濾波的該似然；及一處理器，用於進一步處理該時域雜訊修整級的一輸出’以獲得該編碼音訊信號。 33.如申請專利範圍第32項所述之音訊編碼器，其中該時域雜訊修整控制器被設定組態以當該音訊仏號藉由該時域雜訊修整級而受到該預測爐、波時，估計一位元率或品質上的一增益，以將該估計增益與一判疋臨界值相比較，且 77 201009812 當該估計增益與該判定臨界值處於一預定關係時，判定支援該預測濾波，其中該時域雜訊修整控制器被進一步設定組態以改變該判定臨界值，使得對於同一估計增益而言，當該頻譜表示是基於一時間扭曲信號時，該預測濾波被致動，且當該頻譜表示不是基於一非時間扭曲音訊信號時不被致動。 34. 如申請專利範圍第32或33項所述之音訊編碼器，其中該時間扭曲器包含一信號分類器以供檢測有聲或無聲語音，且其中該時域雜訊修整控制器被設定組態以當一有聲語音被檢測到，或當一無聲語音被檢測到且該頻譜表示是基於該時間扭曲音訊信號時，增加該似然。 35. —種用於產生一音訊信號之方法，包含：時間扭曲該音訊信號，以獲得一時間扭曲音訊信號；將至少一部份的該時間扭曲音訊信號轉換為一頻譜表示；依據一時域雜訊修整控制指令，執行該頻譜表示之頻率上的一預測濾波，其中當該時域雜訊修整控制指令不存在時，該預測濾波不被執行；基於該頻譜表示產生該時域雜訊修整控制指令，其中該時域雜訊修整控制器被設定組態以當該頻譜表示是基於一時間扭曲音訊信號時，增加一執行頻率 78 201009812 上之預測濾波的似然，或當該頻譜表示不是基於一非時間扭曲音訊信號時，降低執行頻率上之預測濾波的該似然；且處理該時域雜訊修整級的一輸出，以獲得該編碼音訊信號。 36. —種電腦程式，具有一當運行於一電腦上時，執行申請專利範圍第35項之方法的程式碼。 37. —種用於編碼一音訊信號的音訊編碼器，包含：一時間扭曲器，用於使用一可變時間扭曲特性扭曲一音訊信號；一時間/頻率轉換器，用於將一時間扭曲音訊信號轉換為具有若干頻譜係數的一頻譜表示；及一處理器，用於處理一可變數目的頻譜係數，以產生一編碼音訊信號，其中該處理器被設定組態以基於該訊框的時間扭曲特性，可變地設定該音訊信號之一訊框的若干頻譜係數，使得由訊框到訊框的處理數目之頻率係數表示的一帶寬變量被減少或消除。 38. 如申請專利範圍第37項所述之音訊編碼器，其中該可變時間扭曲特性包含一訊框的一局部取樣頻率(fSR)，且其中該處理器被設定組態以當該局部取樣頻率被增加時，增加頻譜係數之數目，或其中該處理器被設定組態以當該局部取樣頻率被降低時，減少該等頻譜係數 79 201009812 之數目。 39. 如申請專利範圍第37或38項所述之音訊編碼器，進一步包含一帶寬延伸編碼器，使用從一交叉頻率上的音訊信號的一頻帶導出的參數編碼該交叉頻率上之一頻譜帶，其中該交叉頻率是每一訊框的一目標帶寬的一最大頻率。 40. 如申請專利範圍第37至39項中任一項所述之音訊編碼器，其中該音訊信號，在被時間扭曲前，使用一正常取樣頻率（fN)被取樣，且其中該處理器被設定組態以當該局部取樣頻率等於該正常取樣頻率時，使用從該交叉頻率及該正常取樣頻率導出的一預定數目的頻譜係數 (Nn)，或該局部取樣頻率高於該正常取樣頻率（fN)時，使用一比該預定數目頻譜係數為高之數目的頻譜係數，或當該局部取樣頻率低於該正常取樣頻率（fN)時，使用一比該預定數目頻譜係數一為低之數目的頻譜係數。 41. 如申請專利範圍第37至40項中任一項所述之音訊編碼器，其中該處理器包含一量化器，用於量化該等頻譜係數，以獲得量化頻譜係數，及一熵編碼器用於熵編碼該等量化頻譜係數，其中該處理器包括一選擇器，用於在量化之前或之後廢除不包括在該設定數目頻譜係數中的頻譜係數，使得該編碼音訊信號僅包含未被廢除的該等頻譜係數，或 80 201009812 其中該處理器包括一選擇器，用於在量化之前或之後加入該設定數目頻譜係數所需要的頻譜係數，使得該編碼音訊信號另外包含該等加入的頻譜係數。 42. —種用於編碼一音訊信號的方法，包含：使用一可變時間扭曲特性將一音訊信號時間扭曲；將一時間扭曲音訊信號轉換為具有若干頻譜係數的一頻譜表示；及處理一可變數目的頻譜係數，以產生一編碼的音訊信號，其中該音訊信號的一訊框的一可變數目頻譜係數是基於該訊框的時間扭曲特性被設定，使得由訊框到訊框之處理頻率係數數目表示的一帶寬變量被減少或消除。 43. —種電腦程式，具有一當運行於一電腦上時，執行申請專利範圍第42項的方法的程式碼。

81