TWI488176B

TWI488176B - 音訊信號音軌脈衝位置之編碼與解碼技術

Info

Publication number: TWI488176B
Application number: TW101104350A
Authority: TW
Inventors: Guillaume Fuchs; Tom Backstrom
Original assignee: Fraunhofer Ges Forschung
Priority date: 2011-02-14
Filing date: 2012-02-10
Publication date: 2015-06-11
Also published as: TWI484480B; CA2827296C; EP2676269B1; EP2676269A1; US9037457B2; WO2012110480A1; AR085223A1; KR20140000322A; CN103548078A; HK1192793A1; RU2013141935A; BR112013020589A2; ZA201306872B; KR101648133B1; PL2676269T3; TW201248617A; JP5851525B2; AU2016200351B2; MX2013009302A; AU2016200351A1

Description

音訊信號音軌脈衝位置之編碼與解碼技術

本發明係有關於音訊處理及音訊編碼領域，更明確言之，係有關於音訊信號中音軌脈衝位置之編碼與解碼技術。

音訊處理及/或音訊編碼已經多所進展。於音訊編碼中，線性預測編碼器扮演要角。當編碼音訊信號例如包含語音的音訊信號時，線性預測編碼器通道編碼音訊信號之頻譜波封之表示型態。為了達成該項目的，線性預測編碼器可決定預測濾波器係數來以編碼形式表示該聲音之頻譜波封。然後，濾波器係數可由線性預測解碼器用來藉使用該等線性預測編碼器產生合成音訊信號而解碼該編碼音訊信號。

線性預測編碼器之主要實例為ACELP編碼器(ACELP=代數代碼激勵線性預測編碼器)。ACELP編碼器廣為人使用，例如用於USAC(USAC=統一語音與音訊編碼)且可具有額外應用領域例如用於LD-USAC(低延遲統一語音與音訊編碼)。

ACELP編碼器通道係藉決定預測濾波器係數而編碼音訊信號。為了達成更佳編碼，ACELP編碼器基於欲編碼之音訊信號，及基於已經決定的預測濾波器係數而決定殘差信號，又稱目標信號。殘差信號例如可以是差信號，表示欲編碼之音訊信號與，藉預測濾波器係數及可能地藉音準(pitch)分析所得的適應性濾波器係數編碼之該信號部分間之差值。然後ACELP編碼器針對編碼該殘差信號。為了達成該項目的，編碼器編碼代數碼簿參數，該等代數碼簿參數係用來表示該殘差信號。

為了編碼該殘差信號，使用代數碼簿。通常代數碼簿包含多個音軌，例如四個音軌各自包含16音軌位置。於此種組態中，藉個別代數碼簿可表示共計4x16=64樣本位置，相對應於欲編碼的音訊信號之一子訊框的樣本數目。

碼簿之該等音軌可以交插，使得碼簿之音軌0可表示該子訊框之樣本0、4、8、...、60，使得碼簿之音軌1可表示該子訊框之樣本1、5、9、...、61，使得碼簿之音軌2可表示該子訊框之樣本2、6、10、...、62，及使得碼簿之音軌3可表示該子訊框之樣本3、7、11、...、63。各個音軌可有固定數目之脈衝。或者每個音軌之脈衝數目可改變，例如取決於其它狀況而改變。脈衝例如可以是正或負，例如可以+1(正脈衝)或0(負脈衝)表示。

為了編碼該殘差信號，當編碼時，碼簿組態可經選擇使得最佳表示該殘差信號之其餘信號。為了達成該項目的，可用脈衝可位在最佳地反映出欲編碼的信號位置之適當音軌位置。此外，可載明相對應脈衝為正或為負。

於解碼器端，ACELP解碼器將至少解碼代數碼簿參數。ACELP解碼器也可解碼適應性碼簿參數。為了決定代數碼簿參數，ACELP解碼器可針對代數碼簿之各個音軌決定多個脈衝位置。此外，ACELP解碼器也可解碼在一音軌位置的脈衝是正或負脈衝。又復，ACELP解碼器也可解碼適應性碼簿參數。基於此項資訊，ACELP解碼器通常產生激勵信號。然後，ACELP解碼器施加該等預測濾波器係數於該激勵信號來產生合成音訊信號而獲得解碼音訊信號。

於ACELP中，音軌上的脈衝通常係編碼如下。若該音軌具有長度16，及若此一音軌上的脈衝數目為1，則可藉其位置(4位元)及符號(1位元)共計5位元編碼脈衝位置。若該音軌具有長度16及脈衝數目為2，則第一脈衝係藉其位置(4位元)及符號(1位元)編碼。至於第二脈衝，則只需編碼位置(4位元)，原因在於若該第二脈衝係在第一脈衝左方則可選擇第二脈衝之符號為正，若係在第一脈衝右方則可選擇第二脈衝之符號為正，及若係在第一脈衝之相同位置則可選擇第二脈衝為與第一脈衝相同符號。因此總計，共需9位元來編碼兩個脈衝。比起分開地各藉5位元編碼脈衝位置，因而針對每一對脈衝節省1位元。

編碼比2更大的脈衝數目，可成對地編碼脈衝，及若脈衝數為奇數，則分開地編碼最末脈衝。如此則例如針對5脈衝的音軌，需要9+9+5=23位元。若有4音軌，則要求4 x 23=92位元來編碼具有4音軌及每個音軌5脈衝的長度64之子訊框。但若位元數可以更進一步減少則更有價值。

若能提供具有改良編碼或解碼構思的編碼裝置及個別的解碼裝置將極有價值，該裝置具有針對脈衝資訊表示型態使用較少位元而以改良方式來編碼或解碼脈衝資訊的手段，原因在於如此將例如減低傳輸個別地編碼音訊信號之傳輸速率，及又復，如此將例如減少儲存個別地編碼音訊信號需要的儲存空間。

因此本發明之一目的係提供音訊信號之音軌脈衝的編碼及解碼之改良構思。本發明之目的可藉如申請專利範圍第1項之解碼裝置、如申請專利範圍第9項之編碼裝置、如申請專利範圍第13項之解碼方法、如申請專利範圍第14項之編碼方法、及如申請專利範圍第15項之電腦程式達成。

依據實施例，假設一個狀態數目可供解碼裝置使用。又復假設指示與該編碼音訊信號相聯結的至少一個音軌之音軌位置總數的音軌位置數目、及指示至少一個音軌之脈衝數目的總脈衝數目可供本發明之解碼裝置使用。較佳地，該音軌位置數目及該總脈衝數目係可供與該編碼音訊信號相聯結的各個音軌使用。

舉例言之，具有4音軌有5脈衝，各自可達成粗略地6.6 x 10^21狀態，依據實施例，可藉73位元編碼，比較前述最先進編碼器使用92位元編碼，更有效約21%。

首先，提供一種構思，如何以有效方式編碼一音訊信號之一音軌的多個脈衝位置。後文中，該構思擴延成允許不僅編碼一音軌的脈衝位置，同時也允許編碼該脈衝是正或負。此外，然後該構思擴延成允許以有效方式針對多個音軌編碼脈衝資訊。此等構思同等適用於解碼器端。

此外，實施例又更基於發現若編碼策略使用預定位元數目，使得在各個音軌上有相同脈衝數目的任一種組態皆要求相等位元數目。若可用位元數目為固定，則可能直接地選定使用該給定位元量可編碼多少個脈衝，如此允許以預定品質編碼。此外，使用此種辦法，無需嘗試不等量脈衝直到達成期望的位元率，反而可以直接地選擇正確脈衝量，因而減低複雜度。

基於前述假設，可編碼及/或解碼一音訊信號訊框之一音軌的多個脈衝位置。

雖然本發明可採用來編碼或解碼任一種音訊信號，例如語音信號或樂音信號，本發明特別可用於編碼或解碼語音信號。

於另一實施例中，脈衝資訊解碼器又更適用以使用音軌位置數目、總脈衝數目、及狀態數目來解碼多個脈衝符號，其中該等脈衝符號中之各一者指示多個脈衝中之一者的符號。信號解碼器可適用以又更使用多個脈衝符號，藉產生合成音訊信號而解碼該編碼音訊信號。

依據又一實施例，其中該等一或多個音軌可包含至少一個最末音軌及一或多個其它音軌，該脈衝資訊解碼器可適用以從該狀態數目產生一第一子狀態數目及一第二子狀態數目。該脈衝資訊解碼器可經組配來基於該第一子狀態數目而解碼該等脈衝位置之一第一群組，及該脈衝資訊解碼器更可經組配來基於該第二子狀態數目而解碼該等脈衝位置之一第二群組。該等脈衝位置之該第二群組可只包含指示該最末音軌之音軌位置的脈衝位置。該等脈衝位置之該第一群組可只包含指示該等一或多個其它音軌之音軌位置的脈衝位置。

依據另一實施例，脈衝資訊解碼器可經組配來藉將該狀態數目除以f(p_k ,N)而獲得一整數部分及一餘數作為除法結果來產生該第一子狀態數目及該第二子狀態數目，其中該整數部分為該第一子狀態數目，及其中該餘數為該第二子狀態數目，其中p_k 指示針對該等一或多個音軌中之各一者的脈衝數目，及其中N指示針對該等一或多個音軌中之各一者的音軌位置數目。此處，f(p_k ,N)乃返回於長度N具有p_k 脈衝的音軌中可達成的狀態數目之函式。

於另一實施例中，該脈衝資訊解碼器可適用以進行一測試比較該狀態數目或一已更新狀態數目與一臨界值。

該脈衝資訊解碼器可適用以藉比較該狀態數目或一已更新狀態數目是否大於、大於或等於、小於、或小於或等於該臨界值而進行該測試，及其中該脈衝資訊解碼器又更適用以取決於該測試結果而更新該狀態數目或一已更新狀態數目。

於一實施例中，該脈衝資訊解碼器可經組配來針對該等多個音軌中之一者的各個音軌位置，比較該狀態數目或該已更新狀態數目與該臨界值。

依據一實施例，該脈衝資訊解碼器可經組配來劃分該等音軌中之一者成為包含該等多個音軌位置中之至少兩個音軌位置之一第一音軌區劃，及成為包含該等多個音軌位置中之至少另兩個音軌位置之一第二音軌區劃。該脈衝資訊解碼器可經組配來基於該狀態數目而產生一第一子狀態數目及一第二子狀態數目。此外，該脈衝資訊解碼器可經組配來基於該第一子狀態數目，解碼與該第一音軌區劃相聯結的脈衝位置之一第一群組。又復，該脈衝資訊解碼器可經組配來基於該第二子狀態數目，解碼與該第二音軌區劃相聯結的脈衝位置之一第二群組。

依據一實施例，提出一種編碼一音訊信號之裝置。該裝置包含一信號處理器適用以決定與該音訊信號相聯結的多個預測濾波器係數，用以基於該音訊信號及該等多個預測濾波器係數而產生一殘差信號。此外，該裝置包含一脈衝資訊編碼器適用以編碼與一或多個音軌相關的多個脈衝位置來編碼該音訊信號，該等一或多個音軌係與該殘差信號相聯結。該等音軌中之各一者具有多個音軌位置及多個脈衝。該等脈衝位置中之各一者指示該等音軌中之一者的該等音軌位置中之一者來指示該音軌之該等脈衝中之一者的位置。該脈衝資訊編碼器係經組配來藉產生一狀態數目而編碼該等多個脈衝位置，使得該等脈衝位置唯有基於該狀態數目、指示該等音軌中之至少一者的音軌位置總數之一音軌位置數目、及指示該等音軌中之至少一者的脈衝總數之一總脈衝數目才能被解碼。

依據另一實施例，該脈衝資訊編碼器可適用以編碼多個脈衝符號，其中該等脈衝符號中之各一者指示該等多個脈衝中之一者之一符號。該脈衝資訊編碼器更可經組配來藉產生該狀態數目而編碼該等多個脈衝符號，使得該等脈衝符號唯有基於該狀態數目、指示該等音軌中之至少一者的音軌位置總數之該音軌位置數目、及該總脈衝數目才能被解碼。

於一實施例中，該脈衝資訊編碼器係經組配來針對該等音軌中之一者的各個音軌位置，將一整數值加至針對於一音軌位置的各個脈衝之一中間數目來獲得該狀態數目。

依據另一實施例，該脈衝資訊編碼器可經組配來劃分該等音軌中之一者成為包含該等多個音軌位置中之至少兩個音軌位置之一第一音軌區劃，及成為包含該等多個音軌位置中之至少另兩個音軌位置之一第二音軌區劃。此外，該脈衝資訊編碼器可經組配來編碼與該第一區劃相聯結的之一第一子狀態數目。又復，該脈衝資訊編碼器可經組配來編碼與該第二區劃相聯結的之一第二子狀態數目。又，該脈衝資訊編碼器可經組配來組合該第一子狀態數目與該第二子狀態數目而獲得該狀態數目。

圖式簡單說明

後文中，將就附圖以進一步細節描述本發明之實施例，附圖中：第1圖顯示依據一實施例用以解碼一編碼音訊信號之裝置，第2圖顯示依據一實施例用以編碼一音訊信號之裝置，第3圖顯示針對具有兩個無符號脈衝及三個音軌位置之一音軌的全部可能組態，第4圖顯示針對具有一個有符號脈衝及兩個音軌位置之一音軌的全部可能組態，第5圖顯示針對具有兩個有符號脈衝及兩個音軌位置之一音軌的全部可能組態，第6圖為例示說明一實施例之流程圖，闡釋依據一實施例藉脈衝資訊解碼器所進行的處理步驟，及第7圖為例示說明一實施例之流程圖，該流程圖闡釋依據一實施例藉脈衝資訊編碼器所進行的處理步驟。

第1圖例示說明解碼一編碼音訊信號之裝置，其中一或多個音軌係與該編碼音訊信號相聯結，該等音軌中之各一者具有多個音軌位置及多個脈衝。

該裝置包含一脈衝資訊解碼器110及一信號解碼器120。該脈衝資訊解碼器110係適用以解碼多個脈衝位置。該等脈衝位置中之各一者指示該等音軌中之一者的該等音軌位置中之一者來指示該音軌之該等脈衝中之一者的位置。

該脈衝資訊解碼器110係經組配來藉由使用指示該等音軌中之至少一者的音軌位置總數之一音軌位置數目、指示該等音軌中之至少一者的脈衝總數之一總脈衝數目、及一個狀態數目而解碼該等多個脈衝位置。

該信號解碼器120係適用於藉由使用該等多個脈衝位置及與該編碼音訊信號相聯結的多個預測濾波器係數而產生一合成音訊信號來解碼該編碼音訊信號。

狀態數目為已經依據後述實施例藉編碼器編碼之數目。狀態數目例如包含於一精簡表示型態中有關多個脈衝位置之資訊，該表示型態例如為要求少數位元的表示型態，及當有關該音軌位置數目及總脈衝數目之資訊在該解碼器為可利用時可被解碼的表示型態。

於一實施例中，該音訊信號之一個音軌或各個音軌之該音軌位置數目及/或總脈衝數目在該解碼器為可資利用，原因在於該音軌位置數目及/或總脈衝數目為不變的靜態數值且為接收器所已知。舉例言之，針對各個音軌，該音軌位置數目可以經常性為16，及總脈衝數目可以經常性為4。

於另一實施例中，該音訊信號之一個音軌或各個音軌之該音軌位置數目及/或總脈衝數目例如可藉編碼裝置而明確地傳輸至該解碼裝置。

於又一實施例中，解碼器可決定該音訊信號之一個音軌或各個音軌之該音軌位置數目及/或總脈衝數目，該決定方式係藉分析並不明確地陳述該音軌位置數目及/或總脈衝數目的其它參數，反而從該等其它參數可推衍出該音軌位置數目及/或總脈衝數目。

於其它實施例中，解碼器可分析可利用來推衍出該音訊信號之一個音軌或各個音軌之該音軌位置數目及/或總脈衝數目之其它資料。

於更一實施例中，該脈衝資訊解碼器可適用以也解碼一脈衝為正脈衝或負脈衝。

於另一實施例中，該脈衝資訊解碼器又更可適用以解碼脈衝資訊，包含有關多個音軌之脈衝的資訊。脈衝資訊例如可以是有關於一音軌中的脈衝位置資訊及/或一脈衝為正脈衝或負脈衝之資訊。

第2圖例示說明編碼音訊信號之裝置，包含信號處理器210及脈衝資訊編碼器220。

信號處理器210係適用以決定與該音訊信號相聯結的多個預測濾波器係數，用以基於該音訊信號及該等多個預測濾波器係數而產生一殘差信號。

脈衝資訊編碼器220係適用以編碼與一或多個音軌相關的多個脈衝位置來編碼該音訊信號。該等一或多個音軌係與由信號處理器210所產生的該殘差信號相聯結。該等音軌中之各一者具有多個音軌位置及多個脈衝。此外，該等脈衝位置中之各一者指示該等音軌中之一者的該等音軌位置中之一者來指示該音軌之該等脈衝中之一者的位置。

該脈衝資訊編碼器220係經組配來藉產生一狀態數目而編碼該等多個脈衝位置，使得該等脈衝位置唯有基於該狀態數目、指示該等音軌中之至少一者的音軌位置總數之一音軌位置數目、及指示該等音軌中之至少一者的脈衝總數之一總脈衝數目才能被解碼。

後文中，呈示有關藉產生一狀態數目而編碼脈衝位置及可能地編碼脈衝符號(正脈衝或負脈衝)之本發明之實施例的基本構思。

本發明之實施例的編碼原理係植基於下述發現，若考慮於具有n個音軌位置之一音軌中的k個脈衝之全部可能組態之狀態列舉，則係足以編碼一音軌之脈衝的實際狀態。藉儘可能少數位元編碼此種狀態，提供期望的精簡編碼。藉此，呈示狀態列舉之構思，其中脈衝位置及可能也脈衝符號的各叢表示一個狀態，及各個狀態係獨特地列舉。

第3圖針對簡單情況例示說明此點，於該處闡釋全部可能的組態，此時考慮具有2脈衝及3音軌位置之一音軌。2脈衝可位在相同音軌位置。於第3圖之實例中，不考慮脈衝的符號(例如脈衝是正或負)，例如於此一實例中，全部脈衝皆可視為正脈衝。

於第3圖中，例示說明針對位在具有3音軌位置(第3圖中：音軌位置1、2及3)之一音軌中兩個無方向性脈衝的全部可能組態。只有六個不同的可能狀態(第3圖中標示為0至5)，描述脈衝如何分布在該音軌。藉此，使用0至5之範圍的狀態數目來描述所呈示的實際組態即足。舉例言之，若第3圖實例的狀態數目具有數值(4)，且若解碼器知曉編碼方案，則解碼器可獲得結論狀態數目=4，表示該音軌具有一個脈衝在音軌位置0，及另一個脈衝在音軌位置2。於是於第3圖之實例中，3位元即足以編碼狀態數目來識別第3圖之實例的六個不同狀態中之一者。

第4圖例示說明針對位在具有2音軌位置(第4圖中：音軌位置1及2)之一音軌中一個方向性脈衝的全部可能組態。第4圖中考慮脈衝之符號(例如脈衝是正或負)。有四個不同的可能狀態(第4圖中標示為0至3)，描述脈衝如何分布在該音軌，及也描述其符號(正或負)。使用0至3之範圍的狀態數目來描述所呈示的實際組態即足。舉例言之，若第4圖實例的狀態數目具有數值(2)，且若解碼器知曉編碼方案，則解碼器可獲得結論狀態數目=2，表示該音軌具有一個脈衝在音軌位置1，及該脈衝為正脈衝。

第5圖例示說明又另一情況，於該處闡釋當考慮具有2脈衝及2音軌位置的一音軌時的全部可能組態。脈衝可位在相同音軌位置。於第5圖所示實例中，考慮脈衝之符號(例如脈衝是正或負)。假設在同一個音軌位置的脈衝具有相同符號(例如在同一個音軌位置的音軌脈衝乃全正或全負)。

第5圖中例示說明位在具有2音軌位置(第5圖中：音軌位置1及2)之一音軌中兩個有符號脈衝(例如脈衝是正或負)的全部可能組態。只有八個不同的可能狀態(第5圖中標示為0至7)，描述脈衝如何分布在該音軌。藉此，使用0至7之範圍的狀態數目來描述所呈示的實際組態即足。舉例言之，若第5圖實例的狀態數目具有數值(3)，且若解碼器知曉編碼方案，則解碼器可獲得結論狀態數目=3，表示該音軌具有一個脈衝在音軌位置0，及另一個脈衝在音軌位置1而該脈衝為負。於是於第5圖之實例中，3位元即足以編碼狀態數目來識別第5圖之實例的八個不同狀態中之一者。

於ACELP中，殘差信號可藉固定數目的有符號脈衝編碼。如前述，脈衝例如可分布在四個交插音軌，使得音軌0含有位置mod(n,4)==0，音軌=1含有位置mod(n,4)==1，等等。各個音軌可有經預先界定的有符號單位脈衝數目，脈衝可重疊，但重疊時脈衝有相同符號。

藉編碼脈衝，須達成從脈衝位置及其符號對映至使用最小可能的位元數量之表示型態。此外，脈衝編碼須具有固定的位元耗用量，亦即任何脈衝叢具有相等數目之位元。

各音軌係首先獨立地編碼，及然後各個音軌之狀態被組合成一個數目，表示整個子訊框之狀態。此一辦法給予數學上最佳的位元耗用，給定全部狀態有相等機率，及位元耗用量乃固定。

狀態列舉構思可運用不同狀態叢之精簡表示型態說明：設欲編碼之殘差信號為x_n 。假設考慮例如代數碼簿之四個交插音軌，則第一音軌具有樣本x₀ 、x₄ 、x₈ 、...x_N-4 ，第二音軌具有樣本x₁ 、x₅ 、x₉ 、...x_N-3 等。假設第一音軌係使用一個有符號單位脈衝量化及T=8，故音軌長度為2(T=欲編碼之殘差信號長度(樣本)。若t=8，及若4音軌係用來編碼殘差信號，則4音軌中之各一者具有2音軌位置。舉例言之，第一音軌可考慮具有兩個音軌位置x0及x4。則第一音軌之脈衝出現在下列中之任一者：

此一組態有四個不同狀態。

同理，若第一音軌有兩個脈衝，第一音軌具有兩個音軌位置x0及x4。則脈衝可分配在下列脈衝叢：

因而此一組態有8狀態。

若殘差信號之長度擴延至T=12，則4音軌各自有3音軌位置。第一音軌獲得多一個樣本，現在有音軌位置x0、x4及x8，使得具有：

上表表示若x8=0(x8不具脈衝)則針對x0及x4有8不同狀態；若x8=1(x8具正脈衝)則針對x0及x4有不同狀態；若x8=-1(x8具負脈衝)則針對x0及x4有不同狀態；若x8=2(x8具兩個正脈衝)則針對x0及x4有一個狀態；及若x8=-2(x8具兩個負脈衝)則針對x0及x4有一個狀態。

此處，從先前二表獲得第一列之狀態數目。藉將狀態數目加至第一列，發現此一組態共有18狀態。

於T=12實例中，5位元足夠編碼全部18不同的可能狀態。然後編碼器例如從範圍[0,...,17]選定狀態數目來載明18組態中之一者。若解碼器知曉編碼方案，例如若解碼器知曉哪個狀態數目表示哪個組態，則可針對一音軌解碼脈衝位置及脈衝符號。

後文中，將提供依據實施例之適當編碼方法及相對應解碼方法。依據實施例提供編碼裝置，其係經組配來執行後文呈示之編碼方法中之一者。此外，依據額外實施例提供解碼裝置，其係經組配來執行後文呈示之解碼方法中之一者。

於實施例中，為了產生狀態數目或解碼狀態數目，可計算具有p脈衝之N個音軌位置的可能組態數目。

脈衝可加符號，及可採用遞歸公式，計算針對具有N個音軌位置及p個有符號脈衝(脈衝可以是正或負，但在相同音軌位置的脈衝具有相同符號)的一音軌之狀態數目f (p ,N )，其中遞歸公式f (p ,N )定義為：

初始條件為

因具有一或多個脈衝之單一位置要求一個位元(2狀態)來用於符號。遞歸公式係用於全部不同叢之摘要。

亦即，給定p脈衝，目前位置可具有q_N =0至p脈衝，故其餘N-1位置有p-q_N 脈衝。於目前位置及其餘N-1位置的狀態數目相乘來獲得具此等脈衝組合之狀態數目，組合經加總來獲得狀態總數。

於實施例中，遞歸函式可藉迭代重複演算法計算，其中遞歸係以迭代重複置換。

因f (p ,N )之評估就即時應用而言於數值上相當複雜，依據若干實施例，可採用詢查表來計算f (p ,N )。依據若干實施例，該表可已經離線計算。

後文中，提出額外構思用於狀態數目之編碼與解碼：設f (p ,N )表示具有p個有符號脈衝之N個音軌位置的可能組態數目。

脈衝資訊編碼器現在可分析音軌：若在該音軌的第一位置不具脈衝，則其餘N-1位置具有p個有符號脈衝，為了描述此叢，只需要f (p ,N -1)狀態。

否則，若第一位置具有一或多個脈衝，則脈衝資訊編碼器可定義總狀態係大於f (p ,N -1)。

然後，在脈衝資訊解碼器，脈衝資訊解碼器例如可始於最末位置，及比較該狀態與一臨界值例如f (p ,N -1)。若該狀態為較大，則脈衝資訊解碼器可決定最末位置具有至少一個脈衝。然後脈衝資訊解碼器可從該狀態扣除f (p ,N -1)來獲得已更新狀態數目及將剩餘脈衝數目減1來更新狀態。

否則，若最末位置沒有脈衝，則脈衝資訊解碼器可將剩餘位置數目減1。重複此一程序直到沒有脈衝剩下提供無符號的脈衝位置。

為了也將脈衝符號列入考慮，脈衝資訊編碼器可以最低狀態位元編碼脈衝。於另一實施例中，脈衝資訊編碼器可以最高剩餘狀態位元編碼該符號。但以最低位元編碼脈衝符號為佳，原因在於就整數計算而言更容易處理。

在脈衝資訊解碼器中，若找到給定位置之第一脈衝，則脈衝符號係由最末位元決定。然後，剩餘狀態向右移位一步驟來獲得已更新狀態數目。

於一實施例中，脈衝資訊解碼器係經組配來應用下列解碼演算法。於此解碼演算法中，於逐一步驟辦法中，針對各個音軌位置例如前後相續，狀態數目或已更新狀態數目係與臨界值例如與f(p,k-1)比較。

依據一實施例，提供脈衝資訊解碼器演算法：

依據一實施例，有關脈衝資訊，脈衝資訊編碼器係經組配來施加下列編碼演算法。脈衝資訊編碼器進行與脈衝資訊解碼器之相同步驟但順序相反。

依據一實施例，提供脈衝資訊編碼器演算法：

藉使用此一演算法編碼狀態數目，針對音軌中之一者的各個音軌位置在一音軌位置的各個脈衝，脈衝資訊編碼器將一整數值加至中間數目(例如中間狀態數目)，例如演算法完成前的狀態數目，來獲得狀態數目(之數值)。

脈衝資訊之編碼及解碼辦法，例如脈衝位置及脈衝符號可稱作為「逐一步驟編碼」及「逐一步驟解碼」，原因在於音軌位置由編碼及解碼方法被視為前後相續，亦即逐一步驟。

第6圖為流程圖例示說明一實施例，闡釋依據一實施例由脈衝資訊解碼器所進行的處理步驟。

於步驟610，目前音軌位置k係設定為N。此處，N表示一音軌之音軌位置數目，其中音軌位置係編碼從1至N。

於步驟620，測試k是否大於或等於1，亦即是否有任何剩餘音軌位置尚未考慮。若k不大於或等於1，則全部音軌位置皆已考慮及結束處理。

否則於步驟630，測試狀態是否大於或等於f(p,k-1)。若為是，則位置k至少存在有一個脈衝。若為否，則於音軌位置k不存在有(額外)脈衝，及處理繼續步驟640，於該處k減1，使得將考慮下個音軌位置。

但若狀態係大於或等於f(p,k-1)，處理繼續步驟642，一脈衝置於音軌位置k，及然後於步驟644，狀態係藉將該狀態減f(p,k-1)更新。然後於步驟650，測試目前脈衝是否為在音軌位置k第一個發現的脈衝。若為否，則於步驟680，剩餘脈衝數目減1，及處理繼續步驟630。

但若目前脈衝是在音軌位置k第一個發現的脈衝，處理繼續步驟660，於該處測試s的最低位元是否經設定。若為是，則在此音軌位置的脈衝符號係設定為負(步驟662)，否則在此音軌位置的脈衝符號係設定為正(步驟664)。兩種情況下，於步驟670然後狀態向右移位一個步驟(s：=s/2)。然後，剩餘脈衝數目也減1(步驟680)，及處理繼續步驟630。

第7圖為流程圖例示說明一實施例，該流程圖闡釋依據一實施例由脈衝資訊編碼器所進行的處理步驟。

於步驟710，所找到的脈衝p之數目係設定為0，狀態s係設定為0，及所考慮之音軌位置k係設定為1。

於步驟720，測試k是否小於或等於N，亦即是否仍有音軌位置尚未考慮(此處，N表示：一音軌之音軌位置數目)。若k係不小於或等於N，則全部音軌位置皆已經考慮及結束處理。

否則於步驟730，測試至少一個脈衝是否存在於位置k。若否，處理繼續步驟740，於該處k增加1，使得將考慮下個音軌位置。

但若至少一個脈衝係存在於音軌位置k，則於步驟750測試目前考慮的脈衝是否為音軌位置k的最末脈衝。若否，則於步驟770，狀態s係藉f(p,k-1)加至狀態s更新，所找到的脈衝p數目加1，及處理繼續步驟780。

若目前考慮的脈衝是音軌位置k的最末脈衝，則於步驟750之後，處理繼續步驟755，及狀態向左移位一個步驟(s：=s^＊ 2)。然後於步驟760，測試脈衝符號是否為負。若是，則s的最低位元係設定為1(步驟762)；否則s的最低位元係設定為0(或不變)(步驟764)。然後於兩種情況下，進行步驟770，於該處狀態s係藉f(p,k-1)加至狀態s更新，所找到的脈衝p數目加1，及處理繼續步驟780。

於步驟780，測試在位置k是否有另一脈衝。若是，則處理繼續步驟750；否則，處理繼續步驟740。

後文中，提供編碼多個音軌之狀態的聯合狀態數目之構思。

不幸，於多種情況下，單音軌的可能狀態範圍並非2的倍數，因而各狀態的二進制表示型態無效。舉例言之，若可能的狀態數目為5，則需3位元來以二進制數目表示。但若有4音軌各有5狀態，則整個子訊框有5x5x5x5=625狀態，可以10位元(而非4x3=12位元)表示。如此相當於每個音軌2.5位元而非3位元，如此每音軌節省0.5位元，或相當於每個子訊框節省2位元(占總位元耗用量的20%)。因此重要地係組合各音軌狀態成為一個聯合狀態，原因在於藉此可減少二進制表示型態的無效率。注意相同辦法可用於傳輸的任何數目。舉例言之，因各個子訊框可有一狀態表示脈衝位置，及各訊框可有例如4子訊框，此等狀態可組合成為一個聯合狀態。

給定子訊框例如有4音軌，則藉聯合編碼各音軌狀態，可減少位元耗用而改良效率。舉例言之，給定各音軌有p_k 脈衝，及各音軌具有長度N，例如有N個音軌位置，則各音軌狀態係在0至f (p _k ,N )-1之範圍。然後各音軌之狀態s_k 可經組合成為子訊框之聯合狀態s，具公式(假設每個子訊框有4音軌)公式2：s =[[s ₀ f (p ₀ ,N )+s ₁ ]f (p ₁ ,N )+s ₂ ]f (p ₂ ,N )+s ₃

然後各音軌之狀態可於解碼器決定，藉將聯合狀態除以f (p _k ,N )，藉此餘數為最末音軌狀態，及整數部分為其餘音軌之聯合狀態。若音軌數目非為4，則方便於上式中適當地加或減項數。

注意，當每個音軌之脈衝數目大時，則可能的狀態數目變大。舉例言之，有4音軌，每個音軌有6脈衝，及音軌長度N=16，則狀態為83-位元數目，超過常規中央處理單元(CPU)上的最大二進制數目長度。接著須採取若干額外步驟來使用標準方法以極長整數評估上式。

當狀態機率假設為相等時，也觀察此一辦法等於音軌狀態之算術編碼。

前文已經呈示逐一步驟辦法用以編碼及解碼一音軌之脈衝資訊，例如一音軌之脈衝位置及可能脈衝符號。其它實施例提供另一辦法，稱作為「分裂與征服」辦法。

脈衝資訊編碼器係經組配來施加分裂與征服辦法，將一音軌劃分為兩個音軌區劃x₁ 及x₂ ，可考慮為兩個向量，其中x=[x₁ x₂ ]。基本構想係分開編碼二向量x₁ 及x₂ ，及然後以下式組合二者

上式中，須注意當脈衝數目為已知時，換言之，當向量分別地具有p₁ 及p₂ =p-p₁ 脈衝時，s(x₁ )及s(x₂ )為向量x₁ 及x₂ 之狀態。為了將向量x₁ 中具有0至p₁ -1脈衝的全部狀態列入考慮，須將加總項加至上式。

如上演算法/公式可施加來藉施加以下兩個前處理步驟來編碼交插音軌脈衝。首先，設向量x_{track k} 包含音軌k上的全部樣本，藉定義x=[x_{track 1,} x_{track 2,} x_{track 3,} x_{track 4} ]而合併此等向量。觀察如此只是樣本的重新排序，使得來自音軌1的全部樣本係置於第一組等等。

其次，注意每個音軌之脈衝數目通常為固定數目。接著若音軌1經常性有p₁ 脈衝，則針對全部值k≠p₁ ，音軌1上的狀態數目為f (k ,N ₁ )=0。此乃陳述音軌1沒有任何狀態不具p₁ 脈衝的另一個方式。正式地然後將狀態數目公式定義為：公式4：針對具有p_k 脈衝的完整音軌x_{track k} ，狀態數目為(N=N_{track k} )

否則，針對N>1

以及針對N=1：

藉樣本之重新排序及使用如上針對狀態數目之定義(公式4)，可藉公式3計算全部音軌之聯合狀態。注意因狀態數目大半含有零，當合併音軌狀態時，公式3之加總為零。因此合併二音軌係與公式2相同。同理，方便顯示採用兩個辦法，合併全部4音軌(或5)也獲得相同結果。

依據一實施例，重新排序可用作為編碼器之前處理步驟。於另一實施例中，重新排序可整合入編碼器。同理依據一實施例，重新排序可用作為解碼器之後處理步驟。於另一實施例中，重新排序可整合入解碼器。

若一音軌上的脈衝數目為不固定，則方便適度修改狀態數目公式，而仍然使用相同編碼演算法。

若適當選擇合併音軌順序，則觀察於章節「組合音軌資料」呈示的辦法及前述方法獲得相等結果。同理，逐一步驟辦法及分裂與征服辦法獲得相等結果。因此，依據哪個辦法體現上更實用或哪個辦法最佳匹配平台的運算限制，獨立地選擇哪個辦法用在解碼器及編碼器。

依據一實施例，提供脈衝資訊編碼器演算法，可以假代碼描述

依據一實施例，採用此種編碼演算法，脈衝資訊編碼器係經組配來將音軌中之一者劃分成一第一音軌區劃及一第二音軌區劃。脈衝資訊編碼器係經組配來編碼與第一區劃相聯結的第一子狀態數目。此外，脈衝資訊編碼器係經組配來編碼與第二區劃相聯結的第二子狀態數目。又，脈衝資訊編碼器係經組配來組合第一子狀態數目及第二子狀態數目而獲得該狀態數目。

同理，依據一實施例，提供脈衝資訊解碼器演算法，可以假代碼描述

於實現該分裂與征服辦法之一實施例中，脈衝資訊解碼器係經組配來基於該狀態數目而產生第一子狀態數目及第二子狀態數目。脈衝資訊解碼器係經組配來基於該第一子狀態數目而解碼該等音軌中之一者之第一區劃的脈衝位置之第一群組。此外，脈衝資訊解碼器係經組配來基於該第二子狀態數目而解碼該等音軌中之一者之第二區劃的脈衝位置之第二群組。

雖然已經以裝置脈絡描述若干構面，但顯然此等構面也表示相對應方法的描述，於該處一方塊或一裝置係相對應於一方法步驟或一方法步驟之特徵。同理，以方法步驟之脈絡描述的構面也表示相對應裝置之相對應方塊或項或特徵結構之描述。

取決於某些體現要求，本發明之實施例可於硬體或於軟體體現。體現可使用數位儲存媒體執行，例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體，具有可電子讀取控制信號儲存於其上，該等信號與(或可與)可程式規劃電腦系統協作，因而執行個別方法。

依據本發明之若干實施例包含具有可電子式讀取控制信號的資料載體，該等控制信號可與可程式規劃電腦系統協作，因而執行此處所述方法中之一者。

大致言之，本發明之實施例可體現為具有程式代碼的電腦程式產品，該程式代碼係當電腦程式產品在電腦上跑時可執行該等方法中之一者。該程式代碼例如可儲存在機器可讀取載體上。

其它實施例包含儲存在機器可讀取載體或非過渡儲存媒體上的用以執行此處所述方法中之一者的電腦程式。

換言之，因此，本發明方法之實施例為一種具有一程式代碼之電腦程式，該程式代碼係當該電腦程式於一電腦上跑時用以執行此處所述方法中之一者。

因此，本發明方法之又一實施例為資料載體(或數位儲存媒體或電腦可讀取媒體)包含用以執行此處所述方法中之一者的電腦程式記錄於其上。

因此，本發明方法之又一實施例為表示用以執行此處所述方法中之一者的電腦程式的資料串流或信號序列。資料串流或信號序列例如可經組配來透過資料通訊連結，例如透過網際網路轉移。

又一實施例包含處理構件例如電腦或可程式規劃邏輯裝置，其係經組配來或適用於執行此處所述方法中之一者。

又一實施例包含一電腦，其上安裝有用以執行此處所述方法中之一者的電腦程式。

於若干實施例中，可程式規劃邏輯裝置(例如可現場程式規劃閘陣列)可用來執行此處描述之方法的部分或全部功能。於若干實施例中，可現場程式規劃閘陣列可與微處理器協作來執行此處所述方法中之一者。大致上該等方法較佳係藉任何硬體裝置執行。

前述實施例係僅供舉例說明本發明之原理。須瞭解此處所述配置及細節之修改及變化將為熟諳技藝人士顯然易知。因此，意圖僅受審查中之專利申請範圍所限而非受藉以描述及解說此處實施例所呈示之特定細節所限。

110‧‧‧脈衝資訊解碼器

120‧‧‧信號解碼器

210‧‧‧信號處理器

220‧‧‧脈衝資訊編碼器

610-680、710-780‧‧‧處理步驟

第1圖顯示依據一實施例用以解碼一編碼音訊信號之裝置，第2圖顯示依據一實施例用以編碼一音訊信號之裝置，第3圖顯示針對具有兩個無符號脈衝及三個音軌位置之一音軌的全部可能組態，第4圖顯示針對具有一個有符號脈衝及兩個音軌位置之一音軌的全部可能組態，第5圖顯示針對具有兩個有符號脈衝及兩個音軌位置之一音軌的全部可能組態，第6圖為例示說明一實施例之流程圖，闡釋依據一實施例藉脈衝資訊解碼器所進行的處理步驟，及第7圖為例示說明一實施例之流程圖，該流程圖闡釋依據一實施例藉脈衝資訊編碼器所進行的處理步驟。

110‧‧‧脈衝資訊解碼器

120‧‧‧信號解碼器

Claims

一種用以解碼一編碼音訊信號之裝置，其中一或多個音軌係與該編碼音訊信號相關聯，該等音軌中之各者具有多個音軌位置及多個脈衝，其中該裝置係包含：一脈衝資訊解碼器，係適用以解碼多個脈衝位置，其中該等脈衝位置中之各者指示該等音軌中之一者的該等音軌位置中之一者來指示該音軌之該等脈衝中之一者的位置，及其中該脈衝資訊解碼器係經組配來藉由使用指示該等音軌中之至少一者的音軌位置總數之一音軌位置數目、指示該等音軌中之至少一者的脈衝總數之一總脈衝數目、及一個狀態數目而解碼該等多個脈衝位置；及一信號解碼器，其係用於藉由使用該等多個脈衝位置及與該編碼音訊信號相關聯的多個預測濾波器係數而產生合成音訊信號來解碼該編碼音訊信號。
如申請專利範圍第1項之裝置，其中該脈衝資訊解碼器進一步適用於使用該音軌位置數目、該總脈衝數目及該狀態數目而解碼多個脈衝符號，其中該等脈衝符號中之各者指示該等多個脈衝中之一者之一符號，及其中該信號解碼器係適用以更進一步使用該等多個脈衝符號而產生合成音訊信號來解碼該編碼音訊信號。
如申請專利範圍第1或2項之裝置，其中該等一或多個音軌係包含至少一個最末音軌及一或多個其它音軌，及其中該脈衝資訊解碼器係適用以從該狀態數目產生一第一子狀態數目及一第二子狀態數目，其中該脈衝資訊解碼器係經組配來基於該第一子狀態數目而解碼該等脈衝位置之一第一群組，及其中該脈衝資訊解碼器係經組配來基於該第二子狀態數目而解碼該等脈衝位置之一第二群組，其中該等脈衝位置之該第二群組只包含指示該最末音軌之音軌位置的脈衝位置，及其中該等脈衝位置之該第一群組只包含指示該等一或多個其它音軌之音軌位置的脈衝位置。
如申請專利範圍第3項之裝置，其中該脈衝資訊解碼器係經組配來藉由將該狀態數目除以f(p_k ,N)而獲得一整數部分及一餘數作為除法結果來產生該第一子狀態數目及該第二子狀態數目，其中該整數部分為該第一子狀態數目，及其中該餘數為該第二子狀態數目，其中p_k 指示針對該等一或多個音軌中之各者的脈衝數目，及其中N指示針對該等一或多個音軌中之各者的音軌位置數目。
如申請專利範圍第1項之裝置，其中該脈衝資訊解碼器係適用以進行將該狀態數目或一已更新狀態數目與一臨界值相比較之一測試。
如申請專利範圍第5項之裝置，其中該脈衝資訊解碼器係適用以藉由比較該狀態數目或已更新狀態數目是否大於、大於或等於、小於、小於或等於該臨界值而進行該測試，及其中該脈衝資訊解碼器係進一步適用以取決於該測試之結果而更新該狀態數目或已更新狀態數目。
如申請專利範圍第6項之裝置，其中該脈衝資訊解碼器係經組配來針對該等多個音軌中之一者的各個音軌位置，比較該狀態數目或該已更新狀態數目與該臨界值。
如申請專利範圍第1項之裝置，其中該脈衝資訊解碼器係經組配來劃分該等音軌中之一者成為包含該等多個音軌位置中之至少兩個音軌位置之一第一音軌分區，及成為包含該等多個音軌位置中之至少兩個其他音軌位置之一第二音軌分區，其中該脈衝資訊解碼器係經組配來基於該狀態數目而產生一第一子狀態數目及一第二子狀態數目，其中該脈衝資訊解碼器係經組配來基於該第一子狀態數目，解碼與該第一音軌分區相關聯的脈衝位置之一第一群組，及其中該脈衝資訊解碼器係經組配來基於該第二子狀態數目，解碼與該第二音軌分區相關聯的脈衝位置之一第二群組。
一種用以編碼一音訊信號之裝置，該裝置係包含：一信號處理器，用以決定與該音訊信號相關聯的多個預測濾波器係數，用以基於該音訊信號及該等多個預測濾波器係數而產生一殘差信號；及一脈衝資訊編碼器，用以編碼與一或多個音軌相關的多個脈衝位置來編碼該音訊信號，該等一或多個音軌係與該殘差信號相關聯，該等音軌中之各者具有多個音軌位置及多個脈衝，其中該等脈衝位置中之各者指示該等音軌中之一者的該等音軌位置中之一者來指示該音軌之該等脈衝中之一者的位置，其中該脈衝資訊編碼器係經組配來藉由產生一狀態數目而編碼該等多個脈衝位置，使得該等脈衝位置唯有基於該狀態數目、指示該等音軌中之至少一者的音軌位置總數之一音軌位置數目、及指示該等音軌中之至少一者的脈衝總數之一總脈衝數目才能被解碼。
如申請專利範圍第9項之裝置，其中該脈衝資訊編碼器係適用以編碼多個脈衝符號，其中該等脈衝符號中之各者指示該等多個脈衝中之一者之一符號，其中該脈衝資訊編碼器係經組配來藉由產生該狀態數目而編碼該等多個脈衝符號，使得該等脈衝符號唯有基於該狀態數目、指示該等音軌中之至少一者的音軌位置總數之該音軌位置數目、及該總脈衝數目才能被解碼。
如申請專利範圍第9或10項之裝置，其中該脈衝資訊編碼器係經組配來針對該等音軌中之一者的各個音軌位置，將一整數值加至針對於一音軌位置的各個脈衝之一中間數目來獲得該狀態數目。
如申請專利範圍第9或10項之裝置，其中該脈衝資訊編碼器係經組配來劃分該等音軌中之一者成為包含該等多個音軌位置中之至少兩個音軌位置之一第一音軌分區，及成為包含該等多個音軌位置中之至少兩個其他音軌位置之一第二音軌分區，其中該脈衝資訊編碼器係經組配來編碼與該第一分區相關聯的一第一子狀態數目，其中該脈衝資訊編碼器係經組配來編碼與該第二分區相關聯的一第二子狀態數目，及其中該脈衝資訊編碼器係經組配來組合該第一子狀態數目與該第二子狀態數目而獲得該狀態數目。
一種用以解碼一編碼音訊信號之方法，其中一或多個音軌係與該編碼音訊信號相關聯，該等音軌中之各者具有多個音軌位置及多個脈衝，其中該方法係包含：解碼多個脈衝位置，其中該等脈衝位置中之各者指示該等音軌中之一者的該等音軌位置中之一者來指示該音軌之該等脈衝中之一者的位置，及其中該等多個脈衝位置係藉由使用指示該等音軌中之至少一者的音軌位置總數之一音軌位置數目、指示該等音軌中之至少一者的脈衝總數之一總脈衝數目、及一個狀態數目而予解碼；及藉由使用該等多個脈衝位置及與該編碼音訊信號相關聯的多個預測濾波器係數而產生一合成音訊信號來解碼該編碼音訊信號。
一種用以編碼一音訊信號之方法，該方法係包含：決定與該音訊信號相關聯的多個預測濾波器係數，用以基於該音訊信號及該等多個預測濾波器係數而產生一殘差信號；及編碼與一或多個音軌相關的多個脈衝位置來編碼該音訊信號，該等一或多個音軌係與該殘差信號相關聯，該等音軌中之各者具有多個音軌位置及多個脈衝，其中該等脈衝位置中之各者指示該等音軌中之一者的該等音軌位置中之一者來指示該音軌之該等脈衝中之一者的位置，其中該等多個脈衝位置係藉由產生一狀態數目而予編碼，使得該等脈衝位置唯有基於該狀態數目、指示該等音軌中之至少一者的音軌位置總數之一音軌位置數目、及指示該等音軌中之至少一者的脈衝總數之一總脈衝數目才能被解碼。
一種電腦程式，該電腦程式當在一電腦或信號處理器上執行時體現如申請專利範圍第13或14項之方法。