TWI404429B

TWI404429B - 用於將多頻道音訊信號編碼／解碼之方法與裝置

Info

Publication number: TWI404429B
Application number: TW097151236A
Authority: TW
Inventors: Yang Won Jung; Hee Suk Pang; Hyen O Oh; Dong Soo Kim; Jae Hyun Lim
Original assignee: Lg Electronics Inc
Priority date: 2005-09-27
Filing date: 2006-09-27
Publication date: 2013-08-01
Also published as: EP1938313A4; TW200932030A; US20090048847A1; TWI333385B; EP1943642A1; US7719445B2; WO2007037621A1; US8090587B2; US20080252510A1; EP1943642A4; TW200719746A; WO2007037613A1; JP2009510514A; HK1132576A1; EP1938313A1; JP2009518659A

Description

用於將多頻道音訊信號編碼/解碼之方法與裝置

本發明係有關一種將多頻道音訊信號編碼與解碼之方法、以及有關於一種將多頻道音訊信號編碼與解碼之裝置。本發明更尤其係有關一種將多頻道音訊信號編碼與解碼之方法、以及有關於一種將多頻道音訊信號編碼與解碼之裝置，其可以藉由將關於多頻道音訊信號之複數個空間參數有效率地編碼/解碼，而可以降低位元速率。

最近，已經發展出各種數位音訊編碼技術，以及關於數位音訊編碼大量增加產品已經被商業化。而且，已經根據生理音學模式發展出各種多頻道音訊編碼技術，且其目前已被標準化。

此等生理音學模式是根據人類如何感知聲音而建立。例如，根據此事實：較弱的聲音在較響的聲音存在下變得無法聽到，以及人耳可以聽到20~20,000Hz範圍中之聲音。藉由使用此種生理音學模式，可以藉由在資料編碼期間去除並不必要之音訊信號，而有效地減少資料數量。

在傳統上，此多頻道音訊信號之位元流是藉由實施固定量化而產生，其僅涉及在被編碼之資料上使用單一量化表，因此，位元速率增加。

本發明提供一種種將多頻道音訊信號編碼與解碼之方法、以及有關於一種將多頻道音訊信號編碼與解碼之裝置，其可以將多頻道音訊信號與多頻道音訊信號之空間參數有效率地編碼/解碼，以及甚至因此可以應用至任意擴展之頻率環境。

根據本發明之一觀點，提供一種將具有複數個頻道之音訊信號編碼之方法。此方法包括：判斷在此等複數個頻道之一對頻道間之頻道位準差異(CLD)，以及考慮到此對頻道之位置性質將CLD量化。

根據本發明之另一觀點，提供一種接收位元流且將具有複數個頻道之音訊信號解碼之方法。此方法包括：在複數個頻道之一對頻道間、從位元流擷取量化CLD，以及使用此考慮到此對頻道位置性質之量化表，將此經量化之CLD逆量化。

根據本發明之另一觀點，提供一種接收位元流且將具有複數個頻道之音訊信號解碼之方法。此方法包括：在此等複數個頻道之一對頻道間之擷取此經量化CLD；從此位元流擷取有關量化模式之資訊；如果此量化模式為第一模式，則使用此第一量化表將此經量化之CLD逆－量化；以及如果此量化模式為第二模式，則使用此考慮到此對頻道位置性質之第二量化表，將此經量化之CLD逆－量化。

根據本發明之另一觀點，提供一種將具有複數個頻道之音訊信號編碼之裝置。此裝置包括：空間參數擷取單元，其判斷此等複數個頻道之一對頻道間之CLD；以及量化單元，其考慮到此對頻道位置性質將CLD量化。

根據本發明之另一觀點，提供一種接收位元流且將具有複數個頻道之音訊信號解碼之裝置。此裝置包括：去封裝單元，其在此等複數個頻道之一對頻道間從位元流擷取此經量化CLD；以及逆量化單元，其使用此考慮到此對頻道位置性質之量化表，將此經量化之CLD逆－量化。

根據本發明之另一觀點，提供一種具有程式記錄於其上之電腦可讀取記錄媒體，用於以執行此具有多個頻道之音訊信號編碼與解碼之方法。根據本發明之另一觀點，提供一種具有複數個頻道之音訊信號之位元流。此位元流包括：CLD欄位，其包含有關於一對頻道間量化CLD之資訊；以及表資訊欄位，其包含有關使用量化表以產生量化CLD之資訊。其中，此量化表考慮到此對頻道之位置。

本發明之多頻道音訊信號編碼與解碼之方法與多頻道音訊信號編碼與解碼之裝置，藉由減少所須量化位元之數目，而使得可以有效率地編碼/解碼。

本發明之以上或其他特性與優點將藉由：詳細說明之典範實施例並參考所附圖式，而成為更明顯。

以下參考所附圖式更詳細說明本發明，其中，顯示本發明之典範實施例。

第1圖為根據本發明實施例之多頻道音訊信號編碼器與解碼器之方塊圖。參考第1圖，此多頻道音訊信號編碼器包括：向下混合器110與空間參數估計器120；以及此多頻道音訊信號解碼器包括：空間參數解碼器130與空間參數綜合器140。此向下混合器110產生信號，其根據多頻道來源例如5.1頻道來源而向下混合至立體聲或單音頻道。空間參數估計器120獲得此須要產生多頻道之空間參數。

此等空間參數包括：頻道位準差異(CLD)，其顯示一對頻道能量位準間之差異，而此一對頻道由數個多頻道中選出；頻道預測係數(CPC)，使用此預測係數根據一對頻道信號而產生三個頻道信號；頻道間相關(ICC)，其顯示一對頻道間之相關；以及頻道時間差異(CTD)，其顯示一對頻道間之時間差異。

可以將由外部處理之技術向下混合信號103輸入至：多頻道音訊信號編碼器。空間參數解碼器130將對其傳輸之空間參數解碼。空間參數綜合器140將經編碼之向下混合信號解碼，且將此經解碼之向下混合信號、與由空間參數解碼器130所提供經解碼空間參數綜合，因此產生多頻道音訊信號105。

第2圖用於說明根據一實施例之多頻道組態。特定而言，第2圖說明5.1頻道組態。由於0.1頻道為低頻加強頻道且與位置無關，在第2圖中並未說明。參考第2圖，其左頻道L與右頻道R為30，而與中間頻道C間隔距離。左圍繞頻道Ls與右圍頻道Rs為110而與為80之中間頻道C間隔距離，而各與左頻道L與右頻道R間隔距離。

第3圖說明人耳如何感受音訊信號，且更尤其是、音訊信號之空間參數。參考第3圖，此多頻道音訊信號之編碼是根據此事實，即人耳感受之音訊信號為三度空間(3D)。可以使用複數個組之參數，以代表作為3D空間資訊之音訊信號。此等代表多頻道音訊信號之空間參數可以包括：CLD、ICC、CPC、以及CTD。CLD代表頻道位準間之差異，且尤其是頻道能階間之差異。ICC代表頻道對間之相關。CPC為預測參數，其根據一對頻道信號而產生三個頻信號，以及CTD代表一對頻道間之差異。

以下參考第3圖詳細說明：人耳如何以空間方式感知音頻信號，以及如何產生關於音頻信號之空間參數。請參考第3圖，此第二直接聲波303從與使用者遙遠分開之聲源301傳送至使用者之左耳307，此第一直接聲波 302經由繞射從聲源301傳送至使用者之右耳306。第一與第二直接聲波302與303，可以具有不同抵達時間與不同能量位準。因此，造成第一與第二直接聲波302與303之CLD、CPC、以及CTD。

可以藉由將本發明應用至此根據上述原則所產生空間參數之量化，而提升此量化之效率。

第4圖為根據本發明實施例用於將多頻道音訊信號之空間參數編碼之裝置(以下稱為編碼裝置)之方塊圖。參考第4圖，當輸入此多頻道音訊信IN時，將此多頻道音訊信IN分割成此等信號，其各對應於濾波器庫401之複數個次－頻帶(即，次－頻帶1至N)。此濾波器庫401可以為次－頻帶濾波器庫或為四鏡濾波器(QMF)濾波庫。

空間參數擷取單元402從各此等分割信號擷取一或更多個空間參數。量化單元403將此等所擷取之空間參數量化。詳細而言，量化單元403可以依據此對頻道之位置性質，將此等複數個頻道之一對頻道間之CLD量化。此等將左頻道L與右頻道R間CLD量化所須量化步驟大小或量化步驟數目(以下稱為量化步驟數量)可以與：左頻道L與左周圍頻道Ls間CLD量化所須量化步驟大小或量化數量不同。

以下參考第13圖詳細說明根據本發明實施例空間參數之量化。

參考第13圖，在操作940中，空間參數擷取單元402從此等經分割之音訊信號擷取此等空間參數。此等所擷取空間參數之例包括：CLD、CTD、ICC、以及CPC。在操作945中，此量化單元403使用量化表，將此等所擷取空間參數、尤其是CLD量化，此量化表使用預先確定角度間隔作為量化步驟大小。此量化單元403可以將此對應於：在操作945中所獲得之量化CLD之指數資訊、輸出至位元流產生單元404。此在操作945中所獲得之量化CLD可以界定為：在複數個多頻道音訊信號間基準－10算法之功率比，如同由式(1)所示”：

而n代表時間間隔指數，以及m代表混合次－頻帶指數。

然後，位元流產生單元404使用：向下混合音訊信號與量化空間參數、包括在操作945中所獲得之量化CLD，以產生位元流。

第5圖說明藉由根據本發明實施例量化單元403以說明虛擬聲音來源位置之判斷，以及說明此須要解釋正弦/正切法則之振幅變化(panning)法則。

參考第5圖，當聽者面向前時，此虛擬聲源可以藉由調整頻道ch1與ch2對之大小，而位於任意位置(例如：點C)。在此情形中，此虛擬聲源之位置可以根據頻道ch1與ch2對之大小而決定，如同由式(2)所示：

而φ代表在虛擬聲源與頻道ch1與ch2間中心、之間之角度。而φ₀ 代表頻道ch1與ch2間中心、與頻道ch1間之角度，以及g1代表對應於ch1之增益因子。

當聽者面向虛擬聲源時，式(2)可以重新配置成式(3)。

根據式(1)、(2)、以及(3)，此在頻道ch1與ch2間之CLD可以式(4)界定。

根據式(2)與(4)，此在頻道ch1與ch2間之CLD亦可以使用虛擬聲源與頻道ch1與ch2式之角度位置界定，如同由式(5)與(6)所示：

根據式(5)與(6)，此CLD可以對應於虛擬聲源之角度位置φ。換句話說，此在頻道ch1與ch2間之CLD、即頻道ch1與ch2間能量位準間之差異可以由：位在頻道ch1與ch2間之虛擬聲源之角度位置φ代表。

第6圖藉由根據本發明另一實施例第4圖中量化單元403以說明虛擬聲音來源位置之判斷。

當複數個說話者位於如同第6圖中所說明位置時、第i個頻道與第(i－1)個頻道間之CLD可以式(4)與(5)表示，則其位置可以由式(7)與(8)所示：「數學式7」CLD＝20log10(G_i )

而θ_i 代表位於第i個頻道與第(i－1)個頻道間虛擬聲源之角度位置，以及φ_i 顯示第I個說話者之角度位置。

根據式(7)與(8)，此等一對頻道間之CLD可以由：用於任何說話者組態之此等頻道間之虛擬聲源之角度位置所代表。

第7圖說明使用此預先確定角度間隔將一對頻道間之空間分割成複數個區段。特定而言，第7圖說明將形成30°角度之中間頻道與左頻道間之空間分割成複數個區段。

人類空間資訊解析度顯示：此關於可以由人類感知任意聲音之空間資訊之最小差異。根據生理聲學研究，人類空間資訊之解析度大約為3°角度。因此，可以將一對頻道間CLD量化所須量化步驟大小設定為：3°之角度間隔。因此，可以將中間頻道與左頻道間之空間分割成複數個區段，各區段具有3°之角度。

請參考第7圖，φ₂ －φ_2－1 ＝30°。可以藉由從0°至30°、一次3°增加θ_i ，以計算中間頻道與左頻道間之CLD。此等計算之結果呈現於表1中。

可以藉由使用表1作為量化表將中間頻道與左頻道間之CLD量化。在此情形中，此將中間頻道與左頻道間之CLD量化所須之量化步驟數量為11。

第8圖藉由根據本發明實施例量化單元403使用量化表，以說明CLD之量化。參考第8圖，可以將此量化表中一對相鄰角度間之平均值設定作為量化臨界值。

假設此在中間頻道與右頻道間之角度為30°，且可以藉由將此中間頻道與右頻道間之空間分割成複數個區段、各區段具有角度3°，而將此中間頻道與右頻道間之CLD量化。

使用式(7)與(8)將由空間參數擷取單元402所擷取之CLD轉換成虛擬聲源角度位置。如果此虛擬聲源角度位置是介於1.5°與4.5°之間，則此所擷取之CLD可以被量化至與角度3°有關之值而儲存於表1中。

如果此虛擬聲源角度位置是介於4.5°與7.5°之間，則此所擷取之CLD可以被量化至與角度6°有關之值而儲存於表1中。

此以上述方式所獲得量化CLD可以藉由指數資訊代表。對於此，此包括指數資訊之量化表，即表2可根據表1而產生。

表2僅代表在表1中所呈現CLD值之整數部份，且各以150與－150之CLD值取代表1中8與－8之LCD值。

由於表2包括CLD值之對、其具有相同絕對值但不同符號，因此，可以將表2簡化為表3

在三個或更多頻道中將CLD量化之情形中，可以對於不同對之頻道使用不同之量化表。換句話說，可以將複數個量化表各使用於具有不同位置之複數個頻道對。此量化表適合用於上述方式所產生之各不同對之頻道。

表4為量化表，其被須要將此形成60°角度之左頻道與右頻道間之CLD量化。表4具有3°之量化步驟大小。

「表4」

表5為量化表，其被須要將此形成80°角度之左頻道與左周圍頻道間之CLD量化。表5具有3°之量化步驟大小。

表5不僅可以使用於形成80°角度之左頻道與左周圍頻道，亦可使用於形成80°角度之右頻道與右周圍頻道。

表6為量化表，其被須要將此形成80°角度之左周圍頻道與右周圍頻道間之CLD量化。表6具有3°之量化步驟大小。

在根據本實施例之多頻道音訊信號之空間參數之編碼方法中，此在一對頻道間CLD之量化是對於：此等頻道間虛擬聲源之角度位置線性地量化，而並非對於預先界定之值線性地量化。因此，可以使得能夠達成高度效率與適當量化，而使用於生理聲學模式中。

此根據本實施例之多頻道音訊信號之空間參數編碼方法，不僅可以應用至CLD，而且可以應用至CLD以外之空間參數例如：ICC與CPC。

根據本實施例，如果此用於將多頻道音訊信號之空間參數解碼之裝置(以下稱為解碼裝置)並不具有：由量化單元403使用以實施CLD量化之量化表，則此位元流產生單元404可以將有關於量化表之資訊插入於位流中，且將此位元流傳送至解碼裝置，且此將在以下更詳細說明。

根據本發明之實施例，可以藉由將在量化表中出現之所有值、包括各自對應於此等指數之指數與CLD值插入於位元流中，而將此關於在第4圖中說明而使用於編碼裝置中量化表之資訊傳輸至解碼裝置，且將位元流傳輸至解碼裝置。

根據本發明另一實施例，可以藉由傳輸此由解碼裝置所須資訊，而將此關於使用於編碼裝置中量化表之資訊傳輸至此解碼裝置，以恢復由此編碼裝置所使用之量化表。例如，可以將此使用於編碼裝置中而使用於量化表中之最小與最大角度、以及量化步驟數量插入於位元流中，以及然後，可以將此位元流傳輸至解碼裝置。然後，此解碼裝置可以根據由此編碼裝置所傳輸之資訊以及式(7)與(8)，將此由編碼裝置所使用之量化表恢復。

以下參考第14圖詳細說明：此根據本發明另一實施例空間參數之量化。根據本發明，可以使用此等具有不同量化解析度之兩個或更多量化表，將關於多頻道音訊信號之空間參數量化。

參考第14圖，在操作950中，此空間參數擷取單元402從此將被編碼之音訊信號擷取一或更多個空間參數；此音訊信號為由將一多頻道音訊信號分割而獲得之複數個音訊信號之一，且各自對應於複數個次－頻帶。此等所擷取空間參數之例包括：CLD、CTD、ICC、以及CPC。

在操作955中，量化單元403決定：此具有完全量化解析度之精細模式、與此具有較作為量化模式之精細模式為低量化解析度之粗略模式兩者之一，作為用於被編碼音訊信號之量化模式。此精細模式對應於較粗略模式為大之量化步驟數量，與較小量化步驟大小。

量化單元403可以根據音訊信號之能量位準，以決定精細模式與粗略模式之一作為量化模式。根據心理聲學模式，以高能量位準將音訊信號精密複雜地量化較：以低能量位準將音訊信號精密複雜地量化更為有效率。因此，如果此多頻道音訊信號之能量位準大於預先界定之參考值，則此量化單元403可以精細模式將此多頻道音訊信號量化，否則，以粗略模式將此多頻道音訊信號量化。

例如，此量化單元403可以將此由R－OTT模組所處理信號之能量位準、與此將被編碼音訊信號之能量位準比較。然後，如果由R－OTT模組所處理信號之能量位準低於、此將被編碼音訊信號之能量位準，則此量化單元403可以粗略模式實施量化。另一方面，如果由R－OTT模組所處理信號之能量位準高於、此將被編碼音訊信號之能量位準，則此量化單元403可以粗略模式實施量化。

如果此模組具有5－1－5－1組態，則此量化單元403可以此將被編碼音訊信號之能量位準、與此等各經由左與右頻道輸入之音頻信號之能量位準相比較，以決定此用於輸入至R－OTT3音訊信號之CLD量化模式。

在操作960中，如果將此在在操作955中所決定之精細模式作為：用於此將被編碼音訊信號之量化模式，則量化單元403可以使用此具有完整量化解析度之第一量化表將CLD量化。此第一量化表包括31個量化步驟，且藉由將此等一對頻道間之空間分割成31個區段，而將一對頻道間之CLD量化。在精細模式中，可以將相同的量化表應用至各對頻道。

在操作965中，如果將此在在操作955中所決定之粗略模式作為：用於此將被編碼音訊信號之量化模式，則量化單元403可以使用此具有較第一量化表為低量化解析度之第二量化表將CLD量化。此第二量化表具有預先確定之角度區間作為量化步驟大小。此第二量化表之產生與使用第二量化表將CLD量化可以與：以上參考第7與8圖所說明者相同。

以下參考第15圖詳細說明此根據本發明另一實施例之此等空間參數之量化。

參考第15圖，在操作970中，此空間參數擷取單元402從此一將被編碼音訊信號擷取一或更多個空間參數；此音訊信號為將一多頻道音訊信號分割、而獲得複數個且各對應於複數個次頻帶之音訊信號之一。此等所擷取空間參數之例包括：CLD、CTD、ICC、以及CPD。在操作975中，此量化單元403使用此使用兩個或更多角度作為量化步驟大小之量化表，所此等所擷取空間參數且尤是CLD量化。在此情形中，此量化單元403可以將此對應於在操作975中所獲得經量化CLD之指數資訊，傳輸至編碼單元404。

第9圖說明此根據此對頻道間位置、使用兩個或更多角度區間將一對頻道間之空間分割成數個區段，用於以可變角度區間實施CLD量化操作。

根據心理聲學研究，人類之空間資訊解析度根據聲源之位置而改變。當此聲源位在前方時，人類之空間資訊解析度可以為3.6°。當此聲源位在左側時，人類之空間資訊解析度可以為9.2°。當此聲源位在後方時，人類之空間資訊解析度可以為5.5°。

給定所有此等條件，對於在前方之頻道可以將此量化步驟大小設定為大約3.6°之角度區間，對於在左側或右側之頻道可以將此量化步驟大小設定為大約9.2°之角度區間，以及對於在後方之頻道可以將此量化步驟大小設定為大約5.5°之角度區間。

對於從前方至左側或從左側至後方之平穩移轉，可以將此等量化步驟大小設定為不規則角度區間。換句話說，在此從前方至左側之方向中逐漸增加此角度區間，以致於此量化步驟大小增加。另一方面，在此從左側至後方之方向中此角度區間逐漸減少，以致於此量化步驟大小減少。

請參考第9圖中所說明之複數個頻道，頻道X是位在前方，頻道Y是位在左側，頻道Z是位在後方。為了決定在頻道X與頻道Y間之CLD，可以將頻道X與頻道Y間之空間分割成k個區段，各具有角度1至k。此等角度1至k間之關係可以由式(9)代表：「數學式9」α₁ ≦α₂ ≦...≦α_k

為了決定在頻道Y與頻道Z間之CLD，可以將頻道X與頻道Y間之空間分割成m個區段，各具有角度β₁ 至β_m ，以及n個區段，各具有y₁ 至y_n 。在從頻道Y至左側之方向中，此角度區間逐漸增加，在從左側至頻道Z之方向中，此角度區間逐漸減少。在此等角度β₁ 至β_m 間之關係與此等角度y₁ 至y_n 間之關係，可以各由式(10)與(11)代表「數學式10」β₁ ≦β₂ ≦...≦β_m 「數學式11」γ₁ ≧γ₂ ≧...≧γ_n

此等角度α_k 、β_m 、γ_n 為典範角度，用於說明使用兩個或更多角度區間，將一對頻道間之空間分割。其中，此被使用將一對頻道間之空間分割之角度區間之數目、根據此等多頻道位置之數目與位置可以為4或更大。

而且，此等角度α_k 、β_m 、以及γ_n 可以為均勻或可變。如果此等角度α_k 、β_m 、γ_n 為均勻，則其可以由式(12)代表：「數學式12」α_k ≦γ_n ≦β_m (除了當α_k ＝γ_n ＝β_m 之外)

式(10)顯示根據人類空間資訊解析度之角度區間特徵。例如，α_k ＝3.6°，β_m ＝9.2°以及γ_n ＝5.5°。

表7呈現此等複數個CLD值與複數個角度間之對應；此等複數個角度各對應於複數個相鄰區段，其藉由使用兩個或更多角度區間、將中間頻道與左頻道之間之空間分割而獲得，以形成30之角度。

「表7」

參考第7圖，其中之角度顯示此虛擬聲源與中間頻道間之角度，以及CLD(X)顯示對應於X之CLD值。可以使用式(7)與(8)，以計算此等CLD值CLD(X)。

藉由使用表7作為量化表，可以將中間頻道與左頻道間之CLD量化。在此情形中，此將中間頻道與左頻道間之CLD量化所須量化步驟之數量為11。

參考第7圖，當此從前方至左側方向中之角度區間增加時，此量化步驟大小因此增加，且此顯示人類空間資訊解析度從前方至左側方向中增加。

此在表7中所呈現之CLD值可以由各對應指數代表。在此情形中，表8可以根據表7而獲得。

第10圖藉由根據本發明另一實施例，其由第4圖中所說明量化單元403使用量化表以說明CLD之量化。請參考第10圖，可以將此在量化表中所呈現相鄰一對角度間之平均值作為量化之臨界值。

詳細而言，在此將位於前方頻道A與位於右側上頻道B間之CLD量化之情形中，可以將頻道A與頻道B間之空間分割成k個區段，其各對應於k個角度θ₁ 、θ₂ ...θ_k 。此等角度θ₁ 、θ₂ ...θ_k 可以由式(13)表示。

「數學式13」θ₁ ≦θ₂ ≦...≦θ_k

式(13)顯示此根據此等頻道位置之角度區間特徵。根據式(13)，人類之空間資訊解析度在從前方至左側之方向中增加。

此量化單元403使用式(7)與(8)，將此由此空間參數擷取單元402所擷取之CLD轉換成虛擬聲源角度位置。如同由式(10)所顯示，如果虛擬聲源角度是介於與之間，則可以將此所擷取CLD量化至對應於角度θ₁ 之值。在另一方面，如果虛擬聲源角度是介於與之間，則可以將此所擷取CLD量化至對應於角度θ₁ 與θ₂ 和之值。

在將此用於三個或更多頻道之CLD量化之情形中，對於不同對之頻道可以使用不同之量化表。換句話說，可以將複數個量化表各別使用於：具有不同位置之複數個對之頻道。此用於各不同對頻道之量化表可以上述方式產生。

根據本發明，藉由使用此根據頻道對位置之兩個或更多個角度區間作為量化步驟大小，而將一對頻道間之CLD量化，而並非對於預先確定值線性地量化。因此，可以使得能夠有效率且合適CLD量化而使用於心理聲學模式中。

此根據本實施例之多頻道音訊信號之空間參數編碼方法可以應用至：除了CLD以外之空間參數，例如：ICC與CPC。

以下參考第16圖詳細說明：此根據本發明另一實施例之多頻道音訊信號之空間參數編碼方法。根據此在第16圖中所說明之實施例，可以使用此等具有不同量化解析度之兩個或更多量化表，將此等空間參數量化。

參考第16圖，在操作980中，此等空間參數由此等為複數個音訊信號之一之待編碼音訊信號擷取，此等音訊信號是藉由將一多頻道音訊信號分割而獲得，且各自對應於複數個次－頻道。此等所擷取空間參數之例包括：CLD、CTD、ICC、以及CPC。

在操作985中，此量化單元403決定：此具有完全量化解析度之精細模式、與此具有較此精細模式為低量化解析度之粗略模式之一，作為此用於待編碼音訊信號之量化模式。此精細模式對應於：較大量化步驟數量，以及較粗略模式為小之量化步驟大小。

此量化單元403可以根據此待編碼音訊信號之能量位準以決定：此精細模式與粗略模式之一作為量化模式。根據心理聲學模式，以高能量位準將音訊信號精密複雜地量化較：以低能量位準將音訊信號精密複雜地量化更有效率。因此，如果此音訊信號之能量位準大於此預先界定參考值，則此量化單元403可以精細模式將此多頻道音訊信號量化，否則以粗略模式將此音訊信號量化。

例如，此量化單元403可以將由R－OTT模組所處理之信號之能量位準，與此待編碼音訊信號之能量位準比較。然後，如果此由R－OTT模組所處理之信號之能量位準低於此音訊信號之能量位準，則此量化單元403可以粗糙模式實施量化。另一方面，如果此由R－OTT模組所處理之信號之能量位準高於此待編碼之音訊信號之能量位準，則此量化單元403可以精細模式實施量化。

如果此模組具有5－1－5－1組態，則此量化單元403可以此將此各經由左側與右側頻道輸入之音訊信號之能量位準、與此待編碼音訊信號之能量位準相比較，以決定此用於輸入至R－OTT3音訊信號之CLD量化模式。

在操作990中，如果將此在操作985中所決定之精細模式作為：用於此將被編碼音訊信號之量化模式，則量化單元403可以使用此具有完整量化解析度之第一量化表將CLD量化。此第一量化表包括31個量化步驟。在精細模式中，可以將此等量化表應用至具有相同數目量化步驟之各此等頻道對。

在操作995中，如果將此在在操作985中所決定之粗略模式作為：用於此將被編碼音訊信號之量化模式，則量化單元403可以使用此具有較第一量化表為低量化解析度之第二量化表將CLD量化。此第二量化表可以具有兩個或更多角度區間作為量化步驟大小。此第二量化表之產生與使用第二量化表將CLD量化可以與：以上參考第9與10圖所說明者相同。

根據本發明，如果此用於將多頻道音訊信號之空間參數解碼之裝置(以下稱為解碼裝置)，並不具有由此量化單元403所使用之量化表，以實施CLD量化，則此位元流產生單元404可以將關於量化表之資訊插入於位元流中，且將位元流傳輸至此解碼裝置，這以下將更詳細說明。

根據本發明另一實施例，可以將此關於在第4圖中所說明編碼裝置中所使用量化表之資訊，藉由將存在於量化表中所有值、包括指數與各對應於此等指數值之CLD值插入於位元流中，而傳輸至解碼裝置，以及將位元流傳輸至解碼裝置。

根據本發明另一實施例，可以將此關於在編碼裝置中所始用量化表之資訊，藉由將此解碼裝置所須資訊傳送而傳輸至解碼裝置，以恢復由此編碼裝置所使用之量化表。例如：最大與最小角度、量化步驟數量、以及使用於編碼裝置中量化表之兩個或更多角度區間插入於位元流中，以及然後，可以將此位元流傳輸至解碼裝置。然後，此解碼裝置可以根據此由編碼裝置所傳輸之資訊與式(7)與(8)，而恢復此由編碼裝置所使用之量化表。

第11圖為在第4圖中所說明之空間參數擷取單元402、即空間參數擷取單元910之例之方塊圖。參考第11圖，此空間參數擷取單元910包括：第一空間參數測量單元911，與第二空間參數測量單元913。

此第一空間參數測量單元911根據輸入多頻道音訊信號，以測量在複數個頻道間之CLD。第二空間參數測量單元913，使用預先確定角度區間或兩個或更多個角度區間，將複數個頻道之一對頻道間之空間分割成數個區段，以及產生適用於此等頻道對組合之量化表。然後，此量化單元920使用量化表，將由此空間參數擷取單元910所擷取CLD量化。

第12圖為根據本發明實施例，用於將多頻道音訊信號之空間參數解碼之裝置(以下稱為解碼裝置)之方塊圖。參考第12圖，此解碼裝置包括：解封裝單元930與逆量化單元935。

此解封裝單元930擷取此經量化CLD，其對應於此來自輸入位元流一對頻道間能量位準間之差異。此逆量化單元935使用量化表、考慮此對頻道之位置性質，將此經量化CLD逆量化。

以下參考第17圖詳細說明此根據本發明實施例多頻道音訊信號之空間參數之解碼方法。

參考第17圖，在操作1000中，此解封裝單元930從輸入位元流擷取此經量化之CLD。在操作1005中，此逆量化單元935使用量化表將此經量化CLD逆量化；此量化表使用預先確定角度區間作為量化步驟大小。此量化表之量化步驟大小可以為3°。

此使用於操作1005中之量化表與以上參考第7與8圖所說明操作期間、由編碼裝置所使用之量化表相同，且因此將其詳細說明省略。

根據本實施例，如果此逆量化單元935並不具有關於此量化表之任何資訊，則此逆量化單元935可以從輸入位元流擷取有關量化表之資訊，且根據所擷取資訊恢復此量化表。

根據本發明實施例，可以將存在於量化表中所有值、包括此等指數與各自對應於此等指數之CLD值，插入於位元流中。

根據本發明另一實施例，可以將此量化表之最小與最大角度以及量化步驟數量包括於位元流中。

第18圖為流程圖，其說明根據本發明另一實施例將多頻道音訊信號之空間參數解碼之方法。根據此在第18圖中所說明實施例，可以使用此具有不同量化解析度之兩個或更多量化表，將此等空間參數逆量化。

參考第18圖，在操作1010中，此解封裝單元930從輸入位元流擷取經量化CLD與量化模式資訊。

在操作1015中，此逆量化單元935根據此所擷取量化模式資訊以決定，此由編碼裝置所使用以產生經量化CLD之量化模式是：具有完全量化解析度之精細模式，或是具有較此精細模式為低量化解析度之粗略模式。此精細模式對應於：較大之量化步驟數量與較此粗略模式為小之量化步驟大小。

在操作1020中，如果在操作1015中所決定而使用於產生經量化CLD之量化模式為精細模式，則此逆量化單元935使用此具有完全量化解析度之第一量化表，將此經量化CLD逆量化。此第一量化表包括31個量化步驟，且藉由此等一對頻道間之空間分割成31個區段，而將一對頻道間之CLD量化。在精細模式中，可以將相同的量化步驟數量應用至各對頻道。

在操作1025中，如果將此在操作1015中所決定以產生經量化CLD量化模式為粗略模式，則此逆量化單元935使用此具有較第一量化表為低量量化解析度之第二量化表，將此經量化LCD逆量化。此第二量化表可以具有預先確定角度區間作為量化步驟大小。此使用預先確定角度區間作為量化步驟大小之第二量化表，可以與以上參考第7與8圖所說明之量化表相同。

以下參考第19圖詳細說明：此根據本發明另一實施例之多頻道音訊信號之此等空間參數之解碼方法。

參考第19圖，在操作1030中，此解封裝單元930從輸入位元流擷取經量化CLD。在操作1035中，此逆量化單元935使用量化表將此經量化CLD逆量化，此量化表使用兩個或更多角度區間作為量化步驟大小。

此在操作1035中所使用量化表與在以上參考第9與10圖所說明操作期間由編碼裝置所使用量化表相同，且因此將其詳細說明省略。

根據本實施例，如果此逆量化單元935並不具有關於量化表之任何資訊，則此逆量化單元935可以從輸入位元流擷取有關量化表之資訊，以及根據所擷取資訊恢復此量化表。

根據本發明另一實施例，可以將此量化表之最小與最大角度、量化步驟數量、以及此量化表之兩個或更多個角度區間包括於位元流中。

第20圖為流程圖，其說明根據本發明另一實施例，將多頻道音訊信號之空間參數解碼之方法。根據此在第20圖中所說明之實施例，可以使用此等具有不同量化解析度之兩個或更多量化表，將此等空間參數逆量化。

參考第20圖，在操作1040中，此解封裝單元930從輸入位元流擷取經量化CLD與量化模式資訊。

在操作1045中，此逆量化單元935根據此所擷取量化模式資訊以決定，此被使用以產生經量化CLD之量化模式是否為：具有完全量化解析度之精細模式，或是具有較此精細模式為低量化解析度之粗略模式。此精細模式對應於：較大之量化步驟數量與較此粗略模式為小之量化步驟大小。

在操作1050中，如果在操作1045中所決定而使用於產生經量化CLD之量化模式為精細模式，則此逆量化單元935使用此具有完全量化解析度之第一量化表，將此經量化CLD逆量化。此第一量化表包括31個量化步驟，且藉由此等對(pair)頻道間之空間分割成31個區段，而將一對頻道間之CLD量化。在精細模式中，可以將相同的量化步驟數量應用至各對頻道。

在操作1055中，如果將此在操作1045中所決定以產生經量化CLD量化模式為粗略模式，則此逆量化單元935使用此具有較第一量化表為低量化解析度之第二量化表，將此經量化LCD逆量化。此第二量化表可以具有兩個或更多角度區間作為量化步驟大小。此使用兩個或更多角度區間作為量化步驟大小之第二量化表，可以與以上參考第9與10圖所說明之量化表相同。

本發明可以寫在電腦可讀取記錄媒體上之電腦可讀取碼而實現。此電腦可讀取記錄媒體可以為任何型式之記錄裝置，其中，資料以電腦可讀取方式儲存。此電腦可讀取記錄媒體之例包括：ROM、RAM、CD－ROM、磁帶、軟性磁碟、光學資料儲存體、以及載波(例如：經由網際網路之資料傳輸)。此電腦可讀取記錄媒體可以分佈於：此連接至網路之複數個電腦系統上，以致於可以非集中方式將電腦可讀取碼寫至此媒體且從其執行此等碼。此等須要用於實現本發明之功能程式、碼、以及碼區段，可以由對此技術有一般知識之人士容易地設想。

工業上之應用

如同以上說明，根據本發明可以藉由減少所須量化位元之數目，而加強編碼/解碼效率。在傳統上，可以藉由將此由複數個任意頻道間所構成各對頻道間之空間無區別地分割成31個區段，以計算複數個任意頻道間之CLD，以及因此總共須要5個量化位元。在另一方面，根據本發明，可以將一對頻道間之空間分割成若干區段，各區段具有例如角度3°。如果此對頻道間之角度為30°，則可以將此對頻道間之空間分割成11個區段，以及因而總共須要4個量化位元。因此，根據本發明，可以減少所須量化位元之數目。

此外，根據本發明，可以藉由參考說話者實際組態資訊以實施量化，而加強編碼/解碼之效率。隨著頻道數目增加，此資料數量增加31*N(而N為頻道之數目)。根據本發明，當頻道數目增加時，此將各對頻道間CLD量化所須量化步驟數量減少，以致於可以將整個資料數量維持均勻。因此，不僅可以將本發明應用至5.1頻道環境，而且將其應用至任意擴充頻道環境，以及因此可以使得能夠實施有效率之編碼/解碼。

雖然，以上參考典型實施例以特別顯示與說明本發明，然而，對於此技術有一般知識人士瞭解，其可以作形式與細節之各種改變，而不會偏離由以下申請專利範圍所界定本發明之精神與範圍。

101‧‧‧多頻道輸入

103‧‧‧技術向下混合信號(立體聲/單音)

105‧‧‧多頻道音訊信號

110‧‧‧向下混合器

120‧‧‧空間參數估計器

130‧‧‧空間參數解碼器

140‧‧‧空間參數綜合器

301‧‧‧聲源

302‧‧‧第一直接聲波

303‧‧‧第二直接聲波

306‧‧‧右耳

307‧‧‧左耳

401‧‧‧濾波器庫

402‧‧‧空間參數擷取單元

403‧‧‧量化單元

404‧‧‧位元流產生單元

910‧‧‧空間參數擷取單元

911‧‧‧第一空間參數測量單元

913‧‧‧第二空間參數測量單元

920‧‧‧量化單元

930‧‧‧解封裝單元

935‧‧‧逆量化單元

940、945、950‧‧‧操作

955、960、965‧‧‧操作

970、975、980‧‧‧操作

985、990、995‧‧‧操作

1000、1005‧‧‧操作

1010、1015‧‧‧操作

1020、1025‧‧‧操作

1030、1035‧‧‧操作

1040、1045‧‧‧操作

1050、1055‧‧‧操作

第1圖為根據本發明實施例之多頻道音訊信號編碼器與解碼器之方塊圖；第2圖用於說明多頻道組態；第3圖說明人耳如何感受音訊信號；第4圖為根據本發明實施例用於將多頻道音訊信號之空間參數編碼之裝置之方塊圖；第5圖說明藉由根據本發明實施例在第4圖中量化單元以說明虛擬聲音來源位置之判斷；第6圖藉由根據本發明另一實施例第4圖中量化單元以說明虛擬聲音來源位置之判斷；第7圖說明此根據本發明實施例使用角度區間將一對頻道間之空間分割成複數個區段；第8圖藉由根據本發明實施例第4圖中量化單元以說明頻道位準差異(CLD)之量化；第9圖說明此根據本發明實施例使用兩個或更多角度區間將一對頻道間之空間分割成數個區段；第10圖藉由根據本發明另一實施例第4圖中量化單元以說明CLD之量化；第11圖為根據本發明實施例在第4圖中所說明之空間參數擷取單元之方塊圖；第12圖為根據本發明實施例用於將多頻道音訊信號之空間參數解碼之裝置之方塊圖；第13圖為流程圖，其說明根據本發明實施例將多頻道音訊信號之空間參數編碼之方法；第14圖為流程圖，其說明根據本發明另一實施例將多頻道音訊信號之空間參數編碼之方法；第15圖為流程圖，其說明根據本發明另一實施例將多頻道音訊信號之空間參數編碼之方法；第16圖為流程圖，其說明根據本發明另一實施例將多頻道音訊信號之空間參數編碼之方法；第17圖為流程圖，其說明根據本發明實施例將多頻道音訊信號之空間參數解碼之方法；第18圖為流程圖，其說明根據本發明另一實施例將多頻道音訊信號之空間參數解碼之方法；第19圖為流程圖，其說明根據本發明另一實施例將多頻道音訊信號之空間參數解碼之方法；以及第20圖為流程圖，其說明根據本發明另一實施例將多頻道音訊信號之空間參數解碼之方法。