TWI905561B - 高階保真立體音響訊號表象之壓縮方法和裝置以及解壓縮方法和裝置以及非暫時性電腦可讀取媒體 - Google Patents
高階保真立體音響訊號表象之壓縮方法和裝置以及解壓縮方法和裝置以及非暫時性電腦可讀取媒體Info
- Publication number
- TWI905561B TWI905561B TW112140741A TW112140741A TWI905561B TW I905561 B TWI905561 B TW I905561B TW 112140741 A TW112140741 A TW 112140741A TW 112140741 A TW112140741 A TW 112140741A TW I905561 B TWI905561 B TW I905561B
- Authority
- TW
- Taiwan
- Prior art keywords
- hoa
- signal
- directional
- representation
- decoded
- Prior art date
Links
Abstract
高階保真立體音響(HOA)表象在聲音焦點附近的完整聲場,與擴音器設置無關。高空間解析度需要高HOA係數。在本發明中,估計優勢聲音方向,把HOA訊號表象分解成時間域內之優勢方向性訊號,和相關方向資訊,以及HOA域內之周圍成分,接著藉降低其位階,以壓縮周圍成分。降階周圍成分轉換成空間域,並連同方向性訊號以感知方式編碼。在接收器側,編碼之方向性訊號和降階之編碼周圍成分,以感知方式解壓縮,經感知方式解壓縮之周圍訊號,轉換成降階之HOA域表象,接著是位階延伸。全部HOA表象是由方向性訊號,相對應方向資訊,和原階周圍HOA成分重組。
Description
本發明係關於高階立體保真音響訊號表象之壓縮和解壓縮方法和裝置,其中方向性成分和周圍成分按不同方式處理。
高階保真立體音響(HOA)的優點是,捕集三維度空間內特殊位置附近之完整聲場,該位置稱為「聲音焦點」(sweet spot)。此等HOA表象無關特殊擴音器設置,與立體聲等以頻道為基礎的技術或環境顯然不同。但此項適用性是以解碼過程為代價,需在特別的擴音器設置上回放HOA表象。
HOA係根據對所需聆聽者位置附近的諸多位
置x,個別角波數k的空氣壓力複振幅來描述,使用截頭球諧(Spherical Harmonics,SH)函數展開,可假設無損通則為球形座標原點。此項表象之空間解析,因成長的展開最大位階N而改進。惜展開係數值O隨位階N以二次方成長,即O=(N+1)2。例如使用位階N=4之典型HOA表象,需O=25係數。賦予所需抽樣率fs和每樣本之位元數Nb,即可由O.fs.Nb決定HOA訊號表象傳輸之全部位元率,而位階N=4的HOA訊號表象,以抽樣率fs=48kHz,採用每樣本Nb=16位元傳輸,得位元率19.2Mbits/s。因此,HOA訊號表象亟需壓縮。
綜觀現有空間聲訊壓縮措施,可參見歐洲專利申請案EP 10306472.1,或I.Elfitri,B.Günel,A.M.Kondoz合撰〈基於利用合成法分析之多頻道聲訊寫碼〉,IEEE學報第99卷第4期657-670頁,2011年4月。
下列技術與本發明較有關聯。
B-格式訊號,等於第一階之保真立體音響表象,可用方向性聲訊寫碼(DirAC)壓縮,載於V.Pulkki撰〈以方向性聲訊寫碼之空間聲音複製〉,音響工程學會會刊第55卷第6期503-516頁,2007年。在為電傳會議應用所擬一版本中,B-格式訊號係寫碼於單一全向性訊號和旁側資訊,單一方向和每頻帶之擴散性參數之形式。然而,造成資料率劇降,代價是複製所得微小訊號品質。再者,DirAC限於第一階保真立體音響表象之壓縮,遭受很
低的空間解析。
已知方法相當罕見以N>1壓縮HOA表象。其中之一採用感知進步聲訊寫碼法(AAC)寫解碼器,進行直接編碼個別HOA係數序列,參見E.Hellerud,I.Burnett,A.Solvang,U.Peter Svensson合撰〈以AAC編碼高階保真立體音響〉,第124次AES會議,阿姆斯特丹,2008年。然而,具有如此措施之固有問題是,從未聽到訊號的感知寫碼。重建之回放訊號,通常是由HOA係數序列加權合計而得。這是解壓縮HOA表象描繪在特別擴音器設置時,有揭露感知寫碼雜訊高度或然之原因所在。以更技術性而言,感知寫碼雜訊表露之主要問題是,個別HOA係數序列間之高度交叉相關性。因為個別HOA係數序列內所寫碼雜訊訊號,通常彼此不相關,會發生感知寫碼雜訊之構成性重疊,同時,無雜訊HOA係數序列在重疊時取消。又一問題是,上述交叉相關性導致感知寫碼器效率降低。
為把此等效應程度減到最小,EP 10306472.1擬議把HOA表象在感知寫碼之前,轉換成空間域內之相等表象。空間域訊號相當於習知方向性訊號,也會相當於擴音器訊號,如果擴音器位在空間域轉換所假設之正確同樣方向。
轉換成空間域,會減少個別空間域訊號間的交叉相關性。然而,交叉相關性並未完全消除。較高交叉相關性之例為方向性訊號,其方向落在空間域訊號涵蓋的
相鄰方向之中間。
EP 10306472.1和上述Hellerud等人論文之又一缺點是,感知寫碼訊號數為(N+1)2,其中N為HOA表象位階。所以,被壓縮HOA表象之資料率,以保真立體音響位階呈二次方成長。
本發明壓縮處理進行把HOA聲場表象,分解成方向性成分和周圍成分。尤其是為計算方向性聲場成分,下述為新的處理方式,以估計若干優勢聲音方向。
關於現行根據保真立體音響之方向估計方法,上述Pulkki論文提到與DirAC寫碼有關之方法,可根據B-格式聲場表象,以估計方向。方向是由針對聲場能量流動方向之平均強度向量而得。基於B-格式之變通方法,見D.Levin,S.Gannot,E.A.P.Habets撰〈在雜訊存在下使用音響向量估計到達方向〉,IEEE之ICASSP議事錄第105-108頁,2011年。方向估計是藉搜尋朝該方向的光束先前輸出訊號提供最大功率之方向,反覆進行。
然而,二種措施均拘束於B-格式供方向估計,遭遇較低空間解析。另一缺點是估計只限單一優勢方向。
HOA表象提供改進空間解析,因而得以改進估計若干優勢方向。目前根據HOA聲場表象進行估計若干方向之方法很少。根據壓縮性感測之措施參見N.Epain,C.Jin,A.van Schaik撰〈壓縮性抽樣在空間聲場分析和合成之應用〉,音響工程學會第127次會議,紐約,
2009年,以及A.Wabnitz,N.Epain,A.van Schaik,C Jin撰〈使用被壓縮感測的空間聲場之時間域重建〉,IEEE之ICASSP議事錄第465-468頁,2011年。主要構想在於假設聲場係空間稀疏,即只包含少量方向性訊號。在球體上部署多數測試方向後,採用最適化演算法,以便找出盡量少測試方向,連同相對應方向性訊號,如像所賦予HOA表象所載。此方法提供一種比所賦予HOA表象實際具備更進步之空間解析,因其可迴避所賦予HOA表象有限位階造成的空間分散。惟演算法性能,甚視是否滿足稀疏性假設而定。尤其是若聲場含有任何少量額外周圍成分,或若HOA表象受到由多頻道記錄計算會發生之雜訊影響時,措施即告失敗。
又一相當直覺的方法是,把所賦予HOA表象轉換成空間域,正如B.Rafaely在〈聲場利用球形褶合在球體上之平面波分解〉所述,美國音響學會會刊第4卷第116期,2149-2157頁,2004年10月,再搜尋「方向性功率」最大值。此措施之缺點是,周圍成分存在導致方向性功率分佈模糊,且方向性功率最大值與無任何周圍成分存在相較,會移位。
本發明要解決的問題是,提供HOA訊號的壓縮,仍然保持HOA訊號表象之高度空間解析。此問題是利用申請專利範圍第1項揭示之方法解決。利用此等方法
之裝置載於申請專利範圍第4項。
本發明標的為聲場高階保真立體音響HOA表象之壓縮。在本案中,HOA指高階保真立體音響表象,以及相對應編碼或表示之聲訊訊號。估計優勢之聲音方向,把HOA訊號表象分解成時間域內之許多優勢方向性訊號,和相關方向資訊,以及HOA域內之周圍成分,接著降低其位階,以壓縮周圍成分。分解後,降階之周圍HOA成分轉換成空間域,連同方向性訊號,以感知方式寫碼。在接收器或解碼器側,編碼之方向性訊號和降階編碼之周圍成分,以感知方式解碼。經感知方式解碼之周圍訊號,轉換至降階之HOA域表象,接著是位階延伸。由方向性訊號和相應方向資訊,以及原階周圍HOA成分,重組全部HOA表象。
有利的是,周圍聲場成分可利用比原階為低的HOA表象,以充分準確性表示,而獲取周圍方向性訊號,確在壓縮和壓縮之後,仍然達成高度空間解析。
原則上,本發明方法適於壓縮高階保真立體音響HOA訊號表象,該方法包含步驟為:
估計優勢方向,其中該優勢方向估計視能量優勢的HOA成分之方向性功率分佈而定;
把HOA訊號表象分解或解碼成時間域內之許多優勢方向性訊號,和相關方向資訊,以及HOA域內之剩餘周圍成分,其中該剩餘周圍成分代表該HOA訊號表象和該優勢方向性訊號表象間之差異;
相較於原階,降低位階,以壓縮該剩餘周圍成分;
把降階之該剩餘周圍HOA成分,轉換到空間域;
以感知方式編碼該優勢方向性訊號和該轉換過之剩餘周圍HOA成分。
原則上,本發明方法適於解壓縮利用下列步驟壓縮之高階保真立體音響HOA訊號表象:
估計優勢方向,其中該優勢方向估計視能量優勢的HOA成分之方向性功率分佈而定;
把HOA訊號表象分解或解碼成時間域內之許多優勢方向性訊號,和相關方向資訊,以及HOA域內之剩餘周圍成分,其中該剩餘周圍成分代表該HOA訊號表象和該優勢方向性訊號表象間之差異;
相較於原階,降低位階,以壓縮該剩餘周圍成分;
把降階之該剩餘周圍HOA成分,轉換到空間域;
以感知方式編碼該優勢方向性訊號和該轉換過之剩餘周圍HOA成分;該方法包含步驟為:
以感知方式解碼該以感知方式編碼之優勢方向性訊號,和該以感知方式編碼之轉換過剩餘周圍HOA成分;
逆轉換該以感知方式解碼之轉換過剩餘周圍HOA成分,以獲得HOA域表象;
進行該逆轉換過剩餘周圍HOA成分位階延伸,以建立原階周圍HOA成分;
組成該以感知方式解碼之優勢方向性訊號,該方向資
訊和該原階延伸的周圍HOA成分,以獲得HOA訊號表象。
原則上,本發明裝置適於壓縮高階保真立體音響HOA訊號表象,該裝置包含:
適於估計優勢方向之機構,其中該優勢方向估計視能量優勢的HOA成分之方向性功率分佈而定;
適於分解或解碼之機構,把HOA訊號表象分解或解碼成時間域內之許多優勢方向性訊號,和相關方向資訊,以及HOA域內之剩餘周圍成分,其中該剩餘周圍成分代表該HOA訊號表象和該優勢方向性訊號表象間之差異;
適於壓縮該剩餘周圍成分之機構,相較於其原階,降低其位階;
適於把降階之該剩餘周圍HOA成分轉換至空間域之機構;
適於以感知方式編碼該優勢方向性訊號和該轉換過剩餘周圍HOA成分之機構。
原則上,本發明裝置適於解壓縮利用下列步驟壓縮之高階保真立體音響HOA訊號表象:
估計優勢方向,其中該優勢方向估計視能量優勢的HOA成分之方向性功率分佈而定;
把HOA訊號表象分解或解碼成時間域內之許多優勢方向性訊號,和相關方向資訊,以及HOA域內之剩餘周圍成分,其中該剩餘周圍成分代表該HOA訊號表象和該優勢方向性訊號表象間之差異;
相較於原階,降低位階,以壓縮該剩餘周圍成分;
把降階之該剩餘周圍HOA成分,轉換到空間域;
以感知方式編碼該優勢方向性訊號和該轉換過之剩餘周圍HOA成分;該裝置包含:
適於以感知方式解碼該以感知方式編碼之優勢方向性訊號,和該以感知方式編碼之轉換過剩餘周圍HOA成分之機構;
適於逆轉換該以感知方式解碼之轉換過剩餘周圍HOA成分之機構,以獲得HOA域表象;
適於進行該逆轉換過剩餘周圍HOA成分位階延伸之機構,以建立原階周圍HOA成分;
適於組成該以感知方式解碼之優勢方向性訊號,該方向資訊和該原階延伸的周圍HOA成分之機構,以獲得HOA訊號表象。
本發明優良之另外具體例,列在各申請專利範圍附屬項。
21:成幅
22:估計優勢方向
23:計算方向性訊號
24:計算周圍HOA成分
25:位階降低
26:球諧函數轉換
27:感知編碼
31:感知解碼
32:逆球諧函數轉換
33:位階延伸
34:HOA訊號組成
第1圖為不同保真立體音響位階N和角度θ[0,π]之常態化分散函數νN(θ);
第2圖為本發明壓縮處理之方塊圖;
第3圖為本發明解壓縮處理之方塊圖。
保真立體音響訊號使用球諧函數(Spherical Harmonics,簡稱SH)展開,描述無源面積內之聲場。此項描述之適用性歸因於物理性能,即聲壓之時間和空間行為,基本上由波方程決定。
波方程和球諧函數展開
為詳述保真立體音響,以下假設球座標系統,其空中點x=(γ,θ,Φ)T係以半徑γ>0(即與座標點之距離)、從極軸z測量之傾角θ[0,π],以及在x=y平面內從x軸測量之方位角Φ[0,2π]表示。在此球座標系統中,所連接無源面積內聲壓p(t,x)之波方程(其中t指時間),係由Earl G.Williams著教科書《傅里葉聲學》賦予,列於應用算術科學第93卷,學術出版社,1999年:
在式(4)內,k指由下式(5)界定之角波數:
又,係n階和m度之SH函數:
非負度指數m之相關勒讓德函數,係藉勒讓德多項式P n(x)界定:
在先前技術中,例如M.Poletti撰〈保真立體音響使用實和複球諧函數總一說明〉(奧地利葛拉茲2009年保真立體音響研討會議事錄,2009年6月25~27日)內,也有關於SH函數之定義,對於負度指數m言,與式(6)偏差因數(-1) m 。
另外,聲壓關係時間的傅里葉變換式,可用實SH函數表達:
文獻上對實SH函數有各種定義(參見例如上述Poletti論文)。在此文件前後應用之一可能定義列如下:
複SH函數與實SH函數關係如下:
複SH函數和實SH函數及方向向量,在三維度空間的單位球體上形成平方積分複值函數之正交基礎,因此遵守下列條件:
內部問題和保真立體音響係數
保真立體音響之目的,在於座標原點附近之聲場表象。一般而言,此有趣區域於此假設為半徑R之球,中心在座標原點,以集合{x|0 r R}載明。表象之嚴格假設是,此球視為不含任何聲源。在此球內尋找聲場表象,稱為「內部問題」,參見上述Williams教科書。
對於內部問題顯示,SH函數展開係數可達現為:
同理,實SH函數展開係數可因數分解為:
平面波分解
中心在座標原點的無聲源球內之聲場,可藉從所有可能方向撞擊到球的不同角波數量k之無數平面波重疊來表達,參見上述Rafaely論文〈平面波分解…〉。假設來自方向Ω 0的角波數k之平面波複振幅為D(k, Ω 0),可用式(11)和式(19)以相似方式表示,即關於實SH函數的相對應保真立體音響係數為:
把式(24)代入式(22),可見保真立體音響係數為展開係數之標度版,即
對標度保真立體音響係數和振幅密度函數D(k, Ω),應用關於時間之逆傅里葉變換時,即得相對應時間域量:
時間域方向性訊號d(t, Ω)可以實SH函數展開表示,按照:
使用事實上SH函數為實值,其複共軛可表達為:
假設時間域訊號d(t, Ω)為實值,即d(t, Ω)=d*(t, Ω),則由式(29)與式(30)比較,可知在此情況時,係數為實值,即。
係數以下稱為標度時間域保真立體音響係數。
以下亦假設由此等係數賦予聲場表象,詳見下節就壓縮之討論。
須知利用本發明處理所用係數之時間域HOA表象,等於相對應頻率域HOA表象。所以,所述壓縮和解壓縮,可同樣在頻率域內,分別以方程式稍微修飾實施。
有限位階之空間解析
實務上,在座標原點附近的聲場,只用位階
n N的有限數之保真立體音響係數描述。從截短系列之SH函數計算振幅密度函數,按照
的單一平面波,計算振幅密度函數:
在式(34)內採用式(20)內賦予平面波之保真立體音響係數,而在式(35)和(36)內開拓一些數字理論,參見上述〈平面波分解…〉論文。式(33)內性質可用式(14)表示。
就式(37)與真振幅密度函數比較:
當位階n N的實SH函數之向量,以下式界定:
ν N (Θ)=S T (Ω)S(Ω 0 ) (47)
分散即可同等在時間域內表達成:
抽樣
對於某些用途,需從時間域振幅密度函數d(t, Ω),於有限數J的分立方向Ω j ,決定標度時間域保真立體音響係數。式(28)內之積分再按照B.Rafaely撰〈球形麥克風陣列之分析和設計〉(IEEE Transactions on Speech and Audio Processing,第13卷第1期135-143頁,2005年1月)利用有限合計概算:
若不符合此條件,概算(50)會遭到空間混疊誤差(spatial aliasing errors),參見B.Rafaely撰〈球形麥克風陣列內的空間混疊〉(IEEE Transactions on Signal Processing,第55卷第3期1003-1010頁,2007年3月)。
第二個必要條件需抽樣點Ω j 和相對應權值滿足〈分析和設計〉論文中賦予之相對應條件:
抽樣條件(52)包含線性方程式集合,可用單一矩陣方程式精簡表述為:
ΨGΨ H =I (53)其中Ψ表示下式界定之模態矩陣:
G:=diag(g 1 ,,g J ) (55)
由式(53)可見保持式(52)之必要條件是,抽樣點數J要符合J O。把在J抽樣點的時間域振幅密度集入向量
w(t):=(D(t, Ω 1),...,D(t, Ω J )) T (56)並以下式界定標度時間域保真立體音響係數之向量
w(t)=Ψ H c(t) (58)
使用引進的向量記號,從時間域振幅密度函數樣本計算標度時間域保真立體音響係數,可寫成:
賦予固定保真立體音響位階N,往往不可能計算抽樣點Ω j 之數J O,和相對應權值,得以保持式(52)抽樣條件。然而,若選用抽樣點,得之充分概算抽樣條件,則模態矩陣Ψ之秩數(rank)為0,其條件數量低。在此情況下,模態矩陣Ψ存在假反數:
Ψ + :=(ΨΨ H ) -1 ΨΨ + (60)而從時間域振幅密度函數樣本之向量,由下式可合理概算
標度時間域保真立體音響係數向量c(t):
Ψ + =(ΨΨ H ) -1 Ψ=Ψ -H Ψ -1 Ψ=Ψ -H (62)
另外,若能滿足式(52)之抽樣條件,則保持
Ψ -H =ΨG (63)二個概算(59)和(61)均同等而正確。
向量 w (t)可解釋為空間時間域訊號之向量。從HOA域轉換到空間域,可例如使用式(58)進行。此種轉換在本案稱為「球諧函數轉換」(SHT),用於降階周圍HOA成分之轉換成空間領域。隱含假設SHT之空間抽樣點Ω j 大概滿足式(52)之抽樣條件,對於j=1,...,J而言(J=0),
。在此假設下,SHT矩陣滿足。若SHT
絕對標度不重要,內容可略。
壓縮
本發明係關於所賦予HOA訊號表象之壓縮。如上所述,HOA表象在分解成預定數之時間域內優勢方向性訊號,和HOA域內之周圍成分,接著藉降低周圍成分之HOA表象位階,加以壓縮。此項作業開發出假設(經傾聽測試支持),周圍聲場成分可利用低解HOA表象,以充分準確性表示。優勢方向性訊號之摘取,確保在壓縮和相對應解壓縮後,保有高度空間解析。
分解後,降階周圍HOA成分轉換至空間域,連同方向性訊號,以感知方式寫碼,如歐洲專利申請案EP 10306472.1內實施例所述。
壓縮處理包含二接續步驟,如第2圖所示。個別訊號的正確定義,見下節「壓縮細說」所述。
在第2a圖所示之第一步驟或階段中,於優勢方向估計器22內估計優勢方向,把保真立體音響訊號 C (l)分解成方向性和剩餘或周圍成分,其中l指幅指數。在方向性訊號計算步驟或階段23計算方向性成分,因而把保真立體音響表象變換成時間域訊號,以具有相對應方向的D習知方向性訊號 X (l)集合表示。在周圍HOA成分計算步驟或階段24計算剩餘周圍成分,以HOA域係數 C A(l)表示。
在第2b圖所示第二步驟中,進行方向性訊號 X (l)和周圍HOA成分 C A(l)之感知寫碼如下:
‧習知時間域方向性訊號 X (l),可在感知寫碼器27內,使用任何已知之感知壓縮技術,按個別壓縮。
‧周圍HOA域成分 C A(l)之壓縮,分二副步驟或階段進行:
第一副步驟或階段25,進行原有保真立體音響位階N降到N RED,即N RED=2,結果為周圍HOA成分C A,RED(l)。此時,假設周圍聲場成分可利用低階HOA,以充分準確性表示。第二副步驟或階段26是根據EP 10306472.1專利申請案所述壓縮。在副步驟/階段25計算的周圍聲場成分
之O RED:=(N RED+1)2 HOA訊號C A,RED(l),應用球諧函數轉換,轉換成空間域內O RED相等訊號W A,RED(l),得習知時間域訊號,可輸入於並式感知寫碼器27之庫內。可應用任何已知之感知寫碼或壓縮技術。編碼後之方向性訊號和降階編碼後空間域訊號即輸出,可傳送或儲存。
全部時間域訊號 X (l)和 W A,RED(l)宜在感知寫碼器27內,聯合進行感知壓縮,藉開發潛在剩餘頻道間相關性,改進整體寫碼效率。
解壓縮
對所接收或重播訊號之解壓縮處理,如第3圖所示。如同壓縮處理,包含二接續步驟。
在第3a圖所示第一步驟或階段中,於感知解碼31進行編碼之方向性訊號和降階編碼之空間域訊號的感知解碼或解壓縮,其中代表方向性成分,而代表周圍HOA成分。以感知方式解碼或解壓縮之空間域訊號在逆球諧函數轉換器32內,經逆球諧函數轉換,轉換成N RED階之HOA域表象。然後,在位階延伸步驟或階段33內,利用位階延伸,從估計N階之適當HOA表象。
在第3b圖所示第二步驟或階段中,於HOA訊號組合器34內,由方向性訊號和相對應方向資訊,以及原階周圍HOA成分,再組成全部HOA表象。
可達成之資料率縮小
本發明解決的問題是,把資料率較現有HOA表象壓縮方法大為縮小。茲討論可達成壓縮率與未壓縮HOA表象相較如下。比較率是由位階N的未壓縮HOA訊號 C (l)傳輸所需資料率,與具有相對應方向的D感知方式寫碼之方向性訊號 X (l)所組成壓縮訊號表象傳輸所需資料率比較所得,而 N RED感知方式寫碼之空間域訊號 W A,RED(l)代表周圍HOA成分。
為傳輸未壓縮HOA訊號 C (l),需O.f S .N b之資料率。反之,D感知方式寫碼之方向性訊號 X (l)傳輸,需D.f b,COD之資料率,其中f b,COD指感知方式寫碼訊號之位元率。同理,N RED感知方式寫碼之空間域訊號 W A,RED(l)之傳輸號,需O RED.f b,COD之位元率。假設方向要根據遠較抽樣率f S為低率計算,亦即假設於B樣本組成的訊號幅期限固定不變,例如f S=48kHz抽樣率時B=1200,則在壓縮HOA訊號的全部資料率計算時,相對應資料率分用可略而不計。
所以,壓縮表象之傳輸需大約(D+O RED).f b,COD之資料率。因此,壓縮率r COMPR為:
降低發生寫碼雜訊表露之或然率
如「先前技術」中所述,專利申請案EP 10306482.1號所載空間域訊號之感知壓縮,遭遇到訊號間之剩餘交叉相關性,會導致感知寫碼雜訊表露。按照本發明,優勢方向性訊號是在以感知方式寫碼之前,首先從HOA聲場表象摘取。意即在組成HOA表象時,於感知解碼後,寫碼雜訊之空間方向性,正好與方向性訊號相同。尤其是寫碼雜訊以及方向性訊號對任何隨意方向之助益,是利用「有限位階之空間解析」解說的空間分散函數決定性說明。換言之,在任何時刻,代表寫碼雜訊的HOA係數向量,正是代表方向性訊號的HOA係數向量之倍數。因此,雜訊HOA係數的隨意加權合計,不會導致感知寫碼雜訊之任何表露。
又,降階周圍成分正確按照EP 10306472.1所擬處理,但因根據定義,周圍成分之空間優勢訊號彼此間的相關性相當低,故感知雜訊表露之或然率低。
改進方向估計
本發明方向估計視能量優勢HOA成分之方向性功率分佈而定。方向性功率是由HOA表象之秩數降低相關性矩陣計算,利用HOA表象的相關性矩陣之本徵值(eigenvalue)分解而得。
與前述〈平面波分解…〉論文所用方向估計
相較,具有更準確之優點,因為聚焦在能量優勢HOA成分取代用於方向估計之完全HOA表象,可減少方向性功率分佈之空間模糊。
與前述〈壓縮性抽樣在空間聲場分析和合成之應用〉和〈使用被壓縮感測的空間聲場之時間域重建〉論文所擬方向估計相較,具有更牢靠的優點,理由是HOA表象之分解成方向性成分和周圍成分,迄今難有完美成果,故在方向性成分內留有少量周圍成分。則像在此二篇論文之壓縮性抽樣方法,即因其對周圍訊號存在之高度敏感性,無法提供合理之方向估計。
本發明方向估計的好處是,不會遭遇此問題。
變通應用HOA表象分解
上述HOA表象分解成許多具有相關方向資訊之方向性訊號,和HOA域內之周圍成分,可按照上述Pulkki論文〈以方向性寫碼之空間聲音複製〉所擬,用於訊號適應性DirAC般描繪HOA表象。各HOA成分可以不同方式描繪,因為二成分之物理特徵不同。例如,方向性訊號可描繪於擴音器,使用訊號泛移技術,像「向量基本之振幅泛移」(VBAP),參見V.Pulkki撰〈使用向量基本之振幅泛移的虛擬聲源定位〉,音響工程學會會報第45卷第6期456-466頁,1997年。周圍HOA成分可用已知標準HOA描繪技術加以描繪。
此等描繪不限於位階1的保真立體音響表象,因此可見當做延伸DirAC般描繪至位階N>1之HOA表象。
從HOA訊號表象估計若干方向,可用於任何相關種類之聲場分析。
以下諸節更詳細說明訊號處理步驟。
壓縮
輸入格式之定義
做為輸入,式(26)內界定之標度時間域HOA係數,假設以率抽樣。向量 c (j)界定為屬於抽樣時t=jT s,j 的全部係數所組成,按照下式:
成幅
標度HOA係數之進內向量c(j),在成幅步驟或階段21,按照下式成幅為長度B之非疊合幅:
假設抽樣率f S=48kHz,適當之幅長為B=1200樣本,相當於幅期間25ms。
估計優勢方向
為估計優勢方向,計算下式相關性矩陣:
現時幅l和L-1先前幅之全部合計,表示方向性分析是基於具有L.B樣本的長疊合幅群,即對於各現時幅,考慮到相鄰幅之內容。此有助於方向性分析之穩定,理由有二:較長幅造成較大量觀察,以及因疊合幅,而使方向估計被平滑化。
假設f S=48kHz和B=1200,L之合理值為4,相當於全體幅期間為100ms。
其次,按照下式決定相關性矩陣 B (l)之本徵值分解:
B(l)=V(l)Λ(l)V T (l) (68)其中矩陣V(l)是由本徵值 v i (l),1 i O組成,
設本徵值係按非上升位階為指數,即
然後,計算優勢本徵值之指數集合。管理此事之一可能性為,界定所需最小寬帶方向性對周圍功率比DARMIN,再決定,使
合理選擇DARMIN為15dB。優勢本徵值數又拘限於不超過D,以便集中於不超出D優勢方向。此係以指數集合改為完成,其中
其次,B(l)之秩數概算,係由下式而得:
此矩陣需含有益於B(l)之優勢方向性成分。
然後,計算向量:
模態矩陣Ξ以下式界定:
而1 q Q
σ 2(l)之要件概略為平面波之功率,相當於從方向Ω q 衝擊的優勢方向性訊號。理論上之說明參見下述「方向搜尋演算法之說明」。
從σ 2(l),計算優勢方向的數量,,以決定方向性訊號成分。優勢方向數即拘限於符合,以確保一定之資料率。然而,若容許可變資料率,優勢方向數可適應現時聲場。
計算優勢方向之一可能性,是設定第一優
勢方向於具有最大功率,即,其中而M 1:={1,2,...,Q}。
假設最大功率係優勢方向性訊號所創造,並顧及事實上使用有限位階N之HOA表象,造成方向性訊號之空間分散(參見上述〈平面波分解…〉論文),可結論為,在Ω CURRDOM,1(l)的方向性鄰區,應會發生屬於同樣方向性訊號之功率成分。由於空間訊號分散可利函數表達(見式(38)),其中,指Ω q 和ΩCURRDOM,1(l)間之角度,屬於方向性訊號之功率,按照下降。所以,在具有Θ q,1 ΘMIN的之方向性鄰區內,合理排除全部方向Ω q ,供搜尋其他優勢方向。可選用距離ΘMIN做為ν N (x)之第一個零,對於N 4,是以概略賦予。第二優勢方向則設定於剩餘方向Ω q M 2內之最大功率,其中。剩餘優勢方向以類似方式決定。
優勢方向數,可藉視功率指定給個別優勢方向而決定,並為比率超出所需方向值之情況,搜尋周圍功率比DARMIN。意即滿足:
全部優勢方向的計算整個處理進行如下:
其次,以來自先前幅之方向平滑化在現時幅內所得方向,,得到平滑化的方向,1 d D。
此項運算可區分成二接續部份:
(a)現時優勢方向,,從先前幅指派給平滑化的方向,1 d D,。決定指派函數,使所指派方向間的角度合計最小
如此指派問題可使用公知的匈牙利演算法解答,參見H.W.Kuhn撰〈對指派問題之匈牙利方法〉,Naval研究邏輯學季刊2,第1-2期83-97頁,1955年。現時方向與來自先前幅的消極方向(見下述「消極方向」術語之說明)間之角度,設定於2ΘMIN。此項運算的效果是,試圖
指派的現時方向,與先前消極方向比2ΘMIN更接近。若距離超過2ΘMIN,即指派相對應現時方向屬於新訊號,意即有利於被指派給先前消極方向。
附註:當容許整體壓縮演算法有更大潛候期時,可更加牢靠進行接續方向估計之指派。例如,可更佳識別突然方向改變,不與估計錯誤導致的界外混淆。
(b)使用步驟(a)的指派,計算平滑化的方向,1 d D。平滑是基於球體幾何學,而非歐幾里德幾何學。對於各現時優勢方向,,沿大圓圈之小弧度在球體上兩點交叉進行平滑化,是由方向和所特定。明確地說,方位角和傾角之平滑,係單獨以平滑因數α Ω 計算指數加權運動平均值。對於傾角,可得如下平滑運算:
對於方位角,要修飾平滑以達成在π-ε至-π的過渡(其中ε>0),以及反過渡之確實的平滑。可考慮先計算相差角度模(modulo)2π,為:
利用下式變換到間隔[-π,π]:
決定平滑後的優勢方位角模2π為:
最後變換成位於間隔[-π,π]內:
如果<D,則有來自先前幅的方向得不到所指派現時優勢方向。以下式指定相對應指數集合:
然後,以M ACT(l)指定之積極方向指數集合。其基數以D ACT(l):=|M ACT(l)|指明,則全部平滑後的方向銜接成單一方向矩陣:
方向訊號之計算
方向訊號之計算是根據模態匹配法。具體而言,搜尋其HOA表象造成所賦予HOA訊號最佳概算之方向性訊號。因為接續幅間之方向改變,會導致方向性訊號中斷,可計算疊合幅用之方向性訊號估計,接著使用適當
窗函數,使接續疊合幅之結果平滑化。然而,平滑會引進單幅之潛候期。
方向性訊號之詳細估計,說明如下:
首先,按照下式計算基於平滑後的積極方向之模態矩陣:
其次,計算矩陣X INST(l),對於第(l-1)和第l幅,含有全部方向性訊號之非平滑的估計:
此分二階段完成。在第1階段,相當於消極方向的橫行方向性訊號樣本,設定於零,即:
在第二步驟,相當於積極方向的方向性訊號樣本,係由按照下式先配置於矩陣內而得:
此矩陣再經計算,把誤差的歐幾里德模方(norm)減到最小:
ΞACT(l)X INST,ACT(l)-[C(l-1)C(l)] (97)由下式賦予答案:
方向性訊號x INST,d (l,j),1 d D之估計,係利用適當窗函數w(j)開窗:
窗函數之例,係利用下式界定之周期性Hamming窗賦予:
x d ((l-1)B+j)=x INST,WIN,d (l-1,B+j)+x INST,WIN,d (l,j) (101)
對於第(l-1)幅,全部平滑後的方向性訊號之樣本,配置在矩陣X(l-1)內,為:
周圍HOA成分之計算
周圍HOA成分C A(l-1)係按照下式,從總HOA表象c(l-1)減總方向性HOA組件CDIR(l-1)而得:
因為總方向性HOA成分之計算,亦根據疊合接續瞬間總方向性HOA成分之空間平滑,故周圍HOA成分亦以單幅之潛候期而得。
周圍HOA成分之降階
透過其成分表達C A(l-1)為:
周圍HOA成分之球諧函數轉換
球諧函數轉換是由降階的周圍HOA成分與模態矩陣之反數相乘為之:
解壓縮
逆球諧函數轉換
以感知方式解壓縮過之空間域訊號,經逆球諧函數轉換,利用下式轉換為位階之HOA域表象:
位階延伸
HOA表象之保真立體音響位階,按照下式,藉附加零,延伸至N:
HOA係數組成
最後分解之HOA係數,按照下式,另外由方向性和周圍HOA成分組成:
為計算平滑後的方向性HOA成分,把含有全部個別方向性訊號之二接續幅,銜接於單一長幅內,如:
最後,把全部已開窗方向性訊號摘錄,編碼入適當方向,以疊合方式加以重疊,即可得總方向性HOA成分C DIR(l-1):
方向搜尋演算法之說明
以下說明「估計優勢方向」一節所述方向搜尋處理背後之動機,根據之某些假設,先加以界定。
假設
HOA係數向量c(j)透過下式,一般與時間域振幅密度函數d(j, Ω)相關:
此模式陳明HOA係數向量c(j)一方面由I優勢方向性原始訊號x i (j),1 i I所產生,係於第l幅來自方向。特別是在單幅期間,假設方向固定。優勢原始訊號數I假設明顯小於HOA係數總數O。再者,幅長B假設明顯大於O。另方面,向量c(j)由剩餘成分c A( j )組成,視為代表理想之等方性周圍聲場。
個別HOA係數向量成分,假設具有如下性質:
●優勢原始訊號假設為零平均,即:
並假設彼此無相關性,即:
其中指對於第l幅的第i訊號之平均功率。
●優勢原始訊號假設為與HOA係數向量之周圍成分無相關性,即:
●周圍HOA成分向量假設為零平均,並假設具有協變性(covariance)矩陣:
●各幅l的方向性對周圍之功率比DAR(l),其定義為:
假設大於預定所需值DARMIN,即:
方向搜尋之說明
所要說明之情況為,計算相關性矩陣B(l)(見式(67)),只根據第l幅之樣本,不考慮第L-1先前幅之樣本。此項運算相當於設定L=1。因此,相關性可以下式表示:
把式(120)內之模式假設代入式(128),並且式(122)和(123),以及式(124)內之定義,相關性矩陣B(l)可近似:
由式(131)可見B(l)大略由歸屬於方向性和周圍HOA成分之二加成性成分所組成。其秩數近似值提供方向性HOA成分之近似值,即:
然而應強調的是,ΣA(l)有些部份不免會漏入,因為ΣA(l)一般有滿秩數,因此由矩陣和ΣA(l)的直列所跨越之副空間,彼此並非正交。藉式(132),用於搜尋優勢方向的式(77)內向量,可以下式表達:
在式(135)內使用式(47)內所示球諧函數之如下性質:
式(136)顯示σ 2(l)之成分為來自測試方向Ω q ,1 q Q的訊號功率之近似值。
21:成幅
22:估計優勢方向
23:計算方向性訊號
24:計算周圍HOA成分
Claims (5)
- 一種用於解壓縮被壓縮高階保真立體音響(HOA)訊號的方法,該方法包含: 接收該被壓縮HOA訊號; 接收與該被壓縮HOA訊號相關聯的方向性資訊; 解碼該被壓縮HOA訊號,以確定經解碼之方向性HOA訊號以及經解碼之周圍HOA訊號; 對該經解碼之周圍HOA訊號執行位階延伸,以獲得該經解碼之周圍HOA訊號的位階延伸的表象;以及 從該經解碼之周圍HOA訊號的該位階延伸的表象和該經解碼之方向性HOA訊號重組經解碼之HOA表象。
- 如申請專利範圍第1項之方法,其中該經解碼之HOA表象具有大於1的第一位階。
- 一種非暫時性電腦可讀取媒體,具有儲存於其上的指令,當由一或多個處理器執行該些指令時,使該一或多個處理器執行申請專利範圍第1項之方法。
- 一種用於解壓縮被壓縮高階保真立體音響(HOA)訊號的裝置,該裝置包含: 輸入介面,其接收該被壓縮HOA訊號並且接收與該被壓縮HOA訊號相關聯的方向性資訊; 聲訊解碼器,其解碼該被壓縮HOA訊號,以確定經解碼之方向性HOA訊號以及經解碼之周圍HOA訊號; 處理器,用於對該經解碼之周圍HOA訊號執行位階延伸,以獲得該經解碼之周圍HOA訊號的位階延伸的表象;以及 合成器,用於從該經解碼之周圍HOA訊號的該位階延伸的表象和該經解碼之方向性HOA訊號重組經解碼之HOA表象。
- 如申請專利範圍第4項之裝置,其中該經解碼之HOA表象具有大於1的第一位階。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP12305537.8A EP2665208A1 (en) | 2012-05-14 | 2012-05-14 | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
| EP12305537.8 | 2012-05-14 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW202435200A TW202435200A (zh) | 2024-09-01 |
| TWI905561B true TWI905561B (zh) | 2025-11-21 |
Family
ID=
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20120029912A1 (en) | 2010-07-27 | 2012-02-02 | Voice Muffler Corporation | Hands-free Active Noise Canceling Device |
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20120029912A1 (en) | 2010-07-27 | 2012-02-02 | Voice Muffler Corporation | Hands-free Active Noise Canceling Device |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7471344B2 (ja) | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 | |
| JP2015520411A5 (zh) | ||
| TWI905561B (zh) | 高階保真立體音響訊號表象之壓縮方法和裝置以及解壓縮方法和裝置以及非暫時性電腦可讀取媒體 | |
| HK40088796A (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK40050574A (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK40051314A (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK40051314B (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK1238786A1 (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK1238787A1 (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK1235535A1 (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK1238790A1 (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK1235909A1 (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK1235909B (zh) | 解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK1238787B (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK1238786B (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 | |
| HK1235535B (zh) | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 |