TWI708501B

TWI708501B - 分裂增益形狀向量編碼

Info

Publication number: TWI708501B
Application number: TW108125153A
Authority: TW
Inventors: 艾瑞克諾維爾; 渥拉帝亞甘傑羅夫; 湯瑪斯托夫嘉德
Original assignee: 瑞典商Lm艾瑞克生(Publ)電話公司
Priority date: 2013-11-12
Filing date: 2014-11-12
Publication date: 2020-10-21
Also published as: EP3913808B1; CN110708075B; WO2015072914A1; AR099351A1; ES2891050T3; EP4593009A3; US9385750B2; TW202114420A; MX352106B; EP4593009A2; BR112016009785B1; US20170149441A1; US20160036462A1; TWI776298B; EP3913808A1; EP3624347A1; PT3624347T; EP3069449A1; CN110649925A; ES3019932T3

Abstract

本發明係關於一種編碼器及解碼器以及其中用於支援分裂增益形狀向量編碼及解碼之方法。該方法係由一編碼器執行，其中各向量分段之編碼具有關於允許編碼一向量分段之一最大位元數目B_MAX 之一約束。該方法包括判定用於一目標向量x之一初始分段數目N_p __init ；及基於一向量位元預算及N_p __init 進一步判定每個分段之一平均位元數目B_AVG 。該方法進一步包括基於該N_p __init 個分段之能量及B_MAX 與B_AVG 之間之一差判定該增益形狀向量編碼中用於該向量x之一最終分段數目。該方法之執行使得能夠在該目標向量內有效地分配該位元預算之位元。

Description

分裂增益形狀向量編碼

本文中揭示之發明大體上係關於增益形狀向量編碼及解碼，且特定言之係關於分裂增益形狀向量量化。

用於(例如)音訊及/或視訊之編碼方法通常包括某種類型的信號分段量化。已知無約束向量量化(VQ)係用於某一長度之分組樣本(即，向量)之一種有用的量化方法。然而，記憶體及搜尋複雜性約束導致開發結構化向量量化器。不同結構在搜尋複雜性及記憶體需求方面賦予不同權衡。用於結構化向量量化之一種此習知方法係增益形狀向量量化，其中目標向量x係使用一形狀向量r及一增益G來表示：

增益形狀向量量化之概念係量化一對增益及形狀分量{r, G}而非直接量化目標向量。接著使用經調諧用於正規化形狀輸入之一形狀量化器及處置信號之動態之一增益量化器來編碼增益及形狀分量。此結構常見地用於音訊編碼，此乃因至動態及形狀之劃分(亦標示精細結構)非常適用於聽覺感知模型。進一步言之，諸如IETF Opus及ITU-T G.719之許多音訊編解碼器使用一增益形狀向量量化以編碼目標音訊信號之頻譜係數。此等編解碼器兩者皆使用一固定頻帶結構以將頻譜分割為多個分段，且頻帶結構不適應目標向量之任何變化。增益形狀量化之一個問題係尋找一合適的向量長度。較長的向量賦予向量內之較大的變動，使得形狀量化器需要處置信號之動態。較短的向量減少向量內之動態，但是可具有以下事實：形狀VQ之較低維度善用樣本相關性的能力較低。此外，用於增益編碼之額外負擔隨著分割數目增加而增加，此使得用於形狀編碼之位元更加少。

期望達成一有效的增益形狀向量編碼及解碼。根據一第一態樣，提供一種用於支援分裂增益形狀向量編碼之方法。該方法係由一媒體編碼器執行，其中各向量分段之編碼具有關於允許編碼一向量分段之一最大位元數目B_MAX 之一約束。該方法包括：判定用於一目標向量x之一初始分段數目N_p __init ；及基於一向量位元預算及N_p __init 進一步判定每個分段之一平均位元數目B_AVG 。該方法進一步包括基於該N_p __init 個分段之能量及B_MAX 與B_AVG 之間之一差判定該增益形狀向量編碼中之向量x使用之一最終分段數目。根據一第二態樣，提供一種用於支援分裂增益形狀向量解碼之方法。該方法係由一媒體解碼器執行，其中一增益形狀向量x之各向量分段之一表示具有關於允許編碼一向量分段之一最大位元數目B_MAX 之一約束。該方法包括：判定用於待重新建構之一向量x_q 之一初始分段數目。該方法進一步包括自一媒體編碼器接收是否對該向量x_q 應用一分段數目增加之一指示。該方法進一步包括基於該所接收之指示判定用於該向量x_q 之解碼之一最終分段數目。根據一第三態樣，提供一種經操作以執行分裂增益形狀向量編碼之媒體編碼器，其中各向量分段之該編碼具有關於允許編碼一向量分段之一最大位元數目B_MAX 之一約束。該媒體編碼器經組態以：判定用於一目標向量x之一初始分段數目N_p __init ；及基於一向量位元預算及N_p __init 判定該向量x之每個分段之一平均位元數目B_AVG 。該媒體編碼器經進一步組態以基於該N_p __init 個分段之能量及B_MAX 與B_AVG 之間之一差判定該增益形狀向量編碼中使用之一最終分段數目。根據一第四態樣，提供一種經操作以執行增益形狀向量解碼之媒體解碼器，其中一增益形狀向量x之各向量分段之一表示具有關於允許編碼一向量分段之一最大位元數目B_MAX 之一約束。該媒體解碼器經組態以：判定用於待重新建構之一向量x_q 之一初始分段數目N_p __init ；及進一步自一媒體編碼器接收是否對該向量x_q 應用一分段數目增加之一指示。該媒體解碼器經進一步組態以基於該所接收之指示判定用於該向量x_q 之該解碼之一最終分段數目。根據一第五態樣，提供一種無線裝置，其包括根據第三態樣之一媒體編碼器。根據一第六態樣，提供一種無線裝置，其包括根據第四態樣之一媒體解碼器。根據一第七態樣，提供一種電腦程式，其包括當在至少一處理器上執行時使該至少一處理器實行根據第一態樣及/或第二態樣之方法之指令。根據一第八態樣，提供一種載體，其含有第七態樣之電腦程式。

本文中闡述之實施例之一概念係鑑於某一大小之一目標向量分析形狀及判定分成子向量之一合適的解決方案。在音訊編解碼器之情況下，此可減小量化誤差，且增加感知品質。進一步言之，本文中闡述之一些實施例之一目標係尋找一最佳區段數目，亦即，目標向量之分裂數目。本文中之實施例係關於一種用於支援分裂增益形狀向量編碼之方法。在其中各向量分段之編碼具有關於一最大位元數目B_MAX 之一約束之情形中，該方法旨在由一媒體編碼器執行。亦即，在其中允許用於編碼一向量分段之最大位元數目係B_MAX 之情形中。此約束可歸因於例如媒體編碼器之處理能力及/或記憶體容量。下文將參考圖1闡述根據一例示性實施例之一方法。圖1中圖解說明之方法包括對於一目標向量x，判定101用於該目標向量x之一初始分段數目N_p __init 。可基於例如B_MAX 及一位元預算(亦即，經分配用於編碼整個向量x之位元數目)判定數目N_p __init 。該方法進一步包括基於向量位元預算及N_p __init 判定102每個分段之一平均位元數目B_AVG 。注意，向量x實際上無須在此階段分裂，即使已判定可用於一初始向量分段之一初始分段數目及一平均位元數目亦係如此。該方法進一步包括基於該N_p __init 個分段之能量及B_MAX 與B_AVG 之間之一差判定103該增益形狀向量編碼中使用之一最終分段數目N_p 。藉由基於此等參數判定一最終分段數目，能夠實現在該目標向量內有效地分配該位元預算之該等位元，此將在下文進一步更加詳細地加以闡述。分段數目之判定可替代地表達為分裂數目之判定，此係由於分段數目及分裂數目緊密相關。替代地，術語分裂可用以標示一分段。接著可對一媒體解碼器指示經判定之最終分段數目N_p ，以使得媒體解碼器能夠充分解碼經編碼之增益形狀向量。應注意，不一定指示實際分段數目，但是與經判定之初始分段數目相比有所變化。關於N_{p_init} 之判定，可對編碼器及解碼器賦予此初始分段數目。在此等情況下，術語「判定」將係指(例如)建立N_{p_init} 以供使用或類似目的。在圖2中圖解說明之一實施例中，一最終分段數目之判定包括當該N_p __init 個分段之能量與B_MAX 和B_AVG 之間的差之間之一關係滿足一準則時，增加204分段(及分裂)數目。藉由「增加」分段數目在此處意謂與分段初始數目N_p __init 相比有所增加。例如，該增加可以一個分裂(及分段)為增量，導致一最終分段數目N_p =N_p __init +1。接著可以一適當的方式對一媒體解碼器指示205分段數目的增加。有利的是，使用儘可能少的位元來對一解碼器指示最終分段數目。當該增加係一預定分段(分裂)之一預定數目時(例如，1)，可使用一單個位元(通常稱為一旗標)對媒體解碼器指示最終分段(或分裂)數目的增加。例如，當應用增加分段數目時，將位元設定為「1」，且當使用初始分段數目時，將位元設定為「0」或「錯誤」。亦即，一最終分段數目之判定可進一步包括判定206當該N_p __init 個分段之能量與B_MAX 和B_AVG 之間的差之間之關係不滿足該準則時或當不滿足對應準則時應使用初始數目Np__init 個分段(即，N_p =N_p __init )。此被圖解說明為圖2中之動作206。一最終分段數目N_p 之判定可包括當一目標向量分段能量相距用於該目標向量x之一平均每個分段能量值E_AVG 之一最大偏差大於基於B_MAX 與B_AVG 之間之差之一臨限值時，與用於該目標向量x之初始數目相比增加204該分段數目。亦即，可比較目標向量分段內之一能量變動與基於B_MAX 與B_AVG 之間之差之一臨限值。以一簡化方式闡述使用相距一平均每個分段能量值E_AVG 之一最大偏差背後的邏輯，該邏輯係：當相距一平均每個分段能量之偏差較大時，不同分段之感知重要性的區別亦較大。應注意，可相反地表達「臨限值」比較使得比較B_MAX 和B_AVG 之間的差與取決於或基於該N_p __init 個分段之能量之一臨限值。亦即，上文可被表達為：當B_MAX 與B_AVG 之間之差小於取決於一目標向量分段能量相距用於該目標向量x之一平均每個分段能量值E_AVG 之一最大偏差之一臨限值時，應增加分段數目，等等。例如，此可被表達為：當

時或當

時，應增加分裂數目；其中

或

可被標示為臨限值。關於分段之能量，每個分段之對數能量可計算為：

其中i係一分段指標且k係一樣本指標。平均每個分段能量接著可定義為：

能量變動之一量測接著可定義為距該平均之最大絕對對數能量偏差：

何時增加一額外分裂之判定或決定可基於能量變動量測M是否高於基於B_MAX 及B_AVG 之某一臨限值的測試：

圖3a圖解說明每個分段之一平均能量(黑點)及總平均能量E_AVG (分段平均之平均)。為最小化編碼失真，期望使用的用於編碼包括更多能量的分段之位元多於用於編碼包括較少能量之分段。因此，當分段之間存在大的能量變動時，將期望將來自包括較少能量之分段之位元重新分配給包括較多能量之分段，假設全部分段最初被分配至少近似B_AVG 個位元，亦即，假設分段內該等位元之一初始平均分佈。圖3b係圖解說明分段數目、一B_MAX 值及一B_AVG 值之一簡單圖。當B_MAX 與B_AVG 之間之差(在本文中亦可被標示為容許度)為「小」時(例如，小於一臨限值)，將不可能在達到B_MAX 之前將彼許多位元重新分配給高能量含量分段。然而，藉由增加分段數目，將減小B_AVG ，此係由圖3b中之一虛線箭頭加以圖解說明，且因此增加將更多位元分配給高能量含量分段之可能性。藉由增加分段數目，允許具有偏離B_AVG 之一較高的正偏差(以位元數目表示)，此實現位元之重新分配。最大允許正偏差係B_MAX －B_AVG 。術語重新分配在此處並未暗示一平均位元數目B_AVG 實際上在重新分配之前被分配給各分段，而僅僅係用以促進對本文中提供之解決方案之理解。一例示性實施例可被闡述為：當向量分段之間之一能量變動相對於一容許度(B_MAX －B_AVG )為「大」時，分裂及分段數目增加「1」，此接著藉由設定一個1位元旗標而向一解碼器指示。「大」之判定可藉由使用可基於(例如)模擬選擇之一臨限值而執行。圖4中圖解說明此實施例。在圖4中，能量變動被標示為M，且在此實例中，臨限值M_THR 係基於B_MAX －B_AVG 。下文將進一步闡述用於一能量變動之不同表達實例。由於B_MAX 與B_AVG 之間之差(即，容許度)係一位元數目(應與一能量變動(例如，距一平均之一最大偏差，該最大偏差係一能量量測)比較)，所以可使用一調諧參數α以使得決定臨限值與容許度成比例。例如可基於模擬導出α之一值。進一步言之，存在以下情形：認為執行上述分段數目之分析毫無意義。藉由分析在此處意謂B_AVG 之判定102及一最終分段數目之判定103。在此等情形下，並不期望執行分析或浪費對向解碼器指示一分段數目之位元。因此，可調節(即，僅當滿足至少一額外條件時執行)分析之執行及一結果之指示。一此額外條件可為：向量位元預算高於一臨限值。此一條件之原因將係：當位元預算較低時，不會將許多位元重新分配給其他分段。另一額外條件可為：初始分裂數目或區段數目應低於一臨限值。此一條件之原因將係(例如)複雜性約束。應注意，上述實施例旨在係非遞歸的，此暗示一低的複雜性。與需要更多資源的遞歸方法相比，此可能係有利的。應進一步注意，分段旨在至少近似均勻地分佈在向量內，亦即，具有至少近似相等大小。與產生極為不同大小之分段之方法相比，此亦可能係有利的。本文中之實施例進一步係關於一種用於支援分裂增益形狀向量解碼之方法。該方法對應於上述編碼方法。在其中一增益形狀向量x之各向量分段之一表示具有關於允許編碼一向量分段之一最大位元數目B_MAX 之一約束的情形下，該方法旨在藉由一媒體解碼器執行。術語「媒體」在此處旨在指代(例如)音訊及/或視訊。下文將參考圖5闡述根據一例示性實施例之一方法。圖5中圖解說明之方法包括判定501用於待重新建構之一向量x_q 之一初始分段數目N_{P_init} ；該方法進一步包括自一媒體編碼器接收502是否對向量x_q 應用一分段數目增加之一指示及基於初始分段數目及該所接收之指示判定503用於向量x_q 之解碼之一最終分段數目。接著可基於最終分段數目解碼504向量x_q 。類似於關於編碼器側之實例，可以一位元旗標之形式接收該指示，當應用一額外分裂(N_p =N_{p_init} +1)時該指示被設定為(例如)「1」，且當使用初始分段數目(N_p =N_{p_init} )時該指示被設定為(例如)「0」。圖6中亦圖解說明使用一旗標作為指示符。對應於編碼器側，可調節且因此僅當滿足一或多個額外條件時執行一指示之接收。編碼器及解碼器側上應使用相同條件。例如，此等額外條件可為(如先前所述)向量位元預算高於一臨限值T1，且初始分裂或分段數目低於一臨限值T2，及/或每個樣本之位元率B_SAMPLE 高於一給定限制。(T1及T2僅用以指示該兩種情況的臨限值不同)。下文將闡述本文中提供之解決方案之一些更多細節及變體。[實施方式]結束時將闡述對應於上述方法實施例之一媒體編碼器及媒體解碼器之實施例。可藉由將一目標向量分裂為較小的區段來擷取跨目標向量之能量變動。分裂之好處將取決於目標向量之能量分佈。此可藉由計算正規化各區段中之能量之後目標信號之變異數

而圖解說明。假設該等區段具有相等大小，此可被表達為：

其中

係區段i之變異數，且

係分段數目。通常，如圖7中圖解說明，變異數值針對前面幾個分裂快速降低，但是接著飽和。觀察圖7中之圖的形狀，飽和點可被解譯為其中不需要進一步分解更多區段之點。進一步言之，可能要注意，此曲線將總是收斂至0，此乃因最終分裂將導致區段含有各自具有變異數0之一樣本。圖8中展示具有3路分裂及4路分裂之對應區段能量之一例示性目標向量。在另一實施例中，對於不同分裂組態(亦即，對於不同分段數目)，比較區段/分段之間的能量變異數。不同分裂組態(例如，3個分段對比2個分段)之間之變異數之一大幅增加指示目標向量之額外分裂將係有利的。變異數V被計算為：

其中一分段i中之每個係數的能量係：

其中BW_i 係分段之長度，且其中每個係數之平均能量係：

圖10圖解說明一例示性目標向量(上部圖式)以及例示性目標向量之分別用於2路分裂(中間圖式)及3路分裂(下部圖式)之對應分段能量。在圖11中，對於數目變化的分段展示分段能量之對應變異數。考慮自2個分段至3個分段之變化，變異數V增加，此接著指示分裂為3個分段將優於分裂為2個分段。在一實施例中，基於以下項決定額外分裂：

其中

係連續兩個分裂之間之分段能量之變異數之增加的一較低臨限值。當變異數的增加足夠大(亦即，在此實例中超過臨限值

)時，分段數目增加(例如) 1。如先前提及，可藉由(例如)使用一個位元以發送關於一個額外分裂或無額外分裂之信號自編碼器至解碼器發送關於一額外分裂之使用情況之信號。然而，若較佳，則可使用更多位元來發送一個以上額外分裂之信號。關於上述實施例之一變體係直接使用經正規化分段中之每個係數之平均能量

作為能量變動之一量測。如此做的動機係：當每個係數之平均能量在連續兩個分裂之間不會有太多改變時，各分段內之分佈係類似的且並未受益於進一步分裂，而連續兩個分裂之間的大幅變化促使一額外分裂。類似於上述表達式，可基於一臨限值

做出決定：

在另一實施例中，假設給定初始分段數目N_{p_init} ，例如歸因於量化器約束，演算法用以下程序決定是否增加N_{p_init} ：首先，每個分段之對數能量被計算為：

平均每個分段能量接著被定義為：

能量變動之一量測被定義為距該平均之最大絕對對數能量偏差：

使用絕對值以防有必要引發任何大的平均值偏差(無論其為正或負)。在一些情況下，僅上限係重要的，在該情況下可省略絕對值：

在又另一實施例中，下限可能更為重要且量測可接著經定義以尋找最小負偏差：

在能量偏差量測之所有例示性實施例中，意圖皆係增加分裂數目以防估計的能量偏差較大。原因係：一額外分裂將提供局部地分配位元之稍大自由度，如先前所闡述。何時增加一額外分裂之決定可基於能量變動量測M是否高於某一臨限值M_THR 的測試，如下(亦在圖4中加以圖解說明)：

在一實施例中，額外分裂之決定亦可受不同區段或分段之編碼器之約束影響。在此等情況下，若必要的位元分配在各區段或分段之最大位元數目B_MAX 以下不適用，則可能需要一額外分裂。如先前提及，每個區段之最大位元數目B_MAX 與每個區段之平均位元數目B_AVG 之間之差可被標示為用於位元分配之容許度

。每個頻帶之平均位元可被計算為

其中

標示給定頻帶之位元數目，亦即，表示頻帶之一目標向量之位元預算。術語「頻帶」在此處可被解譯為(例如)目標向量表示之頻率頻帶。進一步言之，可使用一調諧參數α調整決定臨限值以使決定臨限值與容許度成比例：

使用一額外分裂之決定亦可被編碼為一參數且自編碼器發送至解碼器。為確保僅當需要時(例如，由於在使用時需要一額外位元)進行關於額外分裂之信號發送，可限制僅在可係有利的之情形下使用上述演算法。例如，其可被限於僅在以下情況下使用：當初始分裂或分段數目N_{p_init} 低於一最大分裂或分段數目(例如

)時及/或當每個樣本之位元率B_SAMPLE 高於一給定限制(例如B_SAMPLE ＞B_SAMPLE,THR )時。為進行同步，編碼器及解碼器中應針對正確的位元串流解碼使用相同條件。該等實施例之一優點係：其可改良增益形狀量化方案之效能。分裂之準則要求無關緊要之額外計算複雜性，且由於量化較小分段的複雜性不及量化整個目標向量，所以該等實施例之所提出的演算法亦可達成計算複雜性的減小。實施方案 上述方法及技術可在可為其他裝置之部分之編碼器及解碼器中實施。編碼器，圖 12a 至圖 12c 圖12a中以一般方式圖解說明一媒體編碼器之一例示性實施例。媒體編碼器被稱為用於例如音訊及/或視訊信號之一編碼器。編碼器1200經組態以執行上文參考圖1至圖2及圖4之任一者闡述之方法實施例中之至少一者。編碼器1200與相同於先前闡述之方法實施例之技術特徵、目的及優點相關聯。將簡要地闡述編碼器以避免不必要的重複。可如下實施及/或闡述編碼器：編碼器1200經組態用於分裂增益形狀向量編碼。編碼器1200包括處理電路或處理構件1201及一通信介面1202。處理電路1201經組態以使編碼器1200對一目標形狀向量x進行以下項：判定一初始分段數目N_{p_init} ，且基於一向量位元預算及N_{p_init} 進一步判定每個分段之一平均位元數目B_AVG 。處理電路1201經進一步組態以使編碼器基於N_{p_init} 個分段之能量及B_MAX 與B_AVG 之間之一差判定增益形狀向量編碼中使用之一最終分段數目。亦可標示為(例如)輸入/輸出(I/O)介面之通信介面1202包含用於將資料發送至其他實體或模組及自其他實體或模組接收資料之一介面。如圖12b中圖解說明，處理電路1201可包括處理構件，諸如一處理器1203 (例如，一CPU)，及用於儲存或保存指令之一記憶體1204。記憶體接著將包括例如呈一電腦程式1205之形式之指令，該等指令在由處理構件1203執行時使編碼器1200執行上述動作。圖12c中展示處理電路1201之一替代實施方案。處理電路在此處包括一第一判定單元1206，其經組態以使編碼器1200進行以下項：判定用於一目標形狀向量x之一初始分段數目N_{p_init} 。處理電路進一步包括一第二判定單元1207，其經組態以使編碼器基於一向量位元預算及N_{p_init} 判定每個分段之一平均位元數目B_AVG 。處理電路進一步包括一第三判定單元1208，其經組態以使編碼器基於N_{p_init} 個分段之能量及B_MAX 與B_AVG 之間之一差判定增益形狀向量編碼中使用之向量x之一最終分段數目。處理電路1201可包括更多單元，諸如一指示單元1209，其經組態以使編碼器對一媒體解碼器指示最終分段數目，例如與初始數目相比增加1次分段。此任務替代地可藉由其他單元中之一者執行。上述編碼器可經組態用於本文中闡述之不同方法實施例，諸如當一目標向量分段能量相距目標向量x之一平均每個分段能量值E_AVG 之一最大偏差大於基於B_AMX 與B_AVG 之間之差之一臨限值時，與初始數目相比增加增益形狀向量編碼之目標向量x之分段數目。可假設編碼器1200包括用於實行規則的編碼器功能之其他功能。解碼器，圖 13a 至圖 13c 本文中的實施例亦係關於一種媒體解碼器1300，其經組態用於實行上述解碼方法之實施例。亦即，例如圖5中圖解說明用於支援分裂增益形狀向量解碼之方法。圖13a中以一般方式圖解說明一解碼器1300之一例示性實施例。解碼器1300經組態以執行上文參考圖5至圖6闡述之方法實施例中之至少一者。解碼器1300與相同於先前闡述之方法實施例之技術特徵、目的及優點相關聯。將簡要地闡述解碼器以避免不必要的重複。解碼器1300經組態用於支援分裂增益形狀向量解碼，且經操作以執行分裂增益形狀向量解碼。解碼器1300包括處理電路1301及一通信介面1302。處理電路1301經組態以使網路節點判定待重新建構之一向量x_q 之一初始數目N_{p_init} ；且進一步自一媒體編碼器接收是否對向量x_q 應用一分段數目增加之一指示。處理電路1301經進一步組態以使網路節點基於該接收指示判定用於向量x_q 之解碼之一最終分段數目。亦可標示為(例如)輸入/輸出(I/O)介面之通信介面1302包含用於將資料發送至其他實體或模組及自其他實體或模組接收資料之一介面。如圖13b中圖解說明，處理電路1301可包括處理構件，諸如一處理器1303，及用於儲存或保存指令之一記憶體1304。記憶體接著將包括例如呈電腦程式1305之形式之指令，該等指令在由處理構件1303執行時使網路節點1300執行上述動作。圖13c中展示處理電路1301之一替代實施方案。處理電路在此處包括一第一判定單元1306，其經組態以使網路節點判定用於待重新建構之一向量x_q 之一初始分段數目N_p __init 。處理電路1301進一步包括一接收單元1307，其經組態以使網路節點自一媒體編碼器接收是否對向量x_q 應用一分段數目增加之一指示。處理電路1301進一步包括一第二判定單元1308，其經組態以使網路節點基於該所接收之指示判定用於該向量x_q 之解碼之一最終分段數目。可假設網路節點1300包括用於實行規則的解碼器功能之其他功能。替代地可如圖14中圖解說明般闡述及/或實施編碼器及解碼器。圖14係根據本文中建議的解決方案之實施例之一分裂演算法編碼器及解碼器之一示意方塊圖。編碼器包括一初始分裂決定器單元、一能量變動分析器單元及一分裂編碼器單元。解碼器包括一初始分裂決定器及一決定解碼器。編碼器及解碼器及其所包含單元可在硬體及/或軟體中實施。例如，替代地可由一處理器及因此具有適合儲存器或記憶體之適當軟體中之一或多者實施本文中闡述之編碼器及解碼器，以根據本文中闡述之實施例執行一輸入向量之一適當分裂及/或分段數目之判定，參見圖15及圖16。對於圖15中圖解說明之編碼器，藉由連接處理器及記憶體之一輸入(IN)接收傳入向量，且自輸出(OUT)輸出獲自軟體之向量之經編碼表示，例如，一音訊信號(參數)。例如，可由一處理器及因此具有適合儲存器或記憶體之適當軟體中之一或多者實施本文中闡述之解碼器，以根據本文中闡述之實施例執行輸入參數之解碼，參見圖16。藉由連接處理器及記憶體之一輸入(IN)接收傳入參數，且自輸出(OUT)輸出獲自軟體之經解碼信號。上述技術可包括在(例如)一無線裝置中，諸如(例如)一使用者設備、一行動終端機、一平板電腦、用於機器對機器通信之一行動無線裝置、一積體或嵌入式無線卡、一外部插入式無線卡、一伺服器鑰(dongle)等等，或包括在一固定或半固定裝置中，諸如一個人電腦或一智慧型TV。結束語 可使用任何習知技術(諸如離散電路或積體電路技術，包含通用電子電路及特殊應用積體電路)在硬體中實施本文中闡述之步驟、功能、程序、模組、單元及/或區塊。特定實例包含一或多個經適當組態之數位信號處理器及其他已知電子電路，例如經互連以執行一專用功能之離散邏輯閘或特殊應用積體電路(ASIC)。替代地，可以軟體(諸如由包含一或多個處理單元之適當的處理電路執行之一電腦程式)實施上述步驟、功能、程序、模組、單元及/或區塊中之至少一些。可在網路節點中使用電腦程式之前及/或期間由一載體(諸如一電信號、一光學信號、一無線電信號、或一電腦可讀儲存媒體)攜帶該軟體。本文中呈現之一或多個流程圖在由一或多個處理器執行時可被視為一或多個電腦流程圖。一對應設備可被定義為一群組的功能模組，其中由處理器執行之各步驟對應於一功能模組。在此情況下，功能模組被實施為在處理器上運行之一電腦程式。處理電路之實例包含(但不限於)一或多個微處理器、一或多個數位信號處理器DSP、一或多個中央處理單元CPU及/或任何適合的可程式化邏輯電路，諸如一或多個場可程式化閘陣列FPGA或一或多個可程式化邏輯控制器PLC。亦即，上述不同節點中之配置中之單元或模組可由類比及數位電路之一組合及/或經組態具有例如儲存在一記憶體中之軟體及/或韌體之一或多個處理器之一組合而實施。此等處理器中之一或多者以及其他數位硬體可包含在一單個特殊應用積體電路ASIC中，或若干處理器及各種數位硬體可分佈在若干單獨組件之間，而不論是否個別封裝或組裝在一系統單晶片SoC中。亦應瞭解，可再用其中實施所提出的技術之任何習知裝置或單元之一般處理能力。亦可例如藉由再程式化現有軟體或藉由增加新的軟體組件來再用現有軟體。上述實施例僅僅被給定為實例，且應瞭解所提出的技術不限於此。熟習此項技術者將瞭解，在不脫離本範疇的情況下可對實施例作出各種修改、組合及改變。特定言之，若技術上可行，則可以其他組態組合不同實施例中之不同部分解決方案。當使用字詞「包括」或「包括(comprising)」時，其將被解譯為非限制的，亦即，意謂「至少由……組成」。亦應注意在一些替代實施方案中，方塊中所註明之功能/動作可不按流程圖所註明之順序發生。舉例而言，取決於所涉及之功能/動作，連續展示之兩個方塊實際上可實質上同時執行或方塊有時可按相反順序執行。此外，流程圖及/或方塊圖之一給定方塊之功能可劃分為多個方塊，及/或流程圖及/或方塊圖之兩個或兩個以上方塊之功能可至少部分整合。最後，在不脫離發明概念之範疇的情況下，可在已圖解說明之區塊之間增加及/或插入其他區塊，及/或可省略區塊/操作。應瞭解，互動單元之選擇以及本發明內之單元之命名僅僅係為了例示性目的，且適用於執行上述方法中之任一者之節點可以複數種替代方式組態以能夠執行所建議的程序動作。亦應注意，本發明中闡述之單元應被視為邏輯實體且不一定被視為單獨實物實體。除非明確陳述，否則以單數對一元件的引用不旨在意謂「一個且僅一個」，而是意謂「一或多個」。等效於為一般技術者所瞭解之上述實施例之元件之所有結構及功能係以引用之方式明確併入在本文中且旨在特此被涵蓋在本文中。此外，一裝置或方法因其特此涵蓋在本文中而不一定解決力圖由本文中揭示之技術解決之每個問題。在本文中之一些例項中，省略熟知裝置、電路及方法之詳細闡述以免使對所揭示技術之闡述與不必要細節混淆。本文中敘述所揭示技術之原理、態樣及實施例之所有陳述以及其特定實例旨在涵蓋其之結構及功能等效物兩者。此外，此等等效物旨在包含當前已知等效物以及未來開發之等效物(例如，所開發之執行相同功能之任何元件)兩者，而不論結構為何。下文列出一組29個額外的例示性實施例。該等實施例主要對應於先前闡述之實施例，但是表述稍許不同。 • 實施例1：一種用於支援由一媒體編碼器執行之分裂增益形狀向量編碼之方法，其中各向量分段之該編碼具有關於允許編碼一向量分段之一最大位元數目B_MAX 之一約束，該方法包括：對於一目標向量x： -判定用於將該目標向量x劃分為初始數目N_{p_init} 個分段之一初始分裂數目； -基於一向量位元預算及N_{p_init} 判定每個分段之一平均位元數目B_AVG ；及 -基於B_MAX 與B_AVG 之間之一差判定該增益形狀向量編碼中使用之一最終分裂數目。 • 實施例2：如實施例1之方法，其中一最終分裂數目之判定包括：當B_MAX 與B_AVG 之間之差小於一臨限值(203)時： -與用於該增益形狀向量編碼之目標向量x之初始數目相比增加該分裂數目。 • 實施例3：如實施例2之方法，其中該臨限值取決於該等目標向量分段內之一能量變動。 • 實施例4：如實施例2至3中任一項之方法，其中該臨限值取決於一目標向量分段能量相距用於該目標向量x之一平均每個分段能量值E_AVG 之一最大偏差。 • 實施例5：如實施例2至4中任一項之方法，其進一步包括： -對一媒體解碼器指示增加該分裂數目。 • 實施例6：如實施例1至4中任一項之方法，其進一步包括： -對一媒體解碼器指示該最終分裂數目。 • 實施例7：如實施例1至6中任一項之方法，其中當滿足至少一額外條件時，僅執行對B_AVG 之判定及基於B_MAX 與B_AVG 之間之一差對一最終分裂數目之判定。 • 實施例8：如實施例1至7中任一項之方法，其中當該向量位元預算高於用於額外分裂之一臨限值時及/或當每個樣本之一位元率高於一給定限制時，執行對B_AVG 之判定及基於B_MAX 與B_AVG 之間之一差對一最終分裂數目之判定。 • 實施例9：如實施例1至8中任一項之方法，其中當該初始分裂數目低於一臨限值時，執行對B_AVG 之判定及基於B_MAX 與B_AVG 之間之一差對一最終分裂數目之判定。 • 實施例10：一種用於支援由一媒體解碼器執行之分裂增益形狀向量解碼之方法，其中一增益形狀向量x之各向量分段之一表示具有關於允許編碼一向量分段之一最大位元數目B_MAX 之一約束，該方法包括： -判定用於待重新建構之一向量x_q 之一初始分裂數目； -自一媒體編碼器接收是否對該向量x_q 應用一分裂數目增加之一指示，及 -基於該所接收之指示判定用於該向量x_q 之解碼之一最終分裂數目。 • 實施例11：如實施例10之方法，其進一步包括： -基於該最終分裂數目解碼該向量xq。 • 實施例12：如實施例10或11之方法，其中僅當滿足一或多個額外條件時執行該指示之接收。 • 實施例13：如實施例12之方法，其中一額外條件係該向量位元預算高於用於額外分裂之一臨限值。 • 實施例14：如實施例12或13之方法，其中一額外條件係該初始分裂數目低於一臨限值及/或每個樣本之一位元率高於一給定限制。 • 實施例15：一種經操作以執行分裂增益形狀向量編碼之媒體編碼器，其中各向量分段之該編碼具有關於允許編碼一向量分段之一最大位元數目B_MAX 之一約束，該媒體編碼器經組態以：對於一目標向量x： -判定用於將該目標向量x劃分為初始數目N_{p_init} 個分段之一初始分裂數目；基於一向量位元預算及N_{p_init} 判定每個分段之一平均位元數目B_AVG ；及基於B_MAX 與B_AVG 之間之一差判定該增益形狀向量編碼中使用之一最終分裂數目， • 實施例16：如實施例15之媒體編碼器，其為判定該最終分裂數目而經組態以：當B_MAX 與B_AVG 之間之一差小於一臨限值時： -與用於該增益形狀向量編碼之目標向量x之初始數目相比增加該分裂數目。 • 實施例17：如實施例16之媒體編碼器，其中該臨限值取決於該等目標向量分段內之一能量變動。 • 實施例18：如實施例16或17中任一項之媒體編碼器，其中該臨限值取決於一目標向量分段能量相距用於該目標向量x之一平均每個分段能量值E_AVG 之一最大偏差。 • 實施例19：如實施例16至18中任一項之媒體編碼器，其經進一步組態以： -對一媒體解碼器指示增加該分裂數目。 • 實施例20：如實施例15至18中任一項之媒體編碼器，其經進一步組態以： -對一媒體解碼器指示該最終分裂數目。 • 實施例21：如實施例15至20中任一項之媒體編碼器，其經進一步組態以僅當滿足至少一額外條件時，判定B_AVG 且基於B_MAX 與B_AVG 之間之一差判定一最終分裂數目。 • 實施例22：如實施例15至21中任一項之媒體編碼器，其經進一步組態以當該向量位元預算高於用於額外分裂之一臨限值時，判定BAVG且基於BMAX與BAVG之間之一差判定一最終分裂數目。 • 實施例23：如實施例15至22中任一項之媒體編碼器，其經進一步組態以當該初始分裂數目低於一臨限值時，判定BAVG且基於BMAX與BAVG之間之一差判定一最終分裂數目。 • 實施例24：一種經操作以執行增益形狀向量解碼之媒體解碼器，其中一增益形狀向量x之各向量分段之一表示具有關於允許編碼一向量分段之一最大位元數目B_MAX 之一約束；該媒體解碼器經組態以： -判定用於待重新建構之一向量x_q 之一初始分裂數目N_{p_init} ； -自一媒體編碼器接收是否對該向量x_q 應用一分裂數目增加之一指示，及 -基於該所接收之指示判定用於該向量x_q 之解碼之一最終分裂數目。 • 實施例25：如實施例24之媒體解碼器，其經進一步組態以： -基於該最終分裂數目解碼該向量x_q 。 • 實施例26：一種無線裝置，其包括如實施例15至23中任一項之一媒體編碼器。 • 實施例27：一種無線裝置，其包括如實施例24至25中任一項之一媒體解碼器。 • 實施例28：一種電腦程式，其包括當在至少一處理器上執行時使該至少一處理器實行如實施例1至14中任一項之方法之指令。 • 實施例29：一種載體，其含有前一實施例之電腦程式，其中該載體係一電信號、光學信號、無線電信號或電腦可讀儲存媒體中之一者。縮寫詞 N_p 區段數目 E 分段能量對數 E_AVG 一目標向量之分段內之平均分段能量 B_MAX 每個分段之最大允許位元 B_AVG 每個分段之平均位元 B_SAMPLE 每個樣本之位元 B_BAND 一給定頻帶之分配位元 BW 頻寬 x 目標向量 r 形狀向量(亦稱為殘差) G 用於縮放目標向量之增益(標量或向量) i 分段指標 k 樣本指標

1200‧‧‧編碼器 1201‧‧‧處理電路/處理構件 1202‧‧‧通信介面 1203‧‧‧處理構件 1204‧‧‧記憶體 1205‧‧‧電腦程式 1206‧‧‧第一判定單元 1207‧‧‧第二判定單元 1208‧‧‧第三判定單元 1209‧‧‧指示單元 1300‧‧‧媒體解碼器 1301‧‧‧處理電路 1302‧‧‧通信介面 1303‧‧‧處理器/處理構件 1304‧‧‧記憶體 1305‧‧‧電腦程式 1306‧‧‧第一判定單元 1307‧‧‧接收單元 1308‧‧‧第二判定單元 B_MAX‧‧‧最大位元數目 B_AVG‧‧‧平均位元數目 E‧‧‧分段能量對數 E_AVG‧‧‧平均每個分段能量值 N_p__init‧‧‧初始分段數目 N_p‧‧‧區段數目 B_BAND‧‧‧一給定頻帶之分配位元 BW‧‧‧頻寬 r‧‧‧形狀向量

本文中揭示之技術之前述及其他目的、特徵及優點將自如隨附圖式中圖解說明之實施例之下列更特定闡述而顯而易見。圖式不一定按比例繪製，而重點反而在於圖解說明本文中揭示之技術之原理。圖1至圖2係展示由根據例示性實施例之一編碼器執行之方法之流程圖。圖3a圖解說明多個向量分段之E_AVG 及每個分段之平均能量。圖3b圖解說明多個向量分段之B_MAX 及B_AVG 。圖4係展示由根據例示性實施例之一編碼器執行之方法之一流程圖。圖5至圖6係展示由根據例示性實施例之一解碼器執行之方法之流程圖。圖7係展示形狀變異數一般隨著分裂數目降低之一圖。圖8展示一目標向量(上部圖式)以及3和分裂(中間圖式)及4個分裂(下部圖式)之對應能量之一實例。注意，具有4個分裂之模型更緊密地遵循目標向量中之能量動態。圖9係展示分裂目標向量以用於增益形狀量化方面之一權衡之一圖。低數目分裂不能足夠充分地正規化形狀向量。高數目分裂需要大量的位元額外負擔來傳輸增益，且因此沒有足夠數目的位元來用於形狀編碼。圖10展示一目標向量及用於2路分裂及3路分裂之對應分段能量之一實例。圖11係展示分段能量之變異數依據圖10中之目標向量所分裂之分段數目變化之一圖。圖12a至圖16圖解說明根據例示性實施例之一編碼器及/或解碼器之不同實施方案。

Claims

一種用於由一媒體編碼器執行之編碼之方法，該方法包括：判定用於一目標向量x之一初始分段數目(Np_init)；判定每個Np_init目標向量分段的能量；基於一向量位元預算及Np_init判定每個分段之一平均位元數目(B_AVG )；若該Np_init個分段之該等能量與用於一向量分段之一最大位元數目(B_MAX )和B_AVG 之間的差之間之一關係滿足一經判定條件，則藉由增加該初始分段數目Np_init來判定一最終分段數目；及對一解碼器指示增加該分段數目。
如請求項1之方法，其中每個目標向量分段的能量計算為每個分段之對數能量(log-energy)。
如請求項2之方法，其中每個分段之對數能量計算為：
，其中i係一分段指標且k係一樣本指標。
如請求項1之方法，其中該經判定條件包括一目標向量分段能量相距用於一平均每個分段能量值E_AVG 之一最大偏差大於基於B_MAX 與B_AVG 之間的該差之一臨限值。
如請求項1之方法，其中僅當滿足至少一額外條件時執行是否增加該初始分段數目之該判定。
如請求項1之方法，其中僅當該初始分段數目低於一臨限值及/或當每個樣本之一位元率高於一給定限制時執行是否增加該初始分段數目之該判定。
一種媒體編碼器，其經組態以：判定用於一目標向量x之一初始分段數目(Np_init)；判定每個Np_init目標向量分段的能量；基於一向量位元預算及Np_init判定每個分段之一平均位元數目(B_AVG )；若該Np_init個分段之該等能量與用於一向量分段之一最大位元數目(B_MAX )和B_AVG 之間的差之間之一關係滿足一經判定條件，則藉由增加該初始分段數目Np_init來判定一最終分段數目；及對一媒體解碼器指示增加該分段數目。
如請求項7之媒體編碼器，其中該判定每個目標向量分段的能量包括將每個目標向量分段的能量計算為每個分段之對數能量。
如請求項8之媒體編碼器，其中每個分段之對數能量計算為：
，其中i係一分段指標且k係一樣本指標。
如請求項7之媒體編碼器，其中該經判定條件包括一目標向量分段能量相距用於一平均每個分段能量值E_AVG 之一最大偏差大於基於B_MAX 與B_AVG 之間的該差之一臨限值。
如請求項7之媒體編碼器，其中僅當滿足至少一額外條件時執行是否增加該初始分段數目之該判定。
如請求項7之媒體編碼器，其中僅當該初始分段數目低於一臨限值及/或當每個樣本之一位元率高於一給定限制時執行是否增加該初始分段數目之該判定。
一種無線裝置，其包括如請求項7之媒體編碼器。
一種媒體解碼器，其經組態以：判定用於待重新建構之一向量x_q 之一初始分段數目Np_init；接收是否對該向量x_q 應用一增加分段數目之一指示，及基於該所接收之指示判定用於該向量x_q 之該解碼之一最終分段數目Np，其中該媒體解碼器係經組態以判定該所接收之指示是否指示對該向量x_q 應用一增加分段數目，及該媒體解碼器係經組態以使得作為判定該所接收之指示係指示對該向量x_q 應用一增加分段數目的結果，該媒體解碼器判定該最終分段數目Np將等於(Np_init + X)，其中X係大於或等於1。
如請求項14之媒體解碼器，其經進一步組態以僅當滿足一或多個額外條件時接收該指示。
如請求項15之媒體解碼器，其中一額外條件係初始分裂數目低於一臨限值及/或每個樣本之一位元率高於一給定限制。
一種無線裝置，其包括如請求項14之媒體解碼器。