TW201108201A - Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal - Google Patents
Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal Download PDFInfo
- Publication number
- TW201108201A TW201108201A TW098143908A TW98143908A TW201108201A TW 201108201 A TW201108201 A TW 201108201A TW 098143908 A TW098143908 A TW 098143908A TW 98143908 A TW98143908 A TW 98143908A TW 201108201 A TW201108201 A TW 201108201A
- Authority
- TW
- Taiwan
- Prior art keywords
- variation
- parameter
- model
- signal
- autocorrelation
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 112
- 238000004590 computer program Methods 0.000 title claims description 14
- 230000005236 sound signal Effects 0.000 claims abstract description 136
- 230000002123 temporal effect Effects 0.000 claims abstract description 29
- 230000008859 change Effects 0.000 claims description 33
- 238000001914 filtration Methods 0.000 claims description 10
- 230000035772 mutation Effects 0.000 claims description 9
- 230000002829 reductive effect Effects 0.000 claims description 8
- 239000000463 material Substances 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000036961 partial effect Effects 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 5
- 230000006835 compression Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 230000008602 contraction Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 2
- 239000003638 chemical reducing agent Substances 0.000 claims 2
- 238000005070 sampling Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 20
- 238000005259 measurement Methods 0.000 description 11
- 238000007781 pre-processing Methods 0.000 description 10
- 230000003595 spectral effect Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
- Auxiliary Devices For Music (AREA)
- Stored Programmes (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
201108201 六、發明說明: 【發明戶斤屬之技術領域3 本發明係有關於用以獲得描述信號之信號特性變異之參 數的裝置、方法與電腦程式。 【先前技術3 發明背景 根據本發明之實施例有關於用以在描述在一變換域中 之音訊信號的實際變換域參數的基礎上,獲得描述信號之 信號特性變異之參數的一裝置、一方法及一電腦程式。 根據本發明的較佳實施例有關於用以在描述在一變換 域中之音訊信號的實際變換域參數的基礎上,獲得描述音 訊信號之信號特性時間變異之參數的一裝置、一方法及一 電腦程式。 根據本發明的其他實施例有關於信號變異估計。 儘管本發明的原始範圍是對音訊信號的時間變異分 析,但是同一方法可容易地適用於任何數位信號,且此等 信號的變異呈現在其等的任何軸上。此等信號及變異包括 例如,諸如影像及電影之強度對比的特性空間及時間變 異、諸如雷達及無線電信號之振幅及頻率的特性調變(變 異)、及諸如心電圖信號之異質的特性變異。 在下面,將給出關於信號變異估計概念的一簡單介紹。 傳統的信號處理通常由假設局部穩定信號開始,且對 於許多應用,此是一合理的假設。但是,為了申請諸如語 音及音訊之信號是局部穩定拉伸,但是事實上在一些情況 201108201 下超過了可接受的位準的專利。特性快速改變的信號會將 失真引入難以由傳統方式包含的分析結果中,且從而對於 快速變化的信號需要特別定制的方法論。 例如’可能要考慮具有一變換式編碼器之一語音信號 的編碼。此處,輸入信號在視窗中予以分析,其内容轉換 為頻谱域。當該信號是基頻快速改變的一諧波信號時,相 對應於該等諧波之頻譜峰值的位置隨著時間改變^如果例 如相比於基頻的改變,分析視窗的長度相當長,則該等頻 譜峰值會延伸至相鄰的頻率槽(bin)。換句話說,該頻譜表 示會模糊不清。此失真可能在上方頻率處尤為嚴重,其中 當基頻改變時’頻譜峰值的位置較快速地移動。 儘管存在能補償該基頻中諸如時間捲曲修正型餘弦變 換(TW-MDCT)(參見參考[8]及[3])之改變的方法,但是音高 週期變異估計仍然是一挑戰。 在過去’音高週期變異已經透過測量該音高週期且僅 使用時間導數來估計。然而,因為音高週期估計是一困難 且通常不明確的任務,所以該音高週期變異估計值會由於 錯誤而錯亂。其中,音高週期估計遭受二種類型的共用錯 誤(例如參見參考[2])。首先,當該等諧波具有大於基頻的 能量時’估計器通常遭分散以明確該諧波實際上是該基 頻’藉此輸出實際頻率的整數倍。此等錯誤可作為該音高 週期追蹤中的不連續性而觀察到,且在該時間導數方面產 生一極大錯誤。其次,大多數音高週期估計方法基本上依 賴於根據一些啟發,從該(等)自相關(或相似)域中所選取的 201108201 峰值。特別的是,在改變信號的情況下,此等峰值是廣泛 的(在頂部是平坦的),藉此該自相關估計值中小錯誤也會顯 著地移動所估計的峰值位置。因而,該音高週期估計值是 一不穩定的估計值。 如上所示,在信號處理中的一般方法是假設信號在短 時間間隔中枝定的,且以關隔來估計料特性。如果 =信號實際上是時變的,那麼假設該信號的時間演進相當 L,使侍在短間隔中穩定性的假設是相當正確的且在短 間隔中的分析將不會產生顯著的失真。 上面内谷’期望提供用以獲得描述具有改良穩健 性之信號特徵時間變異之參數的一概念。 【發"明内容> 】 發明概要 變換域 根據本發明之一實施例產生用以在描述-變換域中音 訊信號的實際變換域參數的基礎上,獲得描述音訊作號之 信號特性時間變異之參數的—裝置。該裝置包含一=判 定器,該參數判u受組配以依據表卜信號特性的一或 夕個參數,來判定描述變換域參數之相演進的一 變異模型的-或多個模型參數,諸如—模型錯誤、表示。 小化 換域嫩她恤咖㈣際變換域參 數之時間㈣之間的偏差處於—預定臨界值下或予以最 .^ 、旧现的興型時間變異產 在錢換域中的—特徵時間演進’其可以僅使用有限數 201108201 =模型參數予以良好描述。儘”於其巾該特性時間演 =人類語音嗓音的典型解剖來財的聲音信號,這尤其 :,但是該假設持有有廣泛範圍的 他信號,如 典型的音樂信號。 一而且,一信號特性(例如一音高週期、一包絡、一音調、 桑度等)的制平滑時間演進可遭該變換域 變異模型考 二。因此一參數化變換域變異的使用可以甚至用以增強 =考慮)騎輯㈣雜的平魏。目而,賴估計信號 特性或其偏差的不料性可h避免。因此,透過選擇該 變換域變異模型,任何典型的限制都可作用於該等信號特 性的模型化變異’例如一變異的限制比率、一值的限制範 必等而且,透過適當地選擇該變換域變異模型,譜波的 影響可獲得考慮,使得例如可以透過_地模型化一基頻 及其譜波的-時間演進,來獲得改良的可靠性。 而且透過使用在該變換域中的—變異模型化,可以 號失真的影響。儘官某些類型的失真(例如—頻率相 =號延遲)導致—信號波形的嚴重改變,但是此失真可能 / l相變換域表示具有料m的影響。因為自然地還 f確话持在失真的信號特性,所以顯示該變換域的 使用是一極好的選擇。 上所述…變換域變異模型的使用使—典型音訊信 =信號特性能夠在良好的精度及可靠性下予以判定,該 換域變異模型的參數適用於使該參數化變換域變異模型 5其輸出)與描述一輸入音訊信號之實際變換域參數的一 201108201 實際時間演進相一致。 在一較佳實施例中,該裝置可受組配以獲得作為該等 實際變換域參數的,描述相對於預定的一組轉換變數(在此 還指定為“變換變數”)值,該變換域中該音訊信號的一第一 時間間隔的一第一組變換域參數。類似地,該裝置可受組 配以獲得描述相對於預定的該組轉換變數值,該變換域中 該音訊信號的一第二時間間隔的一第二組變換域參數。在 此種情況下,該參數判定器可受組配以使用包含一頻率-變 異(或音高週期-變異)參數且表示針對於假設該音訊信號之 一平滑頻率變異的該轉換變數,該音訊信號之變換域表示 的壓縮或擴展的一參數化變換域變異模型,獲得一頻率(或 音高週期)變異模型參數。該參數判定器可受組配以判定該 頻率變異參數,使得該參數化變換域變異模型適用於該第 一組變換域參數及該第二組變換域參數。透過使用此方 式,一極有效的使用可以由可用於該變換域中的資訊構 成。已經得出的是,一音訊信號的一變換域表示(例如一自 相關域表示、一自協方差域表示、一傅利葉變換域表示、 一離散型餘弦變換域表示等)在變化基頻或音高週期的變 化時,予以平滑地擴展或壓縮。透過模型化該變換域表示 的此平滑壓縮或擴展,該變換域表示的完全資訊内容可予 以使用,因為該變換域表示的多重取樣(對於該轉換變數的 不同值)可相匹配。 在一較佳實施例中,該裝置可受組配以獲得作為該等 實際變換域參數的,描述作為一變換變數之函數之該變換 7 201108201 域中音訊信號的變換域參數。該變換域可以獲得選擇,使 得δ玄音訊信號的頻率變換至少產生相關於該變換變數之該 θ a k號之變換域表示的一頻率偏移,或相關於該變換變 數之該變換域表示的一伸展,或相關於該變換變數之該變 換域表示的一壓縮。該參數判定器可受組配以在相對應(例 如與S亥變換變數之相同值相關聯)實際變換域參數之一時 間變異的基礎上,獲得一頻率-變異模型參數(或音高週期_ 變異模型參數),考慮該音訊信號之變換域表示與該變換變 數的相依性。使用此方式,關於相對應實際變換域參數(例 如相對於相同自相關滯後、自協方差滯後或傅利葉變換頻 率bin的變換域參數)之一時間變異的資訊可分別地評估與 相關於該轉換變數之該變換域表示有關的資訊。隨後,該 經分別計算的資訊可以相結合。因而,一特別有效的方式 可用於,例如透過比較多對變換域參數及考慮該變換域表 示之變換參數相依變數之所估計的局部梯度,來估計該變 換域表示的擴展或壓縮。換句話說,該變換域表示的局部 坡度,依據該變換參數及該變換域表示的時間改變(例如橫 跨隨後視窗)而定,可以相結合以估計該變換域表示之時間 壓縮或擴展的幅值,其接著是一時間頻率變異或音高週期 變異的測量。 其他較佳的實施例還定義於附屬申請專利範圍中。 根據本發明的另一實施例產生用以在描述一變換域中 之該音訊信號的實際變換域參數的基礎上,獲得描述一音 訊信號之信號特性時間變異的一參數的一方法。 201108201 又一實施例產生用以獲得描述一音訊信號之信號特性 時間變異之一參數的一電腦程式。 圖式簡述 第la圖顯示用以獲得描述音訊信號之信號特性時間變 異之參數的一裝置的一方塊示意圖; 第lb圖顯示用以獲得描述音訊信號之信號特性時間變 異之參數的一方法的一流程圖; 第2圖顯示根據本發明之一實施例,用以獲得描述信 號包絡之時間變異之參數的—方法的一流程圖; 第3a圖顯示根據本發明之一實施例,用以獲得描述一 音高週期之時間變異之參數的-方法的-流程圖; 第3b圖顯示用以獲得描述該音高週期之時間演進之參 數的該方法的一簡化流程圖; 第4圖顯示根據本發明之一實施例,用以獲得描述— 音高週期之時間變異之參數的另—改良方法的—流程圖; 第5圖顯示用以獲得描述一自協方差域中音訊信號 #號特性時間變異之參數的一方法的一流程圖; ' —音訊信號編碼 第6圖顯示根據本發明之該實施例 器的一方塊示意圖;以及 —般方法 以促進對 第7圖顯示用以獲得描述信號變異之參數的 的一流程圖。 【實施方式】 實施例之詳細描述 在下面,將大體上描述變異模型化的概念, 9 201108201 本發明的理解。隨後,一般實施例將根據本發明參照第la 及lb圖來描述。隨後,較特定的實施例將參照第2至5圖 來描述。最後,對於音訊信號編碼的發明性概念的應用將 參照第6圖來描述,且總結將參照第7圖給出。 為了避免混淆,該技術將如下使用: •其中用語“變異”是指描述特性在時間上改變的一 組一般函數,及 •該(空間)導數a/ax作為按數學精確定義的一實體 使用。 換句話說,“變異”是指信號特性(在一抽取的位準上), 而“導數”在使用數學定義的任何時候,用作自相關/自協方 差的k(自相關滯後/自協方差滯後)或t(時間)導數。 任何其他改變的測量將以其他詞來說明,而一般不使 用名詞“變異’’。 而且,隨後將針對於音訊信號之時間變異的估計,描 述根據本發明之實施例。然而,本發明不僅限於音訊信號 及時間變異。相反地,根據本發明之實施例可用以估計一 般的信號變異,即使本發明目前主要用以估計音訊信號的 時間變異。 變異模型化 關於變異模型化的一般概述 大體上來說,根據本發明之實施例使用變異模型來分 析一輸入音訊信號。因而,該變異模型用以提供估計該變 異的一方法。 10 201108201 變異模塑化的假設 在下面,在一習知信號特性估計與用於根據本發明之 實施例中的概念之間的一些不同將予以討論。 然而傳統的方法假設,該信號(例如一音訊信號)的特性 在短時間視窗中是恆定的(或穩定的),但是本發明的主要方 法是假設(例如一信號特性(如一音高週期或一包絡)的)(歸 一化)變化率在一短時間視窗中是怪定的。因而,儘管傳統 的方法在適度位準失真的情況下,也能夠處理穩定信號' 緩慢變化的信號,但是根據本發明的一些實施例在適度位 準失真的情況下,還可以處理穩定信號、線性變化信號(或 呈指數變化的信號)、該非線性變化率很慢的非線性改變信 號0 如上所述,本發明的主要方式之一是假設該(歸一化) 改變率在短視窗中是恆定的,但是所呈現的方法及概念可 容易地擴展為較一般的情況。例如,該歸一化改變率、該 變異可由任何函數來模型化,且只要該變異模型(或該函數) 具有小於資料點數量的參數,該等模型參數就可予以明確 地解決。 在該等較佳實施例中,該變異模型可描述例如一信號 特性的平滑改變。例如,該模型可基於假設一信號特性(或 其知一化變化率)遵循一基本函數的調節版本,或基本函數 的調節結合(其中基本函數包含:xa; 1/xa; 1/χ; 1/χ2 ; e,a,1η(χ),l〇ga(x); sinh χ ; cosh χ ; tanh χ ; coth χ ; arsinh x,arcosh x,artanh x ; arcoth x ; sin x ; cos x ; tan x ; cot x ; 201108201
SeCX;:CX:arCSinX;a—-arcta„x;arcc〇tx:)^ 二些中’較佳的是描述該信號特性或該歸一化變化 率之日、間演進的函數在重要範穩定且平滑的。 不同域中的適用性 變的之概念的主要應料域之-是分析幅值改 表的2㈣’相比於此特性的幅值,該變異較有用。例 二X週期方面,此意味著根據本發明之實施例有關 於對2週期改變而不是音高週期幅值較感興趣的應用。 以盥趣1在應用中,該應㈣—信號特性的幅值 較二概/不是變化率’那麼其㈣可以受益於根據本發 明ϋ如’如果關於信號特性的先前資訊是可用的, 諸如隻化率的有效範圍,那麼該信號變異可用作額外的資 汛、名又传正確且穩健的時間輪摩。例如,在音高週期方 面,可能藉由習知的方法來逐格地估計該音高週期,且使 用該音兩週期變異來消除估計錯誤、異數、音階跳躍,且 幫助使該音高週期輪料為-連續的軌跡,而不是在每一 分析㈣中央處的_點。換句話說,可能將模型參數相 ,结合,將變換域變異_參數化,且由描述—信號特性之 快照值的-或多個離散值來描述—信號特性的變異。 > *在根據本發明的_實_中―主要方式是模 μ㈣i ’因為料龍特性的幅值接著從 該等計算中明確地消本, 友。大體上,此方式使該數學公式較 易處理。然而,根據太欢 本發明的實施例不限於使用變異的歸 ,化測量,因為應該會限制變異歸一化測量概念的内在原 12 201108201 因不存在。 學 異 可用於根據本發明的一些實施例中的-數 變異模型料叫述。 模型。 …、而,自然地,也可使用其他變 考慮具有諸如音高週期之特性的―信號隨時間而變 化且由〆0表不。音高週期的改變是其導數i_p(0,且為 了消去該音高週期幅值的影響,_藉岭v)來將該改變 歸—化,且定義為 c(,x略⑷ (1) ^我們稱此測量c⑴為該歸一化音高週期變異,或僅為音 阿週期變異,因為音高週期變異的-非線性化測量在本範 例中是無意義的。 —信號的週期長度7Y0與該音高週期成反比例, T⑺=pH⑺,藉以我們可以容易地獲得 φ) = 透過假設該音高週期變異在一小間隔ί中是悝定的, c⑴=c,方程式!的偏差分方程式可予以容易地解決,藉以 我們獲得 pit) = p〇ea (2) 及 13 201108201 T(t) = T0e-cl 其中pQ及rQ分別表示在時間i=0時音高週期及週期的長度。 儘管Γ(〇是時間ί時的音高週期長度,但是我們認識到 任何時間特徵都遵循相同的公式。特別的是,對於時間ί 時的自相關/?队0的滯後/:,在該t域中的時間特徵遵循此 公式。換句話說,時在滯後心處出現的自相關特徵將 移位作為一ί函數如 k(t) = k0e_c' (3)。 類似地,我們具有 c = -k-l(t)^k(t) (4)。 在方程式2中,我們僅考慮假設可在一短間隔中恆定 的變異。然而,如果期望的話,我們可透過允許該變異在 一短時間間隔内遵循某一函數形式來使用較高階的模型。 在此特別主要的情況下會產生多項式,因為產生的差分方 程式可獲得容易地解決。例如,如果我們定義該變異遵循 該多項式形式
M c(o=Σ 〆⑴τ户⑴ k=\ 那麼 /?(〇 = εχρ(Ες/)。 k=0 現在應注意的是,在不喪失一般性的情況下,方程式2 中出現的該悝量/?〇已經納入該指數中,以使表示更清晰。 14 201108201 此形式證明該變異模型可^ 主·* u如何容易地延伸於較 的情況中。然而’除非另外銳昍 ^ 及雜 月,在此檔中,我們將僅去 慮該一階情況(恆定變異),叫持可理解性及可達性。孰! 該技藝的具有通常知識者可宏总仏μ …‘" 各易地將該等方法延伸於較古 階的情況中。 μ 此處,在不對其他測量作修改的情況下,用於音高週 期變異模型化的相同方式可予以使用,該等其他量測的歸 -化導數是-保證良好的域。例如,㈣應㈣信號希伯 特變換之瞬間能量的一信號時間包絡是此一測量。通常, 相比於作為該包絡之時間變異的相對值,該時間包絡的幅 值較不重要。在音訊編碼中,該時間包絡的模型化在逐漸 縮小時間雜訊擴展中是有用的,且通常藉由已知為時間雜 訊重整(T N S)的方法來實現,其巾該時間包賴由在該頻域 中的一線性預測模型(參見例如參考[4])來模型化。本發明 提供TNS的一替代物來模型化及估計該時間包絡。 如果我們由α⑴來表示該時間包絡,那麼該(歸一化) 包絡變異為 Μ 3 HO = 2 kh/'1 =a~' (〇 α(0 (5) k=\ 且相對應地’該偏差分方程式的解為 Μ a(,) = exp(J]V*)。 又=0 應注意的是,上面的形式暗示了在對數域中,該振幅 疋一簡單的多項式。此是習知的,因為振幅通常由分貝量 15 201108201 度(dB)表示。 用以獲得描述一信號特性之時間變異之參數的一裝置 的一般實施例 第1圖顯示用以在描述一變換域中之音訊信號的實際 變換域參數(例如自相關值、自協方差值、傅利葉係數等) 的基礎上,獲得描述音訊信號之信號特性時間變異之參數 的一裝置的一方塊示意圖。第la圖所示的該裝置其全部内 容由100來表示。該裝置100受組配以獲得(例如接收或運 算)描述在一變換域中之音訊信號的實際變換域參數120。 而且,該裝置100受組配以依據一或多個模型參數,提供 描述變化域參數之時間演進的一變換域變異模型的一或多 個模型參數140。該裝置100包含一可取捨的變換器110, 該可取捨的變換器110受組配以在該音訊信號之時域表示 118的基礎上,提供該等實際變換域參數120,使得該等實 際變換域參數120描述在一變換域中的音訊信號。然而, 該裝置100可選擇地受組配以從變換域參數的外部源中接 收該等實際變換域參數120。 該裝置100更包含一參數判定器130,其中該參數判定 器130受組配以判定該變換域變異模型的一或多個模型參 數,使得表示在該等變換域參數之模型化時間演進與該等 實際變換域參數之實際時間演進之間之偏差的一模型錯誤 在一預定臨界值下或予以最小化。因而,依據表示一信號 特性的一或多個模型參數來描述變換域參數之時間演進的 變換域變異模型適用於(或適合於)由該等實際變換域參數 16 201108201 所表示的音訊信號。因而,可有效地實現,由該變換域變 異模型所暗地或明確描述的音訊信號變換域參數的模型化 變異近似於(在一預定的容忍範圍内)該等變換域參數的實 際變異。 許多不同的實施概念可用於該參數判定器。例如,咳 參數判定器可包含例如儲存於其中(或在一外部資料載體 上)之描述將變換域參數映射於變異模型參數上的變異模 型參數計算方程式13〇a。在此種情況下,該參數判定器13〇 還可包含一變異模型參數計算器130b(例如〜可規劃電腦 或一信號處理器或一現場可程式閘陣列(fpga)),其可受組 配為例如硬體或軟體,以評估該等變異模型參數計算方程 式130a。例如’該變異模型參數計算器13〇b可受組配以接 收描述在一變換域中之音訊信號的多個實際變換域參數, 且使用該等變異模型參數計算方程式13〇a,運算—咬多個 模型參數140。該等變異模型參數計算方程式13加可以明 確的形式描述將該等實際變換域參數12〇映射於該一或多 個模型參數140上。 可選擇地,該參數判定器130可以例如執行—迭代最 優化。以此為目的,該參數判定器130可包含該時域變異 模型的一表示13〇c ’其考慮到描述假設為時間演進的一模 型參數,允許例如在先前的一組實際變換域參數(表示該音 訊信號)的基礎上,運算隨後的一組經估計的變換域參數。 在此種情況下,該參數判定器130還可包含一模型未數優 化器130d’其中該模型參數優化器i3〇d可受組配以修改該 17 201108201 時域變異模型13Ge的—或多個模型參數,直至使用先前的 -組實際㈣域參數,藉由該參數化時域變異模型·所 獲得的該組經估計變換域參數與目前的實際變換域參數完 全一致(例如在一預定差臨界值内)。 然而,自然地,存在用以在該等實際變換域參數的基 礎上,判定該-❹個模型參數14G的多個其他方法,因 為對於判定模型參數的一般問題,存在不同的數學公式 解’使得該_化結果近似於該等實際變換域參數(及/或其 等時間演進)。 由於上面的討論,該裝置1〇〇的功能性可參照第比圖 來說明’第lb圖顯示用以獲得描述音訊信號之信號特性時 間變異之參數140的一方法150的-流程圖。該方法150 包含-可取捨的步驟_,運算描述在—變換域巾 號的實際㈣域參數12G。該方法15G還包含步驟170,依 據表示-㈣特性的—或多個模型參數,來判定描述變換 域參數之時間演進的_變換域變異模型的—或多個模型參 數140,使得表示在—模型化時間演進與該等實際變換域參 數之間之偏差的-模型錯誤在—預定臨界值下或予以最小 化0 在下面,將較詳細地描述根據本發明的一些實施例, 以較詳細地說明該發明性的概念。 在該自相關域中的變異估計 在本脈絡中,信號·^的自相關定義為 18 201108201 且估計為 ΊΣν— /ν «=ι 其中我們假U非零,且在範圍上。應注意的是, 田yv變得無窮大時,該估計值收斂於一真值。而且,大體 上’某種開視窗可以在該自相關估計之前用於^,,以加強 其在β亥/7, A7範圍之外時為零的假設。 在該自相關域中的變異估計_音高週期變異 在一實施例中,我們的目的是估計信號變異,也就是 說’在音高週期變㈣情況下,估計作树間函數之自相 關伸展或收縮的數量。換句話說’我們的目的是判定該自 相關滞後/:的時間導數’其表示為|。為了清晰我們現 在使用簡寫形式a來替似⑴’且假設?的相依性是隱含的。 從方程式4中,我們獲得 dk ~ = -ck ° ύΐ 需在根據本發明的一些實施例中克服的一習知問題 是’的時間導數不可用,且直接的估計报困難。然而,已 經認識到的是,導數的一系列規則可用以獲得 201108201 已經得出的是,使用C的一估計值,我們可接著在時 間6時使用一階泰勒級數來模型化該自相關,在時間0時 使用該自相關且該時間導數 「a〆 I — 〇 A Cli\ R(k, t2) ~ R{k+ —— = R(k,/,)- cAtk ot 在一實際應用中’例如該導數去/?㈨可藉由例如二階估 計值來估計 去/?⑻=去 。 此估计值在一階差值咐“丨)―及认—丨)上是較佳的,因為該 二階估計值不遭受與該一階估計值相同的半樣本相移。為 了改良正確性或運算效率,其他的料值可^使用,諸 如正弦函數之導數的經視窗化音段。 使用最小的均方錯誤標準,我們獲得最優化的問題 Ν ^πΣ[/?(^ω-.«α:,/.2)12 a:3= j - ^ (7) 其解可容易地獲得為
/, _ Σϋ, [R(h: ί·2) - R(k, U)] kQR 當該音高週期變異由連續的自協方差視窗而不是該自 才關來估4時,也可以持有相同的導數。然而,相比於該 自相關’ β自協方差包含額外資訊’該額外資訊的使用描 述於題名為在該自協方差域中的模型化,,的段落中。 20 201108201 在該自相關域中的變異估計_時間包絡 如下面將描述的,該包絡的一時間演 關域中予以估計。 § 49 在下面’將參照第2圖給出時間包絡 单概述:,隨後,根據本發明之一實施例,一可能的 將予以詳細地描述。 、 第2圖顯示用以獲得描述音訊信號之包絡時間變異之 參數的一方法的一流程圖。第2圖所示之方法的全部内容 二=示。該方法包含210判定多個連續時間間隔的 判定該短時能量值可包含例如,對於多個連 續的(時間上交疊或時間上衫疊)自相關視窗,判定在一丘 _定滯彳_如料G)下的自相馳,叫得卿短時能 置值。步驟220更包含判定適當的模型參數。例如,步驟 〇可L 3判疋一多項式時間函數的多項式係數使得該多 項式函數近似於該等短時能量值的時間演進。在下面用 以判定該”項式係㈣—示範演算法將Μ描述。例 该步驟220可包含步驟22〇a’設置包含與連續時間間 :(在:如時間tl ' t2、t3等時開始或居中的時間間隔)相關 =:間值功率序列的-矩陣(例如由V表示)。該步驟220 Ί 3步驟220b,設置—目標向量(例如由『表示),此項 目描述該等連料《隔_時能量值。 、 此外’該步驟220可包含步驟緣,解決由該矩陣(例 如由V表不)及由該目標向量(例如由r表示)所定義的一線 性方程式系統(例如r=Vh的形式),以獲得作為—解的多項 21 201108201 式係數(例如由向量h所述)。 在下面,關於此步驟的額外細節將予以說明。 在該自相關域中,該時間包絡的模型化是直接的。我 們可容易地證明,在滯後零處的自相關相對應於該振幅的 均方值。再者,在所有其他滯後處的自相關由該振幅的均 方值來調節。換句話說,相同的資訊在任何及所有滯後處 都是可用的,藉以僅在滯後零處,充分地考慮該自相關。 因為包絡變異的一階模型是平凡的,所以一較高階模 型用於一較佳實施例中。此還作為如何由較高階模型,同 時在音高週期變異估計的情況下進行的一範例。 根據方程式5,考慮該包絡變異的Μ階多項式模型。 我們接著具有Μ+7個未知,且從而對於一解,較佳地使用 至少Μ+7個方程式。換句話說,較佳地使用至少Μ+7個 連續的自相關視窗(例如由自相關視窗居中時間或自相關 視窗開始時間ί,,λ),he/Ό,W且來表示)。接著, 在W+i個不同時間ί= ί〆或對於Ν+1個不同的交疊或非交 疊時間間隔)處,獲得α⑴的值(例如在一線性或非線性調節 中描述一短期平均功率或短期平均振幅),也就是 W"2及 Μ -In /?,(0. /;/,.) = h^,k
一 kzzzQ 因為⑴是一多項式(較精確的:近似於一多項式),所以其 是存在於文獻中之多個方法解決該多項式係數的傳統問 題。 22 201108201 ~基本的替代解需使用如下的凡德芒矩陣。 例如,該凡德芒矩陣v定義為
J t% 且可在例如步驟220a中予以運算。一目標向量r及一解向 量h可定義為 'il.n.R(0;i〇)V2i 「"〇Ί ^ In ./?(0, t\)1^2 h = h In /^,(0, tv) l/2_ Aiv· 該目標向量可在例如步驟22〇b中予以運算。 接著 因為^疋不同的,所以如果M=iV,那麼該倒數V」存 在且我們在例如步驟220c中獲得 h=V 】r 〇 如果M>N,那麼虛倒數生成答案。然而,如果N及M 很大,那麼在該技藝中已知的較多精確方法可用於有效解。 在該自相_中的變異估計偏差分析 儘管上面呈現了估計值測量變異,但是存在一些實施 例中尚未克狀假設局部歡的㈣。健是,藉 方式(例如㈣有限長度的—自相關視窗)之該自蝴糾 23 201108201 計假設該信號應該是局 信號變異不會將偏差引 分正確的。 部穩定的。在下面,將顯示的是, 入估計值中,使得該方法可視為充 為了分析該自相關的偏差,假設該音高週期變異在此 :間間隔中是怪定的。再者’假設我們具有—信號朴該 l號雄)在ί〇處具有週期長度抓㈣,接著其在一第二點 ~處具有週期長度咖=7>即(端·从。在該間隔仏 上的平均週期長度是 rt\ (It -f0) __ ,f 1.-si Till ·- η - t〇) 1) = Ί〇β 觀察到的是,上面該運算式的後部分是雙曲線正 弦”函數’我們將由下式來表示其
smch(,:) = !^ = £Lz£Z X 2x ο 接著對於長度為Δ。的一視窗,我們具有 = T〇e~('~^nisinch (c^^) 。 (9) 藉由在Γ與/:之間的類似,此運算式還量化一自相關 估计值由於信號變異而伸展的數量。然而,如果開視窗用 於自相關估計之前,則由於信號變異而產生的偏差獲得減 小’因為該估計值接著收斂於該分析視窗的中間點周圍。 24 201108201 當從二個連續的有偏差自相關音框中估計C時,每一 訊框的值是有偏差的,且遵循公式 Μ:(ίι) = Α:()6~·,?ίι8Ϊηα]ι(βΔ/Λν!η/2) \k{i2) = k{)er<:^smch(cAtwhl/2) 其中6及f2是每一訊樞的中間點。 參數c可透過定義ί>0及視窗之間的距離、來 解決,藉以 △“(φ 其中我們觀察到的是,~的所有實例已經分別刪除。換句 話說,即使信號變異使該自相關估計值有偏差,從二個自 相關中所擷取的變異也無偏差。 然而,儘管信號變異不會使該變異估計值有偏差,但 是由於過於短的分析視窗所導致的估計錯科可能會避 免。-短分析視窗的自相關估計傾向於產生錯誤,因為其 依據该分析視窗相對於該信號相位的位置而定。較長的分 析視窗減小了此種類型的估計錯誤,但是為了保持局部二 定變異的假設,必須尋求—折衷方法。在職藝中大體上 可接受的-選擇是其長度是最低期望週期長度兩倍的一分 析視窗。然而’較短的分析視窗也可以使用,如果所 的錯誤時是可接收的^ 曰 在時間包絡變異方面,該等結果是相似的。對於一产 模型’包絡變異的估計值無偏差。而且,準確地來說,: 同的邏輯也可用於自協方差估計值,藉以對於該自協方差 25 201108201 持有相同的結果。 在該自相關域中的變異估計-應用 在下面 曰呵週期變異估計之本發明的一可能應用 將予以描述。首先,將參照第3圖來 圖顯示用轉據本發明之—實_,獲得糾音減:之 音南週期時間變異之參數的-方法3〇〇的一流程圖。隨後, 將給出該方法300的實施細節。 第3圖所示之方法3⑻包含—可取捨的第—步驟31〇, 執行一輸人音訊信號的-音訊信號預處理。該音訊信號預 處理可包含,例如透過減少任何有㈣信號成分,來促進 摘取所期望的音訊信號特性的—預處理。例如下面所述 的共振結構模型化可用作-音訊信號預處理步驟則。 該方法300還包含步驟32〇,相對於一第一時間或時間 間隔…且相對於多個不同的自相關滯後似,判定一音訊 信號&的一第一組自相關值離斗對於該等自相關值的 定義,參照下面的描述。 該方法300還包含步驟322,相對於—第二時間或時間 間隔0,且相對於多個不同的自相關滯後值幻判定該音訊 k號A的一第二組自相關值。因此,該方法3⑻的 步驟320及322可提供自相關值對,每一對自相關值包含 與該音訊信號之不同時間間隔,但與相同自相關滯後值灸 相關聯的二個自相關(結果)值。該方法3〇〇還包含步驟 330 ’例如相對於在^處開始的第—時間間隔或相對於在^ 處開始的第二時間間隔,在自相關滞後上判定該自相關的 26 201108201 偏導數。可選擇地,在自相關滯後上的偏導數還可相對於 在時間或位於或延伸於時間〇與時間ί2之間的時間間隔上 的不同實例來運算。 因此,相對於多個不同自相關滯後值灸,例如相對於該 第一組自相關值及第二組自相關值在步驟32〇、中相對 於其而判定的此等自相關滯後值’在自相關滯後上的自相 關變異eft 〇可獲得判定。 自然地,針對於步驟32〇、322、330的執行,不存在 固定的時間次序,使得該等步驟可以部分地或完全地並行 執行,或以一不同的次序執行。 該方法300還包含步驟34〇,使用在自相關滞後上的第 、’且自相關值、第一組自相關值及自相關的偏導數 —/?((,〇’來判定一變異模型的一或多個模型參數。 當判定該-或多個模型參數時,在一自相關值對(如上 所述)的自相關值之_—時間變異可予以考慮。例如依據 在滞後上的自相關變異(!__)),在該自相關值對的自相 關值之間的差值可予以加權。在加權該自相關值對之自相 關值之間的差值中’該自相關滯後值((與該自相關值對相 關聯)也可視為-加權因數。因此,形式的總和項 h + 1)- R^k ;^j k§:E,{k: h) 用於判定該-或多個模型參數,其中該總和項可與一給定 自相關滞後值相關聯’且其中該總和項包含形式為 27 201108201 一滯後相 的在-自相關值對之二個自相關值之間的差值與 關加權因數的乘積,例如其形式為 〃 kmR{k., h) • ο 該自相關滞後相關加權因數允許考慮事實上,相比於 對於小自相關滯後值’該自相關對於較大自相_後值能 較集中地延伸,因為包括該自相關滞後值因數^而且在 =後上自相關值變異的合併使其可能在局部(相等自相關 取後)自相關值對的基礎上’估計該自相關函數的擴展或麼 縮。因而’該自相關函數(在滞後上)的擴展或屋縮可予以估 計’而不執行—龍觸及匹配功紐。相反地,該等個 別總和項基於局部(單-料值k)絲紙㈣、紙、 έ紙0 〇 …广而’為了獲得來自該自相關函數的大量資訊,與不 同滯後值k相關聯的總和項可相結合,其中該等個別總和 項仍然是單一滞後值總和項。 、此外,歸-化可以在判定該變異模型之模型參數時予 以執行,其中該歸一化因數採用如下形式 Δί^ρΣί1ι>·2 [i:R(k,h)]2 且可包含例如單一自相關滞後值項的總和。 換句話說,該一或多個模型參數的判定可包含對於 給疋且共用自相關滯後值,但對於不同時間間隔且對 28 201108201 於在滯後上該自相關值之變異的運算(自相關的ι導數),自 相關值的比較(例如差值形成或減少)’對於一給定且共用時 間間隔但不同自相關滯後值,自相關值的比較。然而,對 於不同時間間隔及對於不同自相關滯後值之可能會引起相 當大影響的自相關值比較(或減少)予以避免。 該方法300可取捨地更包含步驟350,在步驟340中所 判定之一或多個模型參數的基礎上,運算諸如一時間音高 週期輪廓的一參數輪廓。 在下面,參照第3a圖所述之概念的可能實施將予以詳 細地說明。 作為本創新的一具體應用,我們應該在下面證明估計 在該自相關域中一時間信號之音高週期變異的一方法實施 例。在第3b圖中所示意表示的方法(36〇)包含下面步驟(或 由下面步驟組成): L對於長度為心且由△,卿分離的視窗/^及办+八例如
由開視窗函數冰„開視窗),估計(320、322; 370) a 的自相關/W Δ,ννί·ί—/0 A;. Il) = + /,.," η — :1 2.例如藉由下式,對於視窗(或“訊框,,)/ι,估計(330; 374) 自相關的導數 29 201108201 ο ^R(k,k) = 2m H下式(來自式8),來估計視窗或訊 之間的音高週期變異C/, h + 1 而不=期望的是—(可取捨歸—化的)音高週期輪摩 週期變異測量P則應該加人另_步驟: •使視窗或訊框/1的中間點是接著 h與之h + J p气玷立古、 肉或s框 旖的9尚週期輪廟為 對於 f e ikk+ij 其中〆·先前的該對訊桓或音高週期幅值之實際估 什值中獲得。如果該音高週期幅值中沒有量測是可用 的則我們可以將卿設定為任意選擇的開始值,例 如_=7 ’且迭代地計算所有連續視窗的音高週期輪 廓。 在該技藝中已知的多個預處理步驟(310)可用以改良估 計值的正確性。例如,語音信號大體上具有在80至400 Hz 範圍中的-基頻’且如果期望估計音高週期中的改變,有 利的是帶通濾波器輸入在8〇至1〇〇〇Hz範圍中的信號,以 保持該基本波及少量的第一諧波,而削弱可能特別地降低 該等導數估計值,且從而還降低整體估計值的品質的高頻 成分6 在上面,該方法用於該自相關域中,但是該方法,如 30 201108201 做適當變動,可取捨地實施於諸如自協方差域的其他域 中。類似地,在上面,該方法出現於音高週期變異估計的 應用中,但是相同的方式可用以估計在信號的其他特性中 諸如時間包絡幅值的變異。而且,該(等)變異參數可以由不 止兩個的視窗來估計,以增加正確性,或當該變異模型公 式需要額外的自由度時。所呈現方法的一般形式描述於第7 圖中。 如果與該輸入信號之特性有關的額外資訊是可用的, 則臨界值可取捨地用以移除不可實行的變異估計值。例 如,一語音信號的音高週期(或音高週期變異)很少超過15 八度/秒,藉以超過此值的任何估計值典型地是無語音的或 一估計錯誤,且可以忽略。類似地,來自式7的最小模型 化錯誤可取捨地用作估計值品質的指示符。特別的是,可 能對該模型化錯誤設定一臨界值,使得基於具有大模型化 錯誤之模型的一估計值忽略,因為在該模型中所呈現的改 變藉由該模型不會得到良好地描述,且該估計值自身是不 可靠的。 在該自相關域中的變異估計-共振結構模型化 在下面,一音訊信號預處理的概念將予以描述,其可 用以改良該音訊信號之特性(例如該音高週期變異的)的估 計。 在語音處理中,共振結構大體上藉由線性預測(LP)模 型(參見參照[6]及其導數,諸如捲曲線性預測(WLP)(參見參 照[5])或最小變異不失真回應(MVDR)(參見參照[9])來模型 31 201108201 化。再者,儘管語音恆定改變,但是該共振模型通常内插 於該線性頻譜配對(LSP)域(參見參照[7])中或等效地,内插 於電抗頻譜配對(ISP)域(參見參照[1])中,以獲得在分析視 窗之間的平滑轉變。 然而,對於共振的LP模型化,該歸一化變異不是最重 要的,因為在一些情況下歸一化該LP模型不會產生相關的 優點。特別的是,在語音處理中,相比於在其等位置中的 改變,共振的位置通常是較重要且較有趣的資訊。因而, 儘管也可能公式化共振的歸一化變異模型,但是我們集中 於消去共振影響的較有趣問題。 換句話說,一模型對於共振改變的包含物可用以改良 音高週期變異或其他特性估計的正確性。也就是說,透過 在音高週期變異估計之前,消去該信號之共振結構改變的 影響,可能減小將共振結構改變解譯為音高週期改變的機 會。共振位置及音高週期二者均可改變高達大概15八度每 秒,其意味著改變是極為快速的,其等大概在相同的範圍 上改變,且其等的貢獻可能會容易混淆。 為了可取捨地消去共振結構的影響,我們首先對於每 一訊框估計一 LP模型,透過濾波移除共振結構,且將該經 濾波資料用於該音高週期變異估計中。對於音高週期變異 估計,重要的是,該自相關具有一低通特性,且從而其有 用於由該高通濾波信號來估計該LP模型,而僅消去該原始 信號中的共振結構(即不高通濾波),藉以該經濾波的資料將 具有一低通特性。如已知的,該低通特性使得能較容易地 32 201108201 估計該信號的導數。該濾、波過程自身根據該應用的運算需 求,可執行於時域、自相關域或頻域中。 特別的是,用以消去該自相關值共振結構的預處理方 法可描述為 1. 由一固定高通濾波器遽波該信號 2. 估計該高通濾波信號之每一音框的LP模型。 3. 透過由該LP渡波器渡波該原始信號來移除該共振 結構的貢獻。 步驟1中的固定高通濾波器可取捨地由一信號適應性 濾波器來替代,諸如相對於每一訊框所估計的一低階L P模 型,如果需要較高位準的正確性。如果低通濾波用作該演 算法中另一階段的一預處理步驟,則此高通濾波步驟可忽 略,只要該低通濾波出現在共振消除之後。 步驟2中的LP估計方法可根據該應用的需求予以自由 地選擇。良好保證的選擇可能是,例如習知的LP(參見參照 [6])、捲曲LP(參見參照[5])及MVDR(參見參照[9])。模型 次序及方法應該選擇,使得該LP模型不是模型化該基頻, 而且僅模型化該頻譜包絡。 在步驟3中,由該LP濾波器濾波該信號可在視窗接視 窗的基礎上或在該原始連續信號上執行。如果不開視窗地 濾波該信號(即濾波連續信號),則使用在該技藝中已知的諸 如LSP或ISP的内插方法,來降低在分析視窗之間的轉變 處信號特性的突然改變,這是有用的。 在下面,共振結構移除(或減少)的過程將參照第4圖予 33 201108201 以簡單概述。作為第4圖所示流程圖的方法400包含步驟 410,從一輸入音訊信號中減少或移除一共振結構,以獲得 一共振結構減少的音訊信號。該方法400還包含步驟420, 在該共振結構減少的音訊信號的基礎上,判定一音高週期 變異參數。大體上來說,減少或移除共振結構的步驟410 包含子步驟410a,在該輸入音訊信號的高通濾波版本或信 號適應性濾波版本的基礎上,估計該輸入音訊信號之線性 預測模型的參數。該步驟410還包含子步驟410b,在該等 所估計參數的基礎上,遽波該輸入音訊信號的寬頻版本, 以獲得共振結構減少的音訊信號,使得該共振結構減少的 音訊信號包含一低通特性。 自然地,如上所述,該方法400可予以修改,例如如 果該輸入音訊信號已經獲得低通渡波。 大體上,可以說該輸入音訊信號中共振結構的減少或 移除可用作一音訊信號預處理,該音訊信號預處理與不同 參數(例如音高週期變異、包絡變異等)相結合,且還與不同 域(例如自相關域、自協方差域、傅利葉變換域等)中的處理 相結合。 在該自協方差域中的模型化 在該自協方差域中的模型化:介紹及概述 在下面,將描述的是,表示一音訊信號之時間變異的 模型參數可以如何在一自協方差域中估計。如上所述,不 同的模型參數,如一音高週期變異模型參數或一包絡變異 模型參數相同,可獲得估計。 34 201108201 该自協方差定義為 ⑽)=及 Σ ά'+α: j 其中a表示該輸人音訊信號的樣本。應注意的是,此處與 該自相關不_是’我們不會假設〜僅在該分析間隔中為 非零。也就是說%不需要在分析之前予以開視窗。與該 自相關相同’對於—狱信號,當^時該自協方差收敛 於五+ 。 相比於自相關,該自協方差是一極為相似域但具有 某-額外f訊。特別的是,當處於該自相關域中該信號 的相位資訊去棄’而在該協方差中其獲得保留。當觀察穩 定信號時’我們通常得出相位資訊是沒有用的,但是對^ 快速變化的信號,其可能會是極有用的。事實上潛在的不 同疋,對於穩定信號,該期望值與時間不相關 但疋對於一非穩定信號,則相關。 假設在時間ί(或對於開始於時間?或在時間〖居中的— 時間間隔)處’我們估計信以的自協方差紙〇。接著我 們可以容易看到’其保持為£狐〇]=砸d+fc)]。在下 面’我們將採用該等期望值(由操作符E[]所述)是隱含的 -符號,藉以糾叫。類似地,可以保持此關 係 i)= Q(fc,i-fc)。 透過使用局粒定時間包絡變異的假設,我們具有 B[x(t)] = ehtE[x{0)} 35 201108201 及類似地 從而0队〇的時間導數是
㈨(M (10) dt ~ 2‘hQ(k,t) 〇 使用此等關係式,現在我們可以形成居中於 的一階泰勒估計值 雜./)= (ι + 2_—Μ。 面可以保持 例如,該時移可以作為自相關滞後在相同的單元中測 量,使得在下 Q(-k, t+ k = t +At) = Q{-k, f) + Δί ag(-M) dt 現在所有項都在時間t(或對於相同的時間間隔)上出現 於相同點處,所以我們可以定義I㈣料♦,〇。 記得我們的目的是估計該包絡變異办。因為持有該上面 關係式,戶斤以對於所t K列如,我們都可以最小化平方模 型化錯誤 ' ,έ . (11) 該最小化可容易地得出 2 Σ/L-iY kq'ih (12) 36 201108201 此處我們已經選擇使用最小均方錯誤(MMSE)作為最 優化標準,但是在該技藝中已知的任何其他標準也可良好 地用於此處,及其他實施例中。同樣地,我們已經選擇對 在與之間所有滞後上實行估計,但是指數的選 擇可用於獲得運算效率及正確性的好處,如果在此期望的 話,且還可用於其他實施例中。 應注意的是,相比於自相關,對於該自協方差,我們 不需要使用連續的分析視窗,而是可以由一單一視窗來估 计該時間包絡變異。相對於由一單一自協方差視窗來估計 音尚週期變異的一相似方式可容易地獲得發展。 再者,應注意的是,相比於音高週期變異估計,對於 包絡估計,我們不需要由一低通濾波器預先濾波該信號, 因為不需要該自協方差的i導數。 在該自協方差域中的模型化-應用 作為本發明概念之具體應用的另一範例,我們應該證 明估計該自協方差域中一信號的時間包絡變異的方法。該 方法包含下面步驟(或由下面步驟組成): L對於長度為的一視窗,估計信號心的自協方差 △ Α'νί η (:Ik = Τ' XaXn+k 2 ·透過§十鼻下式得出該時間包絡變異办 h 'N * ((Ik — 2k(•卜 k)(i— 37 201108201 如果期望一歸一化包絡輪廓僅替代該包絡變異測量 /1,則應該可取捨地加入另一步驟: 3.該包絡輪廓是 a(t) = a〇eht 對於々e(〇,〇 其中a0從該先前訊框或該包絡幅值的一實際估計值中獲 得。如果該包絡幅值中沒有量測是可用的,則我們可設定 心=0,且對於所有連續的視窗,迭代地計算該包絡輪廓。 如果與該輸入信號之特性有關的額外資訊是可用的, 則臨界值可取捨地用以移除不可實行的變異估計。例如, 式11中的最小模型化錯誤可取捨地用作該估計值品質的一 指示符。特別的是,可能設定該模型化錯誤的一臨界值, 使得基於具有大模型化錯誤之一模型的一估計值可以忽 略,因為在該模型中所呈現的改變藉由該模型不會獲得良 好地描述,且該估計值自身是不可靠的。 為了進一步改良該正確性,可能首先可取捨地消去該 輸入信號的共振結構(如題目為“在該自相關域中的變異估 計-共振結構模型化”的段落中所說明)。而且,應注意的是, 在語音信號方面,我們接著獲得替代該語音信號(語音聲壓 波形)的一聲壓波形估計值,且該時間包絡從而模型化該聲 壓包絡,這依據該應用而定,可以是或可以不是期望的結 果。 在該自協方差域中的模型化-音高週期及包絡變異的聯合 估計 38 201108201 一類似地,與該包絡變異在先前段落中的估計相同,該 ㈣週期變異也可以由—單—自協方差視窗來直接估計。 然而,在此段落中’我們將證明如何由一單一自協方差視 窗來聯合料音高·及包絡變異龍—般方法。接著對 於在該技藝中具有通常知識者直截了㈣是,僅修改用以 估計該音高變異的方法。應理解較,此處不-定在 該自協方差域巾❹任域視窗。例如,其足崎算該等 自協方差參數,如在題目為‘‘在該自協方差域中的模型化· 概述”的段落中所述。然而,該表示“單—自龄差視窗,,表 不’該音訊錢的-單-gj定部分的自協方差估計值可用 以估計變異,相比於該自相關,其中該音訊信號的至少二 個固定部分的自相關估計值必須用以估計變異。使用一單 -自協方差視窗是可能的,因為在滯後U及4處的自協方 差分別表不一給定樣本的正向及反向自協方差々步驟。換 句5舌說,因為該等信號特性隨著時間而發展,所以一樣本 的正向及反向自協方差將是不同的,且在正向及反向自協 方差中的此差值表示信號特性中的改變幅值。此估計在該 自相關域t是不可㈣’因為該自相關域是對稱的,也就 是說,自相關的正向及反向是相同的。 考慮一信號…,其中振幅及音高週期變異 藉由一階模型來模型化,藉以Ω(0=,且吣)=Vet,。接著 的自協方差Qx(/c)是 QAk; t) = E\;,:(t)x{t + A;)] = a(t)a(t + ^E\f(bit))f(b{t + k))} 13) =a(t)a(t + k)Qf(Lt) 39 201108201 其中Q/k,t)是f(b⑴)的自協方i。 使用方程式6、10及13,我們獲得⑽肩時間導數 為 dQx(k,t) dr = (2 + ck)hQx{kj) - hr) r)k 然而,上面方程式包含cA的乘積,且從而不是e與办 的一線性函數。為了得出參數的有效解,我們可假設丨叫極 小,藉以我們可約計 ^hQx{kJ)-ck ^(M'| dk 如上所述,我們可定義如=仏队,且形成該一階泰勒 估計值 ~ cLk + 2hkq k + ck2 ^i-=L· L ^ J 〇 在真實值心與泰勒估計值心之間的平方差值將在得出 最佳(或至少近似於最佳沁及&時,再次作為目標函數。我 們獲得最小化問題 έ [仉-釗2 其解可容易地獲得為 h =Α'υ 其中 40 (14) 201108201 A =
ΣΙ^ 雖然該等公式看似很複雜,但是A及u的構造可僅使 用長度為2N(滯後零可以被省略)的向量操作來執<_ 及㈣解可使用2 x 2矩陣A的倒置來執行。從而二二複" 雜度僅是適度的O(N)(即N階的)。 音高週期及包絡變異之聯合估計的應用遵循如題目為 “在該自協方差域中的模型化-應用”之段落中所呈現之相同 方式,但是使用步驟2中的式14。 在該自協方差域中的模型化_其他概念 在下面,模型化該自協方差域的不同方式將參照第5 圖予以簡單討論。第5圖顯示根據本發明之一實施例用 以獲得描述音訊信號之信號特性時間變異之參數的一方法 500的一方塊示意圖。該方法5〇〇包含作為一可取捨步驟 510的一音訊信號預處理。步驟510中的該音訊信號預處理 可例如,包含該音訊信號的濾波(例如一低通濾波)及/或一 共振結構減少/移除,如上所述。該方法5〇〇可更包含步驟 520,獲得相對於一第一時間間隔且相對於多個不同自協方 差滯後值々之描述該音訊信號之一自協方差的第一自協方 差資訊。該方法5〇〇還可包含步驟522,獲得相對於一第二 時間間隔且相對於該等不同自協方差滯後值々之描述該音 41 201108201 訊信號之一自協方差的第二自協方差資訊。而且該方法 500可包含步驟wo,相對於該等不同自協方差滞後值卜 5平估在该第-自協方差資訊與該第二自協方差資訊之間的 差值,以獲得一時間變異資訊。 而且,方法500可包含步驟54〇,對於多個不同滞後 值,估计在沛·後上之自協方差資訊的一“局部”(即在—各自 滞後值的環境中)變異,以獲得一“局部滯後變異資訊”。 而且,該方法500可大體上包含步驟550,將該時間變 異資訊與關於在滯後上自協方差資訊之局部變異〆的資訊 (也由“局部滞後變異資訊,,表示)相結合,以獲得模型參數。 當將該時間變異資訊與關於在滯後上自協方差資訊之 局部變異〆的資訊相結合時,該時間變異資訊及/或關於在 滯後上自協方差資訊之局部變異〆的資訊可根據相對應的 自協方差滯後來㈣,例如,與該自協方差滯後&或其 效力成比例地調節。 可選擇地,步驟520、522及530可由步驟57〇、58〇 來替代’如下面將所說明的。在步驟57G +,描述相對於 一單-自協方差視窗,但是相料不同自Μ差滯後值k 之音訊信號的自協方差的一自協方差資訊可予以獲得。例 如,-自協方差值紙h及一自協方差資訊队灸,〇 可予以獲得。 隨後,在與不同滯後值(例如·(、+/〇相關聯的自協方差 值之間的加權差值’例如娜及/或k2(㈣々),可在步 驟580中相對於多個不同自協方差滞後值灸來評估。該等 42 201108201 加權(例如2A、k2)可依據各自所減去的自協方差值之滞後值 的差值(例如在該等自協方差值%、^之間滞後中的差值: 灸-(-々)=2免)來選擇。 紅上所述,存在許多不同的方式來獲得在自協方差域 中的一或多個所期望模型參數。在該等較佳實施例中,一 單一自協方差視窗可能就足以估計一或多個時間變異模型 參數。在此種情況下,在與不同自協方差滯後值相關聯之 自協方差值之間的差值可相比較(例如相減)。可選擇地,相 對於不同時間間隔,但是相同自協方差滯後值的自協方差 值可以相比較(例如相減),以獲得時間變異資訊。在這兩種 情況下,在推導模型參數時,可引人考慮自協方差差值或 自協方差滯後的加權。 在其他域中的模型化 除了該自相關及自協方差,在此所揭露的概念還可以 在諸如傅利葉頻譜的其他域中予以公式化。當將該方法用 於域Ψ中時’該方法可包含下面步驟: 1.將時間信號變換為域ψ。 2_在域Ψ中’以該等變異模型參數以财形式存在的 形式來計算時間導數。 3·形成該信號在❹中的泰勒級數近婦,且將其最 匕使、適合於真貫的時間演進,以獲得該等變異 模型參數。 、 4·(可取檢的)計算信號變異的時間輪廊。 在—實際應用中,該發明性概念的應用可例如,包含 43 201108201 將該信號變換為所期望的域,且判定一泰勒級數近似值的 參數,使得由該泰勒級數近似值所表示的模型獲得調整, 以適合於該變換域信號表示的實際時間演進。 在一些實施例中,該變換域也可能是顯然的,也就是 說,可能將該模型直接用於該時域中。 如在先前段落中所呈現,該(等)變異模型可以例如是 (一或多個)局部恆量、(一或多個)多項式或具有(一或多個) 其他功能形式。 如在先前段落中所證明的,該泰勒級數近似值可用於 橫跨連續視窗,在一視窗内,或在視窗内與橫跨連續視窗 的結合。 該泰勒級數近似值可以是任何階數,儘管一階模型大 體上是吸引人的,因為接著該等參數可作為線性方程式的 解獲得。而且,還可以使用在該技藝中已知的其他近似值 方法。 大體上,該均方錯誤(MMSE)的最小化是一有用的最小 化標準,因為接著參數可以作為線性方程式的解獲得。其 他最小化標準可用以改良穩健性或用於該等參數較佳地解 譯於另一最小化域中時。 用以編碼一音訊信號的裝置 如上所述,該發明性概念可用於編碼一音訊信號的裝 置中。例如,在一音訊編碼器(或一音訊解碼器,或任何其 他音訊處理裝置)中無論在什麼時候需要關於一音訊信號 之時間變異的一資訊,該發明性概念都特別有用。 44 201108201 第6圖顯示根據本發明之一實施例,一音訊編碼器的 一方塊示意圖。第6圖所示之音訊編碼器其全部内容由600 來表示。該音訊編碼器600受組配以接收一輸入音訊信號 的一表示606(例如一音訊信號的一時域表示),及在其基礎 上,提供該輸入音訊信號的一編碼表示630。該音訊編碼器 600可取捨地,包含一第一音訊信號預處理器610,及進一 步可取捨地,一第二音訊信號預處理器612。而且,該音訊 編碼器600可包含一音訊信號編碼器核心620,其可受組配 以接收該輸入音訊信號的表示606,或例如由該第一音訊信 號預處理器610所提供之表示606的一經預處理版本。該 音訊信號編碼器核心620進一步受組配以接收描述該音訊 信號606之信號特性時間變異的參數622。而且,該音訊信 號編碼器核心620可受組配以根據考慮於該參數622中的 一音訊信號編碼演算法,來編碼該音訊信號606,或其各自 的預處理版本。例如,該音訊信號編碼器核心620的一編 碼演算法可獲得調整,以遵循該輸入音訊信號的一變化特 性(由該參數622所描述),或補償該輸入音訊信號的變化特 性。 因而,該音訊信號編碼以一信號適應性方式來執行, 考慮該等信號特性的一時間變異。 該音訊信號編碼器核心620可予以例如最優化,以編 碼音樂音訊信號(例如,使用一頻域編碼演算法)。可選擇 地,該音訊信號編碼器可予以最優化來語音編碼,且從而 還可被視為一語音編碼器核心。然而,自然地,該音訊信 45 201108201 號編碼器核心或語音編碼器核心還可受組配以遵循同時對 編碼音樂信號及語音信號呈現良好性能的一所謂的“混合” 方式。 例如’邊音机信號編碼器核心或語音編碼器核心620 可構造(或包含)一時間捲曲編碼器核心’從而使用描述一信 號特性(例如音高週期)之時間變異的參數622作為一捲曲 參數。 該音訊編碼器600可從而包含參照第1圖所述之一裝 置1〇〇,其中裝置100受組配以接收該輸入音訊信號6〇6, 或其經預處理的版本(由該可取捨的音訊信號預處理器612 所提供)’及在其基礎上,提供描述該音訊信號6〇6之信號 特性(例如音高週期)之時間變異的參數資訊622。 因而,該音訊編碼器606可受組配以利用在此所述的 任何發明性概念來在該輸入音訊信號6〇6的基礎上獲得該 參數622。 電腦實施 依據某些實施需求而定,本發明的實施例可以實施於 更體或軟體中。該實施可使用例如一軟碟、一 DVD、一 CD、
R〇M、— PR0M、一 EPR0M、一 EEPROM 或一 FLASH ^體之具有儲存於其上之電氣可讀控制信號的一數位儲 子媒體來執行,其與一可規劃電腦系統協作(或能夠協作), 各自方法獲得執行。 根據本發明的一些實施例包含具有電氣可讀控制信號 、資料裁體,其能夠與一可規劃電腦系統協作,使得在 46 201108201 此所述之方法之一獲得執行。 大體上,本發明的實施例可以實施為具有一程式碼的 一電腦程式產品,該程式碼可操作地用以在該電腦程式產 品執行於一電腦上時,執行該等方法之一。該程式碼可以 儲存於例如一機器可讀載體上。 其他實施例包含用以執行在此所述方法之一,且儲存 於一機器可讀載體上的電腦程式。 換句話說,該發明性方法的一實施例是具有一程式碼 的一電腦程式,該程式碼用以在該電腦程式執行於一電腦 上時,執行該等方法之一。 該等發明性方法的另一實施例是包含儲存於其上用以 執行在此所述方法之一的電腦程式的一資料載體(或一數 位儲存媒體,或一電腦可讀媒體)。 該發明性方法的另一實施例是表示用以執行在此所述 之電腦程式的一資料流或一序列信號。例如,該資料流或 該序列信號可受組配以經由一資料通訊連接體,例如經由 網際網路來傳輸。 另一實施例包含受組配以或適用於執行在此所述方法 之一的一處理裝置,例如一電腦或一可規劃邏輯設備。 另一實施例包含具有安裝於其上用以執行在此所述一 或多個方法的電腦程式的一電腦。 在一些實施例中,一可規劃邏輯元件(例如一現場可規 劃閘極陣列)可用以執行在此所述方法中的一些或所有功 能。在一些實施例中,一現場可規劃閘極陣列可與一微處 47 201108201 理器協作,以執行在此所述方法之一。 結論 在下面,該發明性概念將參照第7圖來簡單概述,第7 圖顯示根據本發明之一實施例之一方法700的一流程圖。 該方法7〇〇包含步驟710,計算一輸入信號(例如_輪入音 訊信號)的一變換域表示。該方法7〇〇更包含步驟73〇,最 小化描述在該域中變異影響之一模型的模型化錯誤。72〇 模型化該變換域中變異影響可作為方法700的—部分來執 行。但是還可作為一預備步驟來執行。 然而,當在步驟730中最小化模型化錯誤時,該輸入 音訊信號的變換域表示及描述變化影響的模型都可予以考 慮。描述該變異影響的模型可以描述一隨後變換域表示之 估計值的形式,用作先前(或隨後,或其他)實際變換域參數 的明確函數’或以描述最佳(或至少足夠良好)變異模型參數 的形式’用作(該輪入音訊信號之一變換域表示的)多個實際 變換域參數的明確函數。 步驟730中將該模型化錯誤最小化產生描述一變異幅 值的一或多個模型參數。 產生一輪廓的該可取捨的步驟740產生對該輸入(音訊) 信號之信號特性輪廓的描述。 概括地說’上面根據本發明之實施例提出在信號處理 中一個最基本的問題,即—信號改變多少? 根據本發明’實施例提供用以估計信號特性中諸如基 頻或時間包絡改變之變異的一方法(及一裝置)。對於在頻^ 48 201108201 中的改變,八度跳躍顯然的是使僅在該自相關(或自協方差) 中的錯誤強健,但是有效且未偏移。 特別的是,根據本發明之該等實施例包含下面特徵: •在(例如該輸入音訊信號的)信號特性中的變異予 以模型化。在音高週期變異或時間包絡方面,該 模型指明該自相關或自協方差(或另一變換域表 示)如何隨著時間改變。 •儘管信號特性不能假設為局部恆定的,但是在信 號特性中的變異(其在一些實施例中可予以歸一 化)可假設為恆定的,或遵循一基礎形式。 •透過模型化該信號改變,其變異(=該等信號特性 的時間演進)可予以模型化。 •該信號變異模型(例如是暗示或明確的基礎表示) 透過使該模型化錯誤最小化,藉以該等模型參數 量化變異幅值,而適合於觀察(例如透過變換該輸 入音訊信號而獲得的實際變換域參數)。 •在音高週期變異估計方面,該變異由該信號直接 地估計,而沒有音高週期估計的一中間步驟(例如 該音高週期之絕對值的估計)。 •透過模型化音高週期中的變異,該變異影響可由 該自相關的任何滯後及不只是在整數倍的週期長 度處予以測量,從而使所有可用的資料能夠使 用,且從而獲得高位準的強健性及穩定性。 •即使由一非穩定信號估計該自相關或自協方差對 49 201108201 該等自相關及自協方差估計引入了偏移,在本作 品中的變異估計在一些實施例中將仍然是未偏移 的。 •當該信號的實際特性被找出,且不僅是特性的變 異,該方法可取捨地提供可以適用於沿著一輪廓 估計信號特性的一正確且連續的特性。 •在語音及音訊編碼中,所呈現的方法可用作該時 間捲曲MDCT的輸入,使得已知音高週期中的改 變時,在使用該MDCT之前,其等影響可以由時 間捲曲消去。此將減小頻率成分的模糊,且從而 改良能量集中。 •當由該自相關估計時,連續的分析視窗可用以獲 得時間改變。當由該自協方差估計時,僅需要一 單一視窗來測量該時間改變,但是連續視窗在期 望的時候可予以使用。 •聯合估計在音高週期及時間包絡中的改變相對應 於該信號的AM-FM分析。 在下面,將簡單概述根據本發明的一些實施例。 根據一層面,根據本發明的一實施例包含一信號變異 估計器。該信號變異估計器包含在一變換域中的一信號變 異模型化、在變換域中信號之時間演進模型化、及適合於 輸入信號的一模型錯誤最小化。 根據本發明之一層面,該信號變異估計器估計在該自 相關域中的變異。 50 201108201 根據另一層面,該信號變異估計器估計音高週期中的 變異。 根據一層面,本發明產生一音高週期變異估計器,其 中該變異模型包含: •用於在自相關滯後中移位元的一模型。 •自相關滯後導數#的估計。 ok •關係式的一模型(i.)自相關滯後的時間導數,(ii) 自相關的時間導數,及(⑴.)自相關滯後導數。 •自相關的泰勒級數估計 •模型擬合的一 MMSE估計,其產生該(等)音高週 期變異參數。 根據本發明之一層面,該音高週期變異估計器可以在 语音及音訊編碼中,與時間捲曲修改型離散餘弦變換 (TW-MDCT,參見參照[3])相結合,作為該時間捲曲修改型 離散餘弦變換(TW-MDCT)的輸入使用。 根據本發明之一層面,該信號變異估計器估計在該自 相關域中的變異。 根絕一層面,該信號變異估計器估計在時間包絡中的 一變異。 根據一層面’該時間包絡變異估計器包含一變異模 型’該變異模型: •相對於作為滞後k的函數之自協方差上時間包絡 變異影響的一模型。 51 201108201 自協方差的一 模型擬合的一 —泰勒級數估計值。
變異參數。 根據一層面, 予以消去。
估計。 根據-層面,共振結構的料在該錢變異估計器中 概括地說,根據本發明的實施例使用冑異模型來分析 -信號。對比上’習知的方法需要將音高週期變異的估計 作為其等演算法的輸入,但是不提供用以估計該變異的一 方法。 參考文獻 [1] Y. Bistritz and S. Peller. Immittance spectral pairs (ISP) for speech encoding . In Proc. Acou Speech Signal Processing, ICASSP-93, Minneapolis, MN, USA, April 27-30 1993.
[2] A. de Cheveigne and H. Kawahara. YIN, a fundamental frequency estimator for speech and music. J Acoust Soc Am, 111(4): 1917-1930, April 2002.
[3] B. Edler, S. Disch, R. Geiger, S. Bayer, U. Kramer, G. Fuchs, M. Neundorf, M. Multrus, G. Schuller and H. Popp. Audio processing using high-quality pitch correction. US Patent application 61/042,314, 2008. 52 201108201 [4] J. Herre and J.D. Johnston. Enhancing the performance of perceptual audio coders by using temporal noise shaping (TNS). In Proc AES Convention 101, Los Angeles, CA, USA, November 8-11 1996.
[5] A. Harma. Linear predictive coding with modified filter structures. IEEE Trans. Speech Audio Process., 9(8):769-777, November 2001.
[6] J. Makhoul. Linear prediction: A tutorial review. Proc. IEEE, 63(4): 561-580, April 1975 [7] K.K. Paliwal. Interpolation properties of linear prediction parametric representations. In Proc Eurospeech’95, Madrid, Spain, September 18-21 1995.
[8] L. Villemoes. Time warped modified transform coding of audio signals. International Patent PCT/EP2006/010246, Published 10.05.2007.
[9] M. Wolfel and J. McDonough. Minimum variance distortionless response spectral estimation. IEEE Signal Process Mag., 22(5):117-126, September 2005. 【圖式簡單說明】 第la圖顯示用以獲得描述音訊信號之信號特性時間變 異之參數的一裝置的一方塊示意圖; 第lb圖顯示用以獲得描述音訊信號之信號特性時間變 異之參數的一方法的一流程圖; 第2圖顯示根據本發明之一實施例,用以獲得描述信 53 201108201 號包絡之時間變異之參數的一方法的一流程圖; 第3a圖顯示根據本發明之一實施例,用以獲得描述一 基週之時間變異之參數的一方法的一流程圖; 第3b圖顯示用以獲得描述該基週之時間演進之參數的 該方法的一簡化流程圖; 第4圖顯示根據本發明之一實施例,用以獲得描述一 基週之時間變異之參數的另一改良方法的一流程圖; 第5圖顯示用以獲得描述一自協方差域中音訊信號之 信號特性時間變異之參數的一方法的一流程圖; 第6圖顯示根據本發明之該實施例,一音訊信號編碼 器的一方塊示意圖;以及 第7圖顯示用以獲得描述信號變異之參數的一般方法 的一流程圖。 【主要元件符號說明】 100.. .裝置 110.. .變換器 118…音訊信號之時域表示 120.. .實際變換域參數 130.. .參數判定器 130a...變異模型參數計算方 程式 130b...變異模型參數計算器 130c...時域變異模型表示 130d...模型參數優化器 140.. .模型參數 150.. .方法 160/170…步驟 200.. .方法 210/220/220a 〜220c...步驟 300.. .方法 310〜350···步驟 360.. .方法 370~378…步驟 400.. .方法 410.. .步驟 410a/410b...子步驟 420.. .步驟 500.. .方法 54 201108201 510~580…步驟 622…參數 600...音訊編碼 630…音訊信號的經編碼表示 606...輸入音訊信號表示 700...方法 610…第一音訊信號預處理器 612.. .第二音訊信號預處理器 620.. .音訊信號編碼器核心 710〜740…步驟 55
Claims (1)
- 201108201 七、申請專利範圍·· 1· 一種裝置,其用以在描述在一變換域中之信號的實際變 換域參數的基礎上,獲得描述-信號之—信號特性變異 的一參數,該裝置包含: 一參數判定器,其受組配以依據表示一信號特性的 -或多個模型參數而定’判定描述變換域參數演進之一 變換域變異模型的—或多個模型參數,使得表示在該等 變換域參數之-模型化演進與該等實際變換域參數之 一演進之間的一導數的一模型錯誤在一預定臨界值 下,或予以最小化。 2.如申請專利範㈣i項所述之裝置,其中該裝置受組配 以獲得作為該等實際變換域參數’㈣丨於預定的一組變 換變數值之描述該變換域中該音訊信號之一第一時間 間隔的一第一組變換域參數,及相對於預定的該組變換 變數值之描述在該變換域中該音訊信號的―第二時間 間隔的一第二組變換域參數;及 其中Π亥參數判疋器受组配以獲得該頻率變異模型 參數’其使用-模型,賴型包括—料變異模型參數 且表示有關於假設該音訊信號的一平滑頻率變異的該 變換變數的該音訊信號之變換域表示的一愿縮或擴展 及 -中《玄參數判疋器党組配以判定該頻率變異模型 參數’使得該經參數化的變換域變異模型適用於該第一 組變換域參數及該第二組變換域參數。 56 201108201 3. 如申请專利範圍第1項所述之裝置,其中該裝置受組配 以獲得作為該等實際變換域參數的,描述該變換域中之 該音訊信號且作為一變換變數之函數的變換域參數, 其中該變換域遭選擇,使得該音訊信號的一頻率變 換至少產生有關於該變換變數的該音訊信號之該變換 域表示的一移位,或有關於該變換變數的該變換域表示 的一伸長,或有關於該變換變數的該變換域表示的一壓 縮; 其中該參數判定器受組配以在相對應實際變換域 參數之一時間改變的基礎上,獲得一頻率變異模型參 數,考慮該音訊信號之該變換域表示與該變換變數的一 依賴性。 4. 如申凊專利範圍第丨至3項中任一項所述之裝置,其中 該裝置受組配以獲得作為該等實際變換域參數的,描述 相對於-第-時間間隔且相對於多個不同自相關滞後 值之該音難號的-自相關的第—自相關f訊,及描述 相對於-第二時間間隔且相對於該等不同自相關滞後 值之該音訊信號的一自相關的第二自相關資訊; 其中該參數判定器受组配以相對於多個不同的自 相關滞後值’評估在該第—自相關資訊與該第二自相關 資訊之間的一時間變異,來獲得時間變異資訊, 以相對於多個不同滞後值,估計在滯後上的自相關 資訊的-局部變異,來獲得一局部滞後變異資訊,及 以將該時間變異資訊與該局部滞後f訊相結合,來 57 2〇11〇82〇i 獲得該模型參數。 5. 如申請專利範圍第4項所述之裝置,其中該參數判定器 受組配以使用下面的方程式運算一所估計的變異參數 A · Ch, 〜=Σ^=1 [R(k-. {>· +1)- R(k, h)) k-^ R^ h) Aistep EL i k·2 [jj:R(k, /1)]2 , 其中 k表示描述不同自相關滯後值的一連續變數; h表示一第一時間間隔; h+Ι表示一第二時間間隔; 表示需評估之自相關滞後值的數量; R(k,h)表示相對於由指數h所表示的一視窗該 音訊信號的一自相關; R(k,h+Ι)表示由指數h+1所表示的一視窗的該 音訊信號的一自相關;及 表不在由k所表示之該滯後的一周邊 中,由指數h所表示一視窗,在一滯後上之該自相關 的一變異。 6. 如申請專利範圍第丨至3項中任一項所述之裝置,其中 該裝置受組配以獲得作為該等實際變換域參數的,描述 相對於一第一時間間隔且相對於多個不同自相關滯後 值之該音訊信號的一自協方差的第一自協方差資訊,及 描述相對於一第二時間間隔且相對於多個不同自相關 58 201108201 滯後值之該音訊信號的一自協方差的第二自協方差資 訊滞後值;及 其中該參數判定器受組配以相對於多個不同的自 協方差滯後值,評估在該第一自協方差資訊與該第二自 協方差資訊之間的一變異,來獲得時間變異資訊, 以相對於多個不同滞後值,估計在滯後上之該自協 方差資訊的一局部導數,來獲得一局部滯後變異資訊, 及 以將該時間變異資訊與該局部滯後變異資訊相結 合,來獲得該模型參數。 7·如申請專利範圍第1至3項中任一項所述之裝置,其中 該裝置受組配以獲得描述相對於一單一自協方差視 窗’但是相對於不同自協方差滯後值之該音訊信號之一 自協方差的自協方差資訊, 以多個不同的自協方差滯後值對’估計在該等自協 方差值對之間的加權差值, 其中該加權依據該等各自滞後值對之該等滯後值 的一差值,且依據在滯後上該自協方差之一變異來選 擇, 以將不同加權差值的總數相結合,來獲得一結合 值,及 以在該結合值的基礎上獲得該等模型參數。 8.如申請專利範圍第1至7項中任一項所述之裝置,其中 該裝置受組配以獲得描述該音訊信號之一包絡之一時 59 201108201 間變異的一參數, 其中°亥參數判定器受組配以獲得多個變換域參 數,其於多個時間間隔中描述該音訊信號之一信號功 率, 其中5亥參數判定器受組配以獲得-包絡變異模型 參數’其使用-參數化變換域變異模型的—表示,該參 數化變換域變異描^ 4 _ 共棋型包含一包絡變異模型參數且表示 電力中之時間增加或假設該音訊信號的一平滑包絡變 異的該音訊信號之該變換域表示之電力中—時間降 低,及 其中6亥參數判定器受組配以判定該包絡變異模型 參數’使得該參數化變換域變異模型適詩該等變換域 參數。 如申叫專利範圍第8項所述之裝置’其中該參數判定器 受組配以獲得相對於一給定自相關滞後或自協方差滯 後的多個自相關參數或自協方差參數,及 其中該參數判定器受組配以判定一多項式包絡變 異模型的多個多項式參數。 1〇.如申請專利範圍第1項所述之裝置,其中«置受組配 以獲得描述在—自相關域中之該音訊信號的自相關域 參數,及 其中該參數判定器受組配以判定一自相關域變異 模型的一或多個模型參數;或 其中該裝置受組配以獲得描述在一自協方差域中 60 201108201 /曰。TU5號之自協方差域參數,及 其中戎參數判定器受組配以判定一自協方差域變 異模型的一或多個模型參數。 如申'^專利範圍第1 1〇項中任_項所述之裝置,其 中該义換域變異模型描述該音訊信號之一音高週期的 一時間變異,或 其中該變換域變異模型描述該音訊信號之一包絡 的一時間變異,或 其中該變換域變異模型描述該音訊信號之一音高 週期及一包絡的一同時時間變異。 12·如申請專利範圍第1至11項中任-項所述之裝置,其 中該裝置包含一共振結構減少器,其受組配以預處理一 輸入音訊信號,來獲得-共振結構減少的音訊信號;及 其中該装置受組配以在該共振結構減少的音訊信 號的基礎上,獲得該實際變換域參數。 13.如申請專鄕圍第u項所述之裝置,其巾該共振結構 減少器受組配以在該輸入音訊信號之一經高通渡波的 版本基礎上,估計該輸入音訊信號之一線性預測模型的 參數,及 以在該線性預測模型之該等所估計參數的基礎 上,濾、波該輸入音訊信號的一寬頻版本, 以獲得該共振結構減少的音訊信號,使得該共振結 構減少音sfL、號包含一低通特性。 Η.-種方法,其用以在描述-變換域中之該信號的實際變 201108201 換域參數的基礎上,獲得描述—信號之_錢特性變異 的—參數,該方法包含以下步驟·· 依據表示-㈣特性的—❹個模型參數,判定描 述變換域參數之-演進的一變換域變異模型的一或多 個模型參數,使得表示在該等變換域參數之—模型化時 間演進與該等實際變換域參數之一演進之間的一偏差 的-模型錯誤位於-預定臨界值下,或予以最小化。 15·-種電職式’其用以在該電腦程式執行於—電腦中 時,執行申請專利範圍第14項所述之方法。 16.-種用以時間捲曲編碼—輸入音訊信號的一時間捲曲 a «fl編碼H ’ 5辦間捲曲音訊編碼器包含: -褒置’其用於如_請專利範圍第丨至14項中任一 項所述,獲得描述—音訊信號之__信號特性時間變異的 一參數, 、 其中用以獲得一參數的該裝置受組配以獲得描述 a亥等輸入日則§號之—音高週期基週變異的一音高週 期變異參數;及 -時間捲曲信號處理器,其受組配以使用該音高週 期變異參數來執行該輪入音訊信號的一時間捲曲信號 取樣,來調整該時間捲曲。 62
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US14606309P | 2009-01-21 | 2009-01-21 | |
| EP09005486A EP2211335A1 (en) | 2009-01-21 | 2009-04-17 | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW201108201A true TW201108201A (en) | 2011-03-01 |
| TWI470623B TWI470623B (zh) | 2015-01-21 |
Family
ID=40935040
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW98143908A TWI470623B (zh) | 2009-01-21 | 2009-12-21 | 用以獲得描述信號之信號特性變異之參數的裝置、方法與電腦程式、以及用以時間捲曲編碼輸入音訊信號的時間捲曲音訊編碼器 |
Country Status (20)
| Country | Link |
|---|---|
| US (1) | US8571876B2 (zh) |
| EP (2) | EP2211335A1 (zh) |
| JP (2) | JP5551715B2 (zh) |
| KR (1) | KR101307079B1 (zh) |
| CN (1) | CN102334157B (zh) |
| AR (1) | AR075020A1 (zh) |
| AU (1) | AU2010206229B2 (zh) |
| BR (1) | BRPI1005165B1 (zh) |
| CA (1) | CA2750037C (zh) |
| CO (1) | CO6420379A2 (zh) |
| ES (1) | ES2831409T3 (zh) |
| MX (1) | MX2011007762A (zh) |
| MY (1) | MY160539A (zh) |
| PL (1) | PL2380165T3 (zh) |
| PT (1) | PT2380165T (zh) |
| RU (1) | RU2543308C2 (zh) |
| SG (1) | SG173083A1 (zh) |
| TW (1) | TWI470623B (zh) |
| WO (1) | WO2010084046A1 (zh) |
| ZA (1) | ZA201105338B (zh) |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0638733B2 (ja) | 1987-03-06 | 1994-05-25 | 日清製粉株式会社 | 固定化プロテア−ゼによる加水分解グルテンの製造法 |
| US20120089390A1 (en) * | 2010-08-27 | 2012-04-12 | Smule, Inc. | Pitch corrected vocal capture for telephony targets |
| US8805697B2 (en) * | 2010-10-25 | 2014-08-12 | Qualcomm Incorporated | Decomposition of music signals using basis functions with time-evolution information |
| US10316833B2 (en) * | 2011-01-26 | 2019-06-11 | Avista Corporation | Hydroelectric power optimization |
| US8626352B2 (en) * | 2011-01-26 | 2014-01-07 | Avista Corporation | Hydroelectric power optimization service |
| US9026257B2 (en) | 2011-10-06 | 2015-05-05 | Avista Corporation | Real-time optimization of hydropower generation facilities |
| CN103426441B (zh) | 2012-05-18 | 2016-03-02 | 华为技术有限公司 | 检测基音周期的正确性的方法和装置 |
| US10324068B2 (en) * | 2012-07-19 | 2019-06-18 | Carnegie Mellon University | Temperature compensation in wave-based damage detection systems |
| TR201818834T4 (tr) | 2012-10-05 | 2019-01-21 | Fraunhofer Ges Forschung | Otokorelasyon alanında acelp kullanan bir konuşma sinyalinin şifrelenmesine ilişkin bir ekipman. |
| US8554712B1 (en) | 2012-12-17 | 2013-10-08 | Arrapoi, Inc. | Simplified method of predicting a time-dependent response of a component of a system to an input into the system |
| US9741350B2 (en) * | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
| GB2513870A (en) * | 2013-05-07 | 2014-11-12 | Nec Corp | Communication system |
| EP3156861B1 (en) * | 2015-10-16 | 2018-09-26 | GE Renewable Technologies | Controller for hydroelectric group |
| RU169931U1 (ru) * | 2016-11-02 | 2017-04-06 | Акционерное Общество "Объединенные Цифровые Сети" | Устройство сжатия аудиосигнала для передачи по каналам распространения данных |
| KR102634916B1 (ko) * | 2019-08-29 | 2024-02-06 | 주식회사 엘지에너지솔루션 | 온도 추정 모델 결정 방법 및 장치, 온도 추정 모델이 적용된 배터리 관리 시스템 |
| CN112309425B (zh) * | 2020-10-14 | 2024-08-30 | 浙江大华技术股份有限公司 | 一种声音变调方法、电子设备及计算机可读存储介质 |
| CN115913231B (zh) * | 2023-01-06 | 2023-05-09 | 上海芯炽科技集团有限公司 | 一种tiadc的采样时间误差数字估计方法 |
| CN117727330B (zh) * | 2024-02-18 | 2024-04-16 | 百鸟数据科技(北京)有限责任公司 | 基于音频分解的生物多样性预测方法 |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4231408A (en) | 1978-06-08 | 1980-11-04 | Henry Replin | Tire structure |
| NL8701798A (nl) * | 1987-07-30 | 1989-02-16 | Philips Nv | Werkwijze en inrichting voor het bepalen van het verloop van een spraakparameter, bijvoorbeeld de toonhoogte, in een spraaksignaal. |
| WO1992022891A1 (en) * | 1991-06-11 | 1992-12-23 | Qualcomm Incorporated | Variable rate vocoder |
| US5751905A (en) * | 1995-03-15 | 1998-05-12 | International Business Machines Corporation | Statistical acoustic processing method and apparatus for speech recognition using a toned phoneme system |
| US6574593B1 (en) * | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
| RU27259U1 (ru) * | 2000-09-07 | 2003-01-10 | Железняк Владимир Кириллович | Устройство для измерения разборчивости речи |
| US7017175B2 (en) | 2001-02-02 | 2006-03-21 | Opentv, Inc. | Digital television application protocol for interactive television |
| CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
| WO2005031595A1 (en) * | 2003-09-29 | 2005-04-07 | Agency For Science, Technology And Research | Method for performing a domain transformation of a digital signal from the time domain into the frequency domain and vice versa |
| KR100612840B1 (ko) * | 2004-02-18 | 2006-08-18 | 삼성전자주식회사 | 모델 변이 기반의 화자 클러스터링 방법, 화자 적응 방법및 이들을 이용한 음성 인식 장치 |
| KR20050087956A (ko) * | 2004-02-27 | 2005-09-01 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
| PT2200024E (pt) * | 2004-08-30 | 2013-07-08 | Qualcomm Inc | Processo e aparelho para um buffer adaptativo de compensação de jitter |
| US7565018B2 (en) * | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
| US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
| US7965848B2 (en) * | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
| JP2007288468A (ja) | 2006-04-17 | 2007-11-01 | Sony Corp | オーディオ出力装置、パラメータ算出方法 |
| KR101393298B1 (ko) * | 2006-07-08 | 2014-05-12 | 삼성전자주식회사 | 적응적 부호화/복호화 방법 및 장치 |
| JP4958241B2 (ja) * | 2008-08-05 | 2012-06-20 | 日本電信電話株式会社 | 信号処理装置、信号処理方法、信号処理プログラムおよび記録媒体 |
-
2009
- 2009-04-17 EP EP09005486A patent/EP2211335A1/en not_active Withdrawn
- 2009-12-21 TW TW98143908A patent/TWI470623B/zh active
-
2010
- 2010-01-11 CN CN201080008756.0A patent/CN102334157B/zh active Active
- 2010-01-11 WO PCT/EP2010/050229 patent/WO2010084046A1/en not_active Ceased
- 2010-01-11 AU AU2010206229A patent/AU2010206229B2/en active Active
- 2010-01-11 MX MX2011007762A patent/MX2011007762A/es active IP Right Grant
- 2010-01-11 SG SG2011052677A patent/SG173083A1/en unknown
- 2010-01-11 PL PL10701639T patent/PL2380165T3/pl unknown
- 2010-01-11 MY MYPI2011003405A patent/MY160539A/en unknown
- 2010-01-11 RU RU2011130422/08A patent/RU2543308C2/ru active
- 2010-01-11 PT PT107016396T patent/PT2380165T/pt unknown
- 2010-01-11 BR BRPI1005165-1A patent/BRPI1005165B1/pt active IP Right Grant
- 2010-01-11 KR KR1020117017778A patent/KR101307079B1/ko active Active
- 2010-01-11 JP JP2011546736A patent/JP5551715B2/ja active Active
- 2010-01-11 ES ES10701639T patent/ES2831409T3/es active Active
- 2010-01-11 EP EP10701639.6A patent/EP2380165B1/en active Active
- 2010-01-11 CA CA2750037A patent/CA2750037C/en active Active
- 2010-01-14 AR ARP100100085A patent/AR075020A1/es active IP Right Grant
-
2011
- 2011-07-20 ZA ZA2011/05338A patent/ZA201105338B/en unknown
- 2011-07-20 US US13/186,688 patent/US8571876B2/en active Active
- 2011-08-19 CO CO11105765A patent/CO6420379A2/es not_active Application Discontinuation
-
2013
- 2013-07-29 JP JP2013156381A patent/JP5625093B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| CN102334157B (zh) | 2014-10-22 |
| MY160539A (en) | 2017-03-15 |
| CA2750037C (en) | 2016-05-17 |
| AU2010206229A1 (en) | 2011-08-25 |
| JP2012515939A (ja) | 2012-07-12 |
| AU2010206229B2 (en) | 2014-01-16 |
| BRPI1005165B1 (pt) | 2021-07-27 |
| CN102334157A (zh) | 2012-01-25 |
| US8571876B2 (en) | 2013-10-29 |
| CA2750037A1 (en) | 2010-07-29 |
| MX2011007762A (es) | 2011-08-12 |
| PT2380165T (pt) | 2020-12-18 |
| US20110313777A1 (en) | 2011-12-22 |
| EP2380165B1 (en) | 2020-09-16 |
| EP2211335A1 (en) | 2010-07-28 |
| RU2543308C2 (ru) | 2015-02-27 |
| EP2380165A1 (en) | 2011-10-26 |
| BRPI1005165A2 (pt) | 2017-08-22 |
| ZA201105338B (en) | 2012-08-29 |
| KR101307079B1 (ko) | 2013-09-11 |
| JP5551715B2 (ja) | 2014-07-16 |
| AR075020A1 (es) | 2011-03-02 |
| PL2380165T3 (pl) | 2021-04-06 |
| JP5625093B2 (ja) | 2014-11-12 |
| ES2831409T3 (es) | 2021-06-08 |
| KR20110110785A (ko) | 2011-10-07 |
| WO2010084046A1 (en) | 2010-07-29 |
| TWI470623B (zh) | 2015-01-21 |
| BRPI1005165A8 (pt) | 2018-12-18 |
| CO6420379A2 (es) | 2012-04-16 |
| SG173083A1 (en) | 2011-08-29 |
| JP2014013395A (ja) | 2014-01-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TW201108201A (en) | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal | |
| US20110015931A1 (en) | Periodic signal processing method,periodic signal conversion method,periodic signal processing device, and periodic signal analysis method | |
| CN113345460B (zh) | 音频信号处理方法、装置、设备及存储介质 | |
| Saito et al. | Specmurt analysis of polyphonic music signals | |
| JP4127792B2 (ja) | 音声強化デバイス | |
| CN109493880A (zh) | 一种谐波信号基频初步筛选的方法 | |
| US20150162014A1 (en) | Systems and methods for enhancing an audio signal | |
| Amado et al. | Pitch detection algorithms based on zero-cross rate and autocorrelation function for musical notes | |
| Yu et al. | A hybrid speech enhancement system with DNN based speech reconstruction and Kalman filtering | |
| Liu et al. | Speech enhancement based on analysis–synthesis framework with improved parameter domain enhancement | |
| Shannon et al. | MFCC computation from magnitude spectrum of higher lag autocorrelation coefficients for robust speech recognition. | |
| Le et al. | Harmonic enhancement using learnable comb filter for light-weight full-band speech enhancement model | |
| CN118230741A (zh) | 一种基于正弦谐波模型的低速率语音编解码方法 | |
| Srivastava | Fundamentals of linear prediction | |
| Kawahara et al. | A modulation property of time-frequency derivatives of filtered phase and its application to aperiodicity and fo estimation | |
| CN116758930A (zh) | 语音增强方法、装置、电子设备及存储介质 | |
| Zhao | Evaluation of multimedia popular music teaching effect based on audio frame feature recognition technology | |
| Funaki et al. | F 0 estimation using SRH based on TV-CAR speech analysis | |
| Chen et al. | QHARMA-GAN: Quasi-Harmonic Neural Vocoder based on Autoregressive Moving Average Model | |
| HK1160281B (zh) | 用以获得描述信号的信号特性变异参数的装置、方法与电脑程式 | |
| JP2004012884A (ja) | 音声認識装置 | |
| Funaki et al. | Evaluation of F 0 estimation using ZFR based on time-varying speech analysis | |
| Shen et al. | Speech Enhancement Exploiting Probabilistic Approach Using Maximum A Posterior | |
| Bäckström et al. | Pitch variation estimation. | |
| CN116137154A (zh) | 语音信号的信号增强方法、装置、设备及存储介质 |