TWI470623B - 用以獲得描述信號之信號特性變異之參數的裝置、方法與電腦程式、以及用以時間捲曲編碼輸入音訊信號的時間捲曲音訊編碼器 - Google Patents
用以獲得描述信號之信號特性變異之參數的裝置、方法與電腦程式、以及用以時間捲曲編碼輸入音訊信號的時間捲曲音訊編碼器 Download PDFInfo
- Publication number
- TWI470623B TWI470623B TW98143908A TW98143908A TWI470623B TW I470623 B TWI470623 B TW I470623B TW 98143908 A TW98143908 A TW 98143908A TW 98143908 A TW98143908 A TW 98143908A TW I470623 B TWI470623 B TW I470623B
- Authority
- TW
- Taiwan
- Prior art keywords
- variation
- parameters
- parameter
- model
- transform domain
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims description 194
- 238000000034 method Methods 0.000 title claims description 133
- 238000004590 computer program Methods 0.000 title claims description 15
- 230000002123 temporal effect Effects 0.000 claims description 44
- 230000009466 transformation Effects 0.000 claims description 31
- 230000008859 change Effects 0.000 claims description 30
- 238000001914 filtration Methods 0.000 claims description 13
- 230000036961 partial effect Effects 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 12
- 230000035772 mutation Effects 0.000 claims description 10
- 230000002829 reductive effect Effects 0.000 claims description 10
- 230000006835 compression Effects 0.000 claims description 9
- 238000007906 compression Methods 0.000 claims description 9
- 230000000875 corresponding effect Effects 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 230000002596 correlated effect Effects 0.000 claims description 2
- 238000009499 grossing Methods 0.000 claims description 2
- 239000003638 chemical reducing agent Substances 0.000 claims 3
- 230000001747 exhibiting effect Effects 0.000 claims 2
- 238000004458 analytical method Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 19
- 238000005259 measurement Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 238000013459 approach Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 210000003484 anatomy Anatomy 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 238000002407 reforming Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
- Auxiliary Devices For Music (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Stored Programmes (AREA)
Description
本發明係有關於用以獲得描述信號之信號特性變異之參數的裝置、方法與電腦程式。
根據本發明之實施例有關於用以在描述在一變換域中之音訊信號的實際變換域參數的基礎上,獲得描述信號之信號特性變異之參數的一裝置、一方法及一電腦程式。
根據本發明的較佳實施例有關於用以在描述在一變換域中之音訊信號的實際變換域參數的基礎上,獲得描述音訊信號之信號特性時間變異之參數的一裝置、一方法及一電腦程式。
根據本發明的其他實施例有關於信號變異估計。
儘管本發明的原始範圍是對音訊信號的時間變異分析,但是同一方法可容易地適用於任何數位信號,且此等信號的變異呈現在其等的任何軸上。此等信號及變異包括例如,諸如影像及電影之強度對比的特性空間及時間變異、諸如雷達及無線電信號之振幅及頻率的特性調變(變異)、及諸如心電圖信號之異質的特性變異。
在下面,將給出關於信號變異估計概念的一簡單介紹。
傳統的信號處理通常由假設局部穩定信號開始,且對於許多應用,此是一合理的假設。但是,為了申請諸如語音及音訊之信號是局部穩定拉伸,但是事實上在一些情況下超過了可接受的位準的專利。特性快速改變的信號會將失真引入難以由傳統方式包含的分析結果中,且從而對於快速變化的信號需要特別定制的方法論。
例如,可能要考慮具有一變換式編碼器之一語音信號的編碼。此處,輸入信號在視窗中予以分析,其內容轉換為頻譜域。當該信號是基頻快速改變的一諧波信號時,相對應於該等諧波之頻譜峰值的位置隨著時間改變。如果例如相比於基頻的改變,分析視窗的長度相當長,則該等頻譜峰值會延伸至相鄰的頻率槽(bin)。換句話說,該頻譜表示會模糊不清。此失真可能在上方頻率處尤為嚴重,其中當基頻改變時,頻譜峰值的位置較快速地移動。
儘管存在能補償該基頻中諸如時間捲曲修正型餘弦變換(TW-MDCT)(參見參考[8]及[3])之改變的方法,但是音高週期變異估計仍然是一挑戰。
在過去,音高週期變異已經透過測量該音高週期且僅使用時間導數來估計。然而,因為音高週期估計是一困難且通常不明確的任務,所以該音高週期變異估計值會由於錯誤而錯亂。其中,音高週期估計遭受二種類型的共用錯誤(例如參見參考[2])。首先,當該等諧波具有大於基頻的能量時,估計器通常遭分散以明確該諧波實際上是該基頻,藉此輸出實際頻率的整數倍。此等錯誤可作為該音高週期追蹤中的不連續性而觀察到,且在該時間導數方面產生一極大錯誤。其次,大多數音高週期估計方法基本上依賴於根據一些啟發,從該(等)自相關(或相似)域中所選取的峰值。特別的是,在改變信號的情況下,此等峰值是廣泛的(在頂部是平坦的),藉此該自相關估計值中小錯誤也會顯著地移動所估計的峰值位置。因而,該音高週期估計值是一不穩定的估計值。
如上所示,在信號處理中的一般方法是假設信號在短時間間隔中是恆定的,且以此間隔來估計該等特性。如果該信號實際上是時變的,那麼假設該信號的時間演進相當慢,使得在短間隔中穩定性的假設是相當正確的,且在短間隔中的分析將不會產生顯著的失真。
考慮上面內容,期望提供用以獲得描述具有改良穩健性之信號特徵時間變異之參數的一概念。
根據本發明之一實施例產生用以在描述一變換域中音訊信號的實際變換域參數的基礎上,獲得描述音訊信號之信號特性時間變異之參數的一裝置。該裝置包含一參數判定器,該參數判定器受組配以依據表示一信號特性的一或多個參數,來判定描述變換域參數之時間演進的一變換域變異模型的一或多個模型參數,諸如一模型錯誤、表示。在該等變換域參數之模型化時間演進與該等實際變換域參數之時間演進之間的偏差處於一預定臨界值下,或予以最小化。
此實施例是基於得出,一音訊信號的典型時間變異產生在該變換域中的一特徵時間演進,其可以僅使用有限數量的模型參數予以良好描述。儘管對於其中該特性時間演進由人類語音嗓音的典型解剖來判定的聲音信號,這尤其正確,但是該假設持有有廣泛範圍的音訊及其他信號,如典型的音樂信號。
而且,一信號特性(例如一音高週期、一包絡、一音調、一噪度等)的典型平滑時間演進可遭該變換域變異模型考慮。因此,一參數化變換域變異的使用可以甚至用以增強(或考慮)該所估計信號特性的平滑性。因而,該所估計信號特性或其偏差的不連續性可予以避免。因此,透過選擇該變換域變異模型,任何典型的限制都可作用於該等信號特性的模型化變異,例如一變異的限制比率、一值的限制範圍等。而且,透過適當地選擇該變換域變異模型,諧波的影響可獲得考慮,使得例如可以透過同時地模型化一基頻及其諧波的一時間演進,來獲得改良的可靠性。
而且,透過使用在該變換域中的一變異模型化,可以限制信號失真的影響。儘管某些類型的失真(例如一頻率相關信號延遲)導致一信號波形的嚴重改變,但是此失真可能對一信號的變換域表示具有限制性的影響。因為自然地還期望精確估計存在失真的信號特性,所以顯示該變換域的使用是一極好的選擇。
綜上所述,一變換域變異模型的使用使一典型音訊信號的信號特性能夠在良好的精度及可靠性下予以判定,該變換域變異模型的參數適用於使該參數化變換域變異模型(或其輸出)與描述一輸入音訊信號之實際變換域參數的一實際時間演進相一致。
在一較佳實施例中,該裝置可受組配以獲得作為該等實際變換域參數的,描述相對於預定的一組轉換變數(在此還指定為“變換變數”)值,該變換域中該音訊信號的一第一時間間隔的一第一組變換域參數。類似地,該裝置可受組配以獲得描述相對於預定的該組轉換變數值,該變換域中該音訊信號的一第二時間間隔的一第二組變換域參數。在此種情況下,該參數判定器可受組配以使用包含一頻率-變異(或音高週期-變異)參數且表示針對於假設該音訊信號之一平滑頻率變異的該轉換變數,該音訊信號之變換域表示的壓縮或擴展的一參數化變換域變異模型,獲得一頻率(或音高週期)變異模型參數。該參數判定器可受組配以判定該頻率變異參數,使得該參數化變換域變異模型適用於該第一組變換域參數及該第二組變換域參數。透過使用此方式,一極有效的使用可以由可用於該變換域中的資訊構成。已經得出的是,一音訊信號的一變換域表示(例如一自相關域表示、一自協方差域表示、一傅利葉變換域表示、一離散型餘弦變換域表示等)在變化基頻或音高週期的變化時,予以平滑地擴展或壓縮。透過模型化該變換域表示的此平滑壓縮或擴展,該變換域表示的完全資訊內容可予以使用,因為該變換域表示的多重取樣(對於該轉換變數的不同值)可相匹配。
在一較佳實施例中,該裝置可受組配以獲得作為該等實際變換域參數的,描述作為一變換變數之函數之該變換域中音訊信號的變換域參數。該變換域可以獲得選擇,使得該音訊信號的頻率變換至少產生相關於該變換變數之該音訊信號之變換域表示的一頻率偏移,或相關於該變換變數之該變換域表示的一伸展,或相關於該變換變數之該變換域表示的一壓縮。該參數判定器可受組配以在相對應(例如與該變換變數之相同值相關聯)實際變換域參數之一時間變異的基礎上,獲得一頻率-變異模型參數(或音高週期-變異模型參數),考慮該音訊信號之變換域表示與該變換變數的相依性。使用此方式,關於相對應實際變換域參數(例如相對於相同自相關滯後、自協方差滯後或傅利葉變換頻率bin的變換域參數)之一時間變異的資訊可分別地評估與相關於該轉換變數之該變換域表示有關的資訊。隨後,該經分別計算的資訊可以相結合。因而,一特別有效的方式可用於,例如透過比較多對變換域參數及考慮該變換域表示之變換參數相依變數之所估計的局部梯度,來估計該變換域表示的擴展或壓縮。換句話說,該變換域表示的局部坡度,依據該變換參數及該變換域表示的時間改變(例如橫跨隨後視窗)而定,可以相結合以估計該變換域表示之時間壓縮或擴展的幅值,其接著是一時間頻率變異或音高週期變異的測量。
其他較佳的實施例還定義於附屬申請專利範圍中。
根據本發明的另一實施例產生用以在描述一變換域中之該音訊信號的實際變換域參數的基礎上,獲得描述一音訊信號之信號特性時間變異的一參數的一方法。
又一實施例產生用以獲得描述一音訊信號之信號特性時間變異之一參數的一電腦程式。
第1a圖顯示用以獲得描述音訊信號之信號特性時間變異之參數的一裝置的一方塊示意圖;第1b圖顯示用以獲得描述音訊信號之信號特性時間變異之參數的一方法的一流程圖;第2圖顯示根據本發明之一實施例,用以獲得描述信號包絡之時間變異之參數的一方法的一流程圖;第3a圖顯示根據本發明之一實施例,用以獲得描述一音高週期之時間變異之參數的一方法的一流程圖;第3b圖顯示用以獲得描述該音高週期之時間演進之參數的該方法的一簡化流程圖;第4圖顯示根據本發明之一實施例,用以獲得描述一音高週期之時間變異之參數的另一改良方法的一流程圖;第5圖顯示用以獲得描述一自協方差域中音訊信號之信號特性時間變異之參數的一方法的一流程圖;第6圖顯示根據本發明之該實施例,一音訊信號編碼器的一方塊示意圖;以及第7圖顯示用以獲得描述信號變異之參數的一般方法的一流程圖。
在下面,將大體上描述變異模型化的概念,以促進對本發明的理解。隨後,一般實施例將根據本發明參照第1a及1b圖來描述。隨後,較特定的實施例將參照第2至5圖來描述。最後,對於音訊信號編碼的發明性概念的應用將參照第6圖來描述,且總結將參照第7圖給出。
為了避免混淆,該技術將如下使用:
‧ 其中用語“變異”是指描述特性在時間上改變的一組一般函數,及
‧ 該(空間)導數作為按數學精確定義的一實體使用。
換句話說,“變異”是指信號特性(在一抽取的位準上),而“導數”在使用數學定義的任何時候,用作自相關/自協方差的k(自相關滯後/自協方差滯後)或t(時間)導數。
任何其他改變的測量將以其他詞來說明,而一般不使用名詞“變異”。
而且,隨後將針對於音訊信號之時間變異的估計,描述根據本發明之實施例。然而,本發明不僅限於音訊信號及時間變異。相反地,根據本發明之實施例可用以估計一般的信號變異,即使本發明目前主要用以估計音訊信號的時間變異。
大體上來說,根據本發明之實施例使用變異模型來分析一輸入音訊信號。因而,該變異模型用以提供估計該變異的一方法。
在下面,在一習知信號特性估計與用於根據本發明之實施例中的概念之間的一些不同將予以討論。
然而傳統的方法假設,該信號(例如一音訊信號)的特性在短時間視窗中是恆定的(或穩定的),但是本發明的主要方法是假設(例如一信號特性(如一音高週期或一包絡)的)(歸一化)變化率在一短時間視窗中是恆定的。因而,儘管傳統的方法在適度位準失真的情況下,也能夠處理穩定信號、緩慢變化的信號,但是根據本發明的一些實施例在適度位準失真的情況下,還可以處理穩定信號、線性變化信號(或呈指數變化的信號)、該非線性變化率很慢的非線性改變信號。
如上所述,本發明的主要方式之一是假設該(歸一化)改變率在短視窗中是恆定的,但是所呈現的方法及概念可容易地擴展為較一般的情況。例如,該歸一化改變率、該變異可由任何函數來模型化,且只要該變異模型(或該函數)具有小於資料點數量的參數,該等模型參數就可予以明確地解決。
在該等較佳實施例中,該變異模型可描述例如一信號特性的平滑改變。例如,該模型可基於假設一信號特性(或其歸一化變化率)遵循一基本函數的調節版本,或基本函數的調節結合(其中基本函數包含:xa
;1/xa
;;1/x;1/x2
;ex
;ax
;ln(x);loga
(x);sinh x;cosh x;tanh x;coth x;arsinh x;arcosh x;artanh x;arcoth x;sin x;cos x;tan x;cot x;sec x;csc x;arcsin x;arccos x;arctan x;arccot x;)。在一些實施例中,較佳的是描述該信號特性或該歸一化變化率之時間演進的函數在重要範圍內是穩定且平滑的。
根據本發明之概念的主要應用領域之一是分析幅值改變的信號特性,相比於此特性的幅值,該變異較有用。例如,在音高週期方面,此意味著根據本發明之實施例有關於對音高週期改變而不是音高週期幅值較感興趣的應用。
然而,如果在一應用中,該應用對一信號特性的幅值較感興趣而不是變化率,那麼其仍然可以受益於根據本發明的概念。例如,如果關於信號特性的先前資訊是可用的,諸如變化率的有效範圍,那麼該信號變異可用作額外的資訊,以獲得正確且穩健的時間輪廓。例如,在音高週期方面,可能藉由習知的方法來逐格地估計該音高週期,且使用該音高週期變異來消除估計錯誤、異數、音階跳躍,且幫助使該音高週期輪廓成為一連續的軌跡,而不是在每一分析視窗中央處的隔離點。換句話說,可能將模型參數相結合,將變換域變異模型參數化,且由描述一信號特性之快照值的一或多個離散值來描述一信號特性的變異。
而且,在根據本發明的一實施例中,一主要方式是模型化該歸一化變化幅值,因為該等信號特性的幅值接著從該等計算中明確地消去。大體上,此方式使該數學公式較易處理。然而,根據本發明的實施例不限於使用變異的歸一化測量,因為應該會限制變異歸一化測量概念的內在原因不存在。
在下面,可用於根據本發明的一些實施例中的一數學變異模型將予以描述。然而,自然地,也可使用其他變異模型。
考慮具有諸如音高週期之特性的一信號隨時間而變化,且由p(t)
表示。音高週期的改變是其導數,且為了消去該音高週期幅值的影響,我們藉由p -1
(t
)來將該改變歸一化,且定義為
我們稱此測量c(t)
為該歸一化音高週期變異,或僅為音高週期變異,因為音高週期變異的一非線性化測量在本範例中是無意義的。
一信號的週期長度T(t)
與該音高週期成反比例,T(t)
=p -1
(t
),藉以我們可以容易地獲得
透過假設該音高週期變異在一小間隔t
中是恆定的,c(t)
=c
,方程式1的偏差分方程式可予以容易地解決,藉以我們獲得
p
(t
)=p 0 e ct
(2)
及
T
(t
)=T 0 e - ct
其中p 0
及T 0
分別表示在時間t
=0
時音高週期及週期的長度。
儘管T
(t
)是時間t
時的音高週期長度,但是我們認識到任何時間特徵都遵循相同的公式。特別的是,對於時間t
時的自相關R(k,t)
的滯後k
,在該k
-域中的時間特徵遵循此公式。換句話說,t
=0
時在滯後k 0
處出現的自相關特徵將移位作為一t
函數如
k
(t
)=k 0 e - ct
(3)。
類似地,我們具有
在方程式2中,我們僅考慮假設可在一短間隔中恆定的變異。然而,如果期望的話,我們可透過允許該變異在一短時間間隔內遵循某一函數形式來使用較高階的模型。在此特別主要的情況下會產生多項式,因為產生的差分方程式可獲得容易地解決。例如,如果我們定義該變異遵循該多項式形式
那麼
現在應注意的是,在不喪失一般性的情況下,方程式2中出現的該恆量p 0
已經納入該指數中,以使表示更清晰。
此形式證明該變異模型可以如何容易地延伸於較複雜的情況中。然而,除非另外說明,在此檔中,我們將僅考慮該一階情況(恆定變異),以保持可理解性及可達性。熟悉該技藝的具有通常知識者可容易地將該等方法延伸於較高階的情況中。
此處,在不對其他測量作修改的情況下,用於音高週期變異模型化的相同方式可予以使用,該等其他量測的歸一化導數是一保證良好的域。例如,相對應於該信號希伯特變換之瞬間能量的一信號時間包絡是此一測量。通常,相比於作為該包絡之時間變異的相對值,該時間包絡的幅值較不重要。在音訊編碼中,該時間包絡的模型化在逐漸縮小時間雜訊擴展中是有用的,且通常藉由已知為時間雜訊重整(TNS)的方法來實現,其中該時間包絡藉由在該頻域中的一線性預測模型(參見例如參考[4])來模型化。本發明提供TNS的一替代物來模型化及估計該時間包絡。
如果我們由a(t)
來表示該時間包絡,那麼該(歸一化)包絡變異h(t)
為
且相對應地,該偏差分方程式的解為
應注意的是,上面的形式暗示了在對數域中,該振幅是一簡單的多項式。此是習知的,因為振幅通常由分貝量度(dB)表示。
第1圖顯示用以在描述一變換域中之音訊信號的實際變換域參數(例如自相關值、自協方差值、傅利葉係數等)的基礎上,獲得描述音訊信號之信號特性時間變異之參數的一裝置的一方塊示意圖。第1a圖所示的該裝置其全部內容由100來表示。該裝置100受組配以獲得(例如接收或運算)描述在一變換域中之音訊信號的實際變換域參數120。而且,該裝置100受組配以依據一或多個模型參數,提供描述變化域參數之時間演進的一變換域變異模型的一或多個模型參數140。該裝置100包含一可取捨的變換器110,該可取捨的變換器110受組配以在該音訊信號之時域表示118的基礎上,提供該等實際變換域參數120,使得該等實際變換域參數120描述在一變換域中的音訊信號。然而,該裝置100可選擇地受組配以從變換域參數的外部源中接收該等實際變換域參數120。
該裝置100更包含一參數判定器130,其中該參數判定器130受組配以判定該變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之模型化時間演進與該等實際變換域參數之實際時間演進之間之偏差的一模型錯誤在一預定臨界值下或予以最小化。因而,依據表示一信號特性的一或多個模型參數來描述變換域參數之時間演進的變換域變異模型適用於(或適合於)由該等實際變換域參數所表示的音訊信號。因而,可有效地實現,由該變換域變異模型所暗地或明確描述的音訊信號變換域參數的模型化變異近似於(在一預定的容忍範圍內)該等變換域參數的實際變異。
許多不同的實施概念可用於該參數判定器。例如,該參數判定器可包含例如儲存於其中(或在一外部資料載體上)之描述將變換域參數映射於變異模型參數上的變異模型參數計算方程式130a。在此種情況下,該參數判定器130還可包含一變異模型參數計算器130b(例如一可規劃電腦或一信號處理器或一現場可程式閘陣列(fpga)),其可受組配為例如硬體或軟體,以評估該等變異模型參數計算方程式130a。例如,該變異模型參數計算器130b可受組配以接收描述在一變換域中之音訊信號的多個實際變換域參數,且使用該等變異模型參數計算方程式130a,運算一或多個模型參數140。該等變異模型參數計算方程式130a可以明確的形式描述將該等實際變換域參數120映射於該一或多個模型參數140上。
可選擇地,該參數判定器130可以例如執行一迭代最優化。以此為目的,該參數判定器130可包含該時域變異模型的一表示130c,其考慮到描述假設為時間演進的一模型參數,允許例如在先前的一組實際變換域參數(表示該音訊信號)的基礎上,運算隨後的一組經估計的變換域參數。在此種情況下,該參數判定器130還可包含一模型參數優化器130d,其中該模型參數優化器130d可受組配以修改該時域變異模型130c的一或多個模型參數,直至使用先前的一組實際變換域參數,藉由該參數化時域變異模型130c所獲得的該組經估計變換域參數與目前的實際變換域參數完全一致(例如在一預定差臨界值內)。
然而,自然地,存在用以在該等實際變換域參數的基礎上,判定該一或多個模型參數140的多個其他方法,因為對於判定模型參數的一般問題,存在不同的數學公式解,使得該模型化結果近似於該等實際變換域參數(及/或其等時間演進)。
由於上面的討論,該裝置100的功能性可參照第1b圖來說明,第1b圖顯示用以獲得描述音訊信號之信號特性時間變異之參數140的一方法150的一流程圖。該方法150包含一可取捨的步驟160,運算描述在一變換域中之音訊信號的實際變換域參數120。該方法150還包含步驟170,依據表示一信號特性的一或多個模型參數,來判定描述變換域參數之時間演進的一變換域變異模型的一或多個模型參數140,使得表示在一模型化時間演進與該等實際變換域參數之間之偏差的一模型錯誤在一預定臨界值下或予以最小化。
在下面,將較詳細地描述根據本發明的一些實施例,以較詳細地說明該發明性的概念。
在本脈絡中,信號x n
的自相關定義為
r k
=E
[x n x n + k
]
且估計為
其中我們假設x n
為非零,且在[1,N]
範圍上。應注意的是,當N
變得無窮大時,該估計值收斂於一真值。而且,大體上,某種開視窗可以在該自相關估計之前用於x n
,以加強其在該[1,N]
範圍之外時為零的假設。
在一實施例中,我們的目的是估計信號變異,也就是說,在音高週期變異的情況下,估計作為時間函數之自相關伸展或收縮的數量。換句話說,我們的目的是判定該自相關滯後k
的時間導數,其表示為。為了清晰,我們現在使用簡寫形式k
來替代k(t)
,且假設t
的相依性是隱含的。從方程式4中,我們獲得
需在根據本發明的一些實施例中克服的一習知問題是,k
的時間導數不可用,且直接的估計很困難。然而,已經認識到的是,導數的一系列規則可用以獲得
及
已經得出的是,使用c
的一估計值,我們可接著在時間t 2
時使用一階泰勒級數來模型化該自相關,在時間t 1
時使用該自相關且該時間導數
在一實際應用中,例如該導數可藉由例如二階估計值來估計
此估計值在一階差值R
(k
+1)-R
(k
-1)上是較佳的,因為該二階估計值不遭受與該一階估計值相同的半樣本相移。為了改良正確性或運算效率,其他的估計值可予以使用,諸如正弦函數之導數的經視窗化音段。
使用最小的均方錯誤標準,我們獲得最優化的問題
其解可容易地獲得為
當該音高週期變異由連續的自協方差視窗而不是該自相關來估計時,也可以持有相同的導數。然而,相比於該自相關,該自協方差包含額外資訊,該額外資訊的使用描述於題名為“在該自協方差域中的模型化”的段落中。
如下面將描述的,該包絡的一時間演進還可在該自相關域中予以估計。
在下面,將參照第2圖給出時間包絡變異之判定的簡單概述。隨後,根據本發明之一實施例,一可能的演算法將予以詳細地描述。
第2圖顯示用以獲得描述音訊信號之包絡時間變異之參數的一方法的一流程圖。第2圖所示之方法的全部內容由200來表示。該方法包含210判定多個連續時間間隔的短時能量值。判定該短時能量值可包含例如,對於多個連續的(時間上交疊或時間上不交疊)自相關視窗,判定在一共用預定滯後(例如滯後0)下的自相關值,以獲得該等短時能量值。步驟220更包含判定適當的模型參數。例如,步驟220可包含判定一多項式時間函數的多項式係數,使得該多項式函數近似於該等短時能量值的時間演進。在下面,用以判定該等多項式係數的一示範演算法將予以描述。例如,該步驟220可包含步驟220a,設置包含與連續時間間隔(在例如時間t1
、t2
、t3
等時開始或居中的時間間隔)相關聯之時間值功率序列的一矩陣(例如由V
表示)。該步驟220還包含步驟220b,設置一目標向量(例如由r
表示),此項目描述該等連續時間間隔的短時能量值。
此外,該步驟220可包含步驟220c,解決由該矩陣(例如由V
表示)及由該目標向量(例如由r
表示)所定義的一線性方程式系統(例如r=Vh
的形式),以獲得作為一解的多項式係數(例如由向量h
所述)。
在下面,關於此步驟的額外細節將予以說明。
在該自相關域中,該時間包絡的模型化是直接的。我們可容易地證明,在滯後零處的自相關相對應於該振幅的均方值。再者,在所有其他滯後處的自相關由該振幅的均方值來調節。換句話說,相同的資訊在任何及所有滯後處都是可用的,藉以僅在滯後零處,充分地考慮該自相關。
因為包絡變異的一階模型是平凡的,所以一較高階模型用於一較佳實施例中。此還作為如何由較高階模型,同時在音高週期變異估計的情況下進行的一範例。
根據方程式5,考慮該包絡變異的M
階多項式模型。我們接著具有M
+1
個未知,且從而對於一解,較佳地使用至少M
+1
個方程式。換句話說,較佳地使用至少M
+1
個連續的自相關視窗(例如由自相關視窗居中時間或自相關視窗開始時間t h
、R(t,t h ))
,且來表示)。接著,在N
+1
個不同時間t
=t h
(或對於N+1個不同的交疊或非交疊時間間隔)處,獲得a(t)
的值(例如在一線性或非線性調節中描述一短期平均功率或短期平均振幅),也就是a(t h )
=R(0,t h ) 1/2
及
因為a(t)
是一多項式(較精確的:近似於一多項式),所以其是存在於文獻中之多個方法解決該多項式係數的傳統問題。
一基本的替代解需使用如下的凡德芒矩陣。
例如,該凡德芒矩陣V
定義為
且可在例如步驟220a中予以運算。一目標向量r
及一解向量h
可定義為
該目標向量可在例如步驟220b中予以運算。
接著
r=Vh
。
因為是不同的,所以如果M
=N
,那麼該倒數V -1
存在且我們在例如步驟220c中獲得h=V -1 r
。
如果M>N,那麼虛倒數生成答案。然而,如果N及M很大,那麼在該技藝中已知的較多精確方法可用於有效解。
儘管上面呈現了估計值測量變異,但是存在一些實施例中尚未克服之假設局部穩定的步驟。也就是,藉由習知方式(例如使用有限長度的一自相關視窗)之該自相關的估計假設該信號應該是局部穩定的。在下面,將顯示的是,信號變異不會將偏差引入估計值中,使得該方法可視為充分正確的。
為了分析該自相關的偏差,假設該音高週期變異在此時間間隔中是恆定的。再者,假設我們具有一信號x(t)
,該信號x(t)
在t 0
處具有週期長度 T(t 0 ) = T 0
,接著其在一第二點t 1
處具有週期長度 T(t 1 ) = T 0 exp(-c(t 1 - t 0 ))
。在該間隔[t 0 , t 1 ]
上的平均週期長度是
觀察到的是,上面該運算式的後部分是一“雙曲線正弦”函數,我們將由下式來表示其
接著對於長度為Δt win
=t 1
-t 0
的一視窗,我們具有
藉由在T
與k
之間的類似,此運算式還量化一自相關估計值由於信號變異而伸展的數量。然而,如果開視窗用於自相關估計之前,則由於信號變異而產生的偏差獲得減小,因為該估計值接著收斂於該分析視窗的中間點周圍。
當從二個連續的有偏差自相關音框中估計c
時,每一訊框的k
值是有偏差的,且遵循公式
其中及是每一訊框的中間點。
參數c
可透過定義及視窗之間的距離來解決,藉以
其中我們觀察到的是,Δt win
的所有實例已經分別刪除。換句話說,即使信號變異使該自相關估計值有偏差,從二個自相關中所擷取的變異也無偏差。
然而,儘管信號變異不會使該變異估計值有偏差,但是由於過於短的分析視窗所導致的估計錯誤不可能會避免。一短分析視窗的自相關估計傾向於產生錯誤,因為其依據該分析視窗相對於該信號相位的位置而定。較長的分析視窗減小了此種類型的估計錯誤,但是為了保持局部恆定變異的假設,必須尋求一折衷方法。在該技藝中大體上可接受的一選擇是其長度是最低期望週期長度兩倍的一分析視窗。然而,較短的分析視窗也可以使用,如果所增加的錯誤時是可接收的。
在時間包絡變異方面,該等結果是相似的。對於一階模型,包絡變異的估計值無偏差。而且,準確地來說,相同的邏輯也可用於自協方差估計值,藉以對於該自協方差持有相同的結果。
在下面,一音高週期變異估計之本發明的一可能應用將予以描述。首先,將參照第3圖來描述一般概念,第3圖顯示用以根據本發明之一實施例,獲得描述音訊信號之音高週期時間變異之參數的一方法300的一流程圖。隨後,將給出該方法300的實施細節。
第3圖所示之方法300包含一可取捨的第一步驟310,執行一輸入音訊信號的一音訊信號預處理。該音訊信號預處理可包含,例如透過減少任何有害的信號成分,來促進擷取所期望的音訊信號特性的一預處理。例如,下面所述的共振結構模型化可用作一音訊信號預處理步驟310。該方法300還包含步驟320,相對於一第一時間或時間間隔t 1
,且相對於多個不同的自相關滯後值k
,判定一音訊信號x n
的一第一組自相關值R(k,t 1 )
。對於該等自相關值的定義,參照下面的描述。
該方法300還包含步驟322,相對於一第二時間或時間間隔t 2
,且相對於多個不同的自相關滯後值k
,判定該音訊信號x n
的一第二組自相關值R(k,t 2 )
。因此,該方法300的步驟320及322可提供自相關值對,每一對自相關值包含與該音訊信號之不同時間間隔,但與相同自相關滯後值k
相關聯的二個自相關(結果)值。該方法300還包含步驟330,例如相對於在t 1
處開始的第一時間間隔或相對於在t 2
處開始的第二時間間隔,在自相關滯後上判定該自相關的偏導數。可選擇地,在自相關滯後上的偏導數還可相對於在時間或位於或延伸於時間t 1
與時間t 2
之間的時間間隔上的不同實例來運算。
因此,相對於多個不同自相關滯後值k
,例如相對於該第一組自相關值及第二組自相關值在步驟320、322中相對於其而判定的此等自相關滯後值,在自相關滯後上的自相關變異R(k,t)
可獲得判定。
自然地,針對於步驟320、322、330的執行,不存在固定的時間次序,使得該等步驟可以部分地或完全地並行執行,或以一不同的次序執行。
該方法300還包含步驟340,使用在自相關滯後上的第一組自相關值、第二組自相關值及自相關的偏導數,來判定一變異模型的一或多個模型參數。
當判定該一或多個模型參數時,在一自相關值對(如上所述)的自相關值之間的一時間變異可予以考慮。例如依據在滯後上的自相關變異,在該自相關值對的自相關值之間的差值可予以加權。在加權該自相關值對之自相關值之間的差值中,該自相關滯後值k
(與該自相關值對相關聯)也可視為一加權因數。因此,形式的總和項
用於判定該一或多個模型參數,其中該總和項可與一給定自相關滯後值k
相關聯,且其中該總和項包含形式為
R
(k
,h
+1)-R
(k
,h
)
的在一自相關值對之二個自相關值之間的差值與一滯後相關加權因數的乘積,例如其形式為
該自相關滯後相關加權因數允許考慮事實上,相比於對於小自相關滯後值,該自相關對於較大自相關滯後值能較集中地延伸,因為包括該自相關滯後值因數k
。而且,在滯後上自相關值變異的合併使其可能在局部(相等自相關滯後)自相關值對的基礎上,估計該自相關函數的擴展或壓縮。因而,該自相關函數(在滯後上)的擴展或壓縮可予以估計,而不執行一型樣調節及匹配功能性。相反地,該等個別總和項基於局部(單一滯後值k)貢獻 R ( k,h + 1 )、 R ( k ,h ) 、
然而,為了獲得來自該自相關函數的大量資訊,與不同滯後值k相關聯的總和項可相結合,其中該等個別總和項仍然是單一滯後值總和項。
此外,歸一化可以在判定該變異模型之模型參數時予以執行,其中該歸一化因數採用如下形式
且可包含例如單一自相關滯後值項的總和。
換句話說,該一或多個模型參數的判定可包含,對於一給定且共用自相關滯後值,但對於不同時間間隔,且對於在滯後上該自相關值之變異的運算(自相關的k
-導數),自相關值的比較(例如差值形成或減少),對於一給定且共用時間間隔但不同自相關滯後值,自相關值的比較。然而,對於不同時間間隔及對於不同自相關滯後值之可能會引起相當大影響的自相關值比較(或減少)予以避免。
該方法300可取捨地更包含步驟350,在步驟340中所判定之一或多個模型參數的基礎上,運算諸如一時間音高週期輪廓的一參數輪廓。
在下面,參照第3a圖所述之概念的可能實施將予以詳細地說明。
作為本創新的一具體應用,我們應該在下面證明估計在該自相關域中一時間信號之音高週期變異的一方法實施例。在第3b圖中所示意表示的方法(360)包含下面步驟(或由下面步驟組成):
1. 對於長度為Δt win
且由Δt step
分離的視窗h
及h
+1
(例如由開視窗函數w n
開視窗),估計(320、322;370)x n
的自相關R(k,h)
2. 例如藉由下式,對於視窗(或“訊框”)h
,估計(330;374)自相關的k
-導數
3 .
使用下式(來自式8),來估計視窗或訊框h
與h
+1
之間的音高週期變異c h
如果所期望的是一(可取捨歸一化的)音高週期輪廓,而不僅是該音高週期變異測量c n
,則應該加入另一步驟:
4. 使視窗或訊框h
的中間點是t h
。接著在視窗或音框h
與之h
+1
間的音高週期輪廓為
其中p
(t h
)從先前的該對訊框或音高週期幅值之實際估計值中獲得。如果該音高週期幅值中沒有量測是可用的,則我們可以將p(0)
設定為任意選擇的開始值,例如p(0)
=1
,且迭代地計算所有連續視窗的音高週期輪廓。
在該技藝中已知的多個預處理步驟(310)可用以改良估計值的正確性。例如,語音信號大體上具有在80至400Hz範圍中的一基頻,且如果期望估計音高週期中的改變,有利的是帶通濾波器輸入在80至1000Hz範圍中的信號,以保持該基本波及少量的第一諧波,而削弱可能特別地降低該等導數估計值,且從而還降低整體估計值的品質的高頻成分。
在上面,該方法用於該自相關域中,但是該方法,如做適當變動,可取捨地實施於諸如自協方差域的其他域中。類似地,在上面,該方法出現於音高週期變異估計的應用中,但是相同的方式可用以估計在信號的其他特性中諸如時間包絡幅值的變異。而且,該(等)變異參數可以由不止兩個的視窗來估計,以增加正確性,或當該變異模型公式需要額外的自由度時。所呈現方法的一般形式描述於第7圖中。
如果與該輸入信號之特性有關的額外資訊是可用的,則臨界值可取捨地用以移除不可實行的變異估計值。例如,一語音信號的音高週期(或音高週期變異)很少超過15八度/秒,藉以超過此值的任何估計值典型地是無語音的或一估計錯誤,且可以忽略。類似地,來自式7的最小模型化錯誤可取捨地用作估計值品質的指示符。特別的是,可能對該模型化錯誤設定一臨界值,使得基於具有大模型化錯誤之模型的一估計值忽略,因為在該模型中所呈現的改變藉由該模型不會得到良好地描述,且該估計值自身是不可靠的。
在下面,一音訊信號預處理的概念將予以描述,其可用以改良該音訊信號之特性(例如該音高週期變異的)的估計。
在語音處理中,共振結構大體上藉由線性預測(LP)模型(參見參照[6]及其導數,諸如捲曲線性預測(WLP)(參見參照[5])或最小變異不失真回應(MVDR)(參見參照[9])來模型化。再者,儘管語音恆定改變,但是該共振模型通常內插於該線性頻譜配對(LSP)域(參見參照[7])中或等效地,內插於電抗頻譜配對(ISP)域(參見參照[1])中,以獲得在分析視窗之間的平滑轉變。
然而,對於共振的LP模型化,該歸一化變異不是最重要的,因為在一些情況下歸一化該LP模型不會產生相關的優點。特別的是,在語音處理中,相比於在其等位置中的改變,共振的位置通常是較重要且較有趣的資訊。因而,儘管也可能公式化共振的歸一化變異模型,但是我們集中於消去共振影響的較有趣問題。
換句話說,一模型對於共振改變的包含物可用以改良音高週期變異或其他特性估計的正確性。也就是說,透過在音高週期變異估計之前,消去該信號之共振結構改變的影響,可能減小將共振結構改變解譯為音高週期改變的機會。共振位置及音高週期二者均可改變高達大概15八度每秒,其意味著改變是極為快速的,其等大概在相同的範圍上改變,且其等的貢獻可能會容易混淆。
為了可取捨地消去共振結構的影響,我們首先對於每一訊框估計一LP模型,透過濾波移除共振結構,且將該經濾波資料用於該音高週期變異估計中。對於音高週期變異估計,重要的是,該自相關具有一低通特性,且從而其有用於由該高通濾波信號來估計該LP模型,而僅消去該原始信號中的共振結構(即不高通濾波),藉以該經濾波的資料將具有一低通特性。如已知的,該低通特性使得能較容易地估計該信號的導數。該濾波過程自身根據該應用的運算需求,可執行於時域、自相關域或頻域中。
特別的是,用以消去該自相關值共振結構的預處理方法可描述為
1. 由一固定高通濾波器濾波該信號
2. 估計該高通濾波信號之每一音框的LP模型。
3. 透過由該LP濾波器濾波該原始信號來移除該共振結構的貢獻。
步驟1中的固定高通濾波器可取捨地由一信號適應性濾波器來替代,諸如相對於每一訊框所估計的一低階LP模型,如果需要較高位準的正確性。如果低通濾波用作該演算法中另一階段的一預處理步驟,則此高通濾波步驟可忽略,只要該低通濾波出現在共振消除之後。
步驟2中的LP估計方法可根據該應用的需求予以自由地選擇。良好保證的選擇可能是,例如習知的LP(參見參照[6])、捲曲LP(參見參照[5])及MVDR(參見參照[9])。模型次序及方法應該選擇,使得該LP模型不是模型化該基頻,而且僅模型化該頻譜包絡。
在步驟3中,由該LP濾波器濾波該信號可在視窗接視窗的基礎上或在該原始連續信號上執行。如果不開視窗地濾波該信號(即濾波連續信號),則使用在該技藝中已知的諸如LSP或ISP的內插方法,來降低在分析視窗之間的轉變處信號特性的突然改變,這是有用的。
在下面,共振結構移除(或減少)的過程將參照第4圖予以簡單概述。作為第4圖所示流程圖的方法400包含步驟410,從一輸入音訊信號中減少或移除一共振結構,以獲得一共振結構減少的音訊信號。該方法400還包含步驟420,在該共振結構減少的音訊信號的基礎上,判定一音高週期變異參數。大體上來說,減少或移除共振結構的步驟410包含子步驟410a,在該輸入音訊信號的高通濾波版本或信號適應性濾波版本的基礎上,估計該輸入音訊信號之線性預測模型的參數。該步驟410還包含子步驟410b,在該等所估計參數的基礎上,濾波該輸入音訊信號的寬頻版本,以獲得共振結構減少的音訊信號,使得該共振結構減少的音訊信號包含一低通特性。
自然地,如上所述,該方法400可予以修改,例如如果該輸入音訊信號已經獲得低通濾波。
大體上,可以說該輸入音訊信號中共振結構的減少或移除可用作一音訊信號預處理,該音訊信號預處理與不同參數(例如音高週期變異、包絡變異等)相結合,且還與不同域(例如自相關域、自協方差域、傅利葉變換域等)中的處理相結合。
在下面,將描述的是,表示一音訊信號之時間變異的模型參數可以如何在一自協方差域中估計。如上所述,不同的模型參數,如一音高週期變異模型參數或一包絡變異模型參數相同,可獲得估計。
該自協方差定義為
其中x n
表示該輸入音訊信號的樣本。應注意的是,此處與該自相關不同的是,我們不會假設x n
僅在該分析間隔中為非零。也就是說,x n
不需要在分析之前予以開視窗。與該自相關相同,對於一穩定信號,當N
→∞時該自協方差收斂於E
[x n x n + k
]。
相比於自相關,該自協方差是一極為相似域,但具有某一額外資訊。特別的是,當處於該自相關域中,該信號的相位資訊丟棄,而在該協方差中其獲得保留。當觀察穩定信號時,我們通常得出相位資訊是沒有用的,但是對於快速變化的信號,其可能會是極有用的。事實上潛在的不同是,對於穩定信號,該期望值與時間不相關
E
[x n x n + k
]=E
[x n x n - k
]
但是對於一非穩定信號,則相關。
假設在時間t
(或對於開始於時間t
或在時間t
居中的一時間間隔)處,我們估計信號x n
的自協方差Q(k,t)
。接著我們可以容易看到,其保持為E
[Q(k,t)
]=E
[Q(
-k,t
+k)
]。在下面,我們將採用該等期望值(由操作符E[...]所述)是隱含的一符號,藉以Q(k,t)
=Q(
-k
,t
+k)
。類似地,可以保持此關係Q(
-k,t)
=Q(k,t
-k)
。
透過使用局部恆定時間包絡變異的假設,我們具有
E
[x
(t
)]=e ht E
[x
(0)]
及類似地
Q
(k
,t
)=e 2 ht Q
(k
,0)。
從而Q(k,t)
的時間導數是
使用此等關係式,現在我們可以形成居中於t之Q(k,t)
的一階泰勒估計值
例如,該時移可以作為自相關滯後在相同的單元中測量,使得在下面可以保持:
現在所有項都在時間t(或對於相同的時間間隔)上出現於相同點處,所以我們可以定義q k
=Q
(k
,t
)及。
記得我們的目的是估計該包絡變異h
。因為持有該上面關係式,所以對於所有k
,例如,我們都可以最小化平方模型化錯誤
該最小化可容易地得出
此處我們已經選擇使用最小均方錯誤(MMSE)作為最優化標準,但是在該技藝中已知的任何其他標準也可良好地用於此處,及其他實施例中。同樣地,我們已經選擇對在k
=-N
與k
=N
之間所有滯後上實行估計,但是指數的選擇可用於獲得運算效率及正確性的好處,如果在此期望的話,且還可用於其他實施例中。
應注意的是,相比於自相關,對於該自協方差,我們不需要使用連續的分析視窗,而是可以由一單一視窗來估計該時間包絡變異。相對於由一單一自協方差視窗來估計音高週期變異的一相似方式可容易地獲得發展。
再者,應注意的是,相比於音高週期變異估計,對於包絡估計,我們不需要由一低通濾波器預先濾波該信號,因為不需要該自協方差的k
-導數。
作為本發明概念之具體應用的另一範例,我們應該證明估計該自協方差域中一信號的時間包絡變異的方法。該方法包含下面步驟(或由下面步驟組成):
2. 透過計算下式得出該時間包絡變異h
如果期望一歸一化包絡輪廓僅替代該包絡變異測量h
,則應該可取捨地加入另一步驟:
3. 該包絡輪廓是
其中a0
從該先前訊框或該包絡幅值的一實際估計值中獲得。如果該包絡幅值中沒有量測是可用的,則我們可設定a 0
=0,且對於所有連續的視窗,迭代地計算該包絡輪廓。
如果與該輸入信號之特性有關的額外資訊是可用的,則臨界值可取捨地用以移除不可實行的變異估計。例如,式11中的最小模型化錯誤可取捨地用作該估計值品質的一指示符。特別的是,可能設定該模型化錯誤的一臨界值,使得基於具有大模型化錯誤之一模型的一估計值可以忽略,因為在該模型中所呈現的改變藉由該模型不會獲得良好地描述,且該估計值自身是不可靠的。
為了進一步改良該正確性,可能首先可取捨地消去該輸入信號的共振結構(如題目為“在該自相關域中的變異估計-共振結構模型化”的段落中所說明)。而且,應注意的是,在語音信號方面,我們接著獲得替代該語音信號(語音聲壓波形)的一聲壓波形估計值,且該時間包絡從而模型化該聲壓包絡,這依據該應用而定,可以是或可以不是期望的結果。
類似地,與該包絡變異在先前段落中的估計相同,該音高週期變異也可以由一單一自協方差視窗來直接估計。然而,在此段落中,我們將證明如何由一單一自協方差視窗來聯合估計音高週期及包絡變異的較一般方法。接著對於在該技藝中具有通常知識者直截了當的是,僅修改用以估計該音高週期變異的方法。應理解的是,此處不一定在該自協方差域中使用任何開視窗。例如,其足以運算該等自協方差參數,如在題目為“在該自協方差域中的模型化-概述”的段落中所述。然而,該表示“單一自協方差視窗”表示,該音訊信號的一單一固定部分的自協方差估計值可用以估計變異,相比於該自相關,其中該音訊信號的至少二個固定部分的自相關估計值必須用以估計變異。使用一單一自協方差視窗是可能的,因為在滯後+k
及-k
處的自協方差分別表示一給定樣本的正向及反向自協方差k
步驟。換句話說,因為該等信號特性隨著時間而發展,所以一樣本的正向及反向自協方差將是不同的,且在正向及反向自協方差中的此差值表示信號特性中的改變幅值。此估計在該自相關域中是不可能的,因為該自相關域是對稱的,也就是說,自相關的正向及反向是相同的。
考慮一信號x(t)
=a(t)f(b(t))
,其中振幅及音高週期變異藉由一階模型來模型化,藉以a
(t
)=a 0 e ht
且b
(t
)=b 0 te ct
。接著x(t)
的自協方差Q x (k)
是
Q x
(k
,t
)=E
[x
(t
)x
(t
+k
)]=a
(t
)a
(t
+k
)E
[f
(b
(t
))f
(b
(t
+k
))]=a
(t
)a
(t
+k
)Q f
(k
,t
) 13)
其中Q f (k,t)
是f(b(t))
的自協方差。
使用方程式6、10及13,我們獲得Q x (k,t)
的時間導數為
然而,上面方程式包含ch
的乘積,且從而不是c
與h
的一線性函數。為了得出參數的有效解,我們可假設|ch
|極小,藉以我們可約計
如上所述,我們可定義q k
=Q x (k,t)
,且形成該一階泰勒估計值
在真實值q k
與泰勒估計值之間的平方差值將在得出最佳(或至少近似於最佳)c
及h
時,再次作為目標函數。我們獲得最小化問題
其解可容易地獲得為
其中
雖然該等公式看似很複雜,但是A
及u
的構造可僅使用長度為2N(滯後零可以被省略)的向量操作來執行,且c
及h
的解可使用2 x 2矩陣A
的倒置來執行。從而該運算複雜度僅是適度的O(N)
(即N階的)。
音高週期及包絡變異之聯合估計的應用遵循如題目為“在該自協方差域中的模型化-應用”之段落中所呈現之相同方式,但是使用步驟2中的式14。
在下面,模型化該自協方差域的不同方式將參照第5圖予以簡單討論。第5圖顯示根據本發明之一實施例,用以獲得描述音訊信號之信號特性時間變異之參數的一方法500的一方塊示意圖。該方法500包含作為一可取捨步驟510的一音訊信號預處理。步驟510中的該音訊信號預處理可例如,包含該音訊信號的濾波(例如一低通濾波)及/或一共振結構減少/移除,如上所述。該方法500可更包含步驟520,獲得相對於一第一時間間隔且相對於多個不同自協方差滯後值k
之描述該音訊信號之一自協方差的第一自協方差資訊。該方法500還可包含步驟522,獲得相對於一第二時間間隔且相對於該等不同自協方差滯後值k
之描述該音訊信號之一自協方差的第二自協方差資訊。而且,該方法500可包含步驟530,相對於該等不同自協方差滯後值k
,評估在該第一自協方差資訊與該第二自協方差資訊之間的差值,以獲得一時間變異資訊。
而且,方法500可包含步驟540,對於多個不同滯後值,估計在滯後上之自協方差資訊的一“局部”(即在一各自滯後值的環境中)變異,以獲得一“局部滯後變異資訊”。
而且,該方法500可大體上包含步驟550,將該時間變異資訊與關於在滯後上自協方差資訊之局部變異q'
的資訊(也由“局部滯後變異資訊”表示)相結合,以獲得模型參數。
當將該時間變異資訊與關於在滯後上自協方差資訊之局部變異q'
的資訊相結合時,該時間變異資訊及/或關於在滯後上自協方差資訊之局部變異q'
的資訊可根據相對應的自協方差滯後k
來調節,例如,與該自協方差滯後k
或其效力成比例地調節。
可選擇地,步驟520、522及530可由步驟570、580來替代,如下面將所說明的。在步驟570中,描述相對於一單一自協方差視窗,但是相對於不同自協方差滯後值k之音訊信號的自協方差的一自協方差資訊可予以獲得。例如,一自協方差值Q
(k,t
)=q k
及一自協方差資訊q - k
=Q
(-k,t
)可予以獲得。
隨後,在與不同滯後值(例如-k
、+k
)相關聯的自協方差值之間的加權差值,例如2k
(q k
-q - k
)及/或k2
(q k
-q - k
),可在步驟580中相對於多個不同自協方差滯後值k
來評估。該等加權(例如2k
、k2
)可依據各自所減去的自協方差值之滯後值的差值(例如在該等自協方差值q k
、q - k
之間滯後中的差值:k
-(-k
)=2k
)來選擇。
綜上所述,存在許多不同的方式來獲得在自協方差域中的一或多個所期望模型參數。在該等較佳實施例中,一單一自協方差視窗可能就足以估計一或多個時間變異模型參數。在此種情況下,在與不同自協方差滯後值相關聯之自協方差值之間的差值可相比較(例如相減)。可選擇地,相對於不同時間間隔,但是相同自協方差滯後值的自協方差值可以相比較(例如相減),以獲得時間變異資訊。在這兩種情況下,在推導模型參數時,可引入考慮自協方差差值或自協方差滯後的加權。
除了該自相關及自協方差,在此所揭露的概念還可以在諸如傅利葉頻譜的其他域中予以公式化。當將該方法用於域Ψ中時,該方法可包含下面步驟:
1. 將時間信號變換為域Ψ。
2. 在域Ψ中,以該等變異模型參數以明確形式存在的形式來計算時間導數。
3. 形成該信號在域Ψ中的泰勒級數近似值,且將其最小化使其適合於真實的時間演進,以獲得該等變異模型參數。
4. (可取捨的)計算信號變異的時間輪廓。
在一實際應用中,該發明性概念的應用可例如,包含將該信號變換為所期望的域,且判定一泰勒級數近似值的參數,使得由該泰勒級數近似值所表示的模型獲得調整,以適合於該變換域信號表示的實際時間演進。
在一些實施例中,該變換域也可能是顯然的,也就是說,可能將該模型直接用於該時域中。
如在先前段落中所呈現,該(等)變異模型可以例如是(一或多個)局部恆量、(一或多個)多項式或具有(一或多個)其他功能形式。
如在先前段落中所證明的,該泰勒級數近似值可用於橫跨連續視窗,在一視窗內,或在視窗內與橫跨連續視窗的結合。
該泰勒級數近似值可以是任何階數,儘管一階模型大體上是吸引人的,因為接著該等參數可作為線性方程式的解獲得。而且,還可以使用在該技藝中已知的其他近似值方法。
大體上,該均方錯誤(MMSE)的最小化是一有用的最小化標準,因為接著參數可以作為線性方程式的解獲得。其他最小化標準可用以改良穩健性或用於該等參數較佳地解譯於另一最小化域中時。
如上所述,該發明性概念可用於編碼一音訊信號的裝置中。例如,在一音訊編碼器(或一音訊解碼器,或任何其他音訊處理裝置)中無論在什麼時候需要關於一音訊信號之時間變異的一資訊,該發明性概念都特別有用。
第6圖顯示根據本發明之一實施例,一音訊編碼器的一方塊示意圖。第6圖所示之音訊編碼器其全部內容由600來表示。該音訊編碼器600受組配以接收一輸入音訊信號的一表示606(例如一音訊信號的一時域表示),及在其基礎上,提供該輸入音訊信號的一編碼表示630。該音訊編碼器600可取捨地,包含一第一音訊信號預處理器610,及進一步可取捨地,一第二音訊信號預處理器612。而且,該音訊編碼器600可包含一音訊信號編碼器核心620,其可受組配以接收該輸入音訊信號的表示606,或例如由該第一音訊信號預處理器610所提供之表示606的一經預處理版本。該音訊信號編碼器核心620進一步受組配以接收描述該音訊信號606之信號特性時間變異的參數622。而且,該音訊信號編碼器核心620可受組配以根據考慮於該參數622中的一音訊信號編碼演算法,來編碼該音訊信號606,或其各自的預處理版本。例如,該音訊信號編碼器核心620的一編碼演算法可獲得調整,以遵循該輸入音訊信號的一變化特性(由該參數622所描述),或補償該輸入音訊信號的變化特性。
因而,該音訊信號編碼以一信號適應性方式來執行,考慮該等信號特性的一時間變異。
該音訊信號編碼器核心620可予以例如最優化,以編碼音樂音訊信號(例如,使用一頻域編碼演算法)。可選擇地,該音訊信號編碼器可予以最優化來語音編碼,且從而還可被視為一語音編碼器核心。然而,自然地,該音訊信號編碼器核心或語音編碼器核心還可受組配以遵循同時對編碼音樂信號及語音信號呈現良好性能的一所謂的“混合”方式。
例如,該音訊信號編碼器核心或語音編碼器核心620可構造(或包含)一時間捲曲編碼器核心,從而使用描述一信號特性(例如音高週期)之時間變異的參數622作為一捲曲參數。
該音訊編碼器600可從而包含參照第1圖所述之一裝置100,其中裝置100受組配以接收該輸入音訊信號606,或其經預處理的版本(由該可取捨的音訊信號預處理器612所提供),及在其基礎上,提供描述該音訊信號606之信號特性(例如音高週期)之時間變異的參數資訊622。
因而,該音訊編碼器606可受組配以利用在此所述的任何發明性概念來在該輸入音訊信號606的基礎上獲得該參數622。
依據某些實施需求而定,本發明的實施例可以實施於硬體或軟體中。該實施可使用例如一軟碟、一DVD、一CD、一ROM、一PROM、一EPROM、一EEPROM或一FLASH記憶體之具有儲存於其上之電氣可讀控制信號的一數位儲存媒體來執行,其與一可規劃電腦系統協作(或能夠協作),使得該各自方法獲得執行。
根據本發明的一些實施例包含具有電氣可讀控制信號的一資料載體,其能夠與一可規劃電腦系統協作,使得在此所述之方法之一獲得執行。
大體上,本發明的實施例可以實施為具有一程式碼的一電腦程式產品,該程式碼可操作地用以在該電腦程式產品執行於一電腦上時,執行該等方法之一。該程式碼可以儲存於例如一機器可讀載體上。
其他實施例包含用以執行在此所述方法之一,且儲存於一機器可讀載體上的電腦程式。
換句話說,該發明性方法的一實施例是具有一程式碼的一電腦程式,該程式碼用以在該電腦程式執行於一電腦上時,執行該等方法之一。
該等發明性方法的另一實施例是包含儲存於其上用以執行在此所述方法之一的電腦程式的一資料載體(或一數位儲存媒體,或一電腦可讀媒體)。
該發明性方法的另一實施例是表示用以執行在此所述之電腦程式的一資料流或一序列信號。例如,該資料流或該序列信號可受組配以經由一資料通訊連接體,例如經由網際網路來傳輸。
另一實施例包含受組配以或適用於執行在此所述方法之一的一處理裝置,例如一電腦或一可規劃邏輯設備。
另一實施例包含具有安裝於其上用以執行在此所述一或多個方法的電腦程式的一電腦。
在一些實施例中,一可規劃邏輯元件(例如一現場可規劃閘極陣列)可用以執行在此所述方法中的一些或所有功能。在一些實施例中,一現場可規劃閘極陣列可與一微處理器協作,以執行在此所述方法之一。
在下面,該發明性概念將參照第7圖來簡單概述,第7圖顯示根據本發明之一實施例之一方法700的一流程圖。該方法700包含步驟710,計算一輸入信號(例如一輸入音訊信號)的一變換域表示。該方法700更包含步驟730,最小化描述在該域中變異影響之一模型的模型化錯誤。720模型化該變換域中變異影響可作為方法700的一部分來執行。但是還可作為一預備步驟來執行。
然而,當在步驟730中最小化模型化錯誤時,該輸入音訊信號的變換域表示及描述變化影響的模型都可予以考慮。描述該變異影響的模型可以描述一隨後變換域表示之估計值的形式,用作先前(或隨後,或其他)實際變換域參數的明確函數,或以描述最佳(或至少足夠良好)變異模型參數的形式,用作(該輸入音訊信號之一變換域表示的)多個實際變換域參數的明確函數。
步驟730中將該模型化錯誤最小化產生描述一變異幅值的一或多個模型參數。
產生一輪廓的該可取捨的步驟740產生對該輸入(音訊)信號之信號特性輪廓的描述。
概括地說,上面根據本發明之實施例提出在信號處理中一個最基本的問題,即一信號改變多少?
根據本發明,實施例提供用以估計信號特性中諸如基頻或時間包絡改變之變異的一方法(及一裝置)。對於在頻率中的改變,八度跳躍顯然的是使僅在該自相關(或自協方差)中的錯誤強健,但是有效且未偏移。
特別的是,根據本發明之該等實施例包含下面特徵:
‧在(例如該輸入音訊信號的)信號特性中的變異予以模型化。在音高週期變異或時間包絡方面,該模型指明該自相關或自協方差(或另一變換域表示)如何隨著時間改變。
‧儘管信號特性不能假設為局部恆定的,但是在信號特性中的變異(其在一些實施例中可予以歸一化)可假設為恆定的,或遵循一基礎形式。
‧透過模型化該信號改變,其變異(=該等信號特性的時間演進)可予以模型化。
‧該信號變異模型(例如是暗示或明確的基礎表示)透過使該模型化錯誤最小化,藉以該等模型參數量化變異幅值,而適合於觀察(例如透過變換該輸入音訊信號而獲得的實際變換域參數)。
‧在音高週期變異估計方面,該變異由該信號直接地估計,而沒有音高週期估計的一中間步驟(例如該音高週期之絕對值的估計)。
‧透過模型化音高週期中的變異,該變異影響可由該自相關的任何滯後及不只是在整數倍的週期長度處予以測量,從而使所有可用的資料能夠使用,且從而獲得高位準的強健性及穩定性。
‧即使由一非穩定信號估計該自相關或自協方差對該等自相關及自協方差估計引入了偏移,在本作品中的變異估計在一些實施例中將仍然是未偏移的。
‧當該信號的實際特性被找出,且不僅是特性的變異,該方法可取捨地提供可以適用於沿著一輪廓估計信號特性的一正確且連續的特性。
‧在語音及音訊編碼中,所呈現的方法可用作該時間捲曲MDCT的輸入,使得已知音高週期中的改變時,在使用該MDCT之前,其等影響可以由時間捲曲消去。此將減小頻率成分的模糊,且從而改良能量集中。
‧當由該自相關估計時,連續的分析視窗可用以獲得時間改變。當由該自協方差估計時,僅需要一單一視窗來測量該時間改變,但是連續視窗在期望的時候可予以使用。
‧聯合估計在音高週期及時間包絡中的改變相對應於該信號的AM-FM分析。
在下面,將簡單概述根據本發明的一些實施例。
根據一層面,根據本發明的一實施例包含一信號變異估計器。該信號變異估計器包含在一變換域中的一信號變異模型化、在變換域中信號之時間演進模型化、及適合於輸入信號的一模型錯誤最小化。
根據本發明之一層面,該信號變異估計器估計在該自相關域中的變異。
根據另一層面,該信號變異估計器估計音高週期中的變異。
根據一層面,本發明產生一音高週期變異估計器,其中該變異模型包含:
‧用於在自相關滯後中移位元的一模型。
‧自相關滯後導數的估計。
‧關係式的一模型(i.)自相關滯後的時間導數,(ii.)自相關的時間導數,及(iii.)自相關滯後導數。
‧自相關的泰勒級數估計
‧模型擬合的一MMSE估計,其產生該(等)音高週期變異參數。
根據本發明之一層面,該音高週期變異估計器可以在語音及音訊編碼中,與時間捲曲修改型離散餘弦變換(TW-MDCT,參見參照[3])相結合,作為該時間捲曲修改型離散餘弦變換(TW-MDCT)的輸入使用。
根據本發明之一層面,該信號變異估計器估計在該自相關域中的變異。
根絕一層面,該信號變異估計器估計在時間包絡中的一變異。
根據一層面,該時間包絡變異估計器包含一變異模型,該變異模型:
‧相對於作為滯後k的函數之自協方差上時間包絡變異影響的一模型。
‧自協方差的一泰勒級數估計值。
‧模型擬合的一MMSE估計值,其產生該(等)包絡變異參數。
根據一層面,共振結構的影響在該信號變異估計器中予以消去。
根據另一層面,本發明包含將一信號的某些特性的信號變異估計用作額外的資訊,來得出此特性正確且強健的估計。
概括地說,根據本發明的實施例使用變異模型來分析一信號。對比上,習知的方法需要將音高週期變異的估計作為其等演算法的輸入,但是不提供用以估計該變異的一方法。
[1] Y. Bistritz and S. Peller. Immittance spectral pairs(ISP) for speech encoding. In Proc. Acou Speech Signal Processing,ICASSP-93,Minneapolis,MN,USA,April 27-30 1993.
[2] A. de Cheveignand H. Kawahara. YIN,a fundamental frequency estimator for speech and music. J Acoust Soc Am,111(4):1917-1930,April 2002.
[3] B. Edler, S. Disch, R. Geiger,S. Bayer,U. Krmer,G. Fuchs,M. Neundorf,M. Multrus,G. Schuller and H. Popp. Audio processing using high-quality pitch correction. US Patent application 61/042,314,2008.
[4] J. Herre and J.D. Johnston. Enhancing the performance of perceptual audio coders by using temporal noise shaping(TNS). In Proc AES Convention 101,Los Angeles,CA,USA,November 8-11 1996.
[5] A. Hrm. Linear predictive coding with modified filter structures. IEEE Trans. Speech Audio Process.,9(8):769-777,November 2001.
[6] J. Makhoul. Linear prediction: A tutorial review. Proc. IEEE,63(4): 561-580,April 1975
[7] K.K. Paliwal. Interpolation properties of linear prediction parametric representations. In Proc Eurospeech’95,Madrid,Spain,September 18-21 1995.
[8] L. Villemoes. Time warped modified transform coding of audio signals. International Patent PCT/EP2006/010246,Published 10.05.2007.
[9] M. Wolfel and J. McDonough. Minimum variance distortionless response spectral estimation. IEEE Signal Process Mag.,22(5):117-126,September 2005.
100...裝置
110...變換器
118...音訊信號之時域表示
120...實際變換域參數
130...參數判定器
130a...變異模型參數計算方程式
130b...變異模型參數計算器
130c...時域變異模型表示
130d...模型參數優化器
140...模型參數
150...方法
160/170...步驟
200...方法
210/220/220a~220c...步驟
300...方法
310~350...步驟
360...方法
370~378...步驟
400...方法
410...步驟
410a/410b...子步驟
420...步驟
500...方法
510~580‧‧‧步驟
600‧‧‧音訊編碼器
606‧‧‧輸入音訊信號表示
610‧‧‧第一音訊信號預處理器
612‧‧‧第二音訊信號預處理器
620‧‧‧音訊信號編碼器核心
622‧‧‧參數
630‧‧‧音訊信號的經編碼表示
700‧‧‧方法
710~740‧‧‧步驟
第1a圖顯示用以獲得描述音訊信號之信號特性時間變異之參數的一裝置的一方塊示意圖;
第1b圖顯示用以獲得描述音訊信號之信號特性時間變異之參數的一方法的一流程圖;
第2圖顯示根據本發明之一實施例,用以獲得描述信號包絡之時間變異之參數的一方法的一流程圖;
第3a圖顯示根據本發明之一實施例,用以獲得描述一基週之時間變異之參數的一方法的一流程圖;
第3b圖顯示用以獲得描述該基週之時間演進之參數的該方法的一簡化流程圖;
第4圖顯示根據本發明之一實施例,用以獲得描述一基週之時間變異之參數的另一改良方法的一流程圖;
第5圖顯示用以獲得描述一自協方差域中音訊信號之信號特性時間變異之參數的一方法的一流程圖;
第6圖顯示根據本發明之該實施例,一音訊信號編碼器的一方塊示意圖;以及
第7圖顯示用以獲得描述信號變異之參數的一般方法的一流程圖。
100‧‧‧裝置
110‧‧‧變換器
118‧‧‧音訊信號之時域表示
120‧‧‧實際變換域參數
130‧‧‧參數判定器
130a‧‧‧變異模型參數計算方程式
130b‧‧‧變異模型參數計算器
130c‧‧‧時域變異模型表示
130d‧‧‧模型參數優化器
140‧‧‧模型參數
150‧‧‧方法
160/170‧‧‧步驟
Claims (28)
- 一種用以獲得參數之裝置,其用以基於描述在一變換域中之一信號的實際變換域參數,獲得描述該信號之一信號特性變異的一參數,該裝置包含:一參數判定器,其受組配以取決於表示一信號特性的一或多個模型參數,判定描述變換域參數的一演進之一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該裝置係組配以獲得作為該等實際變換域參數的,描述針對變換變數的多個不同值並針對一第一時間間隔的音訊信號之第一變換域資訊,以及描述針對該變換變數的該等不同值並針對一第二時間間隔的音訊信號之第二變換域資訊;其中該參數判定器係組配來:針對該變換變數的多個不同值,評估在該第一變換域資訊和該第二變換域資訊之間的一時間變異,以獲得時間變異資訊,針對該變換變數的多個不同值估計在該變換變數上該變換域資訊的一局部變異,來獲得一局部變異資訊,以及將該時間變異資訊和該局部變異資訊相結合,來獲得一頻率變異模型參數;其中該參數判定器係組配來使用一模型獲得該頻 率變異模型參數,該模型包含該頻率變異模型參數、並表示相對於顯現該音訊信號之一平滑頻率變異的該變換變數,該音訊信號之該變換域表示之一壓縮或擴張;以及其中該參數判定器係組配來決定該頻率變異模型參數,使得經參數化的該變換域變異模型係配適於一第一組的變換域參數與一第二組的變換域參數。
- 如請求項1之裝置,其中該裝置係組配以獲得作為該等實際變換域參數的,針對一組預定的變換變數值描述該變換域中該第一時間間隔音訊信號的一第一組變換域參數,以及針對該組預定的變換變數值描述該變換域中該第二時間間隔音訊信號的一第二組變換域參數。
- 如請求項1之裝置,其中該裝置受組配以獲得作為該等實際變換域參數的,描述該變換域中之該音訊信號為一變換變數之函數的變換域參數,其中該變換域選擇成,使得該音訊信號的一頻率變換至少產生相對於該變換變數的該音訊信號之該變換域表示的一移位,或相對於該變換變數的該變換域表示的一伸長,或相對於該變換變數的該變換域表示的一壓縮;其中該參數判定器受組配以基於對應實際變換域參數之一時間改變,考量該音訊信號之該變換域表示對於該變換變數的一依賴性,獲得一頻率變異模型參數。
- 如請求項1至3中任一項之裝置,其中該裝置受組配以 獲得作為該等實際變換域參數的,針對多個不同自相關滯後值描述該第一時間間隔之音訊信號之一自相關的第一自相關資訊,及針對該等不同自相關滯後值描述該第二時間間隔之音訊信號之一自相關的第二自相關資訊;其中該參數判定器受組配來:針對多個不同的自相關滯後值,評估在該第一自相關資訊與該第二自相關資訊之間的一時間變異,來獲得時間變異資訊,針對多個不同滯後值,估計在滯後上的自相關資訊的一局部變異,來獲得一局部滯後變異資訊,及將該時間變異資訊與該局部滯後資訊相結合,來獲得該模型參數。
- 如請求項4之裝置,其中該參數判定器受組配以使用下面的方程式運算一估計的變異參數:
其中k表示描述不同自相關滯後值的一連續變數;h表示一第一時間間隔;h+1表示一第二時間間隔;N 2表示待評估之自相關滯後值的數量;R(k,h )表示針對由指數h 所表示的一視窗,該音訊信號的一自相關;R(k,h +1 )表示針對由指數h +1 所表示的一視 窗,該音訊信號的一自相關;及表示在由k所表示之滯後的一周邊中,針對由指數h所表示一視窗,在該滯後上該自相關R(k,h )的一變異。 - 如請求項1至3中任一項之裝置,其中該裝置受組配以獲得作為該等實際變換域參數的,針對多個不同自相關滯後值描述該第一時間間隔之音訊信號之一自協方差的第一自協方差資訊,及針對多個不同自相關滯後值描述該第二時間間隔之音訊信號之一自協方差的第二自協方差資訊;及其中該參數判定器受組配來:針對多個不同的自協方差滯後值,評估在該第一自協方差資訊與該第二自協方差資訊之間的一變異,來獲得時間變異資訊,針對多個不同滯後值,估計在滯後上之該自協方差資訊的一局部導數,來獲得一局部滯後變異資訊,及將該時間變異資訊與該局部滯後變異資訊相結合,來獲得該模型參數。
- 如請求項1至3中任一項之裝置,其中該裝置受組配來:獲得描述針對一單一自協方差視窗但針對不同自協方差滯後值之該音訊信號之一自協方差的自協方差資訊,針對多個不同的自協方差滯後值對,估計在該等自協方差值對之間的加權差值, 其中該加權依據該等各別滯後值對之該等滯後值的一差值,且依據在滯後上該等自協方差值之一變異來選擇,將不同加權差值加總結合,來獲得一結合值,及在該結合值的基礎上獲得該等模型參數。
- 如請求項1之裝置,其中該裝置受組配以獲得描述該音訊信號之一包絡之一時間變異的一參數,其中該參數判定器受組配以獲得多個變換域參數,其針對多個時間間隔描述該音訊信號之一信號功率,其中該參數判定器受組配以使用一參數化變換域變異模型的一表示來獲得一包絡變異模型參數,該參數化變換域變異模型包含一包絡變異模型參數,且表示顯現該音訊信號之一平滑包絡變異的該音訊信號之該變換域表示其功率之一時間性增加或功率之一時間性降低,及其中該參數判定器受組配以決定該包絡變異模型參數使得該參數化變換域變異模型配適於該等變換域參數。
- 如請求項8之裝置,其中該參數判定器受組配以獲得針對一給定自相關滯後或自協方差滯後的多個自相關參數或自協方差參數,及其中該參數判定器受組配以決定一多項式包絡變異模型的多個多項式參數。
- 如請求項1之裝置,其中該裝置受組配以獲得描述在一自相關域中之該音訊信號的自相關域參數,及其中該參數判定器受組配以決定一自相關域變異模型的一或多個模型參數;或其中該裝置受組配以獲得描述在一自協方差域中該音訊信號之自協方差域參數,及其中該參數判定器受組配以決定一自協方差域變異模型的一或多個模型參數。
- 如請求項1之裝置,其中該變換域變異模型描述該音訊信號之一音高週期的一時間變異,或其中該變換域變異模型描述該音訊信號之一包絡的一時間變異,或其中該變換域變異模型描述該音訊信號之一音高週期及一包絡的一同時時間變異。
- 如請求項1之裝置,其中該裝置包含一共振結構減少器,其受組配以預處理一輸入音訊信號,來獲得一共振結構減少的音訊信號;及其中該裝置受組配以在該共振結構減少的音訊信號的基礎上,獲得該實際變換域參數。
- 如請求項12所述之裝置,其中該共振結構減少器受組配來:基於該輸入音訊信號之一經高通濾波版本,估計該輸入音訊信號之一線性預測模型的參數,及基於該線性預測模型之該等所估計參數,過濾該輸入音訊信號的一寬頻版本, 獲得該共振結構減少的音訊信號,使得該共振結構減少音訊信號包含一低通特性。
- 一種用以獲得參數之方法,其用以基於描述一變換域中之一信號的實際變換域參數,獲得描述該信號之一信號特性變異的一參數,該方法包含以下步驟:取決於表示一信號特性的一或多個模型參數,判定描述變換域參數之一演進的一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化時間演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中描述針對一變換變數的多個不同值並針對一第一時間間隔的音訊信號之第一變換域資訊,及描述針對該變換變數的該等不同值並針對一第二時間間隔的音訊信號之第二變換域資訊,係獲得來作為該等實際變換域參數;其中針對該變換變數的多個不同值評估在該第一變換域資訊和該第二變換域資訊之間的一時間變異,以獲得時間變異資訊,其中針對該變換變數的多個不同值估計在該變換變數上該變換域資訊的一局部變異,以獲得一局部變異資訊;其中結合該時間變異資訊和該局部變異資訊,以獲得一頻率變異模型參數;其中該頻率變異模型參數係使用一模型而獲得,該 模型包含該頻率變異模型參數、並表示相對於顯現該音訊信號之一平滑頻率變異的該變換變數,該音訊信號之該變換域表示之一壓縮或擴張;以及其中該頻率變異模型參數係被決定,而使得經參數化的該變換域變異模型係配適用於一第一組的變換域參數與一第二組的變換域參數。
- 一種用以獲得參數之裝置,其用以基於描述在一變換域中之一信號的實際變換域參數,獲得描述該信號之一信號特性變異的一參數,該裝置包含:一參數判定器,其受組配以取決於表示一信號特性的一或多個模型參數,判定描述變換域參數的一演進之一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該裝置係組配以獲得作為該等實際變換域參數的,針對多個不同自相關滯後值描述一第一時間間隔之音訊信號之一自相關的第一自相關資訊,及針對該等不同自相關滯後值描述一第二時間間隔之音訊信號之一自相關的第二自相關資訊;其中該參數判定器受組配來:針對多個不同的自相關滯後值,評估在該第一自相關資訊與該第二自相關資訊之間的一時間變異,來獲得時間變異資訊,針對多個不同滯後值,估計在滯後上的自相關資訊 的一局部變異,來獲得一局部滯後變異資訊,及將該時間變異資訊與該局部滯後資訊相結合,來獲得該模型參數;其中該參數判定器受組配以使用下面的方程式運算一估計的變異參數:
其中k表示描述不同自相關滯後值的一連續變數;h表示一第一時間間隔;h+1表示一第二時間間隔;N 2表示待評估之自相關滯後值的數量;R(k,h )表示針對由指數h 所表示的一視窗,該音訊信號的一自相關;R(k,h +1 )表示針對由指數h +1 所表示的一視窗,該音訊信號的一自相關;及表示在由k所表示之滯後的一周邊中,針對由指數h所表示一視窗,在該滯後上該自相關R(k,h )的一變異。 - 一種用以獲得參數之方法,其用以基於描述一變換域中之一信號的實際變換域參數,獲得描述該信號之一信號特性變異的一參數,該方法包含以下步驟:取決於表示一信號特性的一或多個模型參數,判定描 述變換域參數之一演進的一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化時間演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該方法包含獲得作為該等實際變換域參數的,針對多個不同自相關滯後值描述一第一時間間隔之音訊信號之一自相關的第一自相關資訊,及針對該等不同自相關滯後值描述一第二時間間隔之音訊信號之一自相關的第二自相關資訊;其中該方法包含針對多個不同的自相關滯後值,評估在該第一自相關資訊與該第二自相關資訊之間的一時間變異,來獲得時間變異資訊,針對多個不同滯後值,估計在滯後上的自相關資訊的一局部變異,來獲得一局部滯後變異資訊,及將該時間變異資訊與該局部滯後資訊相結合,來獲得該模型參數;其中一估計的變異參數係使用下面的方程式運算:
其中k表示描述不同自相關滯後值的一連續變數;h表示一第一時間間隔;h+1表示一第二時間間隔;N 2表示待評估之自相關滯後值的數量;R(k,h )表示針對由指數h 所表示的一視窗,該音訊信號的一自相關;R(k,h +1 )表示針對由指數h +1 所表示的一視窗,該音訊信號的一自相關;及表示在由k所表示之滯後的一周邊中,針對由指數h所表示一視窗,在該滯後上該自相關R(k,h )的一變異。 - 一種用以獲得參數之裝置,其用以基於描述在一變換域中之一信號的實際變換域參數,獲得描述該信號之一信號特性變異的一參數,該裝置包含:一參數判定器,其受組配以取決於表示一信號特性的一或多個模型參數,判定描述變換域參數的一演進之一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該裝置受組配以獲得作為該等實際變換域參數的,針對多個不同自相關滯後值描述一第一時間間隔之音訊信號之一自協方差的第一自協方差資訊,及針對多個不同自相關滯後值描述一第二時間間隔之音訊信號之一自協方差的第二自協方差資訊;及其中該參數判定器受組配來:針對多個不同的自協 方差滯後值,評估在該第一自協方差資訊與該第二自協方差資訊之間的一變異,來獲得時間變異資訊,針對多個不同滯後值,估計在滯後上之該自協方差資訊的一局部導數,來獲得一局部滯後變異資訊,及將該時間變異資訊與該局部滯後變異資訊相結合,來獲得該模型參數。
- 一種用以獲得參數之方法,其用以基於描述一變換域中之一信號的實際變換域參數的,獲得描述該信號之一信號特性變異的一參數,該方法包含以下步驟:取決於表示一信號特性的一或多個模型參數,判定描述變換域參數之一演進的一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化時間演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該方法包含獲得作為該等實際變換域參數的,針對多個不同自相關滯後值描述一第一時間間隔之音訊信號之一自協方差的第一自協方差資訊,及針對多個不同自相關滯後值描述一第二時間間隔之音訊信號之一自協方差的第二自協方差資訊;及其中該方法包含針對多個不同的自協方差滯後值,評估在該第一自協方差資訊與該第二自協方差資訊之間的一變異,來獲得時間變異資訊,針對多個不同滯後值,估計在滯後上之該自協方差資訊的一局部導數,來獲得一局部滯後變異資訊,及 將該時間變異資訊與該局部滯後變異資訊相結合,來獲得該模型參數。
- 一種用以獲得參數之裝置,其用以在描述在一變換域中之一信號的實際變換域參數的基礎上,獲得描述該信號之一信號特性變異的一參數,該裝置包含:一參數判定器,其受組配以依據表示一信號特性的一或多個模型參數而定,判定描述變換域參數的一演進之一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該裝置受組配來:獲得描述針對一單一自協方差視窗但針對不同自協方差滯後值之該音訊信號之一自協方差的自協方差資訊,針對多個不同的自協方差滯後值對,估計在該等自協方差值對之間的加權差值,其中該加權依據該等各別滯後值對之該等滯後值的一差值,且依據在滯後上該等自協方差值之一變異來選擇,將不同加權差值加總結合,來獲得一結合值,及在該結合值的基礎上獲得該等模型參數。
- 一種用以獲得參數之方法,其用以在描述一變換域中之該信號的實際變換域參數的基礎上,獲得描述一信號之一信號特性變異的一參數,該方法包含以下步驟: 依據表示一信號特性的一或多個模型參數,判定描述變換域參數之一演進的一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化時間演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該方法包含獲得描述針對一單一自協方差視窗但針對不同自協方差滯後值之該音訊信號之一自協方差的自協方差資訊,針對多個不同的自協方差滯後值對,估計在該等自協方差值對之間的加權差值,其中該加權依據該等各別滯後值對之該等滯後值的一差值,且依據在滯後上該等自協方差值之一變異來選擇,將不同加權差值加總結合,來獲得一結合值,及在該結合值的基礎上獲得該等模型參數。
- 一種用以獲得參數之裝置,其用以在描述在一變換域中之一信號的實際變換域參數的基礎上,獲得描述信號之該信號特性變異的一參數,該裝置包含:一參數判定器,其受組配以依據表示一信號特性的一或多個模型參數而定,判定描述變換域參數的一演進之一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化; 其中該裝置受組配以獲得描述該音訊信號之一包絡之一時間變異的一參數,其中該參數判定器受組配以獲得多個變換域參數,其針對多個時間間隔描述該音訊信號之一信號功率,其中該參數判定器受組配以使用一參數化變換域變異模型的一表示來獲得一包絡變異模型參數,該參數化變換域變異模型包含一包絡變異模型參數,且表示顯現該音訊信號之一平滑包絡變異的該音訊信號之該變換域表示其功率之一時間增加或功率之一時間降低,及其中該參數判定器受組配以決定該包絡變異模型參數,使得該參數化變換域變異模型配適於該等變換域參數。
- 一種用以獲得參數之方法,其用以在描述一變換域中之一信號的實際變換域參數的基礎上,獲得描述該信號之一信號特性變異的一參數,該方法包含以下步驟:依據表示一信號特性的一或多個模型參數,判定描述變換域參數之一演進的一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化時間演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該方法包含獲得描述該音訊信號之一包絡之一時間變異的一參數,其中該方法包含獲得多個變換域參數,其針對多個 時間間隔描述該音訊信號之一信號功率,其中該方法包含使用一參數化變換域變異模型的一表示來獲得一包絡變異模型參數,該參數化變換域變異模型包含一包絡變異模型參數,且表示顯現該音訊信號之一平滑包絡變異的該音訊信號之該變換域表示其功率之一時間增加或功率之一時間降低,及其中該方法包含決定該包絡變異模型參數使得該參數化變換域變異模型配適於該等變換域參數。
- 一種用以獲得參數之裝置,其用以在描述在一變換域中之信號的實際變換域參數的基礎上,獲得描述一信號之一信號特性變異的一參數,該裝置包含:一參數判定器,其受組配以依據表示一信號特性的一或多個模型參數而定,判定描述變換域參數的一演進之一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該裝置受組配以獲得描述在一自相關域中之該音訊信號的自相關域參數,及其中該參數判定器受組配以判定一自相關域變異模型的一或多個模型參數;或其中該裝置受組配以獲得描述在一自協方差域中該音訊信號之自協方差域參數,及其中該參數判定器受組配以判定一自協方差域變 異模型的一或多個模型參數。
- 一種用以獲得參數之方法,其用以在描述一變換域中之一信號的實際變換域參數的基礎上,獲得描述該信號之一信號特性變異的一參數,該方法包含以下步驟:依據表示一信號特性的一或多個模型參數,判定描述變換域參數之一演進的一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化時間演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該方法包含獲得描述在一自相關域中之該音訊信號的自相關域參數,及其中該方法包含判定一自相關域變異模型的一或多個模型參數;或其中該方法包含獲得描述在一自協方差域中該音訊信號之自協方差域參數,及其中該方法包含判定一自協方差域變異模型的一或多個模型參數。
- 一種用以獲得參數之裝置,其用以在描述在一變換域中之信號的實際變換域參數的基礎上,獲得描述一信號之一信號特性變異的一參數,該裝置包含:一參數判定器,其受組配以依據表示一信號特性的一或多個模型參數而定,判定描述變換域參數的一演進之一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化演進與該等實際變換域參 數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該裝置包含一共振結構減少器,其受組配以預處理一輸入音訊信號,來獲得一共振結構減少的音訊信號;及其中該裝置受組配以在該共振結構減少的音訊信號的基礎上,獲得該實際變換域參數。
- 一種用以獲得參數之方法,其用以在描述一變換域中之一信號的實際變換域參數的基礎上,獲得描述該信號之一信號特性變異的一參數,該方法包含以下步驟:依據表示一信號特性的一或多個模型參數,判定描述變換域參數之一演進的一變換域變異模型的一或多個模型參數,使得表示在該等變換域參數之一模型化時間演進與該等實際變換域參數之一演進之間的一偏差的一模型錯誤,低於一預定臨界值或予以最小化;其中該方法包含預處理一輸入音訊信號,來獲得一共振結構減少的音訊信號;及其中該方法包含在該共振結構減少的音訊信號的基礎上,獲得該實際變換域參數。
- 一種電腦程式,其用以在該電腦程式執行於一電腦中時,執行請求項14、16、18、20、22、24或26之方法。
- 一種用以時間捲曲編碼一輸入音訊信號的一時間捲曲音訊編碼器,該時間捲曲音訊編碼器包含:一根據請求項1、15、17、19、21、23或25之裝置, 用以獲得描述一音訊信號之一信號特性時間變異的一參數,其中用以獲得一參數的該裝置受組配以獲得描述該等輸入音訊信號之一音高週期基週變異的一音高週期變異參數;及一時間捲曲信號處理器,其受組配以使用該音高週期變異參數來執行該輸入音訊信號的一時間捲曲信號取樣,來調整該時間捲曲。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US14606309P | 2009-01-21 | 2009-01-21 | |
| EP09005486A EP2211335A1 (en) | 2009-01-21 | 2009-04-17 | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW201108201A TW201108201A (en) | 2011-03-01 |
| TWI470623B true TWI470623B (zh) | 2015-01-21 |
Family
ID=40935040
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW98143908A TWI470623B (zh) | 2009-01-21 | 2009-12-21 | 用以獲得描述信號之信號特性變異之參數的裝置、方法與電腦程式、以及用以時間捲曲編碼輸入音訊信號的時間捲曲音訊編碼器 |
Country Status (20)
| Country | Link |
|---|---|
| US (1) | US8571876B2 (zh) |
| EP (2) | EP2211335A1 (zh) |
| JP (2) | JP5551715B2 (zh) |
| KR (1) | KR101307079B1 (zh) |
| CN (1) | CN102334157B (zh) |
| AR (1) | AR075020A1 (zh) |
| AU (1) | AU2010206229B2 (zh) |
| BR (1) | BRPI1005165B1 (zh) |
| CA (1) | CA2750037C (zh) |
| CO (1) | CO6420379A2 (zh) |
| ES (1) | ES2831409T3 (zh) |
| MX (1) | MX2011007762A (zh) |
| MY (1) | MY160539A (zh) |
| PL (1) | PL2380165T3 (zh) |
| PT (1) | PT2380165T (zh) |
| RU (1) | RU2543308C2 (zh) |
| SG (1) | SG173083A1 (zh) |
| TW (1) | TWI470623B (zh) |
| WO (1) | WO2010084046A1 (zh) |
| ZA (1) | ZA201105338B (zh) |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0638733B2 (ja) | 1987-03-06 | 1994-05-25 | 日清製粉株式会社 | 固定化プロテア−ゼによる加水分解グルテンの製造法 |
| US20120089390A1 (en) * | 2010-08-27 | 2012-04-12 | Smule, Inc. | Pitch corrected vocal capture for telephony targets |
| US8805697B2 (en) * | 2010-10-25 | 2014-08-12 | Qualcomm Incorporated | Decomposition of music signals using basis functions with time-evolution information |
| US8626352B2 (en) * | 2011-01-26 | 2014-01-07 | Avista Corporation | Hydroelectric power optimization service |
| US10316833B2 (en) * | 2011-01-26 | 2019-06-11 | Avista Corporation | Hydroelectric power optimization |
| US9026257B2 (en) | 2011-10-06 | 2015-05-05 | Avista Corporation | Real-time optimization of hydropower generation facilities |
| CN103426441B (zh) | 2012-05-18 | 2016-03-02 | 华为技术有限公司 | 检测基音周期的正确性的方法和装置 |
| US10324068B2 (en) * | 2012-07-19 | 2019-06-18 | Carnegie Mellon University | Temperature compensation in wave-based damage detection systems |
| BR112015007137B1 (pt) | 2012-10-05 | 2021-07-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho para codificar um sinal de fala que emprega acelp no domínio de autocorrelação |
| US8554712B1 (en) | 2012-12-17 | 2013-10-08 | Arrapoi, Inc. | Simplified method of predicting a time-dependent response of a component of a system to an input into the system |
| US9741350B2 (en) * | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
| GB2513870A (en) | 2013-05-07 | 2014-11-12 | Nec Corp | Communication system |
| EP3156861B1 (en) * | 2015-10-16 | 2018-09-26 | GE Renewable Technologies | Controller for hydroelectric group |
| RU169931U1 (ru) * | 2016-11-02 | 2017-04-06 | Акционерное Общество "Объединенные Цифровые Сети" | Устройство сжатия аудиосигнала для передачи по каналам распространения данных |
| KR102634916B1 (ko) * | 2019-08-29 | 2024-02-06 | 주식회사 엘지에너지솔루션 | 온도 추정 모델 결정 방법 및 장치, 온도 추정 모델이 적용된 배터리 관리 시스템 |
| CN112309425B (zh) * | 2020-10-14 | 2024-08-30 | 浙江大华技术股份有限公司 | 一种声音变调方法、电子设备及计算机可读存储介质 |
| CN115913231B (zh) * | 2023-01-06 | 2023-05-09 | 上海芯炽科技集团有限公司 | 一种tiadc的采样时间误差数字估计方法 |
| CN117727330B (zh) * | 2024-02-18 | 2024-04-16 | 百鸟数据科技(北京)有限责任公司 | 基于音频分解的生物多样性预测方法 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6757649B1 (en) * | 1999-09-22 | 2004-06-29 | Mindspeed Technologies Inc. | Codebook tables for multi-rate encoding and decoding with pre-gain and delayed-gain quantization tables |
| TW200737127A (en) * | 2006-03-29 | 2007-10-01 | Coding Tech Ab | Reduced number of channels decoding |
Family Cites Families (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4231408A (en) | 1978-06-08 | 1980-11-04 | Henry Replin | Tire structure |
| NL8701798A (nl) * | 1987-07-30 | 1989-02-16 | Philips Nv | Werkwijze en inrichting voor het bepalen van het verloop van een spraakparameter, bijvoorbeeld de toonhoogte, in een spraaksignaal. |
| DE69233794D1 (de) * | 1991-06-11 | 2010-09-23 | Qualcomm Inc | Vocoder mit veränderlicher Bitrate |
| US5751905A (en) * | 1995-03-15 | 1998-05-12 | International Business Machines Corporation | Statistical acoustic processing method and apparatus for speech recognition using a toned phoneme system |
| RU27259U1 (ru) * | 2000-09-07 | 2003-01-10 | Железняк Владимир Кириллович | Устройство для измерения разборчивости речи |
| US7017175B2 (en) | 2001-02-02 | 2006-03-21 | Opentv, Inc. | Digital television application protocol for interactive television |
| CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
| KR100885438B1 (ko) * | 2003-09-29 | 2009-02-24 | 에이전시 포 사이언스, 테크놀로지 앤드 리서치 | 시간 도메인에서 주파수 도메인으로 그리고 그 반대로디지털 신호의 도메인 변환을 수행하는 방법 |
| KR100612840B1 (ko) * | 2004-02-18 | 2006-08-18 | 삼성전자주식회사 | 모델 변이 기반의 화자 클러스터링 방법, 화자 적응 방법및 이들을 이용한 음성 인식 장치 |
| KR20050087956A (ko) * | 2004-02-27 | 2005-09-01 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
| CN101873266B (zh) * | 2004-08-30 | 2015-11-25 | 高通股份有限公司 | 用于语音ip传输的自适应去抖动缓冲器 |
| US7565018B2 (en) * | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
| US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
| JP2007288468A (ja) | 2006-04-17 | 2007-11-01 | Sony Corp | オーディオ出力装置、パラメータ算出方法 |
| KR101393298B1 (ko) * | 2006-07-08 | 2014-05-12 | 삼성전자주식회사 | 적응적 부호화/복호화 방법 및 장치 |
| JP4958241B2 (ja) * | 2008-08-05 | 2012-06-20 | 日本電信電話株式会社 | 信号処理装置、信号処理方法、信号処理プログラムおよび記録媒体 |
-
2009
- 2009-04-17 EP EP09005486A patent/EP2211335A1/en not_active Withdrawn
- 2009-12-21 TW TW98143908A patent/TWI470623B/zh active
-
2010
- 2010-01-11 BR BRPI1005165-1A patent/BRPI1005165B1/pt active IP Right Grant
- 2010-01-11 MY MYPI2011003405A patent/MY160539A/en unknown
- 2010-01-11 WO PCT/EP2010/050229 patent/WO2010084046A1/en not_active Ceased
- 2010-01-11 CN CN201080008756.0A patent/CN102334157B/zh active Active
- 2010-01-11 MX MX2011007762A patent/MX2011007762A/es active IP Right Grant
- 2010-01-11 SG SG2011052677A patent/SG173083A1/en unknown
- 2010-01-11 JP JP2011546736A patent/JP5551715B2/ja active Active
- 2010-01-11 RU RU2011130422/08A patent/RU2543308C2/ru active
- 2010-01-11 AU AU2010206229A patent/AU2010206229B2/en active Active
- 2010-01-11 PL PL10701639T patent/PL2380165T3/pl unknown
- 2010-01-11 PT PT107016396T patent/PT2380165T/pt unknown
- 2010-01-11 EP EP10701639.6A patent/EP2380165B1/en active Active
- 2010-01-11 ES ES10701639T patent/ES2831409T3/es active Active
- 2010-01-11 KR KR1020117017778A patent/KR101307079B1/ko active Active
- 2010-01-11 CA CA2750037A patent/CA2750037C/en active Active
- 2010-01-14 AR ARP100100085A patent/AR075020A1/es active IP Right Grant
-
2011
- 2011-07-20 ZA ZA2011/05338A patent/ZA201105338B/en unknown
- 2011-07-20 US US13/186,688 patent/US8571876B2/en active Active
- 2011-08-19 CO CO11105765A patent/CO6420379A2/es not_active Application Discontinuation
-
2013
- 2013-07-29 JP JP2013156381A patent/JP5625093B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6757649B1 (en) * | 1999-09-22 | 2004-06-29 | Mindspeed Technologies Inc. | Codebook tables for multi-rate encoding and decoding with pre-gain and delayed-gain quantization tables |
| TW200737127A (en) * | 2006-03-29 | 2007-10-01 | Coding Tech Ab | Reduced number of channels decoding |
Non-Patent Citations (1)
| Title |
|---|
| Alain de Cheveigne , Hideki Kawahara ,"YIN, a fundamental frequency estimator for speech and music", J. Acoust. Soc. Am., Vol. 111, No. 4, p.1917~1930, April 2002. * |
Also Published As
| Publication number | Publication date |
|---|---|
| EP2380165B1 (en) | 2020-09-16 |
| EP2211335A1 (en) | 2010-07-28 |
| CN102334157A (zh) | 2012-01-25 |
| RU2543308C2 (ru) | 2015-02-27 |
| BRPI1005165A8 (pt) | 2018-12-18 |
| EP2380165A1 (en) | 2011-10-26 |
| JP2014013395A (ja) | 2014-01-23 |
| US8571876B2 (en) | 2013-10-29 |
| KR101307079B1 (ko) | 2013-09-11 |
| CO6420379A2 (es) | 2012-04-16 |
| PT2380165T (pt) | 2020-12-18 |
| US20110313777A1 (en) | 2011-12-22 |
| WO2010084046A1 (en) | 2010-07-29 |
| PL2380165T3 (pl) | 2021-04-06 |
| BRPI1005165B1 (pt) | 2021-07-27 |
| AR075020A1 (es) | 2011-03-02 |
| MY160539A (en) | 2017-03-15 |
| AU2010206229A1 (en) | 2011-08-25 |
| CN102334157B (zh) | 2014-10-22 |
| ES2831409T3 (es) | 2021-06-08 |
| JP5551715B2 (ja) | 2014-07-16 |
| TW201108201A (en) | 2011-03-01 |
| SG173083A1 (en) | 2011-08-29 |
| BRPI1005165A2 (pt) | 2017-08-22 |
| MX2011007762A (es) | 2011-08-12 |
| JP2012515939A (ja) | 2012-07-12 |
| KR20110110785A (ko) | 2011-10-07 |
| CA2750037A1 (en) | 2010-07-29 |
| AU2010206229B2 (en) | 2014-01-16 |
| ZA201105338B (en) | 2012-08-29 |
| CA2750037C (en) | 2016-05-17 |
| JP5625093B2 (ja) | 2014-11-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI470623B (zh) | 用以獲得描述信號之信號特性變異之參數的裝置、方法與電腦程式、以及用以時間捲曲編碼輸入音訊信號的時間捲曲音訊編碼器 | |
| US8781819B2 (en) | Periodic signal processing method, periodic signal conversion method, periodic signal processing device, and periodic signal analysis method | |
| CN111179952A (zh) | 用于信息编码的概念 | |
| US20060129389A1 (en) | Spectrum modeling | |
| Amado et al. | Pitch detection algorithms based on zero-cross rate and autocorrelation function for musical notes | |
| McAulay | Maximum likelihood spectral estimation and its application to narrow-band speech coding | |
| Giacobello et al. | Speech coding based on sparse linear prediction | |
| CN118230741A (zh) | 一种基于正弦谐波模型的低速率语音编解码方法 | |
| Srivastava | Fundamentals of linear prediction | |
| HK1160281B (zh) | 用以获得描述信号的信号特性变异参数的装置、方法与电脑程式 | |
| Kawahara et al. | Beyond bandlimited sampling of speech spectral envelope imposed by the harmonic structure of voiced sounds. | |
| JPH0990998A (ja) | 音響信号変換復号化方法 | |
| Yuan et al. | All-pole Modelling of Noisy Speech with the Weighted Sum of the Line Spectrum Pair | |
| Beierholm et al. | Particle filter inference in an articulatory-based speech model | |
| JP2003533723A (ja) | オーディオ符号化 | |
| Baghai-Ravary et al. | Modelling the flow inherent in speech representations | |
| Koestoer et al. | Robust Spectrum Analysis for Applications in Signal Processing | |
| Funaki et al. | Low Computational Robust F0 Estimation of Speech Based on TV-CAR Analysis | |
| JPS62502288A (ja) | ノイズを含む環境内の音声分析装置 |