TW200816718A - Systems and methods for modifying a window with a frame associated with an audio signal - Google Patents
Systems and methods for modifying a window with a frame associated with an audio signal Download PDFInfo
- Publication number
- TW200816718A TW200816718A TW096128077A TW96128077A TW200816718A TW 200816718 A TW200816718 A TW 200816718A TW 096128077 A TW096128077 A TW 096128077A TW 96128077 A TW96128077 A TW 96128077A TW 200816718 A TW200816718 A TW 200816718A
- Authority
- TW
- Taiwan
- Prior art keywords
- frame
- signal
- mdct
- window
- encoding
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 230000005236 sound signal Effects 0.000 title claims abstract description 53
- 230000006870 function Effects 0.000 claims description 37
- 238000004891 communication Methods 0.000 claims description 33
- 230000007246 mechanism Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000009471 action Effects 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000008054 signal transmission Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000009377 nuclear transmutation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
200816718 九、發明說明: 【發明所屬之技術領域】 本系統及方法大體而言係關於語音處理技術。更特定言 之,本系統及方法係關於以與音訊訊號相關之訊框修改視 窗之系統及方法。 【先前技術】 藉由數位技術來發射聲音已變得普遍,尤其是在長距 離、數位無線電電話應用、使用電腦之視訊訊息傳遞等等 中。此又對判定可經由通道發送之最少量資訊且同時保持 所重建之語音之可察覺品質產生了興趣。吾人發現用於壓 縮語音之設備可用於許多電信領域中。電信之一實例為無 線通信。另一實例為經由電腦網路(諸如,網際網路)之通 信。通信領域具有許多應用,包括(例如)電腦、膝上型電腦、 個人數位助理(PDA)、無繩電話、尋呼機、無線區域迴路、 無線電話(諸如,蜂巢式及攜帶型通信系統(PCS)電話系 統)、行動網際網路協定(IP)電話及衛星通信系統。 【發明内容】 描述了 一種用於以與音訊訊號相關之訊框修改視窗之方 法。接收一訊號。將該訊號分割為複數個訊框。判定該複 數個訊框内之一訊框是否與一非語音訊號相關。若判定該 訊框與一非語音訊號相關,則將一經修改之離散餘弦變換 (MDCT)視窗函數應用於該訊框以產生一第一零墊區域及 一第二零墊區域。編碼該訊框。 亦描述了一種用於以與音訊訊號相關之訊框修改視窗之 122954.doc 200816718 裝置。該裝置包括一處理器及與該處理器進行電子通信之 記憶體。諸指令儲存於該記憶體中。該等指令可執行以: 接收一訊號;將該訊號分割為複數個訊框;判定該複數個 訊框内之一訊框是否與一非語音訊號相關;若判定該訊框 與一非語音訊號相關,則將一經修改之離散餘弦變換 (MDCT)視窗函數應用於該訊框以產生一第一零墊區域及 一弟二零墊區域;及編碼該訊框。 / 亦描述了一種經組態而以與音訊訊號相關之訊框修改視 窗的系統。該系統包括一用於處理之構件及一用於接收一 訊號之構件。該系統亦包括一用於將該訊號分割為複數個 訊框之構件及一用於判定該複數個訊框内之一訊框是否與 一非語音訊號相關之構件。該系統進一步包括一用於在判 定該訊框與一非語音訊號相關之情況下將一經修改之離散 餘弦變換(MDCT)視窗函數應用於該訊框以產生一第一零 墊區域及一第二零墊區域的構件及一用於編碼該訊框之構 c; 亦描述了一種經組態以儲存一組指令的電腦可讀取媒 體。該等指令可執行以:接收一訊號;將該訊號分割為複 數個訊框;判定該複數個訊框内之一訊框是否與一非語音 訊號相關;若判定該訊框與一非語音訊號相關,則將一經 修改之離散餘弦變換(MDCT)視窗函數應用於該訊框以產 生一第一零墊區域及一第二零墊區域;及編碼該訊框。 亦描述了一種用於選擇一待用於計算訊框之經修改之離 散餘弦變換(MDCT)之視窗函數的方法。提供一用於選擇一 122954.doc 200816718 待用於計算訊框之MDCT之視窗函數的演算法。將該所選擇 之視窗函數應用於該訊框。基於由額外編碼模式強加於一 MDCT編碼模式之約束而以該MDCT編碼模式來編碼該訊 框’其中遠專約束包含該訊框之一長度、一預看長度及一 延遲。
亦描述了 一種用於重建音訊訊框之編碼訊框的方法。接 收一封包。分解該封包以擷取一編碼訊框。合成該訊框之 位於一第一零墊區域與一第一區域之間的樣本。向一第一 長度之一重疊區域添加一先前訊框之一預看長度。儲存該 訊框之該第一長度之一預看。輸出一經重建之訊框。 【實施方式】 現參看諸圖來描述該等系統及該等方法之各種組態,其 中類似之參考數字指示相同或功能類似之元件。如大致在 本文中之諸圖中所描述及說明,可以廣泛之多種不同組態 來配置及設計本系統及方法之特徵。因此,下文之實施方 式並不意欲限制如所主張之系統及方法之範疇,而是僅表 示該等系統及該等方法之組態。 可將本文中所揭示之組態之許多特徵實施為電腦軟體、 電子硬體或兩者之組合。為清楚地說明硬體與軟體之此互
換性,將大致就各種紐> 士 A 裡、且仵之功能性來描述該等組件。將此 功能性實施為硬體還是軟體葙 疋釈篮視特定應用及強加於整個系统 之設計約束而定。熟練技工 、 不钗J以用於母一特定應用之變化 之方式來實施所描述之功能祕 纪之力月b性,但不應將此等實 釋為導致背離本系統及方法之範疇。 朿解 122954.doc 200816718 在將所描述之功能性實施為電腦軟體之情況下,此軟體 可包括任何類型之可位於一記憶體設備内及/或作為電子 訊號而經由一系統匯流排或網路發射的電腦指令或電腦可 執行碼。實施與本文中所描述之組件相關之功能性的軟體 可包含單個指令或許多指令,且可分布為遍及若干不同碼 段、分布於不同程式中及分布為跨越若干記憶體設備。 如本文中所使用,術語,,一組態”、”組態”、若干)組態,, 該組悲、"該等組態"、"一或多個組態”、"一些組態"、 ”某些組態"、”一個組態”、”另一組態"及其類似物意謂,,所 揭示之系統及方法之一或多個(但未必全部)組態”,除非另 外明確規定。 術語”判定n (及其之語法變體)係以一極為廣泛之意義來 使用。術語”判定’’包含廣泛之多種動作且因此"判定”可包括 核算、計算、處理、導出、調查、查找(例如,在一表格、 一資料庫或另一資料結構中進行查找)、確定及其類似物。 又,”判定”可包括接收(例如,接收資訊)、存取(例如,存 取一记憶體中之資料)及其類似物。又,”判定”可包括解析、 選擇、挑選、建立及其類似物。 短語"基於”並不意謂,,僅基於",除非另外明確規定。換言 之,短語”基於,,描述了”僅基於"與"至少基於”兩者。一般而 吕,可使用短語”音訊訊號’’來指代一可被聽到之訊號。音 訊訊號之實例可包括表示人類語音、器樂及聲樂、音調聲 等等。 圖1說明了一劃碼多向近接(CDMA)無線電話系統1〇〇,其 122954.doc 200816718 可包括複數個行動台i〇2、複數個基地台i〇4、一基地台控 制器(BSC)l〇6及一行動交換中心(MSC)1〇8。MSC 108可經
組態以與一公眾交換電話網路(pSTN)11〇建立介面。MSC 108亦可經組態以與BSc 106建立介面。系統1〇〇中可存在一 個以上之BSC 106。每一基地台1〇4可包括至少一個扇區(未 囷示)其中母一扇區可具有一全向天線或一指向一徑向地 遠離基地台104之特定方向的天線。或者,每一扇區可包括 兩個用於分集接收之天線。每一基地台1〇4可經設計以支援 複數次頻率指派。可將一扇區與一頻率指派之相交部分稱 作一 CDMA通道。行動台102可包括蜂巢式或攜帶型通信系 統(PCS)電話。 在蜂巢式電話系統1〇〇之操作期間,基地台1〇4可自若干 組行動台102接收若干組反向鏈路訊號。該等行動台1〇2可 正進行電話呼叫或其他通信。由一給定之基地台1〇4所接收 的母一反向鏈路訊號可在彼基地台内加以處理。可將所 得貧料轉發至BSC 1〇6。該BSC 1〇6可提供呼叫資源配置及 行動性管理功能性(包括對在基地台1〇4之間的軟交遞的控 制)。BSC 106亦可將所接收之資料投送至MSC 108,該Msc 1〇8提供額外之投送服務以用於與PSTN u〇建立介面。類似 地’ PSTN 110可與MSC 108建立介面,且該MSC 108可與 BSC 106建立介面,該BSC 106又可控制基地台1〇4以將若干 組轉發鏈路訊號發射至若干組行動台丨〇2。 圖2描繪了一計算環境2〇〇之一組態,該計算環境2〇〇包括 一來源計算設備202、一接收計算設備2〇4及一接收行動計 122954.doc -10- 200816718 算設備206。來源計算設備202可經由一網路210而與接收計 算設備204、206通信。網路210可為某一類型之計算網路, 其包括(但不限於)網際網路、區域網路(LAN)、校園區域網 路(CAN)、都會區域網路(MAN)、廣域網路(WAN)、環狀網 路、星形網路、符記環狀網路等等。 在一組態中,來源計算設備202可編碼音訊訊號212且經 由網路210而將其發射至接收計算設備2〇4、2〇6。音訊訊號 212可包括語音訊號、音樂訊號、音調、背景雜訊訊號等等。 如本文中所使用,”語音訊號"可指代由一人類語音系統所 產生之訊號且"非語音訊號”可指代並非由人類語音系統所 產生之訊號(亦即,音樂、背景雜訊等等)。來源計算設備2〇2 可為行動電話、個人數位助理(PDA)、膝上型電腦、個人電 腦或任何其他具有一處理器之計算設備。接收計算設備2〇4 可為個人電腦、電話等等。接收行動計算設備2〇6可為行動 電話、PDA、膝上型電腦或任何其他具有一處理器之行動 計算設備。 圖3描繪了一訊號發射環境300,其包括一編碼器3〇2、一 解碼器304及一發射媒體306。可在一行動台1〇2或一來源計 算設備202内實施編碼器302。可在一基地台1〇4、行動台 102、一接收計算設備204或一接收行動計算設備2〇6中實施 解碼器304。編碼器302可編碼一音訊訊號s(n) 31〇,從而形 成、、星編碼之音訊訊號sene(n) 3 12。可跨越發射媒體306而 將、差編碼之音訊訊號3 12發射至解碼器。發射媒體 可幫助編碼器302以無線方式將一經編碼之音訊訊號312發 122954.doc -11· 200816718 射至解碼器或其可幫助編碼器3 〇2經由一在編碼器3 02與解 碼器304之間的有線連接來發射經編碼之訊號312。解碼器 304可解碼%11。(11)312,藉此產生一經合成之音訊訊號§(11) 316 〇 如本文中所使用,術語”編碼”可通常指代包含編碼與解 碼兩者之方法。通常,編碼系統、編碼方法及編碼裝置試 圖使經由發射媒體306所發射之位元的數目(亦即,使Senc(n) 312之頻寬最小化)最小化,同時保持可接受之訊號重現(亦 即’ s(n) 310 = §(n) 316)。經編碼之音訊訊號312之組合可 根據由編碼器302所利用之特定音訊編碼模式而變化。下文 描述了各種編碼模式。 可將下文所描述之編碼器302及解碼器304之組件實施為 電子硬體、電腦軟體或兩者之組合。下文就此等組件之功 旎性而描述了該等組件。將功能性實施為硬體還是軟體可 視特定應用及強加於整個系統之設計約束而定。發射媒體 U 306可表示許多不同發射媒體,其包括(但不限於)基於陸地 之通信線、在基地台與衛星之間的鏈路 '在蜂巢式電話與 基地台之間的無線通信、在行動電話與衛星之間的無線通 信或在計算設備之間的通信。 通信之每一方可發射資料以及接收資料。每一方可利用 :編碼器302及-解碼器3〇4。然而,下文將把訊號發射環 境300描述為包括位於發射媒體3〇6之一端處之編碼器3们 及位於另一端處之解碼器304。 在一組態中,s⑻310可包括一在一典型對話(包括不同 122954.doc -12· 200816718 口耷及無聲週期)期間所獲得之數位語音訊號。可將該語音 訊號S(n)31〇分割為若干訊框,且可將每—訊框進—步分則 為若干子訊框。可使用此等經隨意挑選之訊框/子訊框邊界 (其中執行某-區塊處理)。在此意義上,亦可對子訊框執行 被描述為對訊框所執行的操作;本文中可互換使用訊框及 子Λ框。X’可將一或多個訊框包括於—視窗中,該視窗 可說明在各種訊框之間的置放及時序。 在另一組態中,s(n)310可包括一非語音訊號,諸如,一 音樂訊號。可將該非語音訊號分割為S干訊框。可將一或 多個訊框包括於一視窗中,該視窗可說明在各種訊框之間 的置放及時序。視窗之選擇可視經實施以編碼訊號之編碼 技術及可強加於系統之延遲約束而定。本系統及方法描述 了一種用於選擇一視窗形狀之方法,該視窗形狀用於在一 能夠編碼語音訊號與非語音訊號兩者之系統中以基於一經 修改型離散餘弦轉換(MDCT)及一修改型離散餘弦反轉換 (IMDCT)的編碼技術來編碼及解碼非語音訊號。該系統可 強加約束於可由基於MDCT之編碼器使用多少訊框延遲及 預看而使得能夠以一均勻速率產生編碼資訊。 在一組態中,編碼器302包括一可袼式化包括與非語音訊 號相關之訊框之視窗的視窗格式化模組3 〇 8。可編碼被包括 於格式化視窗中之訊框且解碼器可藉由實施一訊框重建模 組314而重建編碼訊框。訊框重建模組314可合成該等編碼 訊框以使得該等訊框類似於語音訊號310之預編碼訊框。 圖4為一流程圖’其說明了一種用於以與音訊訊號相關之 122954.doc •13-
200816718 訊框修改視窗之方法400的一組態。該方法400可由編碼器 302實施。在一組態中,接收402—訊號。該訊號可為如先 前所描述之音訊訊號。可將該訊號分割404為複數個訊框。 可應用408—視窗函數以產生一視窗且可產生一第一零墊 區域及一第二零墊區域作為該視窗之一部分以用於計算一 修改型離散餘弦轉換(MDCT)。換言之,視窗之開始部分及 結束部分之值可為零。在一態樣中,第一零墊區域之長度 及第二零墊區域之長度可隨編碼器302之延遲約束而定。 可將修改型離散餘弦轉換(MDCT)函數用於若干音訊編 碼標準中以將脈碼調變(PCM)訊號樣本或將其之經處理型 式變換為其之等效頻域表示。MDCT可類似於IV型離散餘 弦變換(DCT),其中訊框之額外特性彼此重疊。換言之,一 訊號之由MDCT所變換之連續訊框可彼此重疊50%。 另外,對於2M個樣本中之每一訊框而言,MDCT可產生 Μ個變換係數。MDCT可為一苛刻取樣式完美重建濾波器 組。為提供完美重建,可由下式給出獲自訊號x(〃)(n= 0、 1、…、2M)之一訊框的MDCT係數XW(k = 0、1、…、Μ): 2Μ-1 X(k)= ^χ{ή)\{η) η=0 其中
(2) K(ri) = w(n\l—cos (2 乃+ M + l)(2A: + l>r 4Μ (k=0、1、…、μ),且 w(n)為一可滿足 Princen-Bradley條件 之視窗,該Princen-Bradley條件陳述為: 122954.doc -14- 200816718 w2 (n) + w2(n-l· Μ) = 1 ( 3 ) 在解碼器處,可使用一反MDCT(IMDCT)而將M個編碼係 數變換回至時域。若夕㈨,(k=0、1、2、…、Μ)為所接收之 MDCT係數,則對應之IMDCT解碼器藉由根據下式而首先 採用所接收之係數之IMDCT來獲得2M個樣本而產生經重 建之音訊訊號: = for n=0 ^ 1 ^ ..." 2 M-1 (4)
k=Q ( 其中由方程式(2)來界定,接著向當前訊框之最初M個 樣本重疊及添加先前訊框之IMDCT輸出之Μ個最後樣本及 來自下一訊框之IMDCT輸出之最初Μ個樣本。因此,若對 應於下一訊框之解碼MDCT係數在一給定時間不可用,則僅 可完整地重建當前訊框之Μ個音訊樣本。 MDCT系統可利用Μ個樣本之一預看。MDCT系統可包 括:一編碼器,其使用一預定視窗而獲得音訊訊號或其之 經濾波型式的MDCT ;及一解碼器,其包括一使用與編碼器 所使用之視窗相同之視窗的IMDCT函數。MDCT系統亦可 包括一重疊及一添加模組。舉例而言,圖4B說明了一 MDCT 編碼器401。由一預處理器405接收一輸入音訊訊號403。該 預處理器405實施預處理、線性預測編碼(LPC)濾波及其他 類型之濾波。自預處理器405產生一經處理之音訊訊號 407。將一 MDCT函數409應用於被適當視窗化之2M個訊號 樣本。在一組態中,一量化器411量化及編碼Μ個係數413 且將該Μ個編碼係數發射至一 MDCT解碼器429。 122954.doc -15- 200816718 解碼器429接收Μ個編碼係數413。使用與編碼器401中之 視窗相同之視窗而將一 IMDCT 415應用於該Μ個接收係數 413。可將2Μ個訊號值41 7分類為最初μ個樣本選擇423且可 保存最後Μ個樣本419。可藉由一延遲器421而將該最後Μ個 樣本419進一步延遲一個訊框。可藉由一求和器425來對最 初Μ個樣本423及經延遲之最後μ個樣本419求和。可使用該 等經求和之樣本來產生音訊訊號之經重建之Μ個樣本427。 厂 通常,在MDCT系統中,可自一當前訊框之乂個樣本及一 未來訊框之Μ個樣本而導出2M個訊號。然而,若僅來自未 來訊框之L個樣本為可用的,則可選擇一實施未來訊框之乙 個樣本的視窗。 在一經由一電路交換網路而操作之即時聲音通信系統 中,可由最大可允許編碼延遲來約束預看樣本之長度。可 假定一預看長度L為可用的。l可小於或等於μ。在此條件 下,可能仍然需要使用MDCT(其中在連續訊框之間的重疊 ) 為L個樣本),同時保持完美之重建特性。 本系統及方法可尤其與即時雙向通信系統有關,其中期 待一編碼器產生資訊以用於以一規則之時間間隔進行發射 而不管對編碼模式之挑選。該系統可能不能夠容忍在由編 碼器產生此資訊時的抖動或在產生此資訊時之此抖動可能 非吾人所要的。 在一組態中,將一修改型離散餘弦轉換(MDCT)函數應用 408於σ孔框。應用視窗函數可為計算該訊框之一 丁中的 一步驟。在一組態中,MDCT函數處理2]^個輸入樣本以產 122954.doc • 16 - 200816718 生Μ個可接著被量化及發射之係數。 在一組悲中’可編碼4 i 〇訊框。在一態樣中,可編碼4丄〇 該訊框之係數。可使用將在下文予以更完整地論述之各種 編碼模式來編碼該訊框。可將該訊框格式化4丨2為一封包且 可發射414该封包。在一組態中,將該封包發射4丨4至一解 碼器。 ' 圖5為一流程圖,其說明了一種用於重建一音訊訊號之一 編碼讯框的方法5⑽之一組態。在一組態中,可由解碼器3 〇4 來實鼽方法500。可接收5〇2—封包。可自編碼器3〇2接收5〇2 4封包。可分解5 〇4該封包以擷取一訊框。在一組態中,可 解碼506該訊框。可重建5〇8該訊框。在一實例中,訊框重 建模組314重建該訊框以類似於音訊訊號之預編碼訊框。可 輸出510重建訊框。可將輸出之訊框與額外輸出之訊框組合 以再現音訊訊號。 圖6為一方塊圖,其說明了一跨越一通信通道而與一 〇 多模式解碼器604通信的多模式編碼器602之一組態。一包 括多模式編碼器602及多模式解碼器6〇4之系統可為一包括 右干不同編碼機制以編碼不同音訊訊號類型的編碼系統。 通仏通道606可包括一射頻(RF)介面。編碼器6〇2可包括一 相關之解碼器(未圖示)。編碼器6〇2及其相關之解碼器可形 成一第-編碼器。解碼器6G4可包括一相關之編碼器(未圖 不)。解碼器604及其相關之編碼器可形成一第二編碼器。 *編碼器602可包括一初始參數計算模組618、一模式分類 模組622、複數個編碼模式624、626、628及一封包袼式化 122954.doc -17- 200816718 模組630。將編碼模式624、626、628之數目展示為N,其可 表示任何數目之編碼模式624、626、628。為簡單起見,展 示了二種編碼模式624、626、628,其中虛線指示存在其他 編碼模式。 解碼器604可包括-封包分解器模組632、複數個解石馬模 • 式634、636、638、一訊框重建模組640及一後濾波器642。 • 將解碼模式634、636、638之數目展示為N,其可表示任何 〇 數目之解碼模式634、636、638。為簡單起見,展示了三種 解碼模式634、636、638,其中虛線指示存在其他解碼模式。 可將一音訊訊號s(n) 610提供至初始參數計算模組618及 模式分類模組622。可將該訊號610劃分為若干樣本區塊(稱 作訊框)。值n可表示訊框數目或值11可表示一訊框中之樣本 數目。在一替代組態中,可使用一線性預測剩餘誤差 訊號來替代音訊訊號610。可由語音編碼器(諸如,一碼激 勵線性預測(CELP)編碼器)使用該LP剩餘誤差訊號。 Ο 初始參數計算模組618可基於當前訊框而導出各種參 數。在一態樣中,此等參數包括以下各者中之至少一者: 線性預測編碼(LPC)濾」皮器係數、、線譜對(LSP)係數、正規 t相關函數(NACF)、開放迴路時滯、零交叉速率、頻帶 能量及共振峰剩餘訊號。在另一態樣中,初始參數計算模 、、且618可错由濾波訊號61〇、計算音調等等來預處理訊 610。 可將初始參數計算模組618麵接至模式分類模組622。該 模式分類模組622可在編碼模式624、626、628之間進行動 122954.doc -18- 200816718 態切換。初始參數計算模組61 8可將關於當前訊框之參數提 供至模式分類模組622。該模式分類模組622可經耦接以逐 訊框地在編碼模式624、626、628之間進行動態切換以便選 擇一用於當前訊框之適當編碼模式624、626、628。模式分 類模組622可藉由將該等參數與預定臨限值及/或最高值相 比較而選擇一用於當前訊框之特定編碼模式624、626、 628。舉例而言,可使用MDCT編碼機制來編碼一與一非語 音訊號相關之訊框。一 MDCT編碼機制可接收一訊框且將一 特定MDCT視窗格式應用於該訊框。下文關於圖8而描述了 特定MDCT視窗格式之一實例。 模式分類模組622可將一語音訊框分類為語音或非活動 語音(例如,無聲、背景雜訊或在言語之間的暫停)。基於訊 框之週期性,模式分類模組622可將語音訊框分類為一特定 類型之語音(例如,濁音、清音或暫態)。 有聲語音可包括顯示出一相對高程度之週期性的語音。 一音調週期可為一語音訊框之一分量,其可用於分析及重 建該訊框之内容。無聲語音可包括子音。暫態語音訊框可 包括在有聲語音與無聲語音之間的過渡。可將既未被分類 為有聲語音亦未被分類為無聲語音之訊框分類為暫態語 將訊框分類為語音還是非語音可允許使用不同編碼模式 624、626、628來編碼不同類型之訊框,從而導致更有效地 使用一共用通道(諸如,通信通道606)中之頻寬。 模式分類模組622可基於訊框之分類而選擇一用於當前 122954.doc -19- 200816718 訊框之編碼模式624、626、628。可並聯耦接各種編碼模式 624、626、628。該等編碼模式624、626、628中之一或多 者可在任何給定時間均為可操作的。在一組態中,根據當 前訊框之分類來選擇一編碼模式624、626、628。 不同編碼模式624、626、628可根據不同編碼位元速率、 不同編碼機制或編碼位元速率與編碼機制之不同組合而操 作。不同編碼模式624、626、628亦可將一不同視窗函數應 用於一訊框。所使用之各種編碼速率可為全速率、半速率、 四分之一速率及/或八分之一速率。所使用之各種編碼模式 624、626、628可為MDCT編碼、碼激勵線性預測(CELP)編 碼、原型音調週期(PPP)編碼(或波形内插(WI)編碼)及/或雜 訊激勵線性預測(NELP)編碼。因此,舉例而言,一特定編 碼模式624、626、628可為MDCT編碼機制,另一編碼模式 可為全速率CELP,另一編碼模式624、626、628可為半速 率CELP,另一編碼模式可為624、626、628可為全速率PPP, 且另一編碼模式624、626、628可為NELP。 根據一使用一傳統視窗來編碼、發射、接收及在解碼器 處重建一音訊訊號之Μ個樣本的MDCT編碼機制,該MDCT 編碼機制利用編碼器處之輸入訊號之2Μ個樣本。換言之, 除音訊訊號之當前訊框之Μ個樣本之外,編碼器可在可開 始編碼之前等待收集額外Μ個樣本。在MDCT編碼機制與其 他編碼模式(諸如,CELP)共存的多模式編碼系統中,使用 用於MDCT計算之傳統視窗格式可影響整體訊框大小及整 個編碼系統之預看長度。本系統及方法針對任何給定之訊 122954.doc -20- 200816718 框大小及預看長度而提供用於MDCT計算之視窗格式的設 計及選擇,使得MDCT編碼機制不會將約束強加於多模式編 碼系統。 根據一 CELP編碼模式,可使用lp剩餘訊號之一量化型式 來激勵一線性預測聲道模型。在CELP編碼模式中,可量化 當前訊框。可使用CELP編碼模式來編碼被分類為暫態語音 之訊框。
根據一 NELP編碼模式,可使用一經濾波之偽隨機雜訊訊 號來模仿LP剩餘訊號。NELp編碼模式可為一達成低位元速 率之相對簡單的技術。可使ffiNELp編碼模式來編碼被分類 為無聲語音之訊框。 根據-PPP編碼模式,可編碼每一訊框内之一音調週期子 集。可藉由於此等原型週期之間進行内插來重建語音訊號 之剩餘週期。在PPP編碼之一時域實施中,可計算一第一: 參數,該第-組參數描述如何修改一先前原型週期以近似 於當前原型週期。可4登摆 .^ 7 了選擇一或多個碼向量,當該或該等碼 向量求^時該或該等碼向量近似於在當前原型週期與經修 改之先前原型週期之間的# 3 ^ 間的差異。一第二組參數描述此等所 選擇之碼向量。在PPP編碼 教好、十、“, K頻域實施中,可計算-組參 數以描述原型之振幅及相位 5! 604VTM ^ # 根據PPP編碼之實施,解碼 1^604可糟由基於描述振 a气m摘±人l 仰诅之右干組參數而重建一 昌刖原型來合成一輸出音 Μ Λ 一 b Λ#ϋ616。可將語音訊號内插為 遍及在當别重建原型週期鱼一 ^ 域。該原型可包括“二、先則重建屑型週期之間的區 括田别訊框之-部分,該部分將被線性地 122954.doc -21 - 200816718 内插有類似地定位於該訊框内的來自先前訊框之原型以便 在解碼器604處重建音訊訊號610或LP剩餘訊號(亦即,將一 往昔原型週期用作當前原型週期之一預測)。 編碼原型週期而非整個訊框可降低編碼位元速率。可以 PPP編碼模式來編碼被分類為有聲語音之訊框。藉由採用有 聲語音之週期性,PPP編碼模式可達成一比CELP編碼模式 低之位速率。 可將所選擇之編碼模式624、626、628耦接至封包格式化 模組630。該所選擇之編碼模式624、626、628可編碼或量 化當前訊框且將該等經量化之訊框參數612提供至封包格 式化模組630。在一組態中,該等經量化之訊框參數係自 MDCT編碼機制所產生之編碼係數。封包格式化模組63〇可 將該等經量化之訊框參數612組合於一格式化封包613中。 封包格式化模組630可經由一通信通道6〇6而將格式化封包 613提供至一接收器(未圖示)。該接收器可接收、解調變及 數位化袼式化封包613,且將封包013提供至解碼器604。 在解碼器604中,封包分解器模組632可自接收器接收封 包613。封包分解器模組632可拆開封包613以擷取編碼訊 框。封包分解器模組632亦可經組態以逐封包地在解碼模式 634、636、638之間進行動態切換。解碼模式634、636、638 之數目可與編碼模式624、626、628之數目相同。每一經編 號之編碼模式624、626、628可與一經組態以採用相同編碼 位疋速率及編碼機制的各別經類似編號之解碼模式^#、 636、638相關。 122954.doc -22· 200816718 若封包分解器模組632偵測到封包613,則分解該封包6 i 3 並將其提供至相關之解碼模式634、636、638。相關之解碼 模式634、636、638可基於封包613内之訊框而實、 CELP、PPP或NELP解碼技術。若封包分解器模組632並未 偵測到一封包,則宣告一封包損失且一抹除解碼器(未圖示) 可執行訊框抹除處理。可將解碼模式634、636、638之並聯 陣列耦接至訊框重建模組640。該訊框重建模組64〇可重建 或合成訊框從而輸出一經合成之訊框。可將該經合成之訊 忙與其他經合成之訊框組合以產生一類似於輸入音訊訊號 s(n) 610的經合成之音訊訊號§(n) 6 16。 圖7為一流程圖,其說明了音訊訊號編碼方法7〇〇之一實 例。可计算702—當前訊框之初始參數。在一組態中,初始 參數計算模組618計算702該等參數。對於非語音訊框而 言,該等參數可包括一或多個係數以指示該訊框為一非語 音讯框。語音訊框可包括以下各者中之一或多者之參數: 線性預測編碼(LPC)濾波器係數、線譜對(LSp)係數、正規 化自相關函數(NACF)、開放迴路時滞、頻帶能量、零交叉 速率及共振峰剩餘訊號。非語音訊框亦可包括諸如線性預 測編碼(LPC)濾波器參數之參數。 :將當前訊框分類704為一語音訊框或一非語音訊框。如 先刚所提及’-語音訊框可與_語音訊號相關且一非語音 訊框可與一非語音訊號(亦即,一音樂訊號)相關。可基於步 ,〇2及7G4中所進行之訊框分類來選擇71卜編碼器/解碼 為核式如圖6中所不,可並聯連接各種編碼器/解碼器模 122954.doc -23 - 200816718 式。不同編碼器/解碼器模式可根據不同編碼機制而操作。 某些模式可在音訊訊號8⑻61〇之顯示某些特性的編碼部 分處更為有效。 如先前所解釋,可選擇“〇(:丁編碼機制以編碼被分類為非 語音訊框(諸如,音樂)之訊框。可選擇CEU>模式以編碼被 分類為暫態語音之訊框。可選擇ppp模式以編碼被分類為有 聲m曰之訊框。可選擇NELP模式以編碼被分類為無聲語音 之訊框。可以變化之效能水平在不同之位元速率來頻繁I 刼作相同編碼技術。圖6中之不同編碼器/解碼器模式可表 示不同編碼技術或以不同位元速率操作之相同編碼技術或 上述之組合。所選擇之編碼器模式71〇可將一適當之視窗函 數應用於訊框。舉例而言,若所選擇之編碼模式為]^〇(::丁 編碼機制,則可應用本系統及方法之一特定MDCT視窗函 數。或者,若所選擇之編碼模式為CELp編碼機制,則可將 一與CELP編碼機制相關之視窗函數應用於訊框。所選擇之 編碼器模式可編碼712當前訊框且將該編碼訊框格式化7 i 4 於一封包中。可將該封包發射716至一解碼器。 圖8為一方塊圖,其說明了在將一特定mdct視窗函數應 用於每一訊框之後複數個訊框8〇2、8〇4、806之一組態。在 一組悲中,一先前訊框8〇2、一當前訊框804及一未來訊框 806可各自被分類為非語音訊框。可由2M來表示當前訊框 804之長度820。先前訊框802及未來訊框806之長度亦可為 2M。當前訊框804可包括一第一零墊區域81〇及一第二零墊 區域818。換言之,第一零墊區域81〇及第二零墊區域818 122954.doc -24- 200816718 中之系數值可為零。 在一組態中,當前訊框804亦包括一重疊長度812及一預 看長度816。可將該重疊長度812及該預看長度816表示為 L。重疊長度812可重疊先前訊框802之預看長度。在一組態 中,值L小於值Μ。在另一組態中,值L等於值Μ。當前訊 框亦可包括一單位長度814,其中在此長度814中訊框之每 一值為1。如所說明,未來訊框806可在當前訊框804之中途 點808處開始。換言之,未來訊框806可在當前訊框804之一 長度Μ處開始。類似地,先前訊框802可在當前訊框804之 中途點808處結束。因而,在當前訊框804上存在先前訊框 802與未來訊框806之50°/。重疊。 若量化器/MDCT係數模組在解碼器處忠實地重建MDCT 係數,則特定MDCT視窗函數可便利於在一解碼器處完美地 重建一音訊訊號。在一組態中,量化器/MDCT係數編碼模 組在解碼器處可能並未忠實地重建MDCT係數。在此狀況 下,解碼器之重建保真度可視量化器/MDCT係數編碼模組 忠實地重建該等係數之能力而定。若一當前訊框被一先前 訊框與一未來訊框兩者重疊50%,則將MDCT視窗應用於該 當前訊框可提供該當前訊框之完美重建。另外,若滿足 Princen-Bradley條件,則MDCT視窗可提供完美重建。如先 前所提及,可將Princen-Bradley條件表達為: w2 (n) + w2 (« + Μ) = 1 ( 3 ) 其中可表示圖8中所說明之MDCT視窗。由方程式(3)所 122954.doc -25 - 200816718 表達之條件可暗示訊框802、804、806上之一被添加至不同 訊框802、8 04、806上之一對應點的點將提供值1。舉例而 言,中途長度808中先前訊框802之一被添加至中途長度808 中當前訊框804之一對應點的點產生值1。 圖9為一流程圖,其說明了 一種用於將一 MDCT視窗函數 應用於一與一非語音訊號相關之訊框(諸如,圖8中所描述 之當前訊框804)的方法900之一組態。應用MDCT視窗函數 之過程可為計算一 MDCT中之一步驟。換言之,在不使用一 滿足兩個連續視窗之間的50%重疊的條件及先前所解釋之 Princen-Bradley條件的視窗的情況下可不應用一完美重建 MDCT。可將方法900中所描述之視窗函數實施為將MDCT 函數應用於一訊框之過程的一部分。在一實例中,來自當 前訊框804之Μ個樣本以及L個預看樣本為可用的。L可為一 任意值。 可產生902當前訊框804之(M-L)/2個樣本之一第一零墊 區域。如先前所解釋,零墊可暗示第一零墊區域810中之樣 本之係數可為零。在一組態中,可提供904當前訊框804之L 個樣本之一重疊長度。當前訊框之L個樣本之重疊長度可重 疊且添加有906先前訊框802之經重建之預看長度。當前訊 框804之第一零墊區域及重疊長度可重疊先前訊框802之 5 0%。在一組態中,可提供908當前訊框之(Μ-L)個樣本。 亦可提供910對於當前訊框而言為預看之L個樣本。該L個預 看樣本可重疊未來訊框806。可產生當前訊框之(M-L)/2個 樣本之一第二零墊區域。在一組態中,當前訊框804之L個 122954.doc -26- 200816718 預看樣本及第二零塾區域可重疊未來訊框806之50%。一已 被應用方法900之訊框可滿足如先前所描述之 Princen-Bradley條件。 圖1 〇為一流程圖,其說明了 一種用於重建一已由MDCT 視窗函數加以修改之訊框的方法1 〇〇〇之一組態。在一組態 中,由訊框重建模組314來實施方法1〇〇〇。可合成1002當前 訊框804之始於第一零墊區域81〇之末端至(m-L)區域8 14之 末端的樣本。可向當前訊框8〇4之L個樣本之重疊區域添加 1004先前訊框802之一預看長度。在一組態中,可儲存1〇〇6 始於(M-L)區域814之末端至第二零墊區域818之開端的當 如訊框804之L個預看樣本816。在一實例中,可將l個預看 樣本816儲存於解碼器3 04之一記憶體組件中。在一組態 中,可輸出1008 Μ個樣本。可將所輸出之M個樣本與額外 樣本組合以重建當前訊框8〇4。 圖11說明了可根據本文中所描述之系統及方法而用於一 通信/計算設備1108中的各種組件。通信/計算設備11〇8可包 括一控制該設備1108之操作的處理器11〇2。亦可將該處理 器1102稱作CPU。記憶體11G4(其可包括唯讀記憶體(r〇m) 及隨機存取記憶體(RAM)兩者)將指令及資料提供至處理器 1102。體1104之-部分亦可包括非揮發性隨機存取記 憶體(NVRAM)。 設備謂亦可包括—含有-發射H111G及-接收器1112 之外殼1122以允許在存取終端機UG8與—遠端位置之間發 射及接收資料。可將發射器111〇及接收器⑴〕組合於一收 122954.doc •27- 200816718 發器1120中。一天線1118附著至外殼1122且電耦接至收發 器1120。可將發射器1110、接收器1112、收發器1120及天 線1118用於一通信設備1108組態中。 設備1108亦包括一用於偵測及量化由收發器1120所接收 之訊號之位準的訊號偵測器1106。訊號偵測器11 〇6偵測諸 如總能量、每偽雜訊(PN)碼片之前導能量、功率譜密度之 訊號及其他訊號。 通信設備1108之一狀態改變器1114基於一當前狀態及由 收發器1120所接收且由訊號偵測器1106所偵測之額外訊號 來控制通信/計算設備110 8之狀態。設備11 〇 8可能能夠以若 干狀態中之任一狀態來操作。 通信/計算設備1108亦包括一系統判定器ι124,該系統判 定器1124用於控制設備1108且在判定當前服務提供者系統 不適當時判定設備1108應轉移至哪一服務提供者系統。 可由一匯流排系統1126而將通信/計算設備11〇8之各種 組件耦接在一起,除一資料匯流排之外,該匯流排系統丨丨26 可包括一功率匯流排、一控制訊號匯流排及一狀態訊號匯 流排。然而,為清晰起見,在圖丨丨中將各種匯流排說明為 匯流排系統1126。通信/計算設備11〇8亦可包括一數位訊號 處理器(DSP)1116以用於處理訊號。 可使用多種不同技術及技巧中之任一者來表示資訊及訊 號。舉例而言,可由電壓、電流、電磁波、磁場或粒子、 光場或粒子或其之任何組合來表示貫穿以上描述而可被參 考的資料、指令、命令、資訊、訊號、位元、符號及碼片。 122954.doc •28- 200816718 可將結合本文中所揭示之組態而描述的各種說明性邏輯 區塊、模組、電路及演算法步驟實施為電子硬體、電腦軟 體或兩者之組合。為清楚地說明硬體與軟體之此互換性, 各種說明性組件、區塊、模組、電路及步驟已大致就其之 功能性而描述於上文。將此功能性實施為硬體還是軟體視 特定應用及強加於整個系統之設計約束而定。熟練技工可 以用於每一特定應用之變化之方式來實施所描述之功能 性’但不應將此等實施決策解釋為導致背離本系統及方法 之範疇。 可藉由經設計以執行本文中所描述之功能的一通用處理 器、一數位訊號處理器(DSP)、一特殊應用積體電路 (ASIC)、一場可程式化閘陣列訊號(FpGA)或其他可程式化 邏輯設備、離散閘或電晶體邏輯、離散硬體組件或其之任 何組合來實施或執行結合本文中所揭示之組態而描述的各 種說明性邏輯區塊、模組及電路。一通用處理器可為一微 處理器,但在替代例中,該處理器可為任何處理器、控制 器、微控制器或狀態機。亦可將一處理器實施為計算設備 之一組合,例如,一DSP與一微處理器之組合、複數個微 處理器、結合一 DSP核心的一或多個微處理器或任何其他 此組合。 結合本文中所揭示之組態而描述的方法或演算法之步驟 可直接以硬體、一由一處理器執行之軟體模組或該兩者之 一組合體現。一軟體模組可常駐於RAM記憶體、快閃記憶 體' ROM記憶體、可抹除可程式化唯讀記憶體(EPr〇m)、 122954.doc •29- 200816718 電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、 抽取式碟片、緊密光碟唯讀記憶體(CD_R0M)或此項技術中 已知之任何其他形式的儲存媒體中。可將一儲存媒體耦接 至该處理器,使得該處理器可自該儲存媒體讀取資訊或將 釦汛寫入至δ亥儲存媒體。在替代例中,該儲存媒體可整合 至忒處理器。该處理器及該儲存媒體可常駐於一 ASIC中。 该ASIC可常駐於一使用者終端機中。在替代例中,該處理 器及該儲存媒體可作為離散組件而常駐於一使用者終端機 中〇
本文中所揭示之方法包含一或多個用於達成所描述之方 法的步驟或動作。該等方法步驟及/或動作可彼此互換而不 背離本系統及方法之範疇。換言之,除非針對組態之恰當 操作而規定步驟或動作之一特定次序’否則可修改特定步 驟及/或動作之次序及/或使用而不背離本系統及方法之範 疇。可將本文中所揭示之方法以硬體、軟體、或兩者實施。 硬體及記憶體之實例可包括RAM、ROM、EPROM、 eeprom、快閃記憶體、光碟、暫存器、硬碟、cd_r⑽ 或任何其他類型之硬體及記憶體。 仏&已說明及描豸了本系統及方法之特冑組態與應用, 但將理解,該料、統及方法並不受限於本文巾所揭示之精 確組態及組件。可在不背離所主張之系統及方法之精神及 料的情況下對本文中所揭示之系統及方法的配置、操作 及細節進行熟習此項技術者所顯而易見之多種修改 及變化。 122954.doc -30- 200816718 【圖式簡單說明】 圖1說明了 一無線通信系統之一組態; 圖2為一說明一計算環境之一組態的方塊圖; 圖3為一說明一訊號發射環境之一組態的方塊圖; 圖4A為一流程圖’其說明了 一種用於以與音訊訊號相關 之°孔框修改視窗之方法的一組態; ;圖扣為-方塊圖’其說明卜用於以與音訊訊號相關之 σ孔框修改視窗之編碼器及一解碼器的一組態; 圖5為一流程圖,其說明了一種用於重建一音訊訊號之一 編碼訊框之方法的一組態; 圖6為一方塊圖,其說明了一與一多模式解碼器通信之多 模式編碼器的一組態; 圖7為一流程圖,其說明了一種音訊訊號編碼方法之一實 例; 圖8為一方塊圖,其說明了在將一視窗函數應用於每一訊 框之後的複數個訊框之一組態; 圖9為一流程圖,其說明了一種用於將一視窗函數應用於 一與一非語音訊號相關之訊框之方法的一組態; 圖10為一流程圖,其說明了 一種用於重建一已由視窗函 數加以修改之訊框之方法的一組態;及 圖Π為一通信/計算設備之一組態中之某些組件的方塊 圖。 【主要元件符號說明】 100 劃碼多向近接(CDMA)無線電 122954.doc -31 - 200816718 話系統/蜂巢式電話系統 102 行動台 104 基地台 106 基地台控制器(BSC) 108 行動交換中心(MSC) 110 公眾交換電話網路(PSTN) 200 計算環境 202 來源計算設備 204 接收計算設備 206 接收行動計算設備 210 網路 212 300 302 304 306 308 310 312 314 316 401 403 音訊訊號 訊號發射環境 編碼器 解碼器 發射媒體 視窗格式化模組 語音訊號 經編碼之音訊訊號 訊框重建模組 經合成之音訊訊號 MDCT編碼器 輸入音訊訊號 預處理器 122954.doc -32- 405 200816718
407 經處理之音訊訊號 409 MDCT函數 411 量化器 413 編碼係數 415 IMDCT 417 訊號值 419 最後Μ個樣本 421 延遲器 423 最初Μ個樣本 425 求和器 427 經重建之Μ個樣本 429 MDCT解碼器 602 多模式編碼器 604 多模式解碼器 606 通信通道 610 音訊訊號 612 經量化之訊框參數 613 格式化封包 616 經合成之音訊訊號 618 初始參數計算模組 622 模式分類模組 624 編碼模式 626 編碼模式 628 編碼模式 122954.doc -33 - 200816718 630 封包格式化模組 632 封包分解器模組 634 解碼模式 636 解碼模式 638 解碼模式 640 訊框重建模組 642 後濾波器 802 先前訊框 804 當前訊框 806 未來訊框 808 中途點 810 第一零墊區域 812 重疊長度 814 單位長度/(M-L)區域 816 預看長度 818 第二零墊區域 820 當前訊框之長度 1102 處理器 1104 記憶體 1106 訊號偵測器 1108 通信/計算設備 1110 發射器 1112 接收器 1114 狀態改變器 122954.doc -34- 200816718 1116 數位訊號處理器(DSP) 1118 天線 1120 收發器 1122 外殼 1124 系統判定器 1126 系統匯流排 122954.doc -35-
Claims (1)
- 200816718 十、申請專利範圍: 1 · 一種用於以一與一音訊訊號相關之訊框修改一視窗之方 法,該方法包含: 接枚一訊號; 將該訊號分割為複數個訊框; 判定該複數個訊框内之一訊框是否與一非語音訊號相 關; Γ若判定該訊框與一非語音訊號相關,則將一修改型離 散餘弦轉換(MDCT)視窗函數應用於該視窗以產生一第 一零塾區域及一第二零墊區域;及 編碼該訊框。 2·如睛求項1之方法,其中該訊框係使用一基於MDCT編碼 之機制而被編碼的。 3·如請求項1之方法,其中該訊框包含一為2Μ之長度,其中 Μ表示該訊框中之樣本之一數目。 夂項1之方法,其中該第一零墊區域位於該訊框之開 端。 其中該第二零墊區域位於該訊框之末 5 ·如请求項1之方法 端。 6 · 如請求項1 $ ft 人 、 去’其中該第一零墊區域及該第二區域包 二(M L)/2之長度,其中1^係一小於或等於%之值,且 其中Μ係該訊框中之樣本之一數目。 7.如請求項6之方 .w 去’其進一步包含提供一長度為L之當前 重璺區域。 122954.doc 200816718 8·如請求項7夕古 、万法:’其中該長度為L之重疊區域重疊且添 加有與 » 无則机框相關之預看樣本。 9 · 如請求瑁1 β +、ι 、、之方法’其進一步包含提供一長度為L之預看 區 ,甘 J , τ, T L小於或等於Μ,且其中Μ係該訊框中之樣本 之一數目。 10. 11. 〇 12. 如明求項9之方法,其中該長度為l之預看區域重疊一與 一未來訊框相關之未來重疊區域。 如明求項1之方法,其中該第一零墊區域及該當前重疊區 域重豐一先前訊框之5〇%。 如明求項1之方法,其中該第二零墊區域及該預看區域重 璺一未來訊框之50%。 13·如請求項1之方法,其中添加有一來自一重疊訊框之相關 樣本的該訊框之每一樣本的一和等於1。 14· 一種用於以一與一音訊訊號相關之訊框修改一視窗之裝 置,其包含: 一處理器; 與該處理器電子通信之記憶體; 儲存於該記憶體中之指令,該等指令可執行以: 接收一訊號; 將該訊號分割為複數個訊框; 判定該複數個訊框内之一訊框是否與一非語音訊號 相關; 若判定該訊框與一非語音訊號相關,則將一修改型 離散餘弦轉換(MDCT)視窗函數應用於該訊框以產生一 122954.doc -2- 200816718 第—零墊區域及一第二零墊區域;及 編碼該訊框。 15·如印求項14之裝置,其中該訊框係使用一基於MDCT編碼 之機制而被編碼的。 16·如印求項14之裝置,其中該訊框包含一等於之樣本長 度’其中Μ表示該訊框中之樣本之一數目。 如叫求項14之裝置,其中該第一零塾區域位於該訊框之 開端。 如明求項14之裝置,其中該第二零墊區域位於該訊框之 末端。 19·種經組態而以一與一音訊訊號相關之訊框修改一視窗 之系統,其包含: 用於處理之構件; 用於接收一訊號之構件; 用於將該訊號分割為複數個訊框之構件; 用於判定該複數個訊框内之一訊框是否與一非語音訊 號相關的構件; 用於在判定該訊框與一非語音訊號相關的情況下將一 修改型離散餘弦轉換(MDCT)視窗函數應用於該訊框以 產生一第一零墊區域及一第二零墊區域的構件;及 用於編碼該訊框之構件。 20· —種電腦可讀取媒體’其經組態以儲存一組指令,該等 指令可執行以: 接收一訊號; 122954.doc 200816718 將該訊號分割為複數個訊框· 判定該複數個訊框内之—訊框是否與一非語音訊號相 關, 右判定該訊框與一非語音訊號相關,則將—修改型離 散餘弦轉換(MDCT)視窗函數應用於該訊框以產生一第 一零墊區域及一第二零墊區域;及 編碼該訊框。21. -種用於選擇-待用於計算一訊框之一纟改型離散餘弦 轉換(MDCT)之視窗函數的方法,該方法包含: 提供一用於選擇一待用於計算一訊框之一 mdct之視 窗函數的演算法; 將該所選擇之視窗函數應用於該訊框;及 基於由額外編碼模式強加於一撾〇(:7編碼模式之約束 而以該MDCT編碼模式來編碼該訊框,其中該等約束包含 該訊框之一長度、一預看長度及一延遲。 22· —種用於重建一音訊訊號之一編碼訊框的方法,該方法 包含: ~ / 接收一封包; 分解該封包以擷取一編碼訊框; 區域之間 合成該訊框之位於一第一零墊區域與一第 的樣本; 向一第 長度; 一長度之一重疊區域添加 一先前訊框之一預看 儲存該訊框之該第一長度之一預看;及 輸出一經重建之訊框。 122954.doc -4-
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US83467406P | 2006-07-31 | 2006-07-31 | |
| US11/674,745 US7987089B2 (en) | 2006-07-31 | 2007-02-14 | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW200816718A true TW200816718A (en) | 2008-04-01 |
| TWI364951B TWI364951B (en) | 2012-05-21 |
Family
ID=38792218
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW096128077A TWI364951B (en) | 2006-07-31 | 2007-07-31 | Systems and methods for modifying a window with a frame associated with an audio signal |
Country Status (10)
| Country | Link |
|---|---|
| US (1) | US7987089B2 (zh) |
| EP (1) | EP2047463A2 (zh) |
| JP (1) | JP4991854B2 (zh) |
| KR (1) | KR101070207B1 (zh) |
| CN (1) | CN101496098B (zh) |
| BR (1) | BRPI0715206A2 (zh) |
| CA (1) | CA2658560C (zh) |
| RU (1) | RU2418323C2 (zh) |
| TW (1) | TWI364951B (zh) |
| WO (1) | WO2008016945A2 (zh) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI426503B (zh) * | 2008-07-11 | 2014-02-11 | Fraunhofer Ges Forschung | 用以使用頻疊切換方案將音訊信號編碼/解碼的裝置與方法 |
| TWI555510B (zh) * | 2015-12-03 | 2016-11-01 | 財團法人工業技術研究院 | 非侵入式血醣量測裝置及使用其之量測方法 |
| TWI581252B (zh) * | 2014-07-28 | 2017-05-01 | 弗勞恩霍夫爾協會 | 使用截斷分析或合成窗段重疊部分處理音訊信號的方法及處理器 |
| TWI588818B (zh) * | 2014-07-28 | 2017-06-21 | 弗勞恩霍夫爾協會 | 使用零輸入響應以獲得平滑移轉的音訊解碼器、方法及電腦程式 |
| TWI851177B (zh) * | 2022-08-31 | 2024-08-01 | 新唐科技股份有限公司 | 延遲判斷系統及其方法 |
Families Citing this family (36)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
| WO2008108702A1 (en) * | 2007-03-02 | 2008-09-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Non-causal postfilter |
| US8214200B2 (en) * | 2007-03-14 | 2012-07-03 | Xfrm, Inc. | Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid |
| US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
| KR100922897B1 (ko) * | 2007-12-11 | 2009-10-20 | 한국전자통신연구원 | Mdct 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법 |
| KR101441896B1 (ko) * | 2008-01-29 | 2014-09-23 | 삼성전자주식회사 | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 |
| MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
| KR20100007738A (ko) * | 2008-07-14 | 2010-01-22 | 한국전자통신연구원 | 음성/오디오 통합 신호의 부호화/복호화 장치 |
| US9384748B2 (en) | 2008-11-26 | 2016-07-05 | Electronics And Telecommunications Research Institute | Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching |
| CN102930871B (zh) * | 2009-03-11 | 2014-07-16 | 华为技术有限公司 | 一种线性预测分析方法、装置及系统 |
| WO2010102446A1 (zh) * | 2009-03-11 | 2010-09-16 | 华为技术有限公司 | 一种线性预测分析方法、装置及系统 |
| KR101297026B1 (ko) * | 2009-05-19 | 2013-08-14 | 광운대학교 산학협력단 | Mdct―tcx 프레임과 celp 프레임 간 연동을 위한 윈도우 처리 장치 및 윈도우 처리 방법 |
| TWI435317B (zh) * | 2009-10-20 | 2014-04-21 | Fraunhofer Ges Forschung | 音訊信號編碼器、音訊信號解碼器、用以提供音訊內容之編碼表示型態之方法、用以提供音訊內容之解碼表示型態之方法及使用於低延遲應用之電腦程式 |
| EP2372704A1 (en) * | 2010-03-11 | 2011-10-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Signal processor and method for processing a signal |
| US8924222B2 (en) | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
| US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
| EP2645365B1 (en) * | 2010-11-24 | 2018-01-17 | LG Electronics Inc. | Speech signal encoding method and speech signal decoding method |
| US20130311174A1 (en) * | 2010-12-20 | 2013-11-21 | Nikon Corporation | Audio control device and imaging device |
| US9942593B2 (en) * | 2011-02-10 | 2018-04-10 | Intel Corporation | Producing decoded audio at graphics engine of host processing platform |
| CA2903681C (en) | 2011-02-14 | 2017-03-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
| CA2827156C (en) | 2011-02-14 | 2017-07-18 | Tom Backstrom | Encoding and decoding of pulse positions of tracks of an audio signal |
| MY166394A (en) * | 2011-02-14 | 2018-06-25 | Fraunhofer Ges Forschung | Information signal representation using lapped transform |
| WO2012110415A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
| KR101562281B1 (ko) | 2011-02-14 | 2015-10-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 |
| SG192721A1 (en) * | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
| RU2575993C2 (ru) | 2011-02-14 | 2016-02-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Основанная на линейном предсказании схема кодирования, использующая формирование шума в спектральной области |
| MX2013009301A (es) | 2011-02-14 | 2013-12-06 | Fraunhofer Ges Forschung | Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio. |
| MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
| FR2977439A1 (fr) * | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
| US9037456B2 (en) | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
| CN103325373A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 用于传送和接收音频信号的方法和设备 |
| KR20140075466A (ko) * | 2012-12-11 | 2014-06-19 | 삼성전자주식회사 | 오디오 신호의 인코딩 및 디코딩 방법, 및 오디오 신호의 인코딩 및 디코딩 장치 |
| PT2959482T (pt) * | 2013-02-20 | 2019-08-02 | Fraunhofer Ges Forschung | Aparelho e método para codificar ou descodificar um sinal de áudio usando uma sobreposição dependente da localização de transiente |
| CA3029041C (en) | 2013-04-05 | 2021-03-30 | Dolby International Ab | Audio encoder and decoder |
| WO2014202790A1 (en) | 2013-06-21 | 2014-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improved signal fade out in different domains during error concealment |
| CN112735449B (zh) * | 2020-12-30 | 2023-04-14 | 北京百瑞互联技术有限公司 | 优化频域噪声整形的音频编码方法及装置 |
Family Cites Families (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5384891A (en) * | 1988-09-28 | 1995-01-24 | Hitachi, Ltd. | Vector quantizing apparatus and speech analysis-synthesis system using the apparatus |
| US5357594A (en) * | 1989-01-27 | 1994-10-18 | Dolby Laboratories Licensing Corporation | Encoding and decoding using specially designed pairs of analysis and synthesis windows |
| CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
| FR2675969B1 (fr) * | 1991-04-24 | 1994-02-11 | France Telecom | Procede et dispositif de codage-decodage d'un signal numerique. |
| US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
| JP3531177B2 (ja) | 1993-03-11 | 2004-05-24 | ソニー株式会社 | 圧縮データ記録装置及び方法、圧縮データ再生方法 |
| DE69619284T3 (de) * | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
| US5704003A (en) * | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
| US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
| EP0932141B1 (en) * | 1998-01-22 | 2005-08-24 | Deutsche Telekom AG | Method for signal controlled switching between different audio coding schemes |
| WO2000070769A1 (en) | 1999-05-14 | 2000-11-23 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for expanding band of audio signal |
| JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
| EP1199711A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Encoding of audio signal using bandwidth expansion |
| US7461002B2 (en) * | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
| US7136418B2 (en) * | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
| US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
| US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
| EP1341160A1 (en) * | 2002-03-01 | 2003-09-03 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for encoding and for decoding a digital information signal |
| US7116745B2 (en) * | 2002-04-17 | 2006-10-03 | Intellon Corporation | Block oriented digital communication system and method |
| US20040098255A1 (en) * | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
| GB0321093D0 (en) | 2003-09-09 | 2003-10-08 | Nokia Corp | Multi-rate coding |
| FR2867649A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
| US7516064B2 (en) * | 2004-02-19 | 2009-04-07 | Dolby Laboratories Licensing Corporation | Adaptive hybrid transform for signal analysis and synthesis |
| BRPI0517513A (pt) | 2004-10-26 | 2008-10-14 | Matsushita Electric Industrial Co Ltd | aparelho de codificação de som e processo de sua realização |
| SG163555A1 (en) * | 2005-04-01 | 2010-08-30 | Qualcomm Inc | Systems, methods, and apparatus for highband burst suppression |
-
2007
- 2007-02-14 US US11/674,745 patent/US7987089B2/en active Active
- 2007-07-31 EP EP07799949A patent/EP2047463A2/en not_active Ceased
- 2007-07-31 JP JP2009523026A patent/JP4991854B2/ja active Active
- 2007-07-31 WO PCT/US2007/074898 patent/WO2008016945A2/en not_active Ceased
- 2007-07-31 CA CA2658560A patent/CA2658560C/en active Active
- 2007-07-31 KR KR1020097003972A patent/KR101070207B1/ko active Active
- 2007-07-31 RU RU2009107161/09A patent/RU2418323C2/ru active
- 2007-07-31 CN CN2007800282862A patent/CN101496098B/zh active Active
- 2007-07-31 TW TW096128077A patent/TWI364951B/zh active
- 2007-07-31 BR BRPI0715206-0A patent/BRPI0715206A2/pt not_active Application Discontinuation
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI426503B (zh) * | 2008-07-11 | 2014-02-11 | Fraunhofer Ges Forschung | 用以使用頻疊切換方案將音訊信號編碼/解碼的裝置與方法 |
| US8862480B2 (en) | 2008-07-11 | 2014-10-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoding/decoding with aliasing switch for domain transforming of adjacent sub-blocks before and subsequent to windowing |
| TWI581252B (zh) * | 2014-07-28 | 2017-05-01 | 弗勞恩霍夫爾協會 | 使用截斷分析或合成窗段重疊部分處理音訊信號的方法及處理器 |
| TWI588818B (zh) * | 2014-07-28 | 2017-06-21 | 弗勞恩霍夫爾協會 | 使用零輸入響應以獲得平滑移轉的音訊解碼器、方法及電腦程式 |
| US10262666B2 (en) | 2014-07-28 | 2019-04-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions |
| US10902861B2 (en) | 2014-07-28 | 2021-01-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Processor and method for processing an audio signal using truncated analysis or synthesis window overlap portions |
| US11664036B2 (en) | 2014-07-28 | 2023-05-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Processor and method for processing an audio signal using truncated analysis or synthesis window overlap portions |
| TWI555510B (zh) * | 2015-12-03 | 2016-11-01 | 財團法人工業技術研究院 | 非侵入式血醣量測裝置及使用其之量測方法 |
| TWI851177B (zh) * | 2022-08-31 | 2024-08-01 | 新唐科技股份有限公司 | 延遲判斷系統及其方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP2047463A2 (en) | 2009-04-15 |
| TWI364951B (en) | 2012-05-21 |
| CN101496098A (zh) | 2009-07-29 |
| CN101496098B (zh) | 2012-07-25 |
| WO2008016945A2 (en) | 2008-02-07 |
| US7987089B2 (en) | 2011-07-26 |
| JP4991854B2 (ja) | 2012-08-01 |
| WO2008016945A9 (en) | 2008-05-29 |
| RU2418323C2 (ru) | 2011-05-10 |
| BRPI0715206A2 (pt) | 2013-06-11 |
| KR20090035717A (ko) | 2009-04-10 |
| CA2658560C (en) | 2014-07-22 |
| KR101070207B1 (ko) | 2011-10-06 |
| JP2009545780A (ja) | 2009-12-24 |
| WO2008016945A3 (en) | 2008-04-10 |
| CA2658560A1 (en) | 2008-02-07 |
| RU2009107161A (ru) | 2010-09-10 |
| US20080027719A1 (en) | 2008-01-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TW200816718A (en) | Systems and methods for modifying a window with a frame associated with an audio signal | |
| RU2470384C1 (ru) | Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов | |
| KR100805983B1 (ko) | 가변율 음성 코더에서 프레임 소거를 보상하는 방법 | |
| ES2322129T3 (es) | Procedimiento y aparato para la interoperatividad entre sistemas de trtansmision de voz durante inactividad de habla. | |
| TW519616B (en) | Method and apparatus for predictively quantizing voiced speech | |
| US7848921B2 (en) | Low-frequency-band component and high-frequency-band audio encoding/decoding apparatus, and communication apparatus thereof | |
| TWI436349B (zh) | 用於重建一被抹除語音訊框之系統與方法 | |
| CN101512639B (zh) | 用于语音/音频发送器和接收器的方法和设备 | |
| TW201131550A (en) | Systems and methods for preventing the loss of information within a speech frame | |
| JP2009193073A (ja) | 望ましくないパケット生成を減少する方法および装置 | |
| ES2297578T3 (es) | Procedimiento y aparato para submuestrear informacion del espectro de fase. | |
| JP2003501675A (ja) | 時間同期波形補間によるピッチプロトタイプ波形からの音声を合成するための音声合成方法および音声合成装置 | |
| JP2005503574A5 (zh) | ||
| Sinder et al. | Recent speech coding technologies and standards | |
| KR101164834B1 (ko) | 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 시스템 및 방법 | |
| JP4437011B2 (ja) | 音声符号化装置 |