[go: up one dir, main page]

TWI364951B - Systems and methods for modifying a window with a frame associated with an audio signal - Google Patents

Systems and methods for modifying a window with a frame associated with an audio signal Download PDF

Info

Publication number
TWI364951B
TWI364951B TW096128077A TW96128077A TWI364951B TW I364951 B TWI364951 B TW I364951B TW 096128077 A TW096128077 A TW 096128077A TW 96128077 A TW96128077 A TW 96128077A TW I364951 B TWI364951 B TW I364951B
Authority
TW
Taiwan
Prior art keywords
window
frame
frames
mdct
signal
Prior art date
Application number
TW096128077A
Other languages
English (en)
Other versions
TW200816718A (en
Inventor
Venkatesh Krishnan
Ananthapadmanabhan A Kandhadai
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW200816718A publication Critical patent/TW200816718A/zh
Application granted granted Critical
Publication of TWI364951B publication Critical patent/TWI364951B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

九、發明說明: 【發明所屬之技術領域】 本系統及方法大體而言係關於語音處理技術。更特定古 之,本系統及方法係關於以與音訊訊號相關之訊框修改視 窗之系統及方法。 【先前技術】 藉由數位技術來發射聲音已變得普遍,尤其是在長距 離、數位無線電電話應用、使用電腦之視訊訊息傳遞等等 中。此又對判定可經由通道發送之最少量資訊且同時保持 所重建之st音之可察覺品質產生了興趣。吾人發現用於壓 縮語音之設備可用於許多電信領域中。電信之一實例為無 線通信。另一實例為經由電腦網路(諸如,網際網路)之通 信。通信領域具有許多應用,包括(例如)電腦、膝上型電腦、 個人數位助理(PDA)、無繩電話、尋呼機、無線區域迴路、 無線電話(諸如,蜂巢式及攜帶型通信系統(PCS)電話系 統)、行動網際網路協定(IP)電話及衛星通信系統。 【發明内容】 描述了 一種用於以與音訊訊號相關之訊框修改視窗之方 法。接收一訊號。將該訊號分割為複數個訊框。判定該複 數個訊框内之一訊框是否與一非語音訊號相關。若判定該 訊框與一非語音訊號相關,則將一經修改之離散餘弦變換 (MDCT)視窗函數應用於該訊框以產生一第一零墊區域及 一第二零墊區域。編碼該訊框。 亦描述了一種用於以與音訊訊號相關之訊框修改視窗之 122954.doc •6- 1364951 裝置。該裝置包括一處理器及與該處理器進行電子通信之 記憶體。諸指令儲存於該記憶體中。該等指令可執行以: 接收一訊號;將該訊號分割為複數個訊框;判定該複數個 訊框内之一訊框是否與一非語音訊號相關;若判定該訊框 與一非語音訊號相關,則將一經修改之離散餘弦變換 (MDCT)視窗函數應用於該訊框以產生一第一零墊區域及 一第二零墊區域;及編碼該訊框。
亦描述了一種經組態而以與音訊訊號相關之訊框修改視 窗的系統。該系統包括一用於處理之構件及一用於接收一 訊號之構件。該系統亦包括一用於將該訊號分割為複數個 訊框之構件及一用於判定該複數個訊框内之一訊框是否與 一非語音訊號相關之構件。該系統進一步包括一用於在判 定該訊框與一非語音訊號相關之情況下將一經修改之離散 餘弦變換(MDCT)視窗函數應用於該訊框以產生一第一零
墊區域及一第二零墊區域的構件及一用於編碼該訊框之構 件。 亦描述了一種經組態以儲存一組指令的電腦可讀取媒 體。該等指令可執行以:接收一訊號;將該訊號分割為複 數個訊框;判定該複數個訊框内之一訊框是否與一非語音 訊號相關;若判定該訊框與一非語音訊號相關,則將一經 修改之離散餘弦變換(MDCT)視窗函數應用於該訊框以產 生一第一零墊區域及一第二零墊區域;及編碼該訊框。 亦描述了一種用於選擇一待用於計算訊框之經修改之離 散餘弦變換(MDCT)之視窗函數的方法。提供一用於選擇一 122954.doc C Ξ ) 1364951 待用於計算訊框之MDct之視窗函數的演算法。將該所選擇 之視窗函數應用於該訊框。基於由額外編碼模式強加於一 MDCT編碼模式之約束而以該MDCT編碼模式來編碼該訊 框,其中該等約束包含該訊框之一長度、一預看長度及一 延遲。
亦描述了一種用於重建音訊訊框之編碼訊框的方法。接 收一封包。分解該封包以擷取一編碼訊框。合成該訊框之 位於一第一零墊區域與一第一區域之間的樣本。向一第一 長度之一重疊區域添加一先前訊框之一預看長度。儲存該 訊框之該第一長度之一預看。輸出一經重建之訊框。 【實施方式】
現參看諸圖來描述該等系統及該等方法之各種組態其 中類似之參考數字指示相同或功能類似之元件。如大致在 本文中之諸圖中所描述及說明’可以廣泛之多種不同組態 來配置及設計本系統及方法之特徵。因此,下文之實施方 式並不意欲限制如所主張之系統及方法之料,而是僅表 示該等系統及該等方法之組態。 可將本文中所揭示之組態之許多特徵實施為電腦軟體、 電子硬體或兩者之組合。為清楚地說明硬體與軟體之此互 換性’將大致就各種組件之功能性來描述該等組件。將此 功月&性實施為硬體遗县赴興^目纟± 瓶遇疋軟體視特定應用及強加於整個系, 之設計約束而定。熟練技工可以用於每一特定應用之變 之方式來實施所描述之功能性,但不應將此等實施決策) 釋為導致背離本系統及方法之範疇。 122954.doc 1364951 Λ 在將所描述之功能性實施為電腦軟體之情況下,此軟體 可包括任何類型之可位於一記憶體設備内及/或作為電子 訊號而經由一系統匯流排或網路發射的電腦指令或電腦可 執行碼。實施與本文中所描述之組件相關之功能性的軟體 可包含單個指令或許多指令’且可分布為遍及若干不同瑪 段、分布於不同程式中及分布為跨越若干記憶體設備。
如本文中所使用’術語"一組態"、"組態"、"(若干)組維” "該組態"、"該等組態"、"一或多個組態"、"一些組態"、 "某些組態"、"一個組態”、"另一組態"及其類似物意謂"所 揭示之系統及方法之一或多個(但未必全部)組態",除非另 外明確規定。
術語"判定··(及其之語法變體)係以一極為廣泛之意義來 使用。術語”判定"包含廣泛之多種動作且因此••判定"可包括 核算、計算、處理、導出、調查、查找(例如,在一表格、 一資料庫或另一資料結構中進行查找)、確定及其類似物。 又,”判定"可包括接收(例如,接收資訊)、存取(例如,存 取一記憶體中之資料)及其類似物β又,"判定"可包括解析' 選擇、挑選、建立及其類似物。 短語”基於’’並不意謂"僅基於",除非另外明確規定。換言 之’短語’’基於"描述了"僅基於"與"至少基於"兩者。一般而 言’可使用短語"音訊訊號,,來指代一可被聽到之訊號。音 訊訊號之實例可包括表示人類語音、器樂及聲樂、音調聲 等等。 圖1說明了 一劃碼多向近接(CDMA)無線電話系統100,其 122954.doc -9- 1364951
可包括複數個行動台102、複數個基地台104、一基地台控 制器(BSC)106及一行動交換中心(MSC)108。MSC 108可經 組態以與一公眾交換電話網路(PSTN) 110建立介面。MSC 108亦可經組態以與BSC 106建立介面。系統100中可存在一 個以上之BSC 106。每一基地台104可包括至少一個扇區(未 圖示),其中每一扇區可具有一全向天線或一指向一徑向地 遠離基地台104之特定方向的天線。或者,每一扇區可包括 兩個用於分集接收之天線。每一基地台104可經設計以支援 複數次頻率指派。可將一扇區與一頻率指派之相交部分稱 作一 CDMA通道。行動台102可包括蜂巢式或攜帶型通信系 統(PCS)電話。
在蜂巢式電話系統100之操作期間,基地台104可自若干 組行動台102接收若干組反向鏈路訊號。該等行動台102可 正進行電話呼叫或其他通信。由一給定之基地台104所接收 的每一反向鏈路訊號可在彼基地台104内加以處理。可將所 得資料轉發至BSC 106。該BSC 106可提供呼叫資源配置及 行動性管理功能性(包括對在基地台104之間的軟交遞的控 制)。BSC 100亦可將所接收之資料投送至MSC 108,該MSC 108提供額外之投送服務以用於與PSTN 110建立介面。類似 地,PSTN 110可與MSC 108建立介面,且該MSC 108可與 BSC 106建立介面,該BSC 106又可控制基地台104以將若干 組轉發鏈路訊號發射至若干組行動台102。 圖2描繪了一計算環境200之一組態,該計算環境200包括 一來源計算設備202、一接收計算設備204及一接收行動計 122954.doc •10· 1364951 鼻。又備206 »來源計算設備202可經由一網路2丨〇而與接收計 算設備204、206通信。網路210可為某一類型之計算網路, 其包括(但不限於)網際網路、區域網路(LAN)、校園區域網 路(CAN)、都會區域網路(MAN)、廣域網路(wan)、環狀網 路、星形網路、符記環狀網路等等。 在一組態中,來源計算設備2〇2可編碼音訊訊號2 12且經 由網路210而將其發射至接收計算設備2〇4、2〇6。音訊訊號 212可包括語音訊號、音樂訊號、音調、背景雜訊訊號等等。 如本文中所使用,"語音訊號"可指代由一人類語音系統所 產生之訊號且"非語音訊號"可指代並非由人類語音系統所 產生之訊號(亦即,音樂、背景雜訊等等)(> 來源計算設備2〇2 可為打動電話、個人數位助理(PDA)、膝上型電腦、個人電 腦或任何其他具有一處理器之計算設備。接收計算設備2〇4 可為個人電腦、電話等等。接收行動計算設備2〇6可為行動 電話、PDA、膝上型電腦或任何其他具有一處理器之行動 計算設備》 圖3描繪了一訊號發射環境3〇〇,其包括一編碼器3〇2、一 解碼器304及一發射媒體306。可在一行動台1〇2或一來源計 算設備202内實施編碼器302。可在一基地台1〇4、行動台 102、一接收計算設備204或一接收行動計算設備2〇6中實施 解碼器304。編碼器302可編碼一音訊訊號s(n) 31〇,從而形 成一經編碼之音訊訊號Sene(n) 312。可跨越發射媒體3〇6而 將經編碼之音訊訊號312發射至解碼器3〇4 ^發射媒體3〇6 可幫助編碼器302以無線方式將一經編碼之音訊訊號312發 122954.doc -11- 1364951 射至解碼器或其可幫助編碼器302經由一在編碼器3〇2與解 • 碼器304之間的有線連接來發射經編碼之訊號312。解碼器 304可解瑪Sene⑷312,藉此產生一經合成之音訊訊號㈣ ‘ · 316 〇 • 如本文中所使用,術語"編碼"可通常指代包含編碼與解 ㉟兩者之方法。Μ ’編碼系、统、編碼方法及編碼裝置試 圖使經由發射媒體306所發射之位元的數目(亦即,使Senc(n) • 312之頻寬最小化)最小化’同時保持可接受之訊號重現(亦 即,s(n) 310 = g(n) 316)。經編碼之音訊訊號312之組合可 根據由編碼器302所利用之特定音訊編碼模式而變化。下文 描述了各種編碼模式。 可將下文所描述之編碼器3〇2及解碼器3〇4之組件實施為 電子硬體、電腦軟體或兩者之組合。下文就此等組件之功 月b性而描述了該等組件。將功能性實施為硬體還是軟體可 視特定應用及強加於整個系統之設計約束而定。發射媒體 參 306可表示許多不同發射媒體,其包括(但不限於)基於陸地 之通信線、在基地台與衛星之間的鏈路、在蜂巢式電話與 基地台之間的無線通信、在行動電話與衛星之間的無線通 k或在計算設備之間的通信。 通信之每一方可發射資料以及接收資料。每一方可利用 一編碼器302及-解碼器304。然』,下文將把訊號發射環 境300描述為包括位於發射媒體3〇6之一端處之編碼器 及位於另一端處之解碼器3〇4。 在一組態中,s(n) 310可包括一在一典型對話(包括不同 122954.doc •12· 1364951 週期)期間所獲得之數位語音訊號。可將該語音 …S η) 310分割為若干訊框且可將每一訊框進一步分叼 為若干子贿。可使用此意挑選之訊框/子訊輕邊界 (其中執行某-區塊相此意義上,亦可料訊框執行 被描述為對訊框所執行的操作;本文中可互換使用訊框及 子訊框。X ’可將一或多個訊框包括於一視窗中,該視窗 可說明在各種訊框之間的置放及時序。 在另一組態中,s⑷310可包括一非語音訊號,諸如,一 音樂訊號。可將該非語音訊號分割為若干訊框。可將一或 多個訊框包括於一視窗中,該視窗可說明在各種訊框之間 的置放及時序。視窗之選擇可視經實施以編碼訊號之編碼 技術及可強加於系統之延遲約束而定。本系統及方法描述 了一種用於選擇一視窗形狀之方法,該視窗形狀用於在一 能夠編碼語音訊號與非語音訊號兩者之系統中以基於一經 修改型離散餘弦轉換(MDCT)及一修改型離散餘弦反轉換 (IMDCT)的編碼技術來編碼及解碼非語音訊號。該系統可 強加約束於可由基於MDCT之編碼器使用多少訊框延遲及 預看而使得能夠以一均勻速率產生編碼資訊。 在一組態中,編瑪器302包括一可格式化包括與非語音訊 號相關之訊框之視窗的視窗格式化模組308。可編碼被包括 於格式化視窗中之訊框且解碼器可藉由實施一訊框重建模 組314而重建編碼訊框。訊框重建模組314可合成該等編瑪 訊框以使得該等訊框類似於語音訊號310之預編碼訊框。 圖4為一流程圖’其說明了一種用於以與音訊訊號相關之 122954.doc -13· 1364951 訊框修改視窗之方法400的一組態。該方法400可由编碼器 3 02實施。在一組態中,接收402—訊號。該訊號可為如先 前所描述之音訊訊號。可將該訊號分割404為複數個訊框。 可應用408—視窗函數以產生一視窗且可產生一第一零墊 區域及一第二零墊區域作為該視窗之一部分以用於計算一 修改型離散餘弦轉換(MDCT)。換言之,視窗之開始部分及 結束部分之值可為零。在一態樣中,第一零墊區域之長度 及第二零墊區域之長度可隨編碼器302之延遲約束而定。
可將修改型離散餘弦轉換(MDCT)函數用於若干音訊編 碼標準中以將脈碼調變(PCM)訊號樣本或將其之經處理型 式變換為其之等效頻域表示。MDCT可類似於IV型離散餘 弦變換(DCT),其中訊框之額外特性彼此重疊。換言之,一 訊號之由MDCT所變換之連續訊框可彼此重疊50%。
另外,對於2M個樣本中之每一訊框而言,MDCT可產生 Μ個變換係數。MDCT可為一苛刻取樣式完美重建濾波器 組。為提供完美重建,可由下式給出獲自訊號X⑻(n= 0 ' 1、...、2M)之一訊框的 MDCT係數义W(k = 0、1、…、Μ): 2Λ/-1 (1) Χ(Α:)=艺X⑻化⑻ 其中 hk(n) = w(n)
(2« + M + \\2k + \)π AM (2) (k=0、1、…、Μ),且 w(n)為一可滿足 Princen-Bradley條件 之視窗,該Princen-Bradley條件陳述為:
122954.doc • 14- 1364951 w2 («) + w2 (« + Μ) = 1 ( 3 ) 在解碼器處,可使用一反MDCT(IMDCT)而將M個編碼係 數變換回至時域。若夕W,(k=0、1、2、…、Μ)為所接收之 MDCT係數,貝ij對應之IMDCT解碼器藉由根據下式而首先 採用所接收之係數之IMDCT來獲得2M個樣本而產生經重 建之音訊訊號: 文⑻=Σ义⑷⑻ for n=0、1、…、2M-1 (4) *=0
其中/2〆《」由方程式(2)來界定,接著向當前訊框之最初Μ個 樣本重疊及添加先前訊框之IMDCT輸出之Μ個最後樣本及 來自下一訊框之IMDCT輸出之最初Μ個樣本。因此,若對 應於下一訊框之解碼MDCT係數在一給定時間不可用,則僅 可完整地重建當前訊框之Μ個音訊樣本。
MDCT系統可利用Μ個樣本之一預看。MDCT系統可包 括:一編碼器,其使用一預定視窗而獲得音訊訊號或其之 經濾波型式的MDCT ;及一解碼器,其包括一使用與編碼器 所使用之視窗相同之視窗的IMDCT函數。MDCT系統亦可 包括一重疊及一添加模組。舉例而言,圖4B說明了一MDCT 編碼器401。由一預處理器405接收一輸入音訊訊號403。該 預處理器405實施預處理、線性預測編碼(LPC)濾波及其他 類型之濾波。自預處理器405產生一經處理之音訊訊號 407。將一 MDCT函數409應用於被適當視窗化之2M個訊號 樣本。在一組態中,一量化器411量化及編碼Μ個係數4 13 且將該Μ個編碼係數發射至一 MDCT解碼器429。 122954.doc •15· 解碼器429接收Μ個編碼係數413。使用與編碼器4〇1中之 視窗相同之視窗而將一 IMDCT 415應用於該μ個接收係數 413。可將2Μ個訊號值417分類為最初Μ個樣本選擇423且可 保存最後Μ個樣本419。可藉由一延遲器421而將該最後河個 樣本419進一步延遲一個訊框。可藉由一求和器425來對最 初Μ個樣本423及經延遲之最後Μ個樣本419求和。可使用該 等經求和之樣本來產生音訊訊號之經重建之Μ個樣本427。 通常’在MDCT系統中,可自一當前訊框之Μ個樣本及一 未來訊框之Μ個樣本而導出2Μ個訊號。然而,若僅來自未 來訊框之L個樣本為可用的,則可選擇一實施未來訊框之^ 個樣本的視窗。 在一經由一電路交換網路而操作之即時聲音通信系統 中 了由最大可允奸編碼延遲來約束預看樣本之長度。可 假定一預看長度L為可用的^ L可小於或等於μ。在此條件 下,可能仍然需要使用MDCT(其中在連續訊框之間的重疊 為L個樣本)’同時保持完美之重建特性。 本系統及方法可尤其與即時雙向通信系統有關,其中期 待一編碼器產生資訊以用於以一規則之時間間隔進行發射 而不管對編碼模式之挑選。該系統可能不能夠容忍在由編 碼器產生此資訊時的抖動或在產生此資訊時之此抖動可能 非吾人所要的。 在一組態中’將一修改型離散餘弦轉換(MDCT)函數應用 40 8於訊框。應用視窗函數可為計算該訊框之一 MDCT中的 一步驟。在一組態中,MDCT函數處理2M個輸入樣本以產 122954.doc •16 1364951 生Μ個可接著被量化及發射之係數。 在一組態t,可編碼410訊框。在一態樣中,可编碼41〇 該訊框之係數。可使用將在下文予以更完整地論述之各種 編碼模式來編碼該訊框。可將該訊框格式化412為一封包且 可發射414該封包。在一組態中,將該封包發射414至一解 碼器。 圖5為一流程圖,其說明了一種用於重建一音訊訊號之一
編碼訊框的方法500之一組態。在一組態中,可由解碼器3〇4 來實施方法50(^可接收5〇2 一封包。可自編碼器3〇2接收5〇2 該封包。可分解5〇4該封包以擷取一訊框❶在一組態中,可 解碼506該訊框。可重建5〇8該訊框。在一實例中,訊框重 建模組314重建該訊框以類似於音訊訊號之預編碼訊框。可 輸出5 10重建訊框。可將輸出之訊框與額外輸出之訊框組合 以再現音訊訊號。
圖6為一方塊圖,其說明了一跨越一通信通道606而與一 多模式解碼器$04通信的多模式編碼器6〇2之一組態。一包 括多模式編碼^ 6G2及多模式解碼^ _之系統可為一包括 若干不同編碼機制以編碼不同音訊訊號類型的編碼系統。 通信通道606可包括—射頻(RF)介面。編碼器602可包括-相關之解碼器(未圖示)。編碼器6〇2及其相關之解碼器可无 成第.編碼器。解碼器6〇4可包括一相關之編碼器(未撞 不)。解碼器604及其相關之編碼器可形成一第二編碼器。 編碼器602可包括-初始參數計算模組618 一模式分卖 模M622、複數個、編碼模式似、㈣、㈣及一封包格式七 122954.doc -17- 1364951 模組630。將編碼模式624、626、628之數目展示為N,其可 表示任何教目之編碼模式624、626、628。為簡單起見,展 • 示了二種編碼模式624、626、628 ’其中虛線指示存在其他 ' 編碼模式。 -' 解碼器604可包括一封包分解器模組632、複數個解碼模 式634、636、638、一訊框重建模組640及一後濾波器642。 將解碼模式634、636、63 8之數目展示為N,其可表示任何 • 數目之解碼模式634、636、638。為簡單起見,展示了三種 解碼模式634、636、638’其中虛線指示存在其他解碼模式。 可將一音訊訊號s(n) 610提供至初始參數計算模組618及 模式分類模組622。可將該訊號610劃分為若干樣本區塊(稱 作訊框)》值η可表示訊框數目或值n可表示一訊框中之樣本 數目。在一替代組態中,可使用一線性預測(Lp)剩餘誤差 訊號來替代音訊訊號61〇。可由語音編碼器(諸如,一碼激 勵線性預測(CELP)編碼器)使用該LP剩餘誤差訊號。 φ 初始參數計算模組618可基於當前訊框而導出各種參 .數。在一態樣中,此等參數包括以下各者中之至少一者: 線性預測編碼(LPC)濾波器係數、線譜對(Lsp)係數、正規 化自相關函數(NACF)、開放迴路時滯、零交又速率、頻帶 能量及共振峰剩餘訊號。在另一態樣中,初始參數計算模 組618可藉由濾波訊號610、計算音調以㈣ 610 〇 可將初始參數計算模組6_接至模式分類模組⑵。該 模式分類模組622可在編碼模式624、咖、⑵之間進行動 122954.doc -18- 1364951
態切換。初始參數計算模組618可將關於當前訊框之參數提 供至模式分類模組622。該模式分類模組622可經耦接以逐 訊框地在編碼模式624、626、628之間進行動態切換以便選 擇一用於當前訊框之適當編碼模式624、626、628。模式分 類模組622可藉由將該等參數與預定臨限值及/或最高值相 比較而選擇一用於當前訊框之特定編碼模式624、626、 628。舉例而言,可使用MDCT編碼機制來編碼一與一非語 音訊號相關之訊框。一 MDCT編碼機制可接收一訊框且將一 特定MDCT視窗格式應用於該訊框。下文關於圖8而描述了 特定MDCT視窗格式之一實例。 模式分類模組622可將一語音訊框分類為語音或非活動 語音(例如,無聲、背景雜訊或在言語之間的暫停)。基於訊 框之週期性,模式分類模組622可將語音訊框分類為一特定 類型之語音(例如,濁音、清音或暫態)。
有聲語音可包括顯示出一相對高程度之週期性的語音。 一音調週期可為一語音訊框之一分量,其可用於分析及重 建該訊框之内容。無聲語音可包括子音。暫態語音訊框可 包括在有聲語音與無聲語音之間的過渡。可將既未被分類 為有聲語音亦未被分類為無聲語音之訊框分類為暫態語 音。 將訊框分類為語音還是非語音可允許使用不同編碼模式 624、626、628來編碼不同類型之訊框,從而導致更有效地 使用一共用通道(諸如,通信通道606)中之頻寬。 模式分類模組622可基於訊框之分類而選擇一用於當前
122954.doc -19- 1364951 訊框之編碼模式624、626、628。可並聯耦接各種編碼模式 624、626、628。該等編碼模式624、626、628中之一或多 者可在任何給定時間均為可操作的。在一組態中,根據當 前訊框之分類來選擇一編碼模式624、626、628。
不同编碼模式624 ' 626、628可根據不同編碼位元速率、 不同編碼機制或編碼位元速率與編碼機制之不同組合而操 作。不同編碼模式624、626、628亦可將一不同視窗函數應 用於一訊框。所使用之各種編碼速率可為全速率、半速率、 四分之一速率及/或八分之一速率。所使用之各種編碼模式 624、626、628可為MDCT編碼、碼激勵線性預測(CELP)編 碼、原型音绸週期(PPP)編碼(或波形内插(WI)編碼)及/或雜 訊激勵線性預測(NELP)編碼。因此,舉例而言,一特定編 碼模式624、626、628可為MDCT編碼機制,另一編碼模式 可為全速率CELP,另一編碼模式624、626、628可為半速 率CELP,另一編碼模式可為624、626、628可為全速率PPP ’ 且另一編碼模式624、626、628可為NELP。 根據一使用一傳統視窗來編碼、發射、接收及在解碼器 處重建一音訊訊號之Μ個樣本的MDCT編碼機制,該MDCT 編碼機制利用編碼器處之輸入訊號之2Μ個樣本。換言之, 除音訊訊號之當前訊框之Μ個樣本之外,編碼器可在可開 始編碼之前等待收集額外Μ個樣本。在MDCT編碼機制與其 他編碼模式(諸如,CELP)共存的多模式編碼系統中,使用 用於MDCT計算之傳統視窗格式可影響整體訊框大小及整 個編碼系統之預看長度。本系統及方法針對任何給定之訊 〆.r·· \ 'a 122954.doc • 20· 1364951 框大小及預看長度而提供用於MDCT計算之視窗格式的設 叶及選擇,使得MDCT編碼機制不會將約束強加於多模式編 碼系統。 根據一 CELP編碼模式,可使用LP剩餘訊號之一量化型式 來激勵一線性預測聲道模型。在CELP編碼模式中,可量化 當前訊框。可使用CELP編碼模式來編碼被分類為暫態語音 之訊框。
根據一 NELP編碼模式,可使用一經濾波之偽隨機雜訊訊 號來模仿LP剩餘訊號。NELP編碼模式可為一達成低位元速 率之相對簡單的技術。可使用NELp編碼模式來編碼被分類 為無聲語音之訊框。
根據一 PPP編碼模式,可編碼每一訊框内之一音調週期子 集。可藉由於此等原型週期之間進行内插來重建語音訊號 之剩餘週期》在??1>編碼之一時域實施中,可計算一第一組 參數,該第一組參數描述如何修改一先前原型週期以近似 前原㈣期°可選擇—或多個碼向量,當該或該等碼 向量求和時該或該等碼向量近似於在當前原型週期與經修 改之先前㈣之間的差異。—第二組參數描述此等所 選擇之碼向量。在ρρρ編碼之—頻域實施中,可計算一组參 數以描述原型之振幅及相位譜。根據ρρρ編喝之實 二04可藉由基於描述振幅及相位之若干組參數而重建一 當前原型來合成一輪Ψ立 曰訊訊號616。可將語音訊號内插為 過及在當月丨j重建原彻 域。該原型可包括一建原型週期之間的區 田剛訊框之一部分,該部分將被線性地 122954.doc •21 · 内插有類似地定位於該訊框内的來自先前訊框之原型以便 在解碼器604處重建音訊訊號610或!^剩餘訊號(亦即,將— 往昔原型週期用作當前原型週期之一預測)。 編碼原型週期而非整個訊框可降低編碼位元速率。可以 PPP編碼模式來編碼被分類為有聲語音之訊框。藉由採用有 聲浯音之週期性,PPP編碼模式可達成一比CELP編碼模式 低之位元速率。 可將所選擇之編碼模式624、626、628耦接至封包格式化 模組630。該所選擇之編碼模式624、626、628可編碼或量 化當前訊框且將該等經量化之訊框參數612提供至封包格 式化模組630 ^在一組態中,該等經量化之訊框參數係自 MDCT編碼機制所產生之編碼係數。封包格式化模組63〇可 將該等經量化之訊框參數612組合於一格式化封包613中。 封包格式化模組630可經由一通信通道606而將格式化封包 613提供至一接收器(未圖示)。該接收器可接收、解調變及 數位化格式化封包613,且將封包613提供至解碼器6〇4。 在解碼器604中’封包分解器模組632可自接收器接收封 包613。封包分解器模組632可拆開封包613以擷取編碼訊 框。封包分解器模組632亦可經組態以逐封包地在解碼模式 634、636、638之間進行動態切換。解碼模式634、636、638 之數目可與編碼模式624、626、628之數目相同。每一經編 號之編碼模式624、626、628可與一經組態以採用相同編碼 位元速率及編碼機制的各別經類似編號之解碼模式、 636、638相關。 I22954.doc •22- 1364951 若封包分解器模組632偵測到封包613,則分解該封包613 — 並將其提供至相關之解碼模式634、636、638。相關之解碼 . 模式634、636、63 8可基於封包613内之訊框而實施MDCT、 CELP、PPP或NELP解碼技術。若封包分解器模組632並未 . 偵測到一封包’則宣告一封包損失且一抹除解碼器(未圖示) 可執行訊框抹除處理。可將解碼模式634、636、638之並聯 陣列耦接至訊框重建模組64(^該訊框重建模組64〇可重建 φ 或合成訊框從而輸出一經合成之訊框。可將該經合成之訊 框與其他經合成之訊框組合以產生一類似於輸入音訊訊號 s(n) 610的經合成之音訊訊號§(n) 616。 圖7為一流程圖,其說明了音訊訊號編碼方法之一實 例。可計算702—當前訊框之初始參數。在一組態中,初始 參數計算模組618計算702該等參數。對於非語音訊框而 t ’該等參數可包括—或多個係數以指示該訊框為一非語 音訊框。語音訊框可包括以下各者中之一或多者之參數: • 線性預測編碼(LPC)濾波器係數、線譜對(LSP)係數、正規 化自相關函數(NACF)、開放迴路時滯、頻帶能量、零交又 速率及共振峰剩餘訊號。非語音訊框亦可包括諸如線性預 測編碼(LPC)濾波器參數之參數。 可將當前訊框分類704為一語音訊框或一非語音訊框。如 先前所提及,-語音訊框可與一語音訊號相關且一非語音 訊框可與-非語音訊號(亦即,—音樂訊號)相關。可基於步 驟702及7G4中所進行之訊框分類來選擇71卜編碼器/解碼 器模式。如圖6中所示,可並聯連接各種編碼器㈣碼器模 122954.doc -23· 1364951 而操作。 的編碼部 ^不同編碼轉碼器模式可根據不同編碼機制 某二模式可在音訊訊號3⑻㈣之顯示某些特性 分處更為有效。
所解釋,可選擇_„編碼機制以編碼被分類㈣ ^ 諸如,音樂)之訊框。可選和咖模式以編碼福 :類為暫^日之訊^可選擇卿模式以編碼被分類為有 聲語音之縫1選擇NELp模式㈣碼被分類為無聲語音 之訊框。可以變化之效能水平在不同之位元速率來頻繁地 刼作相同編碼技術。圖6中之不同編碼器/解碼器模式可表 示不同編碼技術或以不同位元速率操作之相同編碼技術或 上述之組合。所選擇之編碼器模式71〇可將一適當之視窗函 數應用於絲。舉例而言,若所選擇之編碼模式為MDCT 編碼機制,則可應用本系統及方法之一特定mdct視窗函 數。或者,若所選擇之編碼模式為CELp編碼機制,則可將 一與CELP編碼機制相關之視窗函數應用於訊框。所選擇之 編碼器模式可編碼712當前訊框且將該編碼訊框格式化714 於一封包中。可將該封包發射716至一解碼器。 圖8為一方塊圖,其說明了在將一特定mdct視窗函數應 用於每一訊樞之後複數個訊框802、8〇4、806之一組態。在 一組態中,一先前訊框8〇2、一當前訊框8〇4及一未來訊框 806可各自被分類為非語音訊框。可由2M來表示當前訊框 8〇4之長度820。先前訊框802及未來訊框806之長度亦可為 2M。當前訊框804可包括一第一零墊區域810及一第二零墊 區域818。換言之’第一零墊區域81〇及第二零墊區域818 122954.doc -24. 1364951 中之系數值可為零。
在一組態中,當前訊框804亦包括一重疊長度812及一預 看長度816。可將該重疊長度812及該預看長度816表示為 L。重疊長度8 12可重疊先前訊框802之預看長度。在一組態 中,值L小於值Μ。在另一組態中,值L等於值Μ。當前訊 框亦可包括一單位長度814,其中在此長度814中訊框之每 一值為1。如所說明,未來訊框806可在當前訊框804之中途 點808處開始。換言之,未來訊框806可在當前訊框804之一 長度Μ處開始。類似地,先前訊框802可在當前訊框804之 中途點808處結束。因而,在當前訊框804上存在先前訊框 802與未來訊框806之50%重疊。
若量化器/MDCT係數模組在解碼器處忠實地重建MDCT 係數,則特定MDCT視窗函數可便利於在一解碼器處完美地 重建一音訊訊號。在一組態中,量化器/MDCT係數編碼模 組在解碼器處可能並未忠實地重建MDCT係數。在此狀況 下,解碼器之重建保真度可視量化器/MDCT係數編碼模組 忠實地重建該等係數之能力而定。若一當前訊框被一先前 訊框與一未來訊框兩者重疊5 0%,則將MDCT視窗應用於該 當前訊框可提供該當前訊框之完美重建。另外,若滿足 Princen-Bradley條件,則MDCT視窗可提供完美重建。如先 前所提及,可將Princen-Bradley條件表達為: (3) w2 (n) + w2(n + Μ) = 1 其中可表示圖8中所說明之MDCT視窗。由方程式(3)所 / «- '· *··. »3 ./ 122954.doc -25 · 1364951 表達之條件可暗示訊框802、804、806上之一被添加至不同 訊框802、804、806上之一對應點的點將提供值1。舉例而 言,中途長度808中先前訊框802之一被添加至中途長度808 中當前訊框804之一對應點的點產生值1。
圖9為一流程圖,其說明了 一種用於將一MDCT視窗函數 應用於一與一非語音訊號相關之訊框(諸如,圖8中所描述 之當前訊框804)的方法900之一組態。應用MDCT視窗函數 之過程可為計算一 MDCT中之一步驟。換言之,在不使用一 滿足兩個連續視窗之間的50%重疊的條件及先前所解釋之 Princen-Bradley條件的視窗的情況下可不應用一完美重建 MDCT。可將方法900中所描述之視窗函數實施為將MDCT 函數應用於一訊框之過程的一部分。在一實例中,來自當 前訊框804之Μ個樣本以及L個預看樣本為可用的。L可為一 任意值。
可產生902當前訊框804之(M-L)/2個樣本之一第一零墊 區域。如先前所解釋,零墊可暗示第一零墊區域810中之樣 本之係數可為零。在一組態中,可提供904當前訊框804之L 個樣本之一重疊長度。當前訊框之L個樣本之重疊長度可重 疊且添加有906先前訊框802之經重建之預看長度。當前訊 框804之第一零墊區域及重疊長度可重疊先前訊框802之 5 0%。在一組態中,可提供908當前訊框之(Μ-L)個樣本。 亦可提供910對於當前訊框而言為預看之L個樣本。該L個預 看樣本可重疊未來訊框806。可產生當前訊框之(M-L)/2個 樣本之一第二零墊區域。在一組態中,當前訊框804之L個 122954.doc •26- 1364951 預看樣本及第二零墊區域可重疊未來訊框806之50%。一已 被應用方法900之訊框可滿足如先前所描述之 Princen-Bradley條件。
圖10為一流程圖,其說明了 一種用於重建一已由MDCT 視窗函數加以修改之訊框的方法1 〇 〇 〇之一組態。在一組態 中’由訊框重建模組314來實施方法1000。可合成1002當前 訊框804之始於第一零墊區域810之末端至(M-L)區域814之 末端的樣本。可向當前訊框804之L個樣本之重疊區域添加 1004先前訊框802之一預看長度。在一組態中,可儲存丨〇〇6 始於(M-L)區域814之末端至第二零墊區域818之開端的當 前訊框804之L個預看樣本816。在一實例中,可將l個預看 樣本8 1 6儲存於解碼器304之一記憶體組件中。在一組態 中,可輸出1 008 Μ個樣本。可將所輸出之M個樣本與額外 樣本組合以重建當前訊框804。 圖11說明了可根據本文中所描述之系統及方法而用於一
通信/計算設備11〇8中的各種組件。通信/計算設備丨1〇8可包 括一控制該設備1108之操作的處理器11〇2 ^亦可將該處理 器1102稱作CPU。記憶體11〇4(其可包括唯讀記憶體 及隨機存取記憶體(RAM)兩者)將指令及資料提供至處理器 1102。记憶體11〇4之一部分亦可包括非揮發性隨機存取記 憶體(NVRAM)。 。 設備1108亦可包括-含有-發射器mo及一接收器1112 之外殼1122以允許在存取終端機11()8與—遠端位置之間發 射及接收資料。可將發射器111〇及接收器ιιΐ2組合於—收 122954.doc •27· 1364951 發器1120中。一天線1118附著至外殼1122且電耦接至收發 器1120。可將發射器1110、接收器1112、收發器1120及天 線1118用於一通信設備1108組態中。 設備1108亦包括一用於偵測及量化由收發器1120所接收 之訊號之位準的訊號偵測器1106。訊號偵測器1106偵測諸 如總能量、每偽雜訊(PN)碼片之前導能量、功率譜密度之 訊號及其他訊號。
通信設備1108之一狀態改變器1114基於一當前狀態及由 收發器1120所接收且由訊號偵測器11〇6所偵測之額外訊號 來控制通信/計算設備1108之狀態。設備1108可能能夠以若 干狀態中之任一狀態來操作。 通信/計算設備1108亦包括一系統判定器1124,該系統判 定器1124用於控制設備11〇8且在判定當前服務提供者系統 不適當時判定設備1108應轉移至哪一服務提供者系統。
可由一匯流排系統1126而將通信/計算設備1108之各種 組件耦接在一起,除一資料匯流排之外,該匯流排系統丨126 可包括一功率匯流排、一控制訊號匯流排及一狀態訊號匯 流排。然而,為清晰起見,在圖丨丨中將各種匯流排說明為 匯流排系統1126。通信/計算設備1108亦可包括一數位訊號 處理器(DSP)1116以用於處理訊號。 可使用多種不同技術及技巧中之任一者來表示資訊及訊 號:舉例而言,可由電壓、電流、電磁波、磁場或粒子、 光場或粒子或其之任何組合來表示貫穿以上描述而可被參 考的資料、指令、命令、資訊、訊號、位元、符號及碼片。 / 122954.doc •28- 1364951 可將結合本文中所揭示之組態而描述的各種說明性邏輯 區塊、模組、電路及演算法步驟實施為電子硬體、電腦軟 體或兩者之組合。為清楚地說明硬體與軟體之此互換性, 各種說明性組件、區塊、模組、電路及步驟已大致就其之 功能性而描述於上文。將此功能性實施為硬體還是軟體視 特定應用及強加於整個系統之設計約束而定。熟練技工可 以用於每一特定應用之變化之方式來實施所描述之功能
性,但不應將此等實施決策解釋為導致背離本系統及方法 之範疇。 可藉由經設計以執行本文中所描述之功能的一通用處理 器、一數位訊號處理器(DSP)、一特殊應用積體電路 (ASIC)、一場可程式化閘陣列訊號(FpGA)或其他可程式化 邏輯設備、離散閘或電晶體邏輯、離散硬體組件或其之任 何組合來實施或執行結合本文中所揭示之組態而描述的各 種說明性邏輯區塊、模組及電路。一通用處理器可為一微
處理器,但在替代例中,該處理器可為任何處理器、控制 器、微控制器或狀態機。亦可將一處理器實施為計算設備 之一組合,例如,一DSP與一微處理器之組合、複數個微 處理器、結合一DSP核心的一或多個微處理器或任何其他 此組合。 結合本文中所揭示之組態而描述的方法或演算法之步驟 可直接以硬體、一由一處理器執行之軟體模組或該兩者之 一組合體現。一軟體模組可常駐於RAM記憶體、快閃記憶 體、R〇M記憶體、可抹除可程式化唯讀記憶體(EPR〇m)、 122954.doc •29· (S ) 1364951 電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、 弋碟片緊氹光碟唯讀記憶體(CD-ROM)或此項技術中 已知之任何其他形式的儲存媒體中。可將一儲存媒體搞接 u處理器,使#該處理器可自該储存媒體讀取資訊或將 資訊寫入至該儲存媒體。在替代例中,該儲存媒體可整合 至該處理器。該處理器及該儲存媒體可常駐於一 ASIC中。 該ASIC可常駐於—使用者終端機中。在替代例中,該處理 器及該儲存媒體可作為離散組件而常駐於一使用者終端機 中。 本文中所揭示之方法包含一或多個用於達成所描述之方 法的步驟或動作。該等方法步驟及/或動作可彼此互換而不 背離本系統及方法之料。換言之,除非針對組態之恰當 動作之—特定次序’否則可修改特定步 驟及/或動作之次序及/或使用而不背離本系統及方法之範 疇。可將本文中所揭示之方法以硬體、軟體、或兩者實施。 硬體及記憶體之實例可包括RAM、r〇m、㈣⑽、 EEPR0M、快閃記憶體、光碟、暫存器H 或任何其他類型之硬體及記憶體。 儘管已說明及描述了本系統及方法之特定組態與應用, 但將理解,該等系統及方法並不受限於本文中所揭示之精 確:態及組件。可在不背離所主張之系統及方法之精神及 耗'的情況下對本文中所揭示之系統及方法的配置、操作 及=郎進行熟習此項技術者所顯而易見之多種修改、改變 及變化。 122954.doc 1364951 【圖式簡單說明】 圖1說明了 一無線通信系統之一組態; 圖2為一說明一計算環境之一組態的方塊圖; 圖3為一說明一訊號發射環境之一組態的方塊圖; 圖4A為一流程圖’其說明了 一種用於以與音訊訊號相關 之訊框修改視窗之方法的一組態;
圖4B為一方塊圖,其說明了 一用於以與音訊訊號相關之 訊框修改視窗之編碼器及一解碼器的一組態; 圖5為一流程圖’其說明了一種用於重建一音訊訊號之一 編碼訊框之方法的一組態; 圖6為一方塊圖,其說明了一與一多模式解碼器通信之多 模式編碼器的一組態; 圖7為一流程圖,其說明了一種音訊訊號編碼方法之一實 例;
圖8為一方塊圖,其說明了在將一視窗函數應用於每一訊 框之後的複數個訊框之一組態; 圖9為一流程圖,其說明了一種用於將一視窗函數應用於 一與一非語音訊號相關之訊框之方法的一組態; 圖10為一流程圖’其說明了 一種用於重建一已由視窗函 數加以修改之訊框之方法的一組態;及 圖11為一通信/計算設備之一組態中之某些組件的方塊 圖。 【主要元件符號說明】 100 劃碼多向近接(CDMA)無線電 122954.doc 1364951 «9 102 話系統/蜂巢式電話系統 行動台 104 基地台 106 基地台控制器(BSC) 108 行動交換中心(MSC) 110 公眾交換電話網路(PSTN) 200 計算環境 202 來源計算設備 204 接收計算設備 206 接收行動計算設備 210 網路 212 音訊訊號 300 訊號發射環境 302 編碼器 304 解碼器 306 發射媒體 308 視窗格式化模組 310 語音訊號 312 經編碼之音訊訊號 314 訊框重建模組 316 經合成之音訊訊號 401 MDCT編碼器 403 輸入音訊訊號 405 預處理器 122954.doc -32- 1364951
407 經處理之音訊訊號 409 MDCT函數 411 量化器 413 編碼係數 415 IMDCT 417 訊號值 419 最後Μ個樣本 421 延遲器 423 最初Μ個樣本 425 求和器 427 經重建之Μ個樣本 429 MDCT解碼器 602 多模式編碼器 604 多模式解碼器 606 通信通道 610 音訊訊號 612 經量化之訊框參數 613 格式化封包 616 經合成之音訊訊號 618 初始參數計算模組 622 模式分類模組 624 編碼模式 626 編碼模式 628 編碼模式 122954.doc -33- 1364951
630 封包格式化模組 632 封包分解器模組 634 解碼模式 636 解碼模式 638 解碼模式 640 訊框重建模組 642 後濾波器 802 先前訊框 804 當前訊框 806 未來訊框 808 中途點 810 第一零墊區域 812 重疊長度 814 單位長度/(M-L)區域 816 預看長度 818 第二零墊區域 820 當前訊框之長度 1102 處理器 1104 記憶體 1106 訊號偵測器 1108 通信/計算設備 1110 發射器 1112 接收器 1114 狀態改變器 122954.doc •34- 1364951 1116 1118 1120 1122 1124 1126 數位訊號處理器(DSP) 天線 收發器 外殼 系統判定器 系統匯流排
122954.doc •35·

Claims (1)

1364951 第096128077號專利申請案 中文申請專利範圍替換本(101年2月如沒 十、申請專利範圍: 凌 1. 一種以一與一音訊訊號相關之訊框修改一視窗之方法, 1 該方法包含: . 將一訊號分割為複數個訊框;且 當該等複數個訊框與一非語音訊號相關時,則將一修 改型離散餘弦轉換(MDCT)視窗函數應用於各個該等複 數個訊框以產生複數個視窗訊框,其中各個視窗訊框包 括位於該視窗訊框之一第一部分的一第一零墊區域,其 中該第一零墊區域具有一為(M-L)/2的長度,其中L為係一 小於或等於Μ之任意值,且2M為於各個視窗訊框中樣本 的數目。 2. 如請求項1之方法,其進一步包含使用一基於MDCT編碼 之機制至各個該等複數個視窗訊框之各個樣本,以編碼 各個該等複數個視窗訊框,其中該等視窗訊框係連續相 鄰。 3. 如請求項1之方法,其中各個視窗訊框包含一為2Μ之長 度。 4. 如請求項1之方法,其中各個視窗訊框包括一第二零墊區 域,其中各個視窗訊框的該第二零墊區域位於該視窗訊 框之一第二部分。 5. 如請求項4之方法,其中各個視窗訊框的該第二零墊區域 具有一為(M-L)/2之第二零墊長度。 6. 如請求項5之方法,其進一步包含於各個視窗訊框中包括 一長度為L之當前重疊區域,其中一特定視窗訊框的該當 122954-1010210.doc 1364951 =重曼區域與多個預看樣本重疊,料預看樣本與一先 前視窗訊框相關。 7. 8. 9. 10. 11. 12. 13. 14. 如睛之方法,其進—步包含添加與該特定視窗訊框 s w别重疊區域相關之一樣本至一對應預看樣本,該 預看樣本與該先前視窗訊框相關。 如明求項4之方法,其中L為一預看區域,其小於Μ。 月求項8之方法,其中該預看區域重疊一與一未來視窗 訊框相關之未來重疊區域。 如明求項6之方法,其中該第—零塾區域及該當前重疊區 域重疊一先前視窗訊框之大約5〇0/〇。 =印求項8之方法,其中該第二零墊區域及該預看區域重 疊一未來铒窗訊框之大約50%。 項1之方法,其中添加有一來自一重疊視窗訊框之 相關樣本的—第-視窗訊框之每-樣本的-平方和等於 1 ° 如吻求項1之方法’其進一步包含在接收對該等視窗訊框 取樣以外的L個樣本之後’及在接收對該等視窗訊框取樣 以外的Μ個樣本之前’為各個該等複數個視窗訊框,使用 -基於MDCT編竭之機制’編碼該視窗 訊框。 種用於以-與一音訊訊號相關之訊框修改一視窗之裝 置,其包含: 一處理器; 與該處理器電子通信之記憶體;及 儲存於”玄s己憶體中之指令該等指令可執行以: 122954-1010210.doc 將一訊號分割為複數個訊框;且 當該等複數個訊框與一非語音訊號相關時,則將一 修改型離散餘弦轉換(MDct)視窗函數應用於該等複數 個訊框之各個訊框以產生複數個視窗訊框,其中各個 視窗訊框包括位於該視窗訊框之一第一部分的一第一 零塾區域’其中該第一零墊區域具有一為(M-L)/2的長 度’其中L為係一小於或等於μ之任意值,且2M為於各 個視窗訊框中樣本的數目。 15. 16. 17. 18. 如請求項14之裝置,其中該等指令係進一步可執行以使 用一基於MDCT編碼之機制編碼各個該等複數個視窗訊 框’其中該等視窗訊框為連續相鄰的。 如請求項14之裝置’其中各個視窗訊框包含一等於2Μ之 樣本長度。 如請求項14之裝置’其中各個視窗訊框包括一第二零墊 區域’其中該第二零墊區域位於該視窗訊框之一第二部 分。 一種經組態而以一與一音訊訊號相關之訊框修改一視窗 之系統,其包含: 用於處理之構件; 用於將一訊號分割為複數個訊框之構件; 用於當該等複數個訊框與一非語音訊號相關時,將一 修改型離散餘弦轉換(MDCT)視窗函數應用於該等複數 個訊框之各個訊框以產生複數個視窗訊框的構件,該等 複數個視窗訊框為連續相鄰,其中各個視窗訊框包括位 122954-1010210.doc 1364951 於該視窗訊框之一第一部分的一第一零墊區域,其中該 第一零塾區域具有一為(M-L)/2的長度,其中L為係一小於 或等於Μ之任意值,且21^為於各個視窗訊框中樣本的數 目;及 用於使用一基於]VIDCT編碼之機制以編碼各個該等複 數個視窗訊框之構件。 19. 一種電腦可讀取媒體,其經組態以儲存一組指令,該等 指令可執行以: 將一訊號分割為複數個訊框; 當該等複數個訊框與一非語音訊號相關時,將一修改 型離散餘弦轉換(MDCT)視窗函數應用於該等複數個訊 框之各個訊框以產生複數個視窗訊框,該等複數個視窗 訊框為連續相鄰,其中各個視窗訊框包括位於該視窗訊 祀之第°卩为的一第一零墊區域,其中該第一零墊區 域具有一為(M_L)/2的長度,其中L為係一小於或等於M之 任意值,且2M為於各個視窗訊框中樣本的數目;及 使用一基於MDCT編碼之機制以編碼各個該等複數個 視窗訊框。 20. 一種用於選擇一待用於計算一吼招 |异 1框之一修改型離散餘弦 轉換(MDCT)之視窗函數的方法,該方法包含· 提供一用於選擇一視窗函數的演算法; 將該所選擇之視窗函數應用於各個複數個非語音訊框 以產生複數個視窗訊框,其t該等視窗訊框係連續相鄰 且各個視窗訊框包括位於該視窗訊框之一第一部分的一 J22954-i010210.doc -4- 1364951 第一零墊區域,其中該第一零墊區域具有一為(M-L)/2的 長度,其中L為係一小於或等於任意值,且2M為於各 個視窗訊框中樣本的數目;及 基於強加於一修改型離散餘弦轉換(MDCT)編碼模式之 約束而以該MDCT編碼模式來編碼各個該等複數個視窗 訊框,其中該等約束包含該訊框之一長度、一預看長度 及一延遲。 21. —種語音處理之方法,其包含: 當一音訊訊號之一部分被分類為語音時: 當該音訊訊號之該部分之一訊框被分類為有聲語音 時’根據一第一編碼機制編碼該訊框;且 當該音訊訊號之該部分之—訊框被分類為無聲語音 時根據一第一編碼機制編碑該訊框,其中該第二編 碼機制係不同於該第一編碼機制; 當該音訊訊號之該部分被分類為非語音,且該音訊之 該部分包括一當前訊框、一先前訊框、及一隨後訊框且 該等訊框為連續相鄰訊框時: 將一修改型離散餘弦轉換(MDCT)視窗函數應用於 該當前訊框、該先前訊框、及該隨後訊框之各個訊框 以產生複數個視窗訊框,其包括一視窗當前訊框、一 視窗先前訊框、及一視窗隨後訊框,其中該第一零墊 區域具有一為(M-L)/2的長度,其中L為係一小於或等於 Μ之任意值,且2M為於各個視窗訊框中樣本的數目。 22.如請求項21之方法,其中該視窗當前訊框重疊該視窗先 122954-1010210.doc 1364951 前訊框之50%及該視窗隨後訊框之50%,且進一步包含根 據一修改型離散餘弦轉換編碼機制編碼該當前視窗訊 框。 23.如請求項21之方法,其進一步包含當該音訊訊號的該部 分被分類為暫態語音時,根據一第三編碼機制編碼該音 訊訊號的該部分,其中該第三編碼機制係不同於該第一 編碼機制及該第二編碼機制。 122954-1010210.doc 6-
TW096128077A 2006-07-31 2007-07-31 Systems and methods for modifying a window with a frame associated with an audio signal TWI364951B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US83467406P 2006-07-31 2006-07-31
US11/674,745 US7987089B2 (en) 2006-07-31 2007-02-14 Systems and methods for modifying a zero pad region of a windowed frame of an audio signal

Publications (2)

Publication Number Publication Date
TW200816718A TW200816718A (en) 2008-04-01
TWI364951B true TWI364951B (en) 2012-05-21

Family

ID=38792218

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096128077A TWI364951B (en) 2006-07-31 2007-07-31 Systems and methods for modifying a window with a frame associated with an audio signal

Country Status (10)

Country Link
US (1) US7987089B2 (zh)
EP (1) EP2047463A2 (zh)
JP (1) JP4991854B2 (zh)
KR (1) KR101070207B1 (zh)
CN (1) CN101496098B (zh)
BR (1) BRPI0715206A2 (zh)
CA (1) CA2658560C (zh)
RU (1) RU2418323C2 (zh)
TW (1) TWI364951B (zh)
WO (1) WO2008016945A2 (zh)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
WO2008108702A1 (en) * 2007-03-02 2008-09-12 Telefonaktiebolaget Lm Ericsson (Publ) Non-causal postfilter
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR100922897B1 (ko) * 2007-12-11 2009-10-20 한국전자통신연구원 Mdct 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법
KR101441896B1 (ko) * 2008-01-29 2014-09-23 삼성전자주식회사 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
ES2401487T3 (es) 2008-07-11 2013-04-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena
KR20100007738A (ko) * 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
US9384748B2 (en) 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
CN102930871B (zh) * 2009-03-11 2014-07-16 华为技术有限公司 一种线性预测分析方法、装置及系统
WO2010102446A1 (zh) * 2009-03-11 2010-09-16 华为技术有限公司 一种线性预测分析方法、装置及系统
KR101297026B1 (ko) * 2009-05-19 2013-08-14 광운대학교 산학협력단 Mdct―tcx 프레임과 celp 프레임 간 연동을 위한 윈도우 처리 장치 및 윈도우 처리 방법
TWI435317B (zh) * 2009-10-20 2014-04-21 Fraunhofer Ges Forschung 音訊信號編碼器、音訊信號解碼器、用以提供音訊內容之編碼表示型態之方法、用以提供音訊內容之解碼表示型態之方法及使用於低延遲應用之電腦程式
EP2372704A1 (en) * 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor and method for processing a signal
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
EP2645365B1 (en) * 2010-11-24 2018-01-17 LG Electronics Inc. Speech signal encoding method and speech signal decoding method
US20130311174A1 (en) * 2010-12-20 2013-11-21 Nikon Corporation Audio control device and imaging device
US9942593B2 (en) * 2011-02-10 2018-04-10 Intel Corporation Producing decoded audio at graphics engine of host processing platform
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
CA2827156C (en) 2011-02-14 2017-07-18 Tom Backstrom Encoding and decoding of pulse positions of tracks of an audio signal
MY166394A (en) * 2011-02-14 2018-06-25 Fraunhofer Ges Forschung Information signal representation using lapped transform
WO2012110415A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
KR101562281B1 (ko) 2011-02-14 2015-10-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
SG192721A1 (en) * 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
RU2575993C2 (ru) 2011-02-14 2016-02-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Основанная на линейном предсказании схема кодирования, использующая формирование шума в спектральной области
MX2013009301A (es) 2011-02-14 2013-12-06 Fraunhofer Ges Forschung Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio.
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
US9037456B2 (en) 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
CN103325373A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于传送和接收音频信号的方法和设备
KR20140075466A (ko) * 2012-12-11 2014-06-19 삼성전자주식회사 오디오 신호의 인코딩 및 디코딩 방법, 및 오디오 신호의 인코딩 및 디코딩 장치
PT2959482T (pt) * 2013-02-20 2019-08-02 Fraunhofer Ges Forschung Aparelho e método para codificar ou descodificar um sinal de áudio usando uma sobreposição dependente da localização de transiente
CA3029041C (en) 2013-04-05 2021-03-30 Dolby International Ab Audio encoder and decoder
WO2014202790A1 (en) 2013-06-21 2014-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improved signal fade out in different domains during error concealment
EP2980797A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
EP2980791A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
TWI555510B (zh) * 2015-12-03 2016-11-01 財團法人工業技術研究院 非侵入式血醣量測裝置及使用其之量測方法
CN112735449B (zh) * 2020-12-30 2023-04-14 北京百瑞互联技术有限公司 优化频域噪声整形的音频编码方法及装置
US12112764B2 (en) * 2022-08-31 2024-10-08 Nuvoton Technology Corporation Delay estimation using frequency spectral descriptors

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5384891A (en) * 1988-09-28 1995-01-24 Hitachi, Ltd. Vector quantizing apparatus and speech analysis-synthesis system using the apparatus
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
FR2675969B1 (fr) * 1991-04-24 1994-02-11 France Telecom Procede et dispositif de codage-decodage d'un signal numerique.
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3531177B2 (ja) 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
US5704003A (en) * 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
EP0932141B1 (en) * 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
WO2000070769A1 (en) 1999-05-14 2000-11-23 Matsushita Electric Industrial Co., Ltd. Method and apparatus for expanding band of audio signal
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
US7461002B2 (en) * 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
EP1341160A1 (en) * 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
US7116745B2 (en) * 2002-04-17 2006-10-03 Intellon Corporation Block oriented digital communication system and method
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
GB0321093D0 (en) 2003-09-09 2003-10-08 Nokia Corp Multi-rate coding
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
BRPI0517513A (pt) 2004-10-26 2008-10-14 Matsushita Electric Industrial Co Ltd aparelho de codificação de som e processo de sua realização
SG163555A1 (en) * 2005-04-01 2010-08-30 Qualcomm Inc Systems, methods, and apparatus for highband burst suppression

Also Published As

Publication number Publication date
EP2047463A2 (en) 2009-04-15
CN101496098A (zh) 2009-07-29
CN101496098B (zh) 2012-07-25
WO2008016945A2 (en) 2008-02-07
US7987089B2 (en) 2011-07-26
JP4991854B2 (ja) 2012-08-01
WO2008016945A9 (en) 2008-05-29
RU2418323C2 (ru) 2011-05-10
BRPI0715206A2 (pt) 2013-06-11
KR20090035717A (ko) 2009-04-10
CA2658560C (en) 2014-07-22
KR101070207B1 (ko) 2011-10-06
TW200816718A (en) 2008-04-01
JP2009545780A (ja) 2009-12-24
WO2008016945A3 (en) 2008-04-10
CA2658560A1 (en) 2008-02-07
RU2009107161A (ru) 2010-09-10
US20080027719A1 (en) 2008-01-31

Similar Documents

Publication Publication Date Title
TWI364951B (en) Systems and methods for modifying a window with a frame associated with an audio signal
KR100805983B1 (ko) 가변율 음성 코더에서 프레임 소거를 보상하는 방법
KR100804461B1 (ko) 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치
RU2470384C1 (ru) Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов
JP2003524939A (ja) フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置
US6678649B2 (en) Method and apparatus for subsampling phase spectrum information
JP4511094B2 (ja) 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置
TWI358057B (en) Systems and methods for dimming a first packet ass