[go: up one dir, main page]

TW201203224A - Audio signal decoder, audio signal encoder, methods and computer program using a sampling rate dependent time-warp contour encoding - Google Patents

Audio signal decoder, audio signal encoder, methods and computer program using a sampling rate dependent time-warp contour encoding Download PDF

Info

Publication number
TW201203224A
TW201203224A TW100107904A TW100107904A TW201203224A TW 201203224 A TW201203224 A TW 201203224A TW 100107904 A TW100107904 A TW 100107904A TW 100107904 A TW100107904 A TW 100107904A TW 201203224 A TW201203224 A TW 201203224A
Authority
TW
Taiwan
Prior art keywords
time
audio signal
information
warp
sampling frequency
Prior art date
Application number
TW100107904A
Other languages
English (en)
Other versions
TWI455113B (zh
Inventor
Stefan Bayer
Tom Baeckstroem
Ralf Geiger
Bernd Edler
Sascha Disch
Lars Villemoes
Original Assignee
Fraunhofer Ges Forschung
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung, Dolby Int Ab filed Critical Fraunhofer Ges Forschung
Publication of TW201203224A publication Critical patent/TW201203224A/zh
Application granted granted Critical
Publication of TWI455113B publication Critical patent/TWI455113B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

201203224 六、發明說明: 【考务明戶斤屬>#頁】 依據本發明之實施例係有關於一種音訊信號解碼器。 依據本發明之其它實施例係有關於一種音訊信號編碼器。 依據本發明之其它實施例係有關於一種音訊信號之解碼方 法,音訊信號之編碼方法,及電腦程式。 依據本發明之若干實施例係有關於一種取樣頻率相依 性之音面變化量化技術。
L· ^tr 'J 後文中,將對時間扭曲音訊編碼領域作簡短介紹,其 構想可結合本發明之若干實施例施用。 近年來,業已發展出某些技術來將音訊信號變換成頻 域表示型態,以及例如,藉由考慮知覺遮蔽臨界值,而有 效地編碼該頻域表示型態。此種音訊信號編竭構想於用以 發射一編碼頻譜係數集合之區塊長度長時,及在只有比較 少數頻譜係數係遠高於通用遮蔽臨界值,而大量頻譜係數 係遠接近或低於通用遮蔽臨界值因而可被忽略(戋以最】 碼長度編碼)時特別有效。具有該種情況之—頻譜稱作為稀 疏頻譜。 ~ 舉例言之,以餘弦為基礎或以正弦為基礎之調變重疊 變換由於其能量壓縮性質,故常用於來源編碼用途。換: 之’對具有常數基頻(音高)之譜波音調,其將信號能集中 較少數頻譜成分(子帶),結果導致有效信縣示型態。 一般而言,須暸解信號的(基本)音高應為可與信號頻譜 201203224 區別之最低優勢頻率。於常見語音模型,音高乃藉人類喉 喻所調變之激發信號頻率。若只呈現單一個基頻,則頻譜 極其簡單’只包含基頻及泛音(overtones)。此種頻譜可高度 有效地編碼。但對具有可變音高之信號而言,相應於各個 諧波成分之能係展開於數個變換係數,如此導致編碼效率 的減低。 為了克服編碼效率的減低,欲編碼之音訊信號係在非 均勻時間網格上有效地重複取樣。於隨後之處理中,藉非 均勻重複取樣所得之樣本位置係經處理彷彿其表示在一均 勻時間網格上的數值般。此項操作俗稱「時間扭曲」。樣本 時間可優異地依據音高之時間變化而選用,使得音訊信號 之時間扭曲版本的音高變化係小於該音訊信號之原先版本 (時間扭曲之前)的音高變化。於I訊信?虎之時間扭曲之後, 遠音訊信號之時間扭曲版本係轉換成頻域。音高相依性時 間扭曲具訂述效果:時間㈣音減狀頻域表示型態 3地具有能量壓縮成比較縣(非時間扭曲音訊信號 域表示型態遠更少數的頻譜成分。 =解竭器端,時間扭曲音訊信號之頻域表示型態係轉 =使得《間扭曲音訊㈣之時域総型態係於解 之it:身利用。但在解碼器端重建的時間扭曲音訊信號 立:不型態中’未含括編碼器端輸入的音訊信號之原 ^ ―门變化^據此’藉由針對解碼器端重建的時間扭曲音 虎之時域表不型態的重複取樣而施加又另—次時間扭 201203224 為了獲得編碼器端輸入音訊信號在解碼器之良好重 建,期望解碼器端時間扭曲至少約略為相對於編碼器端時 間扭曲的反向操作。為了獲得適當時間扭曲,期望具有在 解馬器可資利用的資訊,其允許調整解碼器端時間拉曲。 由於典型地要求將此種資訊從音訊信號編碼器轉移至 音訊信號解碼器,期望將此一傳送所要求的位元率維持小 元率而仍然允許所要求的時間扭曲資訊在解碼器端 靠地重建。 而 有鐘於此,需要有-種構想其允許基於時間扭曲資訊 之有效編碼表示型態而可靠地重建時間扭曲資訊。 【發明内容】 發明概要 抵像丰發明 ^ —種經組配來基於包含一 取樣頻率貢訊之一編碼音訊信號表示型態、一編碼時 =訊^編娜譜表” “提供—解碼音訊信號表示 曲;,訊信號解碼器。該音訊信號解碼器包含-時間扭 =鼻= 其例如可具有時間扭曲解碼器功能)及—扭= = : = ΐ係—時間扭曲資 τ映至解碼時間扭曲貢訊。該時間扭 ====:適_編碼時 广_二::::::==:· 依攄該解碼—提 201203224 依據本發明之此一實施例係基於發現:由於發現期望 對較低取樣頻率樣本比對較高取樣頻率表示每個樣本更大 的時間扭曲,故當用以將編碼時間扭曲資訊之碼字纽對映 至描述該解碼時間扭曲資訊的解碼時間扭曲值之對映規則 係調整適應於取樣率時,可有欵地編碼時間扭曲(其例如係 藉時間扭曲輪廓描述)。較佳由碥碼時間扭曲資訊之碼字組 集合所表示的每個時間單位之時間扭曲係約略與取樣頻率 獨立無關,其係轉譯成下述結果:假設每個音訊樣本(或每 一音訊框)的時間扭曲碼字組數目維持至少近似常數而與 實際取樣頻率獨立無關之情況下,藉一給定碼字組集合所 能表示的時間扭曲對較小取樣頻率而言須比對較高取樣頻 率為較大。 要言之,發現優異地依據編碼音訊信號(以編碼音訊信 號表示型態表示)之取樣頻率,而調適用以將編碼時間扭曲 資訊之碼字組(也簡稱為時間扭曲碼字組)對映至解碼時間 扭曲值之一對映規則’原因在於如此允許針對較高取樣頻 率之情況及針對較低取樣頻率之情況二者,使用小型(及結 果位元率有效)時間扭曲碼字組集合來表示相關時間扭曲 值。 藉由調適對映規則,可能對較高取樣頻率使用較高解 析度來編碼較小範圍之時間扭曲值,而對較小取樣頻率使 用較粗糙解析度來編碼較大範圍之時間扭曲值,其又轉而 獲致極佳位元率效率。 於一較佳實施例中,編碼時間扭曲資訊之碼字組描述 201203224 時間扭曲輪廓之時間演變。該時間扭曲計算器係纟' 來對由該編碼音訊信號表示型態所表示之* . ' 画己 一 、’构碼音訊信號之 一音訊樞,評估該編碼時間扭曲資訊之瑪字纟 〇;< =,字組之預定數目係與該編碼音訊信; 獨立無關。據此,可達成位元串流格式維拉 I y 〆、樣頻率會 貝上獨立無關,同時仍然可能有效地蝙碼時間杻曲V見 ::編,信號之-音訊框使用預定數目的;二曲= 其中該預定數目較佳係與編碼音訊信號 立無關,位元串流格式並未隨取樣頻率而改變,=率獨 碼器之位元串流别析器無需調整至取樣頻率9 —5fl解 將編石馬時間扭曲資訊之碼字組對映至解石馬=由用以 映規則的調適,仍可達成時間扭曲之有效編 值之对 編碼時間扭曲資訊之碼字組對映至解竭時間扭=因在於 ,率,使得時間扭曲值可表示之範圍獲致: :率’解析度與最大可編碼時間扭曲間之良好折衷问 =較佳實施财,該時_計算㈣巧 =㈣則,使得該編碼時間扭曲資訊之碼字•之來: 疋集5的碼字組對映於其上之— - -取樣頻率俘比對第馬夺間担曲值範圍对第 孜貝羊係比對第一取樣頻率大,但限制 取樣頻率係小於該第二取樣頻率。據此,針龍:=一 率編碼較小時間扭曲值範圍之相_字組,A 樣頻 樣頻率則係編碼較大時間㈣值㈣ Ί對較小取 高取樣頻率及低轉解 ° °此’可確定針對 每秒八重元組定義,簡單標母—時間單位(例如以 為0ct/s」),編碼約略相等 201203224 時間扭曲,即便對相對較高取樣頻率比相對較低取樣頻 率,每個時間單位傳送更多時間扭曲碼字組亦如此。 於一較佳實施例中,解碼時間扭曲值為表示時間扭曲 輪廓值之時間扭曲輪廓值或表示時間扭曲輪廓值變化之時 間扭曲輪廓變異值。 於一較佳實施例中,該時間扭曲計算器係經組配來調 適該對映規則,使得歷經藉該編碼音訊信號表示型態所表 示之一編碼音訊信號之一給定數目樣本的最大音高變化, 其係對第一取樣頻率係比對第二取樣頻率大,但限制條件 為該第一取樣頻率係小於該第二取樣頻率。據此,相同碼 字組集合係用以描述不同解碼時間扭曲值之範圍,其係良 好調適用於不同取樣頻率。 於一較佳實施例中,該時間扭曲計算器係經組配來調 適該對映規則,使得藉于一第一取樣頻率之該編碼時間扭 曲資訊之碼字組之一給定集合所表示之歷經一段給定時間 週期的最大音高變化,與藉於一第二取樣頻率之該編碼時 間扭曲資訊之碼字組之該給定集合所表示之歷經一段給定 時間週期的最大音高變化間之差異,對一第一取樣頻率與 一第二取樣頻率間之差異達至少30%者係不大於10%。如 此,依據本發明藉由對映規則之調適,可避免下述事實, 一給定碼字組集合習知地表示針對不同取樣頻率之每一時 間單位顯著不同的時間扭曲。如此,不同的碼字組數目可 維持合理地少數,結果導致良好編碼效率,其中雖言如此, 時間扭曲之編碼效率係調整配合取樣頻率。 201203224 於一較佳實施例中,該時間扭曲計算器係經組配來依 據該取樣頻率資訊使用不同對映表心將該等編碼時恤 曲資訊之碼字組對映至解碼時間扭曲值。藉由提供不同對 映表,犧牲§己憶體需求,可將解碼機制維持極為簡單。 於另一較佳實施例中,該時間扭曲計算器係經組配來 將對一參考取樣頻率描述與該等編碼時間杻曲資訊之不同 碼字組相關聯之解碼時間扭曲值的(參考)對映規則,調整配 合與該參考取樣頻率不同之一實際取樣頻率。據此,可維 持小量記憶體需求,原因在於針對單一參考取樣頻率,只 需儲存與一不同碼字組集合相關聯之對映值(亦即解碼時 間扭曲值)。業已發現使用小量運算努力即可調適對映值配 合不同取樣頻率。 於一較佳實施例中,該時間扭曲計算器係經組配來依 據该實際取樣頻率與該參考取樣頻率間之比,而定標(scale) 一部分對映值,該部分係描述一時間扭曲。業已發現此種 部分對映值之線性定標組成用以針對不同取樣頻率獲得對 映值之特別有效的解決之道。 於一較佳實施例中,該等解碼時間扭曲值描述歷經由 該編碼音訊信號表示型態所表示之編碼音訊信號之預定數 目樣本的時間扭曲輪廓變化。此種情況下,該取樣位置計 异器較佳係經組配來組合表示時間扭曲輪廓變化之多個解 碼時間扭曲值,而導算出一扭曲輪廓節點值,使得所導算 出之扭曲輪廓節點值之偏離一參考扭曲節點值係大於由該 等解碼時間扭曲值中之單一者所表示的偏離。藉由組合多 201203224 =碼時間扭祕,可輯持對—_時間㈣值所要求 不之時間扭曲之範圍 >圍為夠小。如此提高時間扭曲值之編碼效率。同時, 藉由調適對映規則,可能調整可表 於—較佳實施例中,該等解碼時間扭曲值摇述歷經由 該編竭音難號表示㈣所絲之編碼音補狀預定數 目樣本之時間扭曲輪廓的相對變化。此種情況下,該時間 扭曲計算器係馳配來從該等解碼時間扭曲值而導算出解 碼時間扭曲資訊,使得解碼時間扭曲資訊描述該時間扭曲 輪廓。使用描述歷經預定數目編碼音訊信號樣本之時間扭 曲輪廓相對變化的時間扭曲值,與用以將編碼時間扭曲資 訊之碼字組對映至解碼時間扭曲值之一對映規則的調適組 合’獲致高編碼效率,原因在於可確保針對不同取樣頻率 可編碼貫質上相同或至少相似之時間扭曲(以〇ct/s為單位 表示)之範圍,即便於取樣頻率改變之情況下,每個編碼音 訊信號樣本之時間扭曲碼字組數目可仍維持常數亦如此。 於一較佳實施例中,該時間扭曲計算器係經組配來基 於解碼時間扭曲值而運算一時間扭曲輪廓的支點。此種情 況下,該時間扭曲計算器係經組配來在支點間内插而獲得 時間扭曲輪廓作為解碼時間扭曲資訊。此種情況下,每個 音訊框之解碼時間扭曲值數目係經預定決定且與取樣頻率 獨立無關。據此,支點間之内插方案保持不變,而其有助 於將運算複雜度維持為低。 依據本發明之一實施例提出一種用以提供一音訊信號 之編碼表示型態之音訊信號編碼器。該音訊信號編碼器包 201203224 含一時間扭曲輪廓編碼器,其係組配來將描述一時間扭曲 輪廓之時間扭曲值對映至一編碼時間扭曲資訊。該時間扭 曲輪廓編碼器係經組配來依據該音訊信號之一取樣頻率而 調適用以將描述該時間扭曲輪廓之該等時間扭曲值對映至 該等編碼時間扭曲資訊之碼字組之一對映規則。該音訊信 號編碼器也包含一時間扭曲信號編碼器,其係組配來考慮 由該時間扭曲輪廓資訊所描述之一時間扭曲而獲得該音訊 信號之一頻譜之一編碼表示型態。此種情況下,該音訊信 號之編碼表示型態包含該編碼時間扭曲資訊之碼字組、該 頻譜之編碼表示型態、及描述該取樣頻率之一取樣頻率資 訊。該音訊編碼器係極為適合用以提供用前文討論之音訊 信號解碼器所使用的編碼音訊信號表示型態。此外,該音 訊信號編碼器獲致前文有關音訊信號解碼器已經討論且係 基於相同考量之相同優點。 依據本發明之另一實施例形成一種用以基於編碼音訊 信號表示型態而提供解碼音訊信號表示型態之方法。 依據本發明之另一實施例形成一種用以提供音訊信號 之編碼表示型態之方法。 依據本發明之另一實施例形成一種用以實現該等方法 中之一者或二者之電腦程式。 圖式簡單說明 後文將參考所含括之圖式描述依據本發明之實施例, 附圖中: 第1圖顯示依據本發明之一實施例,音訊信號編碼器之 11 201203224 方塊不意圖, 第2圖顯示依據本發明之一實施例,音訊信號解碼器之 方塊示意圖; 第3a圖顯示依據本發明之另一實施例,音訊信號編碼 器之方塊示意圖; 第3bl、3b2圖顯示依據本發明之另一實施例,音訊信 號解碼器之方塊示意圖; 第4a圖顯示依據本發明之一實施例,用以將編碼時間 扭曲資訊對映至解碼時間扭曲值之一對映器之方塊示意 圖; 第4b圖顯示依據本發明之另一實施例,用以將編碼時 間扭曲資訊對映至解碼時間扭曲值之一對映器之方塊示意 圖; 第4c圖顯示習知量化體系之扭曲之一表格表示型態; 第4d圖顯示依據本發明之一實施例,針對不同取樣頻 率碼字組指數對映至解碼時間扭曲值之對映之一表格表示 型態; 第4e圖顯示依據本發明之另一實施例,針對不同取樣 頻率碼字組指數對映至解碼時間扭曲值之對映之一表格表 示型態; 第5a、5b圖顯示依據本發明之一實施例,抽取自音訊 信號解碼器之方塊示意圖之細節; 第6a、6b圖顯示依據本發明之一實施例,抽取自用以 提供解碼音訊信號表示型態之一對映器之流程圖之細節; 12 201203224 第7al、7a2圖顯示依據本發明之一實施例,用於音气 解碼器之資料元素及輔助元素之定義之圖說; 第7b圖顯示依據本發明之一實施例,用於音訊解碼器 之常數之定義之圖說; 第8圖顯示碼字組指數對映至相應的解碼時間扭曲值 之對映之一表格表示型態; 第9圖顯示用以在相等間隔扭曲節點間線性内插之演 繹法則之假程式碼表示型態; 第10a圖顯示輔助函數「warp_tjme—jnv」之假程式碼表 示型態; 第1 Ob圖顯示輔助函數r warp-inv—vec」之假程式碼表 示型態; 第11a、lib圖顯示用以運算樣本位置向量及變遷長度 之演繹法則之假程式碼表示型態; 第12圖顯示取決於窗序列及核心編碼器框長度之一合 成窗長度N之值之一表格表示型態; 第13圖顯示容許的窗序列之一矩陣表示型態; 第 14a、14b圖顯示用於「eighT_SHORT_SEQUENCE」 型之窗序列之開窗及内部重疊_加法之演繹法則之假程式 碼表示型態; 第15圖顯示用於非屬「mGHT_SH〇RT_SEQUENCE」 么之’、中®序列之開窗及内部重疊-及-加法之演繹法則之 假程式碼表示型態; 第16圖顯示用於重複取樣之演繹法則之假程式碼表示 13 201203224 型態;及 第17a-17f圖顯示依據本發明之一實施例,該音訊串流 之語法元素之表示型態。 C實施冷式】 車乂佳贯施例之詳細說明 1.依據第1圖之時間扭曲音訊信號編碼器 第1圖顯示依據本發明之一實施例,一種時間扭曲音訊 信號編碼器100之方塊示意圖。 音訊信號編碼器100係經組配來接收一輸入音訊信號 no ’及基於此而提供該輸入音訊信號110之一編碼表示塑 態112。該輸入音訊信號110之編碼表示型態112例如包含一 編碼頻譜表示型態、一編碼時間扭曲資訊(其可標示以例如 「tw-data」及其可例如包含碼字組tw_ratio[i])及一取樣頻 率資訊。 音訊信號編碼器選擇性地可包含一時間扭曲分析器 120,其可經組配來接收該輸入音訊信號n〇、分析該輸入 音訊信號、及提供一時間扭曲輪廓資訊122,使得該時間扭 曲輪廓資訊122例如描述該音訊信號11〇之音高之時間演 變。但音訊信號編碼器1〇〇另可接收由位在音訊信號編碼器 外部之-時間㈣分析器所提供科間扭曲輪廓資訊。 音訊信號編碼器100也包含一時間扭曲輪廓編碼器 130,其係組配來接收時間扭曲輪廓資訊122,及基於此而 提供編碼時間扭曲資訊132。舉例言之,時間扭曲輪廊編碼 器130可接收描述該時間扭曲輪薄之日夺間扭曲值。該等時間 14 201203224 扭曲值例如可描述一已標準化或未經標準化之時間扭曲輪 廓之絕對值、或已標準化或未經標準化之時間扭曲輪廓之 隨著時間之經過之相對變化。一般而言,時間扭曲輪廓編 碼器13 0係經組配來將描述時間扭曲輪廓12 2之時間扭曲值 對映至該編碼時間扭曲資訊132。 時間扭曲輪廓編碼器130係經組配來調適用以依據音 訊信號之取樣頻率而將描述該時間扭曲輪廓之時間扭曲值 對映至該編碼時間扭曲資訊132之碼字組之一對映規則。用 於此項目的,時間扭曲輪廓編碼器130可接收取樣頻率資訊 來藉此調適該對映關係134。 音訊信號編碼器100也包含一時間扭曲信號編碼器 140,其係經組配來考慮由該時間扭曲輪廓資訊122所描述 之時間扭曲而獲得該音訊信號110之一頻譜之編碼表示型 態 142。 結果,例如可使用一位元串流提供器而提供編碼音訊 信號表示型態112,使得該輸入音訊信號no之編碼表示型 態112包含該編碼時間扭曲資訊132之碼字組、該頻譜之編 碼表示型態M2、及描述該取樣頻率之一取樣頻率資訊 152(例如,輸入音號110之取樣頻率及/或於時域至頻域 變換脈絡中由時間扭曲信號編碼器140所使用的(平均)取樣 頻率)。 有關音訊信號編碼器100之功能,可謂於一音訊框(其 中以音訊樣本表示…音練之長度可等於由該時間扭曲 4吕號編碼器所使用之時域至頻域變換之一變換長度)期間 15 201203224 改變其音高之一音訊信號之頻譜,該頻譜可藉時間改變重 複取樣而壓縮。據此’可依據時間扭曲輪廓資訊122而藉該 時間扭曲信號編碼器140所執行之時間改變重複取樣結果 導致(經重複取樣之音訊信號之)一頻譜,該頻譜可以比較原 先輸入音訊信號110之頻譜更佳的位元率效率而編碼。 但於時間扭曲信號編碼器14〇所施加的時間扭曲係使 用編碼時間扭曲資訊而發信號給依據第2圖之一音訊信號 解碼器200。此外,可包含該等時間扭曲值對映至碼字組之 時間扭曲資訊的編碼係依據該取樣頻率資訊而調適,使得 該等時間扭曲值對映至碼字組之不同對映關係係用於輸入 音訊信號110之不同取樣頻率,或用於時間扭曲信號編碼器 140(或其時域至頻域變換)所操作的不同取樣頻率。 如此’對各個可藉時間扭曲信號編碼器14〇處理之可能 的取樣頻率可選擇最高位元率效率之對映。此種調適合 理’原因在於發現若描述時間扭曲輪廓之時間扭曲值對映 至碼字組之對映規則匹配目前頻率,則編碼時間扭曲資訊 可維持為小2:(少數),即便於時間扭曲信號編碼 器140使用 多個可能的取樣頻率時亦如此。據此,在較小取樣頻率及 較大取樣頻率兩種情況下,可確保不同碼字組之一小集合 即足以編碼具有夠精細解析度及也具有夠大動態範圍的時 門扭曲輪廓,即便每個音訊框之碼字組數目於不同取樣頻 率,准持㊉數亦如此(其又轉而提供一取樣頻率非相依性 (independemMi &串流,及因而協助編碼音訊信號表示裂態 產生儲存、剖析、及即時動態處理(on_ the- fly- 201203224 processing)) ° 有關對映134之調適之進-步細節將討論如下。 2.依據第2圖之時間扭曲音訊信號解碼器 第2圖顯示依據本發明之—實施例,—種時間扭曲音訊 信號解碼器200之方塊示意圖。 音訊信號解碼器200係經組配來基於編碼音訊信號表 示型態2H)而提供-解碼音訊信號表示型態212。該編石^ 訊信號表示型態2 _如可包含—編碼頻譜表示型態 214(其可等於由時間扭曲信號編碼器刚所提供之編碼頻 譜表示型態142)、-編碼時間扭曲f訊训(其例如可等於由 時間扭曲輪廓編碼器130所提供之編碼時間扭曲資訊 132)、及一取樣頻率資訊218(其例如可等於取樣頻率資訊 152)。 音訊信號解碼器200包含一時間扭曲計算器23〇,其也 可視為時間扭曲解碼器。時間扭曲計算器2珊經組配來將 編碼時間扭曲資訊216對映至-解碼時間扭曲資訊232。編 碼時間扭曲資訊216例如可包含時間扭曲碼字組 「tw一ratio[i]」,而該解碼時間扭曲資訊例如可呈描述一時 間扭曲輪廓之時間扭曲輪廓資訊形式。時間扭曲計算器23〇 係經組配來調適用以依據取樣頻率資訊218而將該編碼時 間扭曲資訊216之(時間扭曲)碼字組對映至描述該解碼時間 扭曲資訊之解碼時間扭曲值之—對映規則234。據此,針對 由該取樣頻率資訊所傳訊的不同取樣頻率,可選擇該編碼 時間扭曲資訊216之碼字組對映至描述該解碼時間扭曲資 17 201203224 訊232之時間扭曲值之不同對映關係。 s afU。號解碼||2〇〇也包含—扭曲解碼器24Q,其係組 配來接收錢4之編碼表示型態214,及基於該編碼頻譜表 示依據4解碼時㈤扭曲冑訊提供解碼音訊 信號表示型態212。 據此’針對較高取樣頻率及較低取樣頻率二者,音訊 信號解碼器200允許編碼時間扭曲資訊之有效率解碼,原因 在於編碼時間扭曲資訊之碼字組對映至解竭時間扭曲值之 對映關係係取決於取樣頻率之故。如此,針對較高取樣頻 率可能獲得編碼音訊信號之高解析度,而針對較小取樣頻 率仍然涵蓋每個時間單位夠大的時間扭曲,及同時對較小 取樣頻率及較高取樣頻率二者使用相同的碼字組集合。如 此,於較高取樣頻率及較小取_率_情況下,該位元 串流格式實質上係與取樣頻相立無關,而仍然可能以合 宜準確度及動態範圍來描述該時間扭曲。 有關對映234之調適之進一步細節將敎述如下。又有 關扭曲解碼器240之進一步細節將描述如下。 3·依據第3a圖之時間扭曲音訊信號編碼器 第3a圖顯示依據本發明之一實施例,時間扭曲音訊信 號編碼器300之方塊示意圖。 依據第3圖之音訊信號編碼器3〇〇係類似依據第工圖之 音訊信號編碼㈣0,㈣㈣錢料㈣標示以相同元 件符號。但第3 a圖顯示有關時間扭曲信號編碼器⑽之進一 步細節。 201203224 因本發明係有關時間扭曲音訊編碼及時間扭曲音訊解 碼’將提出時間扭曲音訊信號編碼器140之細節的簡短综 述。時間扭曲音訊信號編碼器丨4 〇係經組配來接收一輸入音 訊信號110 ’及對一串列訊框提供該輸入音訊信號110之編 碼頻譜表示型態142。時間扭曲音訊信號編碼器140包含一 取樣單元或重複取樣單元UOa,其係調整適用於取樣或重 複取樣輸入音訊信號U〇而導算出用作為頻域變換之信號 區塊(取樣表示型態)14〇d。取樣單元/重複取樣單元14〇a包 含一取樣位置計算器14〇b,其係組配來運算樣本位置,該 等樣本位置係調整適用於藉時間扭曲輪廓資訊122所描述 之時間扭曲,因此若時間扭曲(或音高變異或基頻變異)非為 零,則其在時間上為非等距。取樣單元或重複取樣單元140a 也包含一取樣器或重複取樣器140c,其係組配來使用藉取 樣位置s十鼻益所得的時間上非專距樣本位置而取樣或重複 取樣輸入音訊信號110之一部分(例如一音訊框)。 時間扭曲音訊信號編碼器14 0進一步包含一變換窗計 算器140e,其係適用於針對由取樣單元或重複取樣單元 140a所輸出的取樣或重複取樣表示型態140d而導算定標 窗。定標窗資訊140f及取樣/重複取樣表示型態140d係輸入 開窗器140g,其係適用於將由定標窗資訊140f所描述之定 標窗適加至藉取樣單元/重複取樣單元140a所導算出之取樣 或重複取樣表示型態140d。於其它實施例中,時間扭曲音 訊信號編碼器140可額外地包含一頻域變換器140i來導算 出輸入音訊信號之取樣或重複取樣表示型態14〇h之頻 19 201203224 域表示型態14〇j(例如呈變換係數或頻譜係數形式)。頻域表 不型態140j例如可經過處理。此外,頻域表示型態14〇』或其 後處理版本可❹編碼1撕而編碼來獲得輸人音訊信號 110之編碼頻譜表示型態142。 時間扭曲音訊信號編碼器140進一步使用輸入音訊信 號110之音高輪廓,其中該音高輪射藉時間扭曲輪靡資訊 122描述。該時間扭曲輪廓資訊122可提供給音訊信號編碼 器300作為輪入資訊’或可藉音訊信號編碼器300而導算 出。因此,音訊信號編碼器3〇〇可選擇性地包含一時間扭曲 分析器120,其可操作為一音高估算器,其係用以導算出時 間扭曲輪廓資訊122,因而時間扭曲輪廓資訊122構成一音 高輪靡資訊或描述音高輪廓或基頻。 取樣單元/重複取樣單元14〇a可在輸入音訊信號11〇之 連續表示型態上操作。但另外’取樣單元/重複取樣單元14〇a 可在輸入音訊信號110之先前取樣表示型態上操作。於前一 情況下,單元140a可取樣輸入音訊信號(及因而可視為取樣 單元);而於後一情況下,單元140a可重複取樣該輸入音訊 信號1〖〇之先前取樣表示型態(及因而可視為重複取樣單 元)〇取樣單元140a例如可調整適用於時間扭曲鄰近重疊音 訊區塊,使得於取樣或重複取樣後,在各個輸入區塊内部, 重疊部分具有常數音高或減低的音高變異。 變換窗計真器140e可選擇性地依據藉取樣器i4〇a所執 行的時間扭曲而導算針對音訊區塊(例如針對音訊框)之定 標窗。為了達成此項目的,選擇性的調整區塊1401可存在 20 201203224 來界定由取樣器所使用的扭曲規則,然後該扭曲規則也可 提供給變換窗計算器140e。 於另一實施例中,調整區塊1401可被刪除,而時間扭 曲輪廓資訊122所描述之音高輪廓可直接提供給變換窗計 算器140e,其本身可進行適當計算。此外,取樣單元/重複 取樣單元140a可進行通訊而傳送所施加之取樣給變換窗計 算器140e,來允許計算適當定標窗。 但於若干其它實施例中,開窗實質上係與時間扭曲細 節獨立無關。 由取樣單元/重複取樣單元140a所執行的時間扭曲使得 藉單元140a所時間扭曲的及取樣的(或重複取樣的)經取樣 (或經重複取樣)音訊區塊(或音訊框)之音高輪廓係比原先 輸入音訊信號110之音高輪廓更加怪定。據此,因音高輪廓 之時間變異所造成的頻譜模糊不清可藉單元14〇3執行的取 樣或重複取樣而減少。如此,取樣或重複取樣音訊信號14〇d 之頻譜係比較輸入音訊信號110之頻譜較少模糊不清(及典 型地’顯示更為明確的頻譜峰及頻譜谷)。據此,比較以相 同準確度來編碼輸入音訊信號110之頻譜所要求的位元率 時,典型地可能使用較低位元率而編碼取樣(或重複取樣) 音訊信號140d之頻譜。 此處須注意輸入音訊信號11〇典型地係逐一訊框處 理,其中該等sfl框依據特定需求可重疊或非重疊。舉例言 之,輸入音訊信號之各個音訊框可藉單元14Qa而個別地取 樣或重複取樣,來藉此獲得㈣域樣本丨樹之個別集合所 21 201203224 描述之一串列取樣(或重複取樣)框。又’藉由開窗區塊 140g,可個別地施加開窗至由時域樣本140d之個別集合所 表示之取樣或重複取樣框。此外,由開窗及重複取樣時域 樣本140h之個別集合所描述的開窗及重複取樣框可藉變換 140i而個別地變換成頻域。雖言如此,個別框間可能有若 干(時間)重疊。 此外’須注意音訊信號110可以預定取樣頻率(亦稱取 樣率)取樣。在藉取樣器或重複取樣器140c所執行的重複取 樣中’可進行重複取樣使得輸入音訊信號110之重複取樣區 塊(或訊框)可包含與該輸入音訊信號110之取樣頻率(或取 樣率)相同(或至少近似相同,例如在±5%公差以内)的平均 取樣頻率(或取樣率)。然而,音訊信號編碼器3〇〇另可經組 配來以不同取樣頻率(或取樣率)的輸入音訊信號操作。 據此’於若干實施例中,由時域樣本14〇d所表示之重 複取樣區塊或框之平均取樣頻率(或取樣率)可依據輸入音 訊信號110之取樣頻率或取樣率而變化。 但當然也可能由時域樣本14〇d所表示之經取樣或重複 取樣之音讯彳&號之區塊或框之平均取樣頻率或取樣率,係 與輸入音訊信號110之取樣率不同,原因在於取樣器14〇&可 又據操作員之期望或需要而執行取樣率變換及時間扭曲二 者。 結果,可謂依據輸入音訊信號11〇之平均取樣頻率或取 樣率及/或仙相㈣,㈣域穌⑽撕衫之經取樣 或重複取樣之音訊信號之區塊或框可同取樣頻率或取 22 201203224 樣率提供。 隼人所^干實〜例中,就音訊樣本而言,由頻譜值140d = 取樣或重複取樣之音訊信號之區塊或框可 即便針對列平均取樣鮮或《率亦如此。缺 5fl樣本而言) «ΙΓ實施例中’兩種可能長度(以每區塊或每框料 =表示)間可進行切換,其中於第—(短區塊)模式之區 笛或難長度可與平均取樣頻率獨立㈣;及其中於 -(長區塊)模式之區塊長度或訊框長度(就音 也可與平均取樣頻率獨立無關。 ,據此’藉開窗器14〇g所執行之開窗、藉變換器·所 執行之變換、及藉編碼^概所執行之編碼實質上可與經 取樣或重魏樣之音難號14Qd的平均取樣鮮或取樣率 獨立無關(但紐區塊模式與長區塊模式間可能的切換除 外,該項切換可與平均取樣頻率或取樣率不相關地進行)。 總結而言,時間扭曲音訊信號編碼器140允許有效地編 碼輸入音訊信號110,原因在於於輸入音訊信號n〇包含時 間音南變異之情況下’比較該輸入音訊信號110,藉取樣器 140a執行的取樣或重複取樣,結果導致經重複取樣之音訊 信號140d具有較非模糊不清之頻譜;而其又轉而允許基於 輪入音訊信號11〇之取樣/重複取樣及開窗版本140h,藉轉 換器14 0 i提供頻譜係數14 0j之位元率有效率編碼(藉編碼器 140k)〇 藉時間扭曲輪廓編碼器130以取樣頻率相依性方式執 行的時間扭曲輪廓編碼,允許針對取樣/重複取樣音訊信號 23 201203224 140d之不同取樣頻率(或平均取樣頻率)進行時間扭曲輪廓 資訊122之位元率有效率編碼,使得包含該編碼頻譜表示型 態142及編碼時間扭曲資訊132之一位元串流為位元率有效 率。 4.依據第3b圖之時間扭曲音訊信號解碼器 第3b圖顯示依據本發明之一實施例,音訊信號解碼器 350之方塊示意圖。 音訊信號解碼器350係類似依據第2圖之音訊信號解碼 器200,因而相同信號及裝置將標示以相同的元件符號而在 此不再說明。 音訊信號解碼器350係經組配來用以接收第一時間扭 曲及取樣音訊框之編碼頻譜表示型態,及也用以接收第二 時間扭曲及取樣音訊框之編碼頻譜表示型態。概略言之, 音訊信號解碼器350係經組配來用以接收經時間扭曲-重複 取樣的音訊框之-串列編碼頻譜表示型態,其中該編碼頻 譜表示型態例如可由音訊信號編碼器3 〇 〇之時間扭曲音訊 信號編碼器140提供。此外,音訊信號解碼器35〇接收邊帶 資讯’例如諸如編碼時間扭曲資訊216及取樣頻率資訊以^。 扭曲解碼器240可包含一解碼器24〇&,其係組配來接收 頻譜之編碼表利態214,來解碼此_頻譜之編碼表示型態 214與提供该頻譜之一解碼表示型態24此。扭曲解碼器 也包3反變換器240c,其係經組配來接收該頻譜之解碼 表不型態24〇b ’及基於該頻譜之解碼表示型態240b而執行 反文換,來藉此獲得由該編碼頻譜表示型態214所描述之經 24 201203224 時間扭曲·取樣的音訊信號之—區塊或框之時域表示型態 240d。扭曲解碼器240也包含_開窗器24〇e,其係經組配來 施加-開窗至-區塊或框之時域表示型態24Qd而藉此獲得 -區塊或框之開窗時域表示型態肅。扭轉碼器削也包 含-重複取樣器24Gg,其中該開f時域表示型態2輒係依 據取樣位置資訊240h而重複取樣,來藉此獲得針對一區塊 或框之經開窗且經重複取樣之時域表示型態2 4 〇丨。扭曲解 碼器240也包含-重4 n _加法器2 4 Qj,其係經組配來重疊及 相加經開窗錄重複取樣之時域表示型態之隨後區塊或 框,來藉此獲得經開窗且經重複取樣之時域表示型態24〇i 之隨後區塊或框間的平順變遷,及因而由於重疊_及加法操 作結果而獲得解碼音訊信號表示型態212。 扭曲解碼器240包含一取樣位置計算器24〇k,其係自時 間担曲計算1 (或時師轉碼器)2爾取解碼時間扭曲資 訊232,及基於此而提供取樣位置資訊24诎。據此,解碼時 間扭曲貢訊232描述藉重複取樣24〇g所執行的時間變化重 複取樣。 選擇性地,扭曲解碼器24〇可包含一窗形調整器24〇1, 其可經組配來依據默求而調整由開窗器24〇e所使用的窗形 狀。舉例言之,窗形調整器24〇1可選擇性地接收解碼時間 扭曲資訊232,及依據該解碼時間扭曲資訊232而調整窗。 另外或此外,當扭曲解碼器24〇係可在此種長區塊模式與短 區塊模式間切換時,窗形調整器24〇1可經組配來依據是否 使用指不長區塊模式與短區塊模式之資訊而調整由開窗器 25 201203224 240e所使用的窗形狀。另外或此外,當扭曲解碼器240係使 用不同窗形狀時,窗形調整器2401可經組配來依據窗序列 資訊而選擇由開窗器240e所使用的窗形狀。但須注意藉窗 形調整器2401所執行之窗形調整須視為選擇性,而對本發 明而言並非特別相關。 此外,扭曲解碼器240可選擇性地包含取樣率調整器 240m,其可經組配來依據取樣頻率資訊218而控制窗形調整 器2401及/或取樣位置計算器240k。但取樣率調整器24〇m可 視為選擇性’而對本發明而言並非特別相關。 有關扭曲解碼器240之功能,可謂例如針對多個音訊框 (或甚至針對若干音訊框之多個頻譜係數集合)之各者,可包 含一變換係數(亦稱頻譜係數)集合之頻譜之編碼表示型態 214係首先使用解碼器240a解碼,因而獲得解碼頻譜表示型 態240b。該解碼音訊信號之一區塊或框之解碼頻譜表示型 態240b係變換成該音訊内容之該區塊或框之時域表示型陣 (例如每一音訊框包含預定數目的時域樣本)。典型地,但= 必要,該頻譜之解碼表示型態240b包含顯著峰及谷,— 在於此-頻譜可有效編碼故。結果,於單—區塊或框== 相應於具有顯著峰及谷之賴)期間,時域㈣型態2彻勺’ 含較小音高變異。 ^ ^ 開窗260e係、施加至音訊信號之時域表示型態_ 許重疊及加法操作。結果’已開窗之時域表示型能 以時間變化方式重複取樣’其中該重複取樣係於編
信號表示型態210中以編碼形式所含括 9 L 的時間扭曲資訊進 26 201203224 行。據此,假設編碼時間扭曲資訊描述一時間扭曲或相當 地’描述一音高變異,經重複取樣之音訊信號表示型態24〇i 典型地包含比較已開窗之時域表示型態240f顯著更大的音 高變異。如此,在重複取樣器240g之輸出端可提供包含歷 經單一音訊框之顯著音高變異之一音訊信號,即使反變換 器240c之輸出信號24〇d包含歷經單一音訊框之顯著較小音 南變異亦如此。 但扭曲解碼器24〇可經組配來處理使用不同取樣頻率 所提供的編娜譜表示型態,及提供具有不同取樣頻率的 解碼音讯#戒表示型態212。但對多個不同取樣頻率,每— 音訊框或音訊區塊之時域樣本數目可相同。但另外,扭曲 解碼器24〇可在其中一音訊區塊包含較少數樣本(例如攻 樣本)之-短區塊模式與其中—音訊區塊包含較大量樣本 (例如2048樣本)之一長區塊模式間切換。此種情況下,針對 不同取樣頻率,短區塊模式中之每—音訊區塊的樣本數為 相同;及針對不同取樣頻率,長區塊模式中之每—音訊區 塊(或音訊框)的樣本數為相同。又,針對不同取樣頻日率^ 一音訊框之時間扭曲碼字組數目典型地為相同。據此,= 達成-致位元串流格式’其係與取_率實質上獨立無關 (至少就每一音訊框編碼的時域樣本數目而言及就每」音 訊框之時間扭曲碼字組數目而言)。 曰 但為了具有時間扭曲資訊之位元率有效率編碼及時間 扭曲資訊之足夠解析度二者,時間扭曲資訊之編碼係調‘ 於在音訊信號編碼器300該端之取樣頻率(其提供編碼立π 27 201203224 信號表示型態210)。結果’包含時間扭曲碼字組對映至解 碼時間扭曲值之編碼時間扭曲資訊216的解碼係調適於取 樣頻率。後文將描述有關時間扭曲資訊解碼之此一調適細 即0 5.時間扭曲編碼與解碼之調適 5.1.構想綜論 後文中’將描述有關依據欲編碼之音讯信號或欲解碼 之音訊信號的取樣頻率而做時間扭曲編碼與解碼之調適之 細節。換言之,將描述取樣頻率相依性音高變異量化。為 了協助瞭解,首先將描述若干習知構想。 於使用時間扭曲之習知音訊編碼器及音訊解碼器,胃 音高變異或扭曲之量化表對全部取樣頻率為固定。舉例言 之’參考統一語音及音訊編碼之工作草稿6(「USAC之 WD6」,ISO/IEC JTC1/SC29/WG11 N11213 ’ 2010)。由於樣 本之更新距離(例如就音訊樣本而言,時間扭曲值從音訊編 碼器傳送至音sR解碼器之距離)也係固定(於習知時間扭曲 音訊編碼器/音訊解碼器及於依據本發明之時間扭曲音訊 編碼器/音訊解碼器二者)’故以較低位元率施加此種編碼方 案,結果導致可涵蓋的實際音高變化之範圍減小(例如以每 單位時間之音高變化表示)。於語音基頻之典型最大變化係 低於約15 oct/s(每秒15八重元組)〇 第4c圖之表顯示針對若干用在音訊編碼之取樣頻率, 參考文獻[3]所述編碼方案無法對映期望的音高變異範圍, 因而結果導致讀擇性編碼增益。為了顯示此項效應,第 28 201203224 4c圖之表顯示針對參考文獻[3]所述音訊解碼器所使用的該 表(例如用以將時間扭曲碼字組對映至解碼時間扭曲值之 對映表)之不同取樣頻率的扭曲。獲得該等扭曲值(以〇ct/s 表+ )之公式為· f fi'np、 w = l〇g2 pre7 r (!) v y 上式中W標示扭曲,prel標示相對音高變化因數,fs標示 取樣頻率,np標示一個框内的音高節點數目,及nf標示樣本 的框長度。 據此,第4c圖之表顯示用在參考文獻[3]所述音訊解碼 器所使用的該量化方案之扭曲,其中nf=1024及np=16。 依據本發明,發現優異地係依據取樣頻率而調適扭曲 值指數(可視為時間扭曲碼字組)對映至一相應時間扭曲值 prel之對映關係。換言之,發現前述問題的解決之道係對不 同取樣頻率設計獨特量化表,使得以〇ct/s(每秒八重元組) 表示之所涵蓋的音高變異或扭曲之絕對範圍對全部取樣頻 率皆為相同(或至少約略相同)。發現此點例如可藉提供數個 明確量化表,其各自用於鄰近取樣頻率之狹窄範圍而達 成;或藉針對所使用的取樣頻率立即時動態量化表之計算 而達成。 依據本發明之一實施例,此點可藉提供扭曲值之表, 與藉由從上式變換公式而計算針對相對音高變化音數之量 化表: 29 201203224
上式中, ,Prel標示相對音高變化因數
相對音高變化因數prel。 -頻率’及np標示一個框内的 可獲得顯示於第4d圖之表的 參考第4d圖’第—襴48〇標示 一指數,該指數可視為時 間扭曲碼字組,及該指數可含括於表示該編碼音訊信號表 示型態210之位元串流。第二 —欄482描述最大可表示之時間
音高變化(亦即針對音高減低)之相對音高變化因數Prel ;指 數值3係對應1之相對音高變化隨,其表*常數音高丨及 才曰數4、5、6及7係對應「正」音高變化,亦即針對音高增 高之相對音高變化因數Pre|。 但發現為了獲得相對音高變化因數,可有不同構想。 發現獲得相對音高變化因數之另一方式係設計針對相對立 高變化因數及相對應參考取樣率之一量化值表。對—给定 取樣頻率之實際量化表可使用下式而簡易地從所設計 中導算出: 30 201203224 + (3) 人
Prel描述一目前取樣頻率fs之相對音高變化因數。此 外’〜,时描述—參考取樣頻率fs,ref之相S音高變化因數。 與不同指數(時間扭曲碼字組)相關聯之參考音高變化因數 Ρ_集合可儲存在表中,其中參考(相對)音高變化因數相 應的參考轉頻率fs,ref為 已知。 業已發現後式對藉上式所得結果給予合理的近似估 計,同時屬於運算上較不複雜。 一第4e圖顯示從參考相對音高變化因數〜所得的相對 曰同麦化因數prel之—表格表示型態,其中該表保有相對取 樣頻率fs,ref=240〇〇赫兹。 第一欄490描述可視為日夺間扭曲碼?組之一指數。第二 欄492描述第-攔490在個別列所顯示的指數(或碼字組)相 關聯之參考相對音高變化因數pw w。第三攔494及第四搁 496描述針對24〇0〇赫兹(第三欄494)及i2_赫兹(第四欄 496)之取樣頻率fs’與第—攔49〇指數相關聯之(相對)音高變 化因數。如此可知,針對顯示於第三欄494之24000赫茲之 取樣頻率fs,相對音高變化因數prei係與第二欄492所示參考 相對音咼變化因數相同,原因在於24〇〇〇赫茲之取樣頻率& 係等於參考取樣頻率fs,ref。但第四欄496顯示在丨2〇〇〇赫茲之 取樣頻率fs的相對音高變化因數Prei,其係依據如上方程式(3) 而從第二攔492之參考相對音高變化因數而導算出。 當然’如刖述’此等量化程序容易直捷地施加至例如 31 201203224 於頻率或音高上改變之任何其它表示型態,及也施加至編 碼絕對音高或頻率值但未編碼其相對變化之方案。 5·2·依據第4a圆之實現 第4a圖顯示可用於依據本發明之一實施例之一種調適 性對映400之方塊示意圖。 調適性對映400可替代於音訊信號解碼器2 〇 〇之對映 234或於音訊信號解碼器350之對映234。 調適性對映400係經組配來接收編碼時間扭曲資訊,如 同例如包含時間扭曲碼字組「tw_ratio[i]」之所謂「tw_data」 資訊。據此’調適性對映400可提供解碼時間扭曲值,例如 解碼比值,其偶爾標示為值「warp_value_tbl[tw_ratio]」, 及其偶爾也標示為相對音高變化因數prel。調適性對映4〇〇 也接收取樣頻率資訊’其描述例如由反變換230c所提供的 時域表示型態240d之取樣頻率fs,或由重複取樣240g所提供 之經開窗且經重複取樣之音訊信號表示型態240i之平均取 樣頻率,或解碼音訊信號表示型態212之取樣頻率。 調適性對映包含一對映器420,其係提供呈編碼時間扭 曲資訊之時間扭曲碼字組之函數變化的一解碼時間扭曲 值。對映規則選擇器430依據取樣頻率資訊406而從多個對 映表432、434中選出一對映表用以由對映器420使用。舉例 言之,若目前取樣頻率係等於24000赫茲,或若目前取樣頻 率係係於24000赫茲之預定環境範圍内,則對映規則選擇器 430選擇一對映表,其表示由第4d圖之表之第一欄480及第 4d圖之表之第三欄484所定義之對映。相反地,若取樣頻率 32 201203224 fs係等於12000赫茲,或若取樣頻率fs係係於12000赫茲之預 定環境範圍内,則對映規則選擇器43〇選擇—對映表,其表 示由第4d圖之表之第—攔48〇及第_之表之第四棚486所 定義之對映。 據此,當取樣頻率係等於24000赫茲時,時間扭曲碼字 組(也標示為「指數」)〇_7係對映至第如圖之表之第三欄484 所示個別解碼時間扭曲值(或相對音高變化因數);而當取樣 頻率係等於12000赫茲時,係對映至第牝圖之表之第四攔 486所示個別解碼時間扭曲值(或相對音高變化因數)。 要言之,依據取樣頻率,由對映規則選擇器43〇可選擇 不同對映表,藉此將一時間扭曲碼字組(例如含括於表示解 碼音訊信號之位元串流的值「指數」)對映至一解碼時間扭 曲值(例如相對音高變化因數Pre|,或時間扭曲值 「warp_value_tbl」)。 5·3·依據第4b圖之實現 第4b圖顯示可用於依據本發明之一實施例之一種調適 性對映450之方塊示意圖。調適性對映450可替代於音訊信 唬解碼器200之對映234或於音訊信號解碼器35〇之對映 234。調適性對映450係經組配來接收編碼時間扭曲資訊, 其中適用前文有關調適性對映400之解說。 首先,調適性對映450係經組配來提供解碼時間扭曲 值’其中也適用前文有關調適性對映400之解說。 調適性對映450包含一對映器470,其係經組配來接收 編碼時間扭曲之碼字組及提供解碼時間扭曲值。調適性對 33 201203224 映450也包含一對映值運算器或對映表運算器 於對映值運算器之情況下,解碼時間扭曲值係依據如 上方私式(3)運算。用於此項目的,對映值運算器可包含一 參考對映表搬。該參考對映表術可例如描述由第如圖之 表之第149G及第二攔492所定義之對映f訊。據此,對 映值運算H48G及對映n·可協力合作使縣於參考對映 表而針對-給料間扭曲碼字組選擇—相應的參考相對音 高變化因數’及使得_該給料間扭曲碼字組之相對音 高變化因數〜係依據方程式⑶使用有關目前取樣頻率^之 資訊運算’及送返作為解碼時間扭曲值。此種情況下,甚 至無需儲存調整適詩目前取樣頻率對映表的全部 分錄而犧牲針對各時間扭曲碼字組之解碼時間扭曲值(相 對音高變化因數)之運算。 但另外,對映表運算器彻可前置運算調適於目前取樣 頻率fs之-對映表供對映器47咖。舉例言之對映表運 算器可經組配來回應於料選擇1聰賊之目前取樣頻 率而運算第㈣第四攔496之分錄。針對12__之取樣 頻率fs而運算相對音高變化因數^可基於參考對映表(例如 匕3由第4e圖之表之第—攔彻及第二欄492所定義之對 映)’且可使用方裎式(3)執行。 據此’該經前置運算的對映表可用於將一時間扭曲碼 字組對映至-解瑪時間杻曲值。此外,每當重複取樣率改 變時,可更新前置取樣對映表。 十對時間扭曲碼字組對映至解碼時間扭曲值 34 201203224 之對映的對映規則可基於參考對映表482評估或運算,其中 可執行調適於目前取樣頻率之一對映表的前置運算,或解 碼時間扭曲值之即時動態運算。 6·時間扭曲控制資訊之運算之細節描述 後文將敘述有關基於時間扭曲輪廓演變資訊之時間扭 曲控制資訊的運算細節。 6.1·依據第5a及5b圖之裝置 第5a及5b圖顯示用以基於時間扭曲輪廊演變資訊 510 ’其可包含解碼時間扭曲資訊及其例如可包含由時間扭 曲計算器230之對映234所提供的解碼時間扭曲值,而提供 時間扭曲控制資訊512之裝置500之方塊示意圖。裝置5〇〇包 含用以基於時間扭曲輪廓演變資訊510而提供重建時間扭 曲輪廓資訊522之設備520,及用以基於重建時間扭曲輪廓 資訊522而提供時間扭曲控制資訊512之一時間扭曲控制資 訊計算器530。 後文中,將敘述設備520之結構及功能。 设備520包含一時間扭曲輪廓計算器540,其係經组配 來接收時間扭曲輪廓演變資訊510,及基於此而提供新的時 間杻曲輪廓部分資訊542。舉例言之,針對欲重建的音訊信 號之各訊框,時間扭曲輪廓演變資訊之一集合(例如由對映 234所提供之預定數目解碼時間扭曲值集合)可傳送至裝置 500。雖言如此’於某些情況下,與欲重建立一音訊信號訊 框相關聯之時間扭曲輪廓演變資訊510集合可用於多個音 机信號訊框之重建。同理,多個時間扭曲輪廓演變資訊集 35 201203224 合可用於音訊信號之單一訊框的音訊内容的重建,容後詳 述。總結而言,於某些情況下’時間扭曲輪廓演變資訊可 以〃 s人重建的音訊信號變換域係數集合相等的速率更新 (每一音訊信號框為1時間扭曲輪廓演變資訊510集合,及/ 或每一音訊信號框為一個時間扭曲輪廓部分)。 時間扭曲輪廓計算器540包含一扭曲節點值計算器 544 ’其係經組配來基於多個時間扭曲輪廓比值(或時間序 列)而運算多個扭曲輪廓節點值(或時間序列),其中該時間 杻曲比值係包含於時間扭曲輪廓演變資訊51〇。換言之,由 對映234所提供之解碼時間扭曲值可組成時間扭曲比值(例 如warp—value_tbl[tw_ratio[]])。為了達成此項目的,扭曲節 點值計算器544係經組配來於預定起始值(例如丨)而開始提 供時間扭曲輪廓節點值,及使用該時間扭曲比值而計算隨 後之時間扭曲輪廓節點值,容後詳述。 又,扭曲節點值計算器544選擇性地包含一内插器 548 ,其係經組配來在内插在隨後時間扭曲輪廓節點值間。 如此’獲得新時間扭曲輪廓部分之描述542,其中該新時間 扭曲輪廓部分典型地始於由扭曲節點計算器524所使用的 預定起始值。此外,設備520係經組配來將所謂「上一個時 間扭曲輪廓部分」及所謂的「目前時間扭曲輪廟部分」儲 存在第5圖未顯示的記憶體。 但設備520包含一重新定標器550,其係經組配來重新 定標「上一個時間扭曲輪廓部分」及「目前時間扭曲輪廓 部分」而避免(或減少’或消除)整個時間扭曲輪廊區段之非 36 201203224 連續,該整個區段係基於「上一個時間扭曲輪靡部分」、「目 前時間扭曲輪摩部分」及「新時間扭曲輪鄭部分」。為了達 成此項目的’重新定標器550係經組配來接收「上一個時間 扭曲輪廓部分」及「目前時間扭曲輪廓部分」之描述,及 將「上/個時間扭曲輪廓部分」及「目前時間扭曲輪廓部 分」一起重新定標來獲得「上一個時間扭曲輪廓部分」及 「目前時間扭曲輪廓部分」之重新定標版本。有關此一功 能細節敘述如下。 此外,重新定標器550也可經組配來例如從第5圖未顯 示之一記憶體而接收在與「目前時間扭曲輪廓部分」相關 聯之另一和值内部的與「上一個時間扭曲輪廓部分」相關 聯之一和值。此等和值偶爾分別地標示為「last-warP-Sum」 及「cur_warp_sum」。重新定標器550係經組配來使用相應 的時間扭曲輪廓部分所用來重新定標的相同重新定標因數 \ 而重新定標與時間扭曲輪廓部分相關聯之和值。據此獲得 經重新定標之和值。 於某些情況下,設備520可包含一更新器560,其係經 組配來重複地更新輸入重新定標器550之時間扭曲輪廓部 分,及亦重複地更新輸入重新定標器550之和值。舉例言 之,更新器560可經組配來以該訊框率更新該資訊。例如, 目前訊框週期之「新時間扭曲輪廓部分」可用作為下一個 訊框週期之「目前時間扭曲輪廓部分」。同理,目前訊框週 期之「目前時間扭曲輪廓部分」可用作為下一個訊框週期 之「上一個時間扭曲輪廓部分」。據此,形成記憶體有效率 37 201203224 7實現,原因在於目前訊框週期之「上—個時間扭曲輪廟部 分」可在「目前訊框週期」完成時被拋棄。 ”’’τ上所述,设備52〇係經組配來針對各個訊框週期(), θ ^ δ新時間扭曲輪廓部分」、「重新定標目前時間扭 輪廓。卩刀」及「重新定標上一個時間扭曲輪廓部分」之 述的時間扭曲輪廓區段之描述。此外,設備可針對各 忙週期(則述特殊訊框週期除外),提供扭曲輪廓和值之 一表不型態,例如包含「新時間扭曲輪廓部分」、「重新定 標目前時間扭曲輪廟部分」及「重新定標上一個時間扭曲 輪廓部分」。 時間扭曲控制資訊計算器5 3 〇係經組配來基於由設備 520所提供之重建時間扭曲輪廓資訊542而計算時間扭曲控 制資訊512。舉例言之’時間扭曲控制資訊計算器53〇包含 一時間輪廓計算器570,其係經組配來基於重建時間扭曲輪 廓資訊而運算一時間輪廓572(例如時間扭曲輪廓之逐一樣 本表示型態)。此外,時間扭曲控制資訊計算器53〇包含一 樣本位置計算器574,其係設置來接收時間輪廓572,及基 於此而提供例如呈樣本位置向量576之樣本位置資訊。樣本 位置向量576描述例如由重複取樣器24〇g所執行的時間扭 曲。 時間扭曲控制資訊計算器530也包含一變遷長度計算 器’其係經組配來從重建時間扭曲輪廓資訊而導算變遷長 度資訊。變遷長度資訊582例如可包含描述左變遷長度之資 訊及描述右變遷長度之資訊。變遷長度例如可取決於由「上 38 201203224 一個時間扭曲輪廓部分」、「目前時間扭曲輪靡部分」及「新 時間杻曲輪廓部分」所描述之時間節段長度。舉例言之, 若由上一個時間扭曲輪廓部分」所描述的時間節點之時 間延長係比由「目前時間扭曲輪廓部分」所描述的時間節 點之時間延長短,或若由「新時間扭曲輪廓部分」所描述 的時間節點之時間延長係比由「目前時間扭曲輪廓部分」 所描述的時間節點之時間延長短,則變遷長度可縮短(比較 内設變遷長度)。 此外,時間扭曲控制資訊計算器530可進一步包含一第 一及最末位置計算器584 ’其係經組配來基於左及右變遷長 度而計算所謂的「第一位置」及「最末位置」。若在此等位 置外側區在開窗後係與零相同,且因而無需考慮時間扭 曲,則「第一位置」及「最末位置」提高重複取樣器效率。 此處須注意樣本位置向量576例如包含由重複取樣器24〇g 所執行的時間扭曲所使用的(或甚至要求的)資訊。此外,左 及右變遷長度582及「第一位置」及「最末位置」586組成 例如由開窗器240e所使用的(或甚至要求的)資訊。 據此’可謂設備520及時間扭曲控制資訊計算器530可 一起接管取樣率調整器240m、窗形調整器2401及取樣位置 計算240k之功能。 6.2.依據第6a及6b圖之功能描述 後文中,將參考第6a及6b圖描述包含設備520及時間扭 曲控制資訊計算器530之一音訊解碼器的功能。 第6a及6b圖顯示依據本發明之一實施例,一種用以解 39 201203224 碼一音訊信號之編碼表示型態之流程圖。該方法600包含提 供重建時間扭曲輪廓資訊,其中提供重建時間扭曲輪廓資 訊包含將編碼時間扭曲資訊之碼字組對映6〇4至解瑪時間 扭曲值;計算610扭曲節點值;内插620在扭曲節點值間; 及重新定標630 —或多個先前計算之扭曲輪廓部分及一或 多個先前計算之扭曲輪廓和值。方法600進一步包含使用在 步驟610及620所得「新時間扭曲輪廓部分」、重新定標之先 前計算得的時間杻曲輪廓部分(「目前時間扭曲輪廓部 分」、「上一個時間扭曲輪廓部分」)及選擇性地(也使用重 新定標之計算得的扭曲輪廓和值來計算640時間扭曲控制 資訊。結果,於步驟640可獲得時間輪廓資訊、及/或樣本 位置資訊、及/或變遷長度資訊及/或第一位置及最末位置資 訊。 該方法600進一步包含使用於步驟640所獲得之時間輪 廢資訊執行650時間扭曲信號重建。後文將敘述有關時間杻 曲k號重建之細節。 方法600也包含更新記憶體之一步驟660,容後詳述。 7.演繹法則之細節描述 7a·综論 後文中,將以細節描述依據本發明之一實施例,藉音 訊解碼器所執行之若干演繹法則。為了達成此項目的,將 參考第 5a、5b、6a、6b、7a、7b、8、9、10a、l〇b、11、 12 ' U、14、15及16圖做說明。 首先’參考第7a圖,顯示資料元素之定義之圖說及輔 40 201203224 助元素之;t義之圖說。此外,參考第几圖,顯示常數 義之圖說。 概略言之,可謂此處所述方法可 々沄了用於依據時間扭曲而 修改離散餘弦變換而編碼之音訊串流之解碼。如此,告針 對-音訊串流允許TW-MDCT作動(可以旗標例如稱:為 「_DCT」旗標指示,其可包含於特定組態資訊)時,時 間扭曲渡波器組及區塊⑽可置換音轉抑之標準渡波 器組及區塊切換。除了修改離散餘弦反變換⑽DC”之 外,時間扭曲遽波器組及區塊切換含有自任意間隔時間網 格對映至正常規則間隔或線性間隔時間網格的時域至時域 對映’及相應的窗形調適。 此處須注意基於頻譜之細碼表示型態214及也基於編 碼時間扭曲資訊232,此處所述解碼演繹法則例如可藉扭曲 解碼器240進行。 7.2. 定義: 至於資料元素、輔助元素及常數之定義,請參考第7a 及7b圖。 7.3. 解碼處理-扭曲輪廓 扭曲輪廓節點之碼簿指數係針對個別節點,如後文說 明而解碼成扭曲值:
f〇r present => 0, 0 ^ i :2 mum_TW_WODES warp ^ node __ vaiues[i) - |
present /=*〇 present^ 0</£NUM_TM_MODES 但時間扭曲碼字組「tw_rati〇[k]」之對映至解碼時間扭 41 201203224 曲值,此處標示為「warp_value_tbl[tw_ratio[k]]」,於依據 本發明之實施例係取決於取樣頻率。據此,於依據本發明 之實施例並非單一對映表,反而對不同取樣頻率有個別對 映表。 舉例言之’藉對映表存取與目前取樣頻率相應的對映 表所送返之結果值「warp_value_tbl[tw_rati〇[k]]」可被視為 解碼時間扭曲值’且可基於含括於組成(或表示)編碼音訊信 號表示型態210之一位元串流中的時間扭曲碼字組 「tw_ratio[k]」,而藉對映234、藉調適性對映400或藉調適 性對映450提供。 為了獲得逐一樣本(n_long samples)新扭曲輪廓資料 「new_wai:p_contour[]」,現在使用一種演繹法則,其假程 式碼表示型態係顯示於第9圖,扭曲節點值 warp—node一values[]」現在係在等間隔(interp_dist apart) 節點内插β 在獲得此一框(例如目前框)之全扭曲輪廓前,來自於過 去之緩衝值可被重新定標’使得過去扭曲輪扉 「past_warp_contour[]」之最末扭曲值=1 〇 norm fac =-—~—---- past ^warp^cofitotirxl n_long-1] past_warp_contour[i}-past^warp^contourii]·norm_fac for 0^i<2*n_long last jwarp一sum = iast_warp—sum· norm一 fac cur warp^sum cur^warp^sum * norm^ fac 藉由串接(concatenating)過去扭曲輪廓 「past_warp_contour」及新扭曲輪廓「new_warp_contour」, 42 201203224 獲得全扭曲輪摩「warp_contour[]」,及新扭曲和 「new_warp_sum」係計算為全部新扭曲輪廊值 「new_warp_contour[]」之和。 new _warp _sum = new _ warp_con(awii] 〇 7.4·解碼處理-樣本位置及窗長度調整 自扭曲輪廓「warp_contour[]」,運算在線性時間標度 上扭曲樣本之樣本位置向量。對此依據如下方程式而產生 時間扭曲輪廓: ·last_warp_sum fori = 0 time _cont〇ur[i] ( μ Λ
Ww\ ~~^^^arP^um^2^j\varp contour[k] forO < / < 3·« l〇ng V *«〇 ) ~ 此處,〜=—一_ cur _warp _sum 運用輔助功能 「 warp_inv_vec〇」及 「warp_time_vec()」,其假程式碼表示型態分別係顯示於第 10a〃此處圖,依據一個演繹法則,其假程式碼表示型態分 別係顯示於第11圖,而運算樣本位置向量及變遷長度。 7 ·5 •解妈處理-修改離散餘弦反變換(IMdct) 後文中’將簡短描述修改離散餘弦反變換。 修改離散餘弦反變換之分析表示法如下: Σ辦φ·κ*ι⑽…+士)J f〇r 〇 5 ” < λγ 此處: n==樣本指數 i=窗指數 43 201203224 k=頻譜係數指數 N=基於window_sequence之窗長度 n〇=(N/2+l)/2 反變換之合成窗長度為語法元素r window_sequence」 (其可含括於位元串流)及演繹法則脈絡之函數。合成窗長度 例如係依據第12圖之表定義。 有意義之區塊變遷係列舉在第13圖之表。於―給定表 單元之打鉤記號指示列舉在此一特定列的窗序列可接著為 此一特定行所列舉之一窗序列。 有關容許的窗序列,須注意音訊解碼器例如可在不同 長度窗間切換。但窗長度的切換與本發明並非特別相關。 反而基於假设·彳一型ronly_1〇ng—sequence」冑序列及核 心編碼器框長度係等於1024,可瞭解本發明。 此外,須注意音訊信號解碼器可在頻域編碼模式與時 域編碼模式m刀換。但此-可能性並非與本發明特別相 關。反而,本發明係適用於只能處理頻域編碼模式之音訊 信號編碼器,例如參考第i、2、知及孙圖討論。 7.6.解碼處理-開窗及區塊切換 後文將描述可藉扭曲解碼器24〇及特別藉其開窗器 240e而執行的開窗及區塊切換。 依據「windowjhape」元素(其可含括於表示音訊信號 之位疋串流),使用不同的過取樣變換窗原型,及過取樣窗 長度為
= 2 · μ _ long -OS^FACTOR WIN 44 201203224 針對window_shape==l,藉凯舍-貝索導出(KBD)窗而給 定窗係數如下: ΣΚρ,《)] 娜、2 J 1 〜/2 Σ [吟α)] ! ρ=0 此處· for 午“ <
Nos W’凱舍-貝索核心函數定義如下: W(n,a) I〇[x] = 2 πα. 1·0· .NJA , (fj Ιά ι〇Μ for OSn 幺
E〇L a=核心窗α因數,a=4 否則,針對window_shape==0,採用正弦窗如下 iy q含 ΪΧ ^........._1 sin 2 for Έμ. <n< Nos 針對全部各種窗序列,左窗部分所使用的原型係由前 一區塊的窗形決定。下式表示此項事實: fW,,Rn\n\ \ϊwindow shape previous block — l 伽L ’· 一 window_shape_previous_block — 〇 同理,右窗形之原型係藉下式決定: ^κβο\ρ\ ^window_shape = 1 WSJN [m], if window _shape — 0 right _ window _ shape[n) 因已經決定變遷窗長度,只須在 45 201203224 「EIGHT一SHORT一SEQUENCE」型窗序列與全部其它窗序 列間區別。 於目前框屬於「EIGHT__SHORT_SEQUENCE」型之情 況下,執行開窗及内部(框内部)重疊及加法。第14圖之C碼 狀部分描述具有窗型「EIGHT_SHORT_SEQUENCE」的框 之開窗及内部重疊及加法。 針對任何其它類型框,可使用演繹法則,其假程式碼 型係顯示於第15圖。 7.7.解碼處理-時間變異重複取樣 後文中,將描述時間變異重複取樣,其可藉扭曲解碼 器240 ’特別係藉重複取樣器24〇g執行。 開窗區塊z[]係使用如下脈衝響應,依據樣本位置(其係 藉取樣位置計算240k基於由對映234所提供的解碼時間扭 曲值而提供)重複取樣: nn ί>Η = 1〇[α]-ι.Ι。 η1 IP LEN 22
,OS FACTOR RESAMP -/〇r〇Sw<xp sI2E_, 〇, 4«-IPjLEN__2S], ι〇. 46 201203224 相加對全部序列皆相同且以數學式描述如下: ,ΐ〇τ〇^<η_ΙοηΒ/2 ⑽ — U· fox η_1〇ηξβ^η<η Jong 7.9.解碼處理-記憶體更新 後文中將說明記憶體更新。即便第3d圖並未顯示特定 手段,但須注意記憶體更新可藉扭曲解碼器240執行。 解碼下一個框所需記憶體緩衝器係更新如下: pa^t_warp_contour[n\ = warp_contour\n + n_long]$ for0^w<2*n_long cur_\^arp_sum ^new_warp_sum 第一框解碼前或末框以光學LPC域編碼器編碼時,記 憶體狀態係設定如下: past_warp_coniour[n] = 1, for 0 s « < 2 · nj0ng cur^warp^sum =n^long last _warp _sum = n^long 7.10.解碼處理·•結論 综上所述,已經描述解碼處理程序,其可藉扭曲解碼 器240執行。如此可知,時域表示型態係如係對薦時域樣 本之-音訊框提供,及隨後音訊框例如可重疊約%%,使 得確保隨後音訊框之時域表示型態_平順變遷。 例如冊M-TW-N〇DES=16解碼時間扭曲值之-集合 例如可關聯各個音訊框(設該音訊框之時間扭曲為致動),而 與音訊框之時域樣本之實際取_率獨立Μ。 8.依據第17a-17f圖之音訊串流 後文中,將描述音訊串流,复 、s β ^ , ^ ,、包含—或多個音訊信號 通道及一或多個時間扭曲輪廓之 為碼表示型態。後文中描 47 201203224 述的音訊_流例如攜載編碼音訊信號表示型態112或編碼 音訊信號表示型態210。 第17a圖顯示所謂的「USAC_raw_data_block」資料串 流元素之線圖表示型態,其可包含一信號頻道元素(SCE)、 一成對頻道元素(CPE)、及一或多個信號頻道元素及/或一 或多個成對頻道元素之組合。 「USAC_raw_data_block」典型地可包含一編碼音訊資 料區塊,而額外時間扭曲輪廓資訊可於一分開資料串流元 素提供。雖言如此,當然可能將部分時間扭曲輪廓值編碼 成「USAC_raw_data_block」。 如由第17b圖可知,單一頻道元素典型地包含頻域頻道 串流(「fd_channel_stream」),容後參考第17d圖詳加說明。 如由第17c圖可知,成對頻道元素 (「channel_pair_element」)典型地包含多個頻域頻道串流。 又,成對頻道元素可包含時間扭曲資訊,例如時間扭曲致 動旗標(「tw_MDCT」),其可於組態資料串流元素中或在 「USAC_raw_data_block」中傳送,及其判定時間扭曲資訊 是否含括於成對頻道元素。舉例言之,「tw_MDCT」旗標 指示時間扭曲為作動時,成對頻道元素可包含一旗標 (「common_tw」),其指示成對頻道元素之音訊頻道是否具 有一共通時間扭曲。若該旗標(「common_tw」)指示多個音 訊頻道具有一共通時間扭曲,則一共通時間扭曲資訊 (「tw_data」)係含括在成對頻道元素,例如與頻域頻道串 流分開。 48 201203224 現在參考第17d圖,描述頻域頻道串流。如由第I%圖 可知,頻域頻道串流例如包含通用增益資訊。又,若時間 扭曲為作動(旗標「twJVIDCT」為作動)且若對多個音訊信 號頻道無共用時間扭曲資訊(旗標「c〇mm〇n一tw」為非作 動),則頻域頻道串流包含時間扭曲資料。 又頻域頻道串流也包含定標因數資料 (「scale—factor_data」)及編碼頻譜資料(例如算術編碼頻譜 資料「ac_spectral一data」)。 現在參考第17e圖,簡短討論時間扭曲資料之語法。時 間扭曲資料例如可選擇性地包含一旗標(例如 tw_data_present」或「active_pitch_data」指示是否存在 有時間扭曲資料。若存在有時間扭曲資料(亦即時間扭曲輪 廓非為平坦)’則時間扭曲資料可包含多個編碼時間扭曲比 值序列(例如「tw_ratio[i]」或「pitchldx[i]」),其例如可依 據取樣率相依性碼薄表編碼,如前文已述。 如此’時間扭曲資料可包含一旗標’指示當時間扭曲 輪廓為常數(時間扭曲比約等於1〇〇〇)時,並無可藉音訊信 號編碼器設定的時間扭曲資料可資利用。相反地,當時間 扭曲輪廓為可變時’隨後時間扭曲輪廓節點間之比可使用 組成「tw—ratio」資訊的碼薄指數編碼。 第l7f圖顯示算術編碼頻譜資料Γ ac_Spectral_data()」 之語法之線圖表示型態。算術編碼頻譜資料係依據非相關 性旗標(此處:「indepHag」)狀態而編碼,該旗標若為作動, 則指示算術編碼資料係與前一框的算術編碼資料獨立無 49 201203224 關。若非相關性旗標「—Flag」為作動 ,則算術復置旗 才不arith—reset—flag」設定為作動。否則,算術復置旗標之 值係取決於算術編碼頻譜資料之一位元。 此外,算術編碼頻譜資料區塊「ac—spectral—dataO」包 含一或多個算術編碼資料單元,其中算術編碼資料 Fanth_data〇」單元數目係取決於目前框之區塊(或窗)數 目。於一長區塊模式中,每個音訊框只有一個窗。但於一 短區塊模式中,每個音訊框例如可有八個窗。算術編碼頻 譜資料「arith—data」之各個單元包含一頻譜係數集合,其 可用作為頻域至時域變換之輸入信號,該項變換例如可藉 反變換240c執行。 每單元算術編碼資料「arith_data」之頻譜係數數目例 如可與取樣頻率獨立無關,但可取決於區塊長度模式(短區 塊模式「EIGHT_SHORT_SEQUENCE」或長區塊模式 「ONLY_LONG_SEQUENCE」)。 9.結論 綜上所述’業已描述時間扭曲修改離散餘弦變換 (TW-MDCT)之改良。前述發明係關時間扭曲mdCT變換編 碼器脈絡,及形成用以改良時間扭曲MDCT變換編碼器之 效能之方法。有關時間扭曲修改離散餘弦變換細節,請注 意參考文獻[1]及[2]。 此種時間扭曲MDCT變換編碼器之一項具體實現係在 正在進行中的MPEG USAC音訊編碼標準化工作(例如參考 參考文獻[3])。所使用之時間扭曲MDCT實現細節請參照參 50 201203224 考文獻[4]。 此外’須注意此處描述之音訊信號編碼器及音訊信號 解碼器包含國際專利申請案WO/2010/003583、 WO/2010/003618、WO/1010/003581 及 WO/2010/003582所述 特徵結構。四件國際專利申請案之教示係明確地以引用方 式併入此處。該四件國際專利申請案所揭示之特徵結構及 特性可併入依據本發明之實施例。 10.實現替代之道 雖然已經就裝置脈絡猫述若干構面,但顯然此等構面 也表示相應方法之描述,此處一區塊或一裝置係對應一方 法步驟或一方法步驟之特徵結構。同理,於一方法步驟脈 絡所描述之構面也係表示對應裝置之對應區塊或項目或特 數之描述。部分或全部方法步驟可藉(或使用)硬體裝置例 如,微處理器、可程式電腦或電子電路執行。於若干實施 例中,最主要方法步驟中之某一個或某些個可藉此種裝置 執行。 本發明之編碼音訊信號可儲存在一數位儲存媒體或可 在傳輪媒體諸如無線傳輸媒體或有線傳輸媒體諸如網際網 路上傳輸。 依據某些實現要求,本發明之實施例可在硬體或軟體 實現。該項實現可使用數位儲存媒體執行,該等媒體例如 為軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM、 或快閃(FLASH)記憶體,其上儲存有可電子式讀取控制信 號,該等信號與可程式規劃電腦系統協力合作(或可協力合 51 201203224 作)來執行個別方法。因此該數位儲存媒體可為電腦讀取。 依據本發明之若干實施例包含一種具有可電子式讀取 控制信號之資料載體,其可與可程式規劃電腦系統協力合 作因而執行此處所述方法中之—者。 一般而言,本發明之實施例可實現為具有程式碼之一 種電腦程式產品’該程式碼係可操作來當該電腦程式產品 在-電腦上跑時執行該等方法中之一者。該程式碼例如可 儲存在機器可讀取載體上。 其它實施例包含儲存在機器可讀取載體上用以執行此 處所述方法中之一者之該電腦裎式。 換言之,因此本發明方法之—實施例為一種具有一程 式媽之電腦程式,當該電腦程式在—電腦上跑時該程式碼 係用以執行此處所述方法中之一者。 因此本發明方法之又-實施例為—種資料載體(或數 位儲存媒體’或電腦可讀取媒體)包含記錄於其上之用以執 行此處所述方法中之一者的電腦程式。 因此本發明方法之又-實施例為一種表現用以執行此 處所述方法中之一者的電腦程式之資料串H争列信 號。該資料串流或串列信號例如可經組配來透過資料通訊 連結,例如透過網際網路傳輪。 又一實施例包含—種組配來或適用於執行此處所述方 法中之-者之處理裝置,例如電腦或可程式規劃邏輯裝置。 又-實施例包含-種電腦,其上安裝有用以執行此處 所述方法中之一者之電腦裎式。 52 201203224 依據本發明之又—實施例包含組配來傳輪(例如電子 式或光學㈣讀行此處所述方法巾之_者之電腦程式 給一接收器之—種裝置或系統。該接收器例如可為電腦、 灯動裝置、記憶體元件等。該裝置或系統例如可包含一種 用來將電腦程式傳輪至接收器之檔案伺服器。 於若干實施财,可使料程式_邏輯裝置(例如場 可=式規劃_列)來執行此處所述方法中之部分或全部 魏。於若干實關中,場可程式__列可與微處理 益協力合作來執行此處所述方法中之-者。-般而言,該 等方法較佳係藉任一種硬體裝置執行。 則述實施例僅供舉例說明本發明之原理。須瞭解此處 所述配置及細節之修改及變異為熟諳技藝人士顯然易知。 因此,本發明意圖僅受隨附之申請專利範圍之範圍所限, 而非受此處藉由實施例之描述及解說所呈現的特定細節所 限。 參考文獻 [1] Bemd Edler et.alM uTime Warped MDC T9, US 61/042,314, Provisional application for patent, [2] L. Vil丨emoes,“Time Warped Transform Coding of Audio Signals’’, PCT/EP2006/010246, International, patent application, November 2005.
[3] (tWD6 of USAC", ISO/IEC JTC1/SC29/WG11 N11213,2010 [4] Bemd Edkr et. al.,“A Time-Warped MDCT Approach to Speech Transform Coding”,126th AES Convention Munich,May 2009, preprint 7710 [5] Nikolaus Meine, MVektorquantisierung und kontextabhangige arithmetischc Codierung fllr MPEG-4 AACn, VDI, Hannover, 2007 i:圖式簡單說明3 第1圖顯示依據本發明之一實施例,音訊信號編碼器之 方塊示意圖; 53 201203224 第2圖顯示依據本發明之一實施例,音訊信號解碼器之 方塊示意圖; 第3a圖顯示依據本發明之另一實施例,音訊信號編碼 器之方塊示意圖; 第3bl、3b2圖顯示依據本發明之另一實施例,音訊信 號解碼器之方塊示意圖; 第4a圖顯示依據本發明之一實施例,用以將編碼時間 扭曲資訊對映至解碼時間扭曲值之一對映器之方塊示意 圖; 第4b圖顯示依據本發明之另一實施例,用以將編碼時 間扭曲資訊對映至解碼時間扭曲值之一對映器之方塊示意 圖; 第4c圖顯示習知量化體系之扭曲之一表格表示型態; 第4d圖顯示依據本發明之一實施例,針對不同取樣頻 率碼字組指數對映至解碼時間扭曲值之對映之一表格表示 型態; 第4e圖顯示依據本發明之另一實施例,針對不同取樣 頻率碼字組指數對映至解碼時間扭曲值之對映之一表格表 示型態; 第5a、5b圖顯示依據本發明之一實施例,抽取自音訊 信號解碼器之方塊示意圖之細節; 第6a、6b圖顯示依據本發明之一實施例,抽取自用以 提供解碼音訊信號表示型態之一對映器之流程圖之細節; 第7al、7a2圖顯示依據本發明之一實施例,用於音訊 54 201203224 解碼器之資料元素及輔助元素之定義之圖說; a第7b圖顯示依據本發明之—實施例,用於音訊解碼器 之常數之定義之圖說; ° 第8圖顯示碼字組指數對映至相應的解碼時間扭曲值 之對映之—表格表示型態; 第9圖顯示用以在相等間隔扭曲節點間線性内插之演 繹法則之假程式碼表示型態; λ、 第l〇a圖顯示輔助函數「warp—timeJnv」之假程式碼表 第l〇b圖顯示輔助函數「warpjnv—vec」之假程式碼表 示型態; 第Ua、lib圖顯示用以運算樣本位置向量及變遷長度 之演繹法則之假程式碼表示型態; 第12圖顯示取決於窗序列及核心編碼器框長度之一合 成窗長度N之值之一表格表示型態; 第13圖顯示容許的窗序列之一矩陣表示型態; 第 14a、14b 圖顯示用於「EIGHT_SHORT_SEQUENCE」 型之窗序列之開窗及内部重疊_加法之演繹法則之假程式 碼表示型態; 第15圖顯示用於非屬「EIGHT_SHORT_SEQUENCE」 型之其中窗序列之開窗及内部重疊_及_加法之演繹法則之 假程式碼表示型態; 第16圖顯示用於重複取樣之演繹法則之假程式碼表示 型態;及 55 201203224 第17邮圖顯示依據本發明之一實施例,該 之語法元素之表示型態。 °"淹 【主要元件符號說明】 100、300…時間扭曲音訊信號 編碼器 110…輸入音訊信號 112···編碼表示型態 120···時間扭曲分析器 122…時間扭曲輪廓資訊 130··.時間扭曲輪廓編碼器 132、216··.編碼時間扭曲資訊 134、234···對映關係、對映規則 140…時間扭曲音訊信號編碼器 140a…取樣單元/重複取樣單元 140b、240k·.·取樣位置計算器 140c、240g...取樣器/重複取樣器 140d···取樣或重複取樣表示型態 140e···變換窗計算器 140f、2401…定標窗育訊、窗形 調整器 140g、240e...開窗器 140h、240i...開窗及重複取樣 時域樣本、經開窗且經重 複取樣之時域表示型態 1401.. .頻域變換器 140j…頻域表示型態 140k...編碼器 1401.. .調整器 142、214...編碼頻譜表示型態 152、218··.取樣頻率資訊 200、350···音訊信號解碼器 210…編碼音訊信號表示型熊 212·..解碼音訊信號表示型態 230·.· B夺間扭曲計算器 232…解碼時間扭曲資訊 240…扭曲解碼器 240a·.·解碼器 240b…解碼表示型態 240c···反變換器 240d…時域表示型態 240f…開窗時域表示型態 240h…取樣位置資訊 240j…重疊器·加法器 240m. ··取樣率調整器 400、450..·調適性對映 56 201203224 406.. .取樣頻率資訊 420、470…對映器 430.. .對映規則選擇器 432、434.··對映表 480.. .對映值運算器、對映表運 算器 482…參考對映表 480-496···欄 500·.·裝置 510.. .時間扭曲輪廓演變資訊 512.. .時間扭曲控制資訊 520.. .設備 522.. .重建時間扭曲輪廓資訊 530.. .時間扭曲控制資訊計算器 540.. .時間扭曲輪廓計算器 542.. .新時間扭曲輪廓部分資訊 544…扭曲節點值計算器 548.. .内插器 550.. .重新定標器 560.. .更新器 570.. .時間輪廓計算器 572.. .時間輪廓 574.. .樣本位置計算器 576.. .樣本位置向量 580.. .變遷長度計算器 582.. .左及右變遷長度 584…第一及最末位置計算器 586.. .「第一位置」及「最末位置」 600.. .方法 604、610、620、630、650、660... 步驟 57

Claims (1)

  1. 201203224 七、申請專利範圍: 1. 一種經組配來基於包含一取樣頻率資訊之一編碼音訊 信號表示型態、一編碼時間扭曲資訊及一編碼頻譜表示 型態而提供一解碼音訊信號表示型態之音訊信號解碼 器,該音訊信號解碼器包含: 一時間扭曲計算器其係組配來將該編碼時間扭曲 資訊對映至一解碼時間扭曲資訊, 其中該時間扭曲計算器係經組配來依據該取樣頻 率資+訊而調適用以將編碼時間扭曲資訊之碼字組對映 至描述該解碼時間扭曲資訊的解碼時間扭曲值之一對 映規則;及 一扭曲解碼器其係經組配來基於該編碼頻譜表示 型態及依據該解碼時間扭曲資訊而提供該解碼音訊信 號表示型態。 2. 如申請專利範圍第1項之音訊信號解碼器,其中該等編 碼時間扭曲資訊之碼字組描述一時間扭曲輪廓之時間 演變,及 其中該時間扭曲計算器係經組配來對由該編碼音 訊信號表示型態所表示之編碼音訊信號之一音訊框,評 估該編碼時間扭曲資訊之碼字組之預定數目,其中該碼 字組之預定數目係與該編碼音訊信號之取樣頻率獨立 無關。 3. 如申請專利範圍第1或2項之音訊信號解碼器,其中該時 間扭曲計算器係經組配來調適該對映規則,使得該編碼 58 201203224 時間扭曲資訊之碼字組之一給定集合的碼字組對映於 其上之一解碼時間扭曲值範圍對第一取樣頻率係比對 第二取樣頻率大,但限制條件為該第一取樣頻率係小於 該第二取樣頻率。 4.如申請專利範圍第3項之音訊信號解碼器,其中該等解 碼時間扭曲值為表示時間扭曲輪廓值之時間扭曲輪廓 值或表示時間扭曲輪廓值之絕對變化或相對變化之時 間扭曲輪廓值。 5.如申請專利圍第1至4項中任—項之音訊信號解碼 器,其中該時間扭曲計算器係經組配來調適該對映規 則’使得歷經藉該編碼音訊信號表示㈣所表示之一編 碼音訊信號之-給定數目樣本的最大音高變化,其係可 以該編碼時間扭曲資訊之碼字組之一給定集合表示者 對第-取樣頻率係比對第二取樣頻率大,但限制條件為 該第一取樣頻率係小於該第二取樣頻率。 6·=申請專利範圍第⑴項中任—項之音訊信號解 Γ、中D亥時間扭曲計算器係經組配來調適該對映 則使得藉于-第一取樣頻率之該編碼時間扭曲資訊 碼社之—給定集合所表示之歷經—段給㈣間週 的取大日尚變化’與藉于—第二取樣頻率之該編碼時I =貢訊之碼字組之該給定集合所表示之歷經一化 二夺間:㈣最大音高變化間之差異,對一第一取斯 -第二取樣頻率間之差異達至少娜者係不大力 59 201203224 ^申:專利範圍第1至6項中任一項之音訊信號解碼 °°°八Λ夺間扭曲計算器係經組配來依據該取樣頻率 貝。η*使用不同對映表用以將該等編碼時間扭曲資訊之 碼字組對映至解碼時間扭曲值。 8· Π1專利範圍第1至6項中任-項之音訊信號解碼 Γ /、巾Λ時間杻曲計算器係經組配來將對-參考取樣 =述與該等編碼時間扭曲資訊之不同碼字組相關 敌碼時間扭曲值的參考對映值,調整配合與該 取樣頻率不同夕 _ ^ 值。 貫際取樣頻率,而獲得適應性對映 j申°"專利範圍第8項之音訊信號解碼器,直中該時門 =計算器係經組配來依據該實際取樣頻;“ 取樣頻率間之比u貝手”轉考 考對映值。疋以响描述一時間扭曲之部分參 1〇*如申請專利範圍第⑴ 器,其中㈣姑至9項中任一項之音訊信號解碼 號表示型;夺間扭曲值描述歷經由該編碼音訊信 時間扭曲輪廊變:之:碼音訊信號之預定數目樣本的 中該取1=:::器包含-取樣位置計算器,其 摩變化組配來組合表示時間扭曲輪 固解碼時間扭曲值,而導算出一杻曲 點值,使得异出扭曲輪廓節 曲節點值佐 出之扭曲輪廓節點值之偏離-參考扭 表示的傷離Γ於由該等解碼時間扭曲值中之單1所 60 201203224 11.如申喷專利範圍第1至l〇項中任一項之音訊信號解碼 器,其中該等解碼時間扭曲值描述歷經由該編碼音訊信 號表示型態所表示之編碼音訊信號之預定數目樣本的 時間扭曲輪廓的相對變化,及 其中該音訊信號解碼器包含一取樣位置計算器,其 中§亥取樣位置計算器係經組配來從該等解碼時間扭曲 值而導算出一時間扭曲輪廓資訊。 A如申請專利範圍第項中任—項之音訊信號解碼 器,其中該音訊信號解碼器包含一取樣位置計算器,其 中"亥取樣位置S十算器係經組配來基於該等解碼時間扭 曲值而運算一時間扭曲輪廓之支點,及 其中该取樣位置計算器係經組配來在該等支點間 内插而獲得該時間扭曲輪廓, 及其中每個音訊框辭多個解碼時間扭曲值係與該 取樣頻率獨立無關。 種用以提供-音削§號之編碼表示型態之音訊信號 編碼器,該音訊信號編碼器包含: 時間扭曲輪廓編碼器其係組配來將描述一時間 扭曲輪廓之時間扭曲值對映至一編碼時間扭曲資訊, 其中該時間扭曲輪廓編碼器係經組配來依據該音 訊信號之-取樣頻率而調適用以將描述該時間扭曲輪 廓之該等時間扭曲值對映至該等編碼時間扭曲資訊之 碼字組之一對映規則;及 -時間扭曲信號編碼器其係組配來考慮由該時間 61 201203224 扭曲輪廓資訊所描述之一時間扭曲而獲得該音訊信號 之一頻譜之一編碼表示型態, 其中該音訊信號之編碼表示型態包含該編碼時間 扭曲資訊之碼字組、該頻譜之編碼表示型態、及描述該 取樣頻率之一取樣頻率資訊。 14. 一種用以基於包含一取樣頻率資訊之一編碼音訊信號 表示型態、一編碼時間扭曲資訊及一編碼頻譜表示型態 而提供一解碼音訊信號表示型態之方法,該方法包含: 將該編碼時間扭曲資訊對映至一解碼時間扭曲資 訊,其中用以將編碼時間扭曲資訊之碼字組對映至描述 該解碼時間扭曲資訊的解碼時間扭曲值之一對映規則 係依據該取樣頻率資訊而調適;及 基於該編碼頻譜表示型態及依據該解碼時間扭曲 資訊而提供該解碼音訊信號表示型態。 15. —種用以提供一音訊信號之編碼表示型態之方法,該方 法包含: 將描述一時間扭曲輪廓之時間扭曲值對映至一編 碼時間扭曲資訊, \ 其中用以將描述該時間扭曲輪廓之該等時間扭曲 值對映至該等編碼時間扭曲資訊之碼字組之一對映規 則係依據該音訊信號之一取樣頻率而調適; 考慮由該時間扭曲輪廓資訊所描述之一時間扭曲 而獲得該音訊信號之一頻譜之一編碼表示型態, 其中該音訊信號之編碼表示型態包含該編碼時間 62 201203224 扭曲資訊之碼字組、該頻譜之編碼表示型態、及描述該 取樣頻率之一取樣頻率資訊。 16. —種電腦程式,其係用以當該電腦程式在該電腦上跑時 執行如申請專利範圍第14或15項之方法。 63
TW100107904A 2010-03-10 2011-03-09 音訊信號解碼器、音訊信號編碼器、用以提供解碼音訊信號表示型態之方法及電腦程式與用以提供音訊信號之編碼表示型態之方法及電腦程式 TWI455113B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US31250310P 2010-03-10 2010-03-10

Publications (2)

Publication Number Publication Date
TW201203224A true TW201203224A (en) 2012-01-16
TWI455113B TWI455113B (zh) 2014-10-01

Family

ID=43829343

Family Applications (2)

Application Number Title Priority Date Filing Date
TW100107905A TWI441170B (zh) 2010-03-10 2011-03-09 音訊信號解碼器、音訊信號編碼器、用以將音訊信號解碼之方法、用以將音訊信號編碼之方法、及使用編碼脈絡之音高相依適應技術之電腦程式
TW100107904A TWI455113B (zh) 2010-03-10 2011-03-09 音訊信號解碼器、音訊信號編碼器、用以提供解碼音訊信號表示型態之方法及電腦程式與用以提供音訊信號之編碼表示型態之方法及電腦程式

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW100107905A TWI441170B (zh) 2010-03-10 2011-03-09 音訊信號解碼器、音訊信號編碼器、用以將音訊信號解碼之方法、用以將音訊信號編碼之方法、及使用編碼脈絡之音高相依適應技術之電腦程式

Country Status (15)

Country Link
US (2) US9129597B2 (zh)
EP (2) EP2539893B1 (zh)
JP (2) JP5625076B2 (zh)
KR (2) KR101445296B1 (zh)
CN (2) CN102884573B (zh)
AR (2) AR080396A1 (zh)
AU (2) AU2011226140B2 (zh)
BR (2) BR112012022741B1 (zh)
CA (2) CA2792504C (zh)
ES (2) ES2461183T3 (zh)
MX (2) MX2012010439A (zh)
PL (2) PL2532001T3 (zh)
RU (2) RU2607264C2 (zh)
TW (2) TWI441170B (zh)
WO (2) WO2011110591A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI581257B (zh) * 2013-06-21 2017-05-01 弗勞恩霍夫爾協會 使用品質控制之時間定標器、音訊解碼器、方法和電腦程式
US9997167B2 (en) 2013-06-21 2018-06-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2083418A1 (en) * 2008-01-24 2009-07-29 Deutsche Thomson OHG Method and Apparatus for determining and using the sampling frequency for decoding watermark information embedded in a received signal sampled with an original sampling frequency at encoder side
US8924222B2 (en) * 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
CN103035249B (zh) * 2012-11-14 2015-04-08 北京理工大学 一种基于时频平面上下文的音频算术编码方法
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9769586B2 (en) 2013-05-29 2017-09-19 Qualcomm Incorporated Performing order reduction with respect to higher order ambisonic coefficients
BR112016007515B1 (pt) * 2013-10-18 2021-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Método de codificação de segmento de sinal de áudio, codificador de segmento de sinal de áudio, e, terminal de usuário.
KR101831289B1 (ko) * 2013-10-18 2018-02-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 신호의 스펙트럼의 스펙트럼 계수들의 코딩
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
PL3117432T3 (pl) * 2014-03-14 2019-10-31 Ericsson Telefon Ab L M Sposób i aparatura do kodowania audio
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
CN105070292B (zh) * 2015-07-10 2018-11-16 珠海市杰理科技股份有限公司 音频文件数据重排序的方法和系统
JP6412292B2 (ja) * 2016-01-22 2018-10-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法
EP3306609A1 (en) * 2016-10-04 2018-04-11 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for determining a pitch information
KR102383195B1 (ko) 2017-10-27 2022-04-08 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 디코더에서의 노이즈 감쇠
WO2020207593A1 (en) 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
EP4026124B1 (en) * 2019-10-19 2025-12-10 Google LLC Self-supervised pitch estimation
US12148120B2 (en) * 2019-12-18 2024-11-19 Ati Technologies Ulc Frame reprojection for virtual reality and augmented reality
US11776562B2 (en) * 2020-05-29 2023-10-03 Qualcomm Incorporated Context-aware hardware-based voice activity detection
CA3195301A1 (en) * 2020-10-13 2022-04-21 Andrea EICHENSEER Apparatus and method for encoding a plurality of audio objects and apparatus and method for decoding using two or more relevant audio objects
TWI872420B (zh) 2020-10-13 2025-02-11 弗勞恩霍夫爾協會 在降混過程中使用方向資訊對多個音頻對象進行編碼的設備和方法、或使用優化共變異數合成進行解碼的設備和方法
CN114488105B (zh) * 2022-04-15 2022-08-23 四川锐明智通科技有限公司 一种基于运动特征及方向模板滤波的雷达目标检测方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP4196235B2 (ja) * 1999-01-19 2008-12-17 ソニー株式会社 オーディオデータ処理装置
WO2000074039A1 (en) * 1999-05-26 2000-12-07 Koninklijke Philips Electronics N.V. Audio signal transmission system
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7394833B2 (en) * 2003-02-11 2008-07-01 Nokia Corporation Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification
JP4364544B2 (ja) * 2003-04-09 2009-11-18 株式会社神戸製鋼所 音声信号処理装置及びその方法
CN101171626B (zh) * 2005-03-11 2012-03-21 高通股份有限公司 通过修改残余对声码器内的帧进行时间扭曲
CA2602804C (en) * 2005-04-01 2013-12-24 Qualcomm Incorporated Systems, methods, and apparatus for highband burst suppression
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
WO2008022184A2 (en) 2006-08-15 2008-02-21 Broadcom Corporation Constrained and controlled decoding after packet loss
CN101375330B (zh) * 2006-08-15 2012-02-08 美国博通公司 丢包后解码音频信号的时间扭曲的方法
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
RU2536679C2 (ru) * 2008-07-11 2014-12-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
DK3573056T3 (da) * 2008-07-11 2022-10-03 Fraunhofer Ges Forschung Audiokoder og audioafkoder
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI581257B (zh) * 2013-06-21 2017-05-01 弗勞恩霍夫爾協會 使用品質控制之時間定標器、音訊解碼器、方法和電腦程式
US9997167B2 (en) 2013-06-21 2018-06-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program
US10204640B2 (en) 2013-06-21 2019-02-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time scaler, audio decoder, method and a computer program using a quality control
US10714106B2 (en) 2013-06-21 2020-07-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program
US10984817B2 (en) 2013-06-21 2021-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time scaler, audio decoder, method and a computer program using a quality control
US11580997B2 (en) 2013-06-21 2023-02-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program
US12020721B2 (en) 2013-06-21 2024-06-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time scaler, audio decoder, method and a computer program using a quality control

Also Published As

Publication number Publication date
PL2532001T3 (pl) 2014-09-30
BR112012022744B1 (pt) 2021-02-17
KR101445296B1 (ko) 2014-09-29
PL2539893T3 (pl) 2014-09-30
RU2012143340A (ru) 2014-04-20
US20130073296A1 (en) 2013-03-21
BR112012022741B1 (pt) 2021-09-21
HK1179743A1 (zh) 2013-10-04
EP2532001B1 (en) 2014-04-02
US9524726B2 (en) 2016-12-20
US20130117015A1 (en) 2013-05-09
RU2586848C2 (ru) 2016-06-10
KR20120128156A (ko) 2012-11-26
JP2013522658A (ja) 2013-06-13
JP5625076B2 (ja) 2014-11-12
CN102884573A (zh) 2013-01-16
AU2011226140A1 (en) 2012-10-18
RU2012143323A (ru) 2014-04-20
KR101445294B1 (ko) 2014-09-29
RU2607264C2 (ru) 2017-01-10
CN102884572A (zh) 2013-01-16
CA2792500A1 (en) 2011-09-15
AU2011226143B2 (en) 2014-08-28
KR20130018761A (ko) 2013-02-25
JP5456914B2 (ja) 2014-04-02
MX2012010469A (es) 2012-12-10
US9129597B2 (en) 2015-09-08
AR084465A1 (es) 2013-05-22
CA2792500C (en) 2016-05-03
TWI441170B (zh) 2014-06-11
AU2011226143B9 (en) 2015-03-19
BR112012022741A2 (pt) 2020-11-24
EP2539893B1 (en) 2014-04-02
TWI455113B (zh) 2014-10-01
MX2012010439A (es) 2013-04-29
CA2792504A1 (en) 2011-09-15
BR112012022744A2 (pt) 2017-12-12
AU2011226140B2 (en) 2014-08-14
JP2013521540A (ja) 2013-06-10
ES2461183T3 (es) 2014-05-19
ES2458354T3 (es) 2014-05-05
HK1181540A1 (zh) 2013-11-08
EP2539893A1 (en) 2013-01-02
AU2011226143A1 (en) 2012-10-25
WO2011110594A1 (en) 2011-09-15
CN102884572B (zh) 2015-06-17
CN102884573B (zh) 2014-09-10
CA2792504C (en) 2016-05-31
AR080396A1 (es) 2012-04-04
TW201207846A (en) 2012-02-16
WO2011110591A1 (en) 2011-09-15
EP2532001A1 (en) 2012-12-12

Similar Documents

Publication Publication Date Title
TW201203224A (en) Audio signal decoder, audio signal encoder, methods and computer program using a sampling rate dependent time-warp contour encoding
CN101512639B (zh) 用于语音/音频发送器和接收器的方法和设备
JP5208901B2 (ja) 音声信号および音楽信号を符号化する方法
JP6636574B2 (ja) 雑音信号処理方法、雑音信号生成方法、符号化器、および、復号化器
JP2020190751A (ja) オーディオ信号のスペクトルのスペクトル係数のコード化
JP6113278B2 (ja) 改良された確率分布推定を使用する線形予測に基づくオーディオ符号化
JP6148811B2 (ja) 周波数領域におけるlpc系符号化のための低周波数エンファシス
JP4489959B2 (ja) 時間同期波形補間によるピッチプロトタイプ波形からの音声を合成するための音声合成方法および音声合成装置
TWI691954B (zh) 控制編碼器及/或解碼器中頻寬之技術
TW202209303A (zh) 音頻量化器和音頻去量化器及相關方法
JP2016510426A (ja) 低複雑度の調性適応音声信号量子化
CN103137135A (zh) Lpc系数量化方法和装置及多编码核音频编码方法和设备
HK1179743B (zh) 使用取样率依赖时间扭曲轮廓编码的音频信号解码器、音频信号编码器、方法及计算机程序