TW200816167A

TW200816167A - Method and device for transcoding audio signals

Info

Publication number: TW200816167A
Application number: TW096131326A
Authority: TW
Inventors: Peter Jax; Sven Kordon
Original assignee: Thomson Licensing
Priority date: 2006-09-20
Filing date: 2007-08-24
Publication date: 2008-04-01
Also published as: CN101563726A; WO2008034723A1; TWI423251B; JP2010504544A; KR20090055579A; CA2662910C; EP2064700B1; EP2064700A1; EP1903559A1; JP5324450B2; CA2662910A1; ZA200901367B; BRPI0718465A2; KR101341317B1; US9093065B2; US20090240507A1

Description

200816167 九、發明說明：【發明所屬之技術領域】勒本於聲頻峨之轉碼村和裝置。與聲頻壓縮 ί古尤其是不同知覺的聲頻寫碼格相之轉碼領域有關。用本發明基本概念’於其他聲頻處理用途上。 ” L聲頻轉碼」—辭常指按照特定聲頻寫碼格式代表聲頻 1的位4，與按照不_聲頻寫碼格式所_的另一』兀机之偏差。在此意義上，「轉碼」指從mpeg層冚，應性位福獲制如MPEG AAC職錄元触完全斤。文獻上已知一般性知覺聲頻編碼（τ.以如沉和A Pa: (2000):〈數位聲頻之知覺寫碼〉此IEEE :第狀卷〕之基本原理，如第！圖所示。吨於今聲親號的壓縮方法和格式，—般使用時間 Γ1Λ斤i〇i，即滤波器排或轉換，以代表聲頻訊號107之參數 Μ此等參數要經量化和編碼104、熵寫碼105和位元流异106 ,此等步驟均利用輸入聲頻訊號的心理聽覺分析1〇1 加以控制:第2 ®表示相對應-般性知覺聲頻解碼n，具有位兀流運算20卜熵解碼202、位元分配203、解碼和去^ 夺間/頻率合成，由參數212、213發生時間界域弟1和2圖说明知覺聲頻寫解碼器之例。雖然特殊實施可有某種程度的不同，但絲採料間/頻率分析、及直向之時間/頻率合成。〃驟則於時間/頻率分析和合成’而中間編碼和解碼步對時間/頻率分析102，在今曰之聲頻寫解石馬器多不同的演算。例如MPEG聲頻寫解碼器標準，包含聰^ 200816167 1層I和Π寫解碼器，使用32帶擬似(正交，）濾波獅，以及则G_i輕(mp3)，則採用混雜^波态排，即32帶擬似qmf濾波器排後接（修^ === 之，。應CT濾、波(從缺值18磁帶箱，為匕/又~到ό磁▼相），分別導致576或192磁解。=EG AAC寫解碼器及其衍生產品使用全帶 ^ ’有1G24磁帶箱的從缺值分解（過渡曰幅耵置（100%重搭）*frame_size。疋所明 μ、ΐί’ΡΒΓΒΐ/頻率分析1G2的輸出和時間/頻率人成哭夕ί輸界域（其中編碼器的輸出訊號116即為; =聲㈣碼格式為時間/鮮分析究_ 示對聲頻轉碼的措施，為目前典型丄；：’=、:弟j圖表 2圖内業已敘述的可行赛畢握έ、。— ’ 口广、汐及第1和 :元流，解碼dec-a成Wi間==1二:之輸入即按照目標格式產生立 =唯一界面，是時間界域聲頻訊_，即^ 雖然此項措施使用簡單，但段MC—A、ENC—β不知彼此，5歹=。弟一，因為二步化：一般而言，會有一条 f/頒率为析程序會去同碼（量化），導致訊號品質’降等、，所碼（去量化）和編之計算複雜高，㈣所讀顧差。第二，措施若原始格式和目標格式利用解碼器摘取’再用於編ίϊ:;;: 些側資訊，、彳了仵更好的轉碼結果。 6 200816167 弟4a圖表示此措施之例，可用於例如如〇〇1|^ AC-3轉碼至 BSAC (Bit Sliced Arithmetic Coding)格式（見 Kyoung H〇

Bang, Young Cheol Park 和 Dae Hee Youn (2006)，〈為活動多媒體應用之聲頻轉碼演算〉，刊於“pr〇c·奸ICassP”，第3 卷）。在此特例中，AC-3位元分配可再用來導衍和控制 BSAC編碼器内之新位元分配4〇3。除了由原始位元流再用侧貧訊SI外，時間/頻率合成和分析程序在時間上同步化。在此情況下，第4a圖的進步概念較前述轉碼計劃，減少計算雜性，會導致目標訊號之更佳品質。 ^ (且只有如果）原始和目標位元流的寫解碼器格 ί 間/頻率分析界域一致’即分析和合成段完全互 4-:二—t兀流從指定轉碼至較低資料率），轉碼才可名略第4b圖所示·時間/頻率分析和合成程序可此來數—,ΐ界域PD内直接發生資料率修飾，例如把某 7例ί位另外有益的是，從原始位元流再用侧資【發明内容】編碼=;==^同時間/頻率分析界域的不同此種方法和裝置，尤指供具有其中目域線性映射至目標參數界域，用處理方級訊間之轉碼複雜性低，並防止習分析已時間/嫩按照本發明^惟往往有時間變式。間界域對立）棘踩I二1荦頻訊號從第一或輸入界域（與時 #' 一或輸出參數界域之方法，包括步驟 7 200816167 把輸人參數界域之參數映制輸出參數 ▲，少：輸出參數線性因二或以上之輸人參數’其參數為二或以上輸入參數之線性組合）。疋（即輸出來自二或以上不同的輸入幅。之輸入參數在一具體例中，映射或轉換描述該輪夂士輪入參數間之關係’有時間變式：盖二^二或以 j輸出格式.時間不變式關十:=:和/ 時間/鮮合成之_ 界域的時心;：中’時間變式映射周期性重複'即：重複在一具體例中，映射包括副步驟為一射部份輸人向量，再為單-輸出幅相加或重最原始幅映產生5;具於=當於整數輪出“整數輸入幅， :¾中從===汐 ==運幅產生輸出。因此，由此謝複可得數杳式映射是使用預先計算的轉換係換Ϊ”列。惟在另—具體例中，線性轉、*二的77析表達’例如功能，應用於輸入參數。號而首，從—參數界域不通過連續時間界域訊 ^連ίίϊίί ί另Γ參數界域所需之計算複雜性，比經、】π 4界域汛號的習知直率轉碼程序，大為降低。時間ί=ίί轉;間之交換’可適應又-優點是，經由單-線性轉換之直接轉碼，比經由時 8 200816167 間界域訊號的習知轉碼計劃，在原始界域的特殊參數磁帶箱之影塑值;里。由於參數磁帶箱，則量化和不準確數^ ^目”域的小範圍定點f所通用）之廣佈效應，^運^^如習知轉碼的固明和2财益之具體例申請專植_屬項、以下說【實施方式】，參照附圖說明本發明具體例如下。 mTti^ 情况Ϊ得矩陣丁了相同，蓋因轉換步驟為線ί、Γ果相加，二者 510 ^ rs也二 A( )，A(m υ···。乘以線性轉換矩陳τ 節$ 原ΐ格式之合成），轉換成相對應之時 =TDS。在此例中，時間節有重搭才間界域二’石?f碼之連_間界域™C聲頻訊號504。W 3 程按照嘯各式B發生時間/頻 $ 中==號5G4分解5G5成—系列之（通常）重=與格式A採用之重搭不同， ^二^ 換ί目標參數界域PDb (〜代表按照格式Β 由於目標格式Β可應用與原始格式a不同的 200816167 移，故使用另一幅指數n。具有=第二在二全碼部方時

Tab，可準確說明任何時間/頻率人成弋二矩陣TsA和如_ «解碼器的混雜濾波器排排。= =====值= 達。務五入，即可配成充分正確的表成和時間/頻率合頻 3^頻率分析Tab之順序，可改為單—線=50 ^ 益的疋不必發生連續時間界域訊號5G4。、Ττ，故有 2明線性轉換Ττ之若干性質如下。如頻譜磁帶箱），對 =乡數界域的各錄元件（例訓練矩陣之可能性^^=;目標幅之線性貢獻，即有代表。轉Ττ可修时析絲料查表加以若干接續性時間節以習知轉 =幅有影響。反之，原始界序，假設為/頻率分析和合成程視原始界域的時間節對目二= 200816167 ί ί 修改表達a和β的幅間之計時差異，-r奋和1 標格式的時間/頻率分析不同二矩 til本之幅前進）間轉碼例，見第6圖所示。時ϋ 式，換包括在此情況下要採用的十六

工;掉視窗更換計劃)。第6圖表示AAC D 。由於不同的幅前進，幅間的時間位移i時門九個道幅和十六個师3幅期間後 =二使用十六個預定轉換矩二:= 超二 ί mp3幅^各超幅重複此轉換^列因此轉換（在超幅内）是時間變式。 α 肉而超幅内周期序列之轉換數，相當於目外々 ==不，mp3轉瑪至心時間變式轉以二，情況下’幅間關係與於轉換之線性，亦mt.^6m+4而定。然而，由格式幅，並將必要之姓果6曰f，式幅分別轉換至一目標。對於本實同。 ]重搭而疋，亚與一幅之時間期限不右涉及時間/頻率f 之分開良好，而且若在相力‘私序，顯示相鄰參數磁帶箱陣TT典型上粗疏，fCf譜解像度相似’則轉換矩轉換中不料慮。社部鱗於零，在可予f計>&++瞀i M I* 車Ττ利用線性轉換加以轉;g馬，預十在#_上，較習知轉碼方法經由連續時間界以訊 200816167 號不複雜。轉換矩陣之例見第9圖。灰級表示從mp3混雜濾波器排轉碼至全帶MDCT (二者均有長視窗）用的轉換矩陣係數，數幅度。舉例為三個接續mp3幅影響目標MDCT幅。暗區内係數指比売區為高。在此例中，轉換係數的幅度，在-60 dB以下。對轉碼，此等係數可以省略，故以很低的計算費心即可實施矩陣乘法。第10圖表示第9圖中央區之細部，以三次元條桿曲線圖代替灰級碼。由圖示41*41 = 1681係數，大部份在_60犯以下/戴在-80 dB)，即可以忽略。理想情況是，只有沿線性區之^少係數，有糊位級值。在此分析衍生例巾，以18個磁條箱的周期性距離橫越線性區之另外區，亦具有不可忽略之，’由mp3混雜渡波器排内的假化失真效應所造成：^量的 =組，健存在，即使在混雜mp3驗器、制已應用假化权正。在全帶MDCT情況下，不存在此假化（咖麵）。、产頻率選擇性料要件考慮進*，可進—步降。例如’ # mp3核心位元流具有低位元率，則二般頻磁帶箱加以編碼，在解㈣内可設定於零（即被在此情況下’轉碼轉換Ττ的高頻部份可以省略。一二二·^何頻率範圍均可容易遮蔽。遮蔽亦可為時間變式賴性’例如根據侧資訊内所含之位元分配。此為有^性之賴，較_連猶間界域訊號之習知轉碼率磁播轉^矩陣Ττ說明以綜合方式，對目標幅的各頻 ί從= μ例如某些目標頻率磁帶箱不需要）。故選 =從王德換的切片或共用，為計算上 12 200816167 可為時間二=生轉，陣Ττ之利用轉碼準確性之頻率依賴2屋格式轉碼成另-時，位元分配為函數加以妓標聲頻格式的之目標準確性磁帶箱（―項可低轉碼準確性所需 =轉 ί:^;ΗΗ=== 程序的數财準之4 ’關咖/_合成和分析，、P3編碼器’包含多二皮了郎和MDCT 702、快速傅立葉轉換（FFT) 7〇4、心理夂又析705、位元分配和量化器、7〇3、侧資訊編碼$ 7〇6，和J二用和mp3核〜寫解碼器相同之適應性視窗更換計劃。全數MDCT的頻譜解像度，亦按照、卿3濾波器排之時= 式頻譜解像度加以控制。為了二並式時間/頻率分析程序的 200816167 t其是若_轉碼轉換涉及—個和相對應分“ 數^CT。此構想可媲美MPEG SLS (可標度為盎内：之原則，惟基於從全帶峨丁磁、‘二所需卢▲之充八^頻率磁帶箱’不會導致低率無損寫碼 =經去*化(逆向量則後，-般會顧及至2 庫用器排701在長、短分析/合成視窗之間，式（在第7 圖如二或以上之相Ϊ轉過渡相_；應用不同的轉換。例化。丈母超&之不叫間不變式轉換次數，可在連流内變和/4"^份利2率，性’例如省略轉碼轉換Ττ高頻 !；f-805' 710,803在編碼器和解碼哭一逆化里化為與無損編碼程序713 。…損解碼程序802，碼器706互補補’而侧貧訊解 804與側資訊編轉i為？- 即從-壓縮格式的聲頻内容勹力般而吕，轉碼可以原始格式的任一幅開始。 200816167 第11圖表示所擬系統之 ▲ 接轉碼。與第4圖所示習知轉二^用在荼數界域内之直例，是將解碼器DEC A 馬系、、先相較，本發明此具體的時間/頻率分析之心辭合成和編碼It ENC—B 碼Ττ為目標參數界域PDb。此界域pda直接轉低，因此，效率較高，而蘇A心知之一么點是，計算複雜性少。此舉尤其能以常用於轉失真較固定點實施。所以，本發日胁：運r有限準確性，保持目標聲頻格式，而結果之品快速轉碼為 musr, °^ 所揭示演算之用途，不限於一欠二颌似。用做其他聲頻相闕演算=全轉碼、不同聲頻格式間無損寫【圖式簡單說明】 Ϊ1圖為通性知覺聲頻編碼器之結構；弟2圖為通性知覺聲頻解椹·’ ρ圖表示習辦直轉碼；m f 4a圖為習知再用位元分配之轉碼；，4b圖為習知一致聲頻格式間之轉碼；弟5圖為不同參數界域間之直 ' 碼第6圖為具有柳禱進的砰時間/頻率界域間之轉第7圖為混雜mp3加無損延伸聲頻混雜一無損延伸聲頻弟9圖表示轉換矩陣例之係數；鮮馬裔，第1〇圖表示轉換矩陣例之細部；第11圖為參數界域内不同聲頻格式間之轉瑪器結構。 15 200816167

【主要元件符號說明】 101 心理聽覺分析 102 時間/頻率分析 103 位元分配 104 量化和編碼 105 烟寫碼 106 位元流運算 107 聲頻訊號 110 參數 201 位元流運算 202 滴寫碼 203 位元分配 204 解碼和去量化 205 時間/頻率合成 212 參數 213 參數 214 時間界域訊號 403 新位元分配 501 輸入參數向量 502 輸出向量 503 重搭相加程序 504 時間界域訊號 505 分節 510 處理 701 多相濾波器排和十選一 702 分節和MDCT 703 位元分配和量化器 704 快速傅立葉轉換 705 心理聲學分析 706 侧貧訊編碼器 707 多工器 708 延遲 709 分節和整數MDCT 710 逆向量化器 711 轉碼和捨入 713 無損編碼程序 801 解多工器 802 無損解碼程序 803 逆向量化器 804 解碼器側資訊 805 轉碼和捨入 807 逆向整數MDCT TD 時間界域聲頻訊號 DEC—A 解碼器 ENCB 編碼器 PDa 第一參數界域 PDb 第二參數界域 si,sr 侧資訊 Tt9Tsa 線性轉換矩陣 16

Claims

200816167 、申請專利範圍： 1·一種加幅聲頻訊號從第一參數界域（PDA)轉碼一參數界域（PDB)之方法，包括步驟為： .、、、弟二 —把第一參數界域（PDa )之二或以上袁數， (Ττ)為第二參數界域（pdb)之至少一"參數’，轉換士時間界域聲頻訊號，其中第一參數界域I二或不產參數來自第一參數界域内聲頻訊號之不同幅亡時間/頻率轉換而得者。糸利用 2·如申請專利範圍第1項之方法，其中該二 ▲ 數線性轉換為至少_輸出參數之該步驟，係時間變认參么3」如申請專利範圍第2項之方法，其中時^始換’係周期性重複複數時間不變式線性轉換者。一工、次性轉 4·如申請專利範圍第2或3項之方法，、盆轉^數所传，该線性轉換係非平凡式者。的線 5·如申請專利範圍第3戎4頊方 6甘如中請專利範圍第法，域係基於時間/頻率分、，、中弟和弟二參數界界域（叫時間性分析視窗，而第二參數窗’又其中該線性轉換H二2 2視窗和短分析視不同者。、d)對長分析視窗和短分析視窗有所 7·如申請專利範步驟包括步驟為：項之方法，其中該線性轉換（Ττ) 伤輸入向量從不同輸入幅映射至部份輸出向量； 8·如申向量重疊，以發生輸出幅者。月專利蝴第丨項之綠，其中第-麵界域的二 17 200816167 I。乂上减之線性轉換步驟’包括使用持有轉換係數之查表或以上參數之項其中第—參數界域的二參數界域==第_參數界域（〜轉碼至第二 ==上參以第：而得i耳頻訊號之不同幅，並利用時間/頻率^ 參數、項之裝置’其中該二或以上輸入上之4么或11項之錢’其中包二以 13.如申|專和檢後轉換係數者。評估預界定之分· 項之裝置，又包括評估機構，以參數界域圍之一項的方法或裝置，其中第- (PDB)聲頻幅^ 幅（501)具有與第二參數界域搭者。爲刊之⑽進’其中幅前進描述幅之時間性重 -42以術产严置，其中該第間/頻率合成之參數，x 7二係f照時間/頻率分析和時頻率分柄釦二數而弟一和弟二參數界域係不同之時間/ 解合成者。性轉換描述ί昭^之;項的方法或裝置，其中該線 (PDB)之時間/頻率分析（=者Y及备知第-翏數界域 IS 200816167 17.如前述申請專利範圍之一項的方法或裝置，其中時間 /頻率合成（TSA)和/或分析（TAb)相當於線性段轉換或線性向前饋送之濾波器排者。 18·如前述申請專利範圍之一項的方法或裝置，其中第一參數界域的各幅（501)參數影響第二參數界域一幅（502)以上，並代表聲頻訊號之波型者。 19. 如前述申請專利範圍之一項的方法或裝置，其中該轉換（Ττ)包括省略聲頻訊號之特定頻率部份者。 20. 如前述申請專利範圍之方法或裝置，其中該項省略聲頻訊號之特定頻率部份，係時間變式，且視第一參數界域内聲頻訊號所用位元分配而定者。