[go: up one dir, main page]

TW200816167A - Method and device for transcoding audio signals - Google Patents

Method and device for transcoding audio signals Download PDF

Info

Publication number
TW200816167A
TW200816167A TW096131326A TW96131326A TW200816167A TW 200816167 A TW200816167 A TW 200816167A TW 096131326 A TW096131326 A TW 096131326A TW 96131326 A TW96131326 A TW 96131326A TW 200816167 A TW200816167 A TW 200816167A
Authority
TW
Taiwan
Prior art keywords
parameter
time
boundary
frequency
audio
Prior art date
Application number
TW096131326A
Other languages
English (en)
Other versions
TWI423251B (zh
Inventor
Peter Jax
Sven Kordon
Original Assignee
Thomson Licensing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing filed Critical Thomson Licensing
Publication of TW200816167A publication Critical patent/TW200816167A/zh
Application granted granted Critical
Publication of TWI423251B publication Critical patent/TWI423251B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

200816167 九、發明說明: 【發明所屬之技術領域】 勒本於聲頻峨之轉碼村和裝置。與聲頻壓縮 ί古尤其是不同知覺的聲頻寫碼格相之轉碼領域有關。 用本發明基本概念’於其他聲頻處理用途上。 ” L聲頻轉碼」—辭常指按照特定聲頻寫碼格式代表聲頻 1的位4,與按照不_聲頻寫碼格式所_的另一』 兀机之偏差。在此意義上,「轉碼」指從mpeg層冚 ,應性位福獲制如MPEG AAC職錄元触完全 斤。 文獻上已知一般性知覺聲頻編碼(τ.以如沉和A Pa: (2000):〈數位聲頻之知覺寫碼〉 此IEEE :第狀卷〕之基本原理,如第!圖所示。吨 於今聲親號的壓縮方法和格式,—般使用時間 Γ1Λ斤i〇i,即滤波器排或轉換,以代表聲頻訊號107之參數 Μ此等參數要經量化和編碼104、熵寫碼105和位元流 异106 ,此等步驟均利用輸入聲頻訊號的心理聽覺分析1〇1 加以控制:第2 ®表示相對應-般性知覺聲頻解碼n,具有 位兀流運算20卜熵解碼202、位元分配203、解碼和去^ 夺間/頻率合成,由參數212、213發生時間界域 弟1和2圖说明知覺聲頻寫解碼器之例。雖然特殊實施 可有某種程度的不同,但絲採料間/頻率分析、及直 向之時間/頻率合成。 〃 驟則於時間/頻率分析和合成’而中間編碼和解碼步 對時間/頻率分析102,在今曰之聲頻寫解石馬器 多不同的演算。例如MPEG聲頻寫解碼器標準,包含聰^ 200816167 1層I和Π寫解碼器,使用32帶擬似(正交 ,)濾波獅,以及则G_i輕(mp3),則採用混雜^波 态排,即32帶擬似qmf濾波器排後接(修^ === 之,。應CT濾、波(從缺值18磁帶箱,為 匕/又~到ό磁▼相),分別導致576或192磁 解。=EG AAC寫解碼器及其衍生產品使用全帶 ^ ’有1G24磁帶箱的從缺值分解(過渡 曰 幅耵置(100%重搭)*frame_size。 疋所明 μ、ΐί’ΡΒΓΒΐ/頻率分析1G2的輸出和時間/頻率人成 哭夕ί輸界域(其中編碼器的輸出訊號116即為; =聲㈣碼格式為時間/鮮分析究_ 示對聲頻轉碼的措施,為目前典型丄;:’=、:弟j圖表 2圖内業已敘述的可行赛畢握έ、。— ’ 口广、汐及第1和 :元流,解碼dec-a成Wi間==1二:之輸入 即按照目標格式產生立 =唯一界面,是時間界域聲頻訊_,即^ 雖然此項措施使用簡單,但 段MC—A、ENC—β不知彼此,5歹=。弟一,因為二 步化:一般而言,會有一条 f/頒率为析程序會去同 碼(量化),導致訊號品質’降等、,所碼(去量化)和編 之計算複雜高,㈣所讀顧差。第二,措施 若原始格式和目標格式 利用解碼器摘取’再用於編ίϊ:;;: 些側資訊, 、彳了仵更好的轉碼結果。 6 200816167 弟4a圖表示此措施之例,可用於例如如〇〇1|^ AC-3轉碼至 BSAC (Bit Sliced Arithmetic Coding)格式(見 Kyoung H〇
Bang, Young Cheol Park 和 Dae Hee Youn (2006),〈為活動多 媒體應用之聲頻轉碼演算〉,刊於“pr〇c·奸ICassP”,第3 卷)。在此特例中,AC-3位元分配可再用來導衍和控制 BSAC編碼器内之新位元分配4〇3。除了由原始位元流再用侧 貧訊SI外,時間/頻率合成和分析程序在時間上同步化。在 此情況下,第4a圖的進步概念較前述轉碼計劃,減少計算 雜性,會導致目標訊號之更佳品質。 ^ (且只有如果)原始和目標位元流的寫解碼器格 ί 間/頻率分析界域一致’即分析和合成段完全互 4-:二—t兀流從指定轉碼至較低資料率),轉碼才可 名略第4b圖所示·時間/頻率分析和合成程序可 此來數—,ΐ界域PD内直接發生資料率修飾,例如把某 7例ί位另外有益的是,從原始位元流再用侧資 【發明内容】 編碼=;==^同時間/頻率分析界域的 不同此種方法和裝置,尤指供具有 其中目域線性映射至目標參數界域, 用處理方級訊間之轉碼複雜性低,並防止習 分析已時間/嫩 按照本發明^惟往往有時間變式。 間界域對立)棘踩I二1荦頻訊號從第一或輸入界域(與時 #' 一或輸出參數界域之方法,包括步驟 7 200816167 把輸人參數界域之參數映制輸出參數 ▲,少:輸出參數線性因二或以上之輸人參數’其 參數為二或以上輸入參數之線性組合)。 疋(即輸出 來自二或以上不同的輸入幅。 之輸入參數 在一具體例中,映射或轉換描述該輪夂 士輪入參數間之關係’有時間變式 :盖二^二或以 j輸出格式.時間不變式關十:=:和/ 時間/鮮合成之_ 界域的 時心;:中’時間變式映射周期性重複'即:重複 在一具體例中,映射包括副步驟為 一 射部份輸人向量,再為單-輸出幅相加或重最原始幅映 產生5;具於=當於整數輪出“整數輸入幅, :¾中從===汐 ==運幅產生輸出。因此,由此謝複可得 數杳式映射是使用預先計算的轉換係 換Ϊ”列。惟在另—具體例中,線性轉 、*二的77析表達’例如功能,應用於輸入參數。 號而首,從—參數界域不通過連續時間界域訊 ^連ίίϊίί ί另Γ參數界域所需之計算複雜性,比經 、】π 4界域汛號的習知直率轉碼程序,大為降低。 時間ί=ίί轉;間之交換’可適應 又-優點是,經由單-線性轉換之直接轉碼,比經由時 8 200816167 間界域訊號的習知轉碼計劃,在 原始界域的特殊參數磁帶箱之影塑值;里。由於 參數磁帶箱,則量化和不準確數^ ^目”域的小範圍 定點f所通用)之廣佈效應,^運^^如習知轉碼的固 明和2财益之具體例申請專植_屬項、以下說 【實施方式】 ,參照附圖說明本發明具體例如下。 mTti^ 情况Ϊ得矩陣丁了相同,蓋因轉換步驟為線ί、Γ果相加,二者 510 ^ rs也二 A( ),A(m υ···。乘以線性轉換矩陳τ 節$ 原ΐ格式之合成),轉換成相對應之時 =TDS。在此例中,時間節有重搭 才間界域 二’石?f碼之連_間界域™C聲頻訊號504。W 3 程按照嘯各式B發生時間/頻 $ 中==號5G4分解5G5成—系列之(通常) 重=與格式A採用之重搭不同, ^二^ 換ί目標參數界域PDb (〜代表按照格式Β 由於目標格式Β可應用與原始格式a不同的 200816167 移,故使用另一幅指數n。 具有=第二在二全碼部方時
Tab,可準確說明任何時間/頻率人成弋二矩陣TsA和 如_ «解碼器的混雜濾波器排排。= =====值= 達。 務五入,即可配成充分正確的表 成和時間/頻率合 頻 3^頻率分析Tab之順序,可改為單—線=50 ^ 益的疋不必發生連續時間界域訊號5G4。 、Ττ,故有 2明線性轉換Ττ之若干性質如下。 如頻譜磁帶箱),對 =乡數界域的各錄元件(例 訓練矩陣之可能性^^=;目標幅之線性貢獻,即有 代表。 轉Ττ可修时析絲料查表加以 若干接續性時間節以習知轉 =幅有影響。反之,原始界 序,假設為/頻率分析和合成程 視原始界域的時間節對目二= 200816167 ί ί 修改表達a和β的幅間之計時差異,-r奋 和1 標格式的時間/頻率分析不同二矩 til本之幅前進)間轉碼例,見第6圖所示。時ϋ 式,換包括在此情況下要採用的十六
工;掉視窗更換計劃)。第6圖表示AAC D 。由於不同的幅前進,幅間的時間位移i時門 九個道幅和十六個师3幅期間後 =二使用十六個預定轉換矩二:= 超二 ί mp3幅^各超幅重複此轉換^列因 此轉換(在超幅内)是時間變式。 α 肉而超幅内周期序列之轉換數,相當於目外々 ==不,mp3轉瑪至心時間變式轉以 二,情況下’幅間關係與 於轉換之線性,亦mt.^6m+4而定。然而,由 格式幅,並將必要之姓果6曰f,式幅分別轉換至一目標 。對於本實 同。 ]重搭而疋,亚與一幅之時間期限不 右涉及時間/頻率f 之分開良好,而且若在相力‘私序,顯示相鄰參數磁帶箱 陣TT典型上粗疏,fCf譜解像度相似’則轉換矩 轉換中不料慮。社部鱗於零,在 可予f計>&++瞀i M I* 車Ττ利用線性轉換加以轉;g馬, 預十在#_上,較習知轉碼方法經由連續時間界以訊 200816167 號不複雜。 轉換矩陣之例見第9圖。灰級表示從mp3混雜濾波器排 轉碼至全帶MDCT (二者均有長視窗)用的轉換矩陣係 數,數幅度。舉例為三個接續mp3幅影響目標MDCT幅。 暗區内係數指比売區為高。在此例中,轉換係數的幅 度,在-60 dB以下。對轉碼,此等係數可以省略,故以很低 的計算費心即可實施矩陣乘法。 第10圖表示第9圖中央區之細部,以三次元條桿曲線圖 代替灰級碼。由圖示41*41 = 1681係數,大部份在_60犯以 下/戴在-80 dB),即可以忽略。理想情況是,只有沿線性區 之^少係數,有糊位級值。在此分析衍生例巾,以18個磁 條箱的周期性距離橫越線性區之另外區,亦具有不可忽略之 ,’由mp3混雜渡波器排内的假化失真效應所造成:^量的 =組,健存在,即使在混雜mp3驗器、制已應用假化 权正。在全帶MDCT情況下,不存在此假化(咖麵)。 、产頻率選擇性料要件考慮進*,可進—步降 。例如’ # mp3核心位元流具有低位元率,則二般 頻磁帶箱加以編碼,在解㈣内可設定於零(即被 在此情況下’轉碼轉換Ττ的高頻部份可以省略。一 二二·^何頻率範圍均可容易遮蔽。遮蔽亦可為時間變式 賴性’例如根據侧資訊内所含之位元分配。此 為有^性之賴,較_連猶間界域訊號之習知轉碼 率磁播轉^矩陣Ττ說明以綜合方式,對目標幅的各頻 ί從= μ例如某些目標頻率磁帶箱不需要)。故選 =從王德換的切片或共用,為計算上 12 200816167 可為時間二=生轉,陣Ττ之利用 轉碼準確性之頻率依賴2屋格式轉碼成另-時, 位元分配為函數加以妓 標聲頻格式的 之目標準確性磁帶箱(―項可低轉碼準確性所需 =轉 ί:^;ΗΗ=== 程序的數财準之4 ’關咖/_合成和分析 ,、P3編碼器’包含多二皮了 郎和MDCT 702、快速傅立葉轉換(FFT) 7〇4、心理夂又 析705、位元分配和量化器、7〇3、侧資訊編碼$ 7〇6,和J二 用和mp3核〜寫解碼器相同之適應性視窗更換計劃。全 數MDCT的頻譜解像度,亦按照、卿3濾波器排之時= 式頻譜解像度加以控制。為了二並式時間/頻率分析程序的 200816167 t其是若_轉碼轉換涉及—個 和相對應分“ 數^CT。此構想可媲美MPEG SLS (可標度為盎 内:之原則,惟基於從全帶峨丁磁、‘二 所需卢▲之充八^頻率磁帶箱’不會導致低率無損寫碼 =經去*化(逆向量則後,-般會顧及至2 庫用器排701在長、短分析/合成視窗之間, 式(在第7 圖 如二或以上之相Ϊ轉過渡相_;應用不同的轉換。例 化。丈母超&之不叫間不變式轉換次數,可在連流内變 和/4"^份利2率,性’例如省略轉碼轉換Ττ高頻 !;f-805' 710,803在編碼器和解碼哭 一 逆化里化為 與無損編碼程序713 。…損解碼程序802, 碼器706互補 補’而侧貧訊解 804與側資訊編 轉i為?- 即從-壓縮格式的聲頻内容 勹力 般而吕,轉碼可以原始格式的任一幅開始。 200816167 第11圖表示所擬系統之 ▲ 接轉碼。與第4圖所示習知轉二^用在荼數界域内之直 例,是將解碼器DEC A 馬系、、先相較,本發明此具體 的時間/頻率分析之心辭合成和編碼It ENC—B 碼Ττ為目標參數界域PDb。此界域pda直接轉 低,因此,效率較高,而蘇A心知之一么點是,計算複雜性 少。此舉尤其能以常用於轉失真較 固定點實施。所以,本發日胁:運r有限準確性,保持 目標聲頻格式,而結果之品快速轉碼為 musr, °^ 所揭示演算之用途,不限於一欠二颌似。 用做其他聲頻相闕演算=全轉 碼、不同聲頻格式間無損寫 【圖式簡單說明】 Ϊ1圖為通性知覺聲頻編碼器之結構; 弟2圖為通性知覺聲頻解 椹·’ ρ圖表示習辦直轉碼;m f 4a圖為習知再用位元分配之轉碼; ,4b圖為習知一致聲頻格式間之轉碼; 弟5圖為不同參數界域間之直 ' 碼 第6圖為具有柳禱進的砰時間/頻率界域間之轉 第7圖為混雜mp3加無損延伸聲頻 混雜一無損延伸聲頻 弟9圖表示轉換矩陣例之係數; 鮮馬裔, 第1〇圖表示轉換矩陣例之細部; 第11圖為參數界域内不同聲頻格式間之轉瑪器結構。 15 200816167
【主要元件符號說明】 101 心理聽覺分析 102 時間/頻率分析 103 位元分配 104 量化和編碼 105 烟寫碼 106 位元流運算 107 聲頻訊號 110 參數 201 位元流運算 202 滴寫碼 203 位元分配 204 解碼和去量化 205 時間/頻率合成 212 參數 213 參數 214 時間界域訊號 403 新位元分配 501 輸入參數向量 502 輸出向量 503 重搭相加程序 504 時間界域訊號 505 分節 510 處理 701 多相濾波器排和十選一 702 分節和MDCT 703 位元分配和量化器 704 快速傅立葉轉換 705 心理聲學分析 706 侧貧訊編碼器 707 多工器 708 延遲 709 分節和整數MDCT 710 逆向量化器 711 轉碼和捨入 713 無損編碼程序 801 解多工器 802 無損解碼程序 803 逆向量化器 804 解碼器側資訊 805 轉碼和捨入 807 逆向整數MDCT TD 時間界域聲頻訊號 DEC—A 解碼器 ENCB 編碼器 PDa 第一參數界域 PDb 第二參數界域 si,sr 侧資訊 Tt9Tsa 線性轉換矩陣 16

Claims (1)

  1. 200816167 、申請專利範圍: 1·一種加幅聲頻訊號從第一參數界域(PDA)轉碼 一 參數界域(PDB)之方法,包括步驟為: .、、、弟二 —把第一參數界域(PDa )之二或以上袁數, (Ττ)為第二參數界域(pdb)之至少一"參數’,轉換 士時間界域聲頻訊號,其中第一參數界域I二或不產 參數來自第一參數界域内聲頻訊號之不同幅亡 時間/頻率轉換而得者。 糸利用 2·如申請專利範圍第1項之方法,其中該二 ▲ 數線性轉換為至少_輸出參數之該步驟,係時間變 认參 么3」如申請專利範圍第2項之方法,其中時^始 換’係周期性重複複數時間不變式線性轉換者。一工、次性轉 4·如申請專利範圍第2或3項之方法,、盆 轉^數所传,该線性轉換係非平凡式者。 的線 5·如申請專利範圍第3戎4頊方 6甘如中請專利範圍第法, 域係基於時間/頻率分 、 ,、中弟和弟二參數界 界域(叫時間性分析視窗,而第二參數 窗’又其中該線性轉換H二2 2視窗和短分析視 不同者。 、d)對長分析視窗和短分析視窗有所 7·如申請專利範 步驟包括步驟為: 項之方法,其中該線性轉換(Ττ) 伤輸入向量從不同輸入幅映射至部份輸出向量; 8·如申向量重疊,以發生輸出幅者。 月專利蝴第丨項之綠,其中第-麵界域的二 17 200816167 I。乂上减之線性轉換步驟’包括使用持有轉換係數之查表 或以上參數之項其中第—參數界域的二 參數界域==第_參數界域(〜轉碼至第二 ==上參以第: 而得i耳頻訊號之不同幅,並利用時間/頻率^ 參數、項之裝置’其中該二或以上輸入 上之4么或11項之錢’其中包二以 13.如申|專和檢後轉換係數者。 評估預界定之分· 項之裝置,又包括評估機構,以 參數界域圍之一項的方法或裝置,其中第- (PDB)聲頻幅^ 幅(501)具有與第二參數界域 搭者。爲刊之⑽進’其中幅前進描述幅之時間性重 -42以術产严置,其中該第 間/頻率合成之參數,x 7二係f照時間/頻率分析和時 頻率分柄釦二數而弟一和弟二參數界域係不同之時間/ 解合成者。 性轉換描述ί昭^之;項的方法或裝置,其中該線 (PDB)之時間/頻率分析(=者Y及备知第-翏數界域 IS 200816167 17.如前述申請專利範圍之一項的方法或裝置,其中時間 /頻率合成(TSA)和/或分析(TAb)相當於線性段轉換或線 性向前饋送之濾波器排者。 18·如前述申請專利範圍之一項的方法或裝置,其中第一 參數界域的各幅(501)參數影響第二參數界域一幅(502)以 上,並代表聲頻訊號之波型者。 19. 如前述申請專利範圍之一項的方法或裝置,其中該轉 換(Ττ)包括省略聲頻訊號之特定頻率部份者。 20. 如前述申請專利範圍之方法或裝置,其中該項省略聲 頻訊號之特定頻率部份,係時間變式,且視第一參數界域内聲 頻訊號所用位元分配而定者。
TW096131326A 2006-09-20 2007-08-24 加幅聲頻訊號從第一參數界域轉碼至第二參數界域之方法和裝置 TWI423251B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP06120969A EP1903559A1 (en) 2006-09-20 2006-09-20 Method and device for transcoding audio signals

Publications (2)

Publication Number Publication Date
TW200816167A true TW200816167A (en) 2008-04-01
TWI423251B TWI423251B (zh) 2014-01-11

Family

ID=37605771

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096131326A TWI423251B (zh) 2006-09-20 2007-08-24 加幅聲頻訊號從第一參數界域轉碼至第二參數界域之方法和裝置

Country Status (10)

Country Link
US (1) US9093065B2 (zh)
EP (2) EP1903559A1 (zh)
JP (1) JP5324450B2 (zh)
KR (1) KR101341317B1 (zh)
CN (1) CN101563726A (zh)
BR (1) BRPI0718465A2 (zh)
CA (1) CA2662910C (zh)
TW (1) TWI423251B (zh)
WO (1) WO2008034723A1 (zh)
ZA (1) ZA200901367B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8793738B2 (en) 1994-05-04 2014-07-29 Starsight Telecast Incorporated Television system with downloadable features
CH705207B1 (de) 2002-06-19 2012-11-30 Prospective Concepts Ag Pneumatisches Bauelement mit Knotenelementen.
WO2007071100A1 (de) 2005-12-23 2007-06-28 Prospective Concepts Ag Pneumatisches bauelement, und daraus erzeugtes dach
CH704442B1 (de) 2005-12-23 2012-08-15 Prospective Concepts Ag Pneumatisches Bauelement.
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
EP2099027A1 (en) 2008-03-05 2009-09-09 Deutsche Thomson OHG Method and apparatus for transforming between different filter bank domains
ES2671711T3 (es) * 2008-09-18 2018-06-08 Electronics And Telecommunications Research Institute Aparato de codificación y aparato de decodificación para transformar entre codificador basado en transformada de coseno discreta modificada y hetero codificador
CN101989429B (zh) 2009-07-31 2012-02-01 华为技术有限公司 转码方法、装置、设备以及系统
EP2306456A1 (en) * 2009-09-04 2011-04-06 Thomson Licensing Method for decoding an audio signal that has a base layer and an enhancement layer
US8509329B2 (en) * 2009-11-06 2013-08-13 Samsung Electronics Co., Ltd. Data receiving apparatus for receiving data frame using constellation mapping scheme and data transmission apparatus for transmitting the date frame
CN104781878B (zh) * 2012-11-07 2018-03-02 杜比国际公司 音频编码器和方法、音频转码器和方法、以及转换方法
JP5855317B2 (ja) * 2013-04-18 2016-02-09 三菱電機株式会社 分波装置、合波装置および中継装置
EP3044790B1 (en) 2013-09-12 2018-10-03 Dolby International AB Time-alignment of qmf based processing data
TWI557724B (zh) 2013-09-27 2016-11-11 杜比實驗室特許公司 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器
KR102632136B1 (ko) 2017-04-28 2024-01-31 디티에스, 인코포레이티드 오디오 코더 윈도우 사이즈 및 시간-주파수 변환
WO2022179406A1 (zh) * 2021-02-26 2022-09-01 腾讯科技(深圳)有限公司 音频转码方法、装置、音频转码器、设备以及存储介质
CN113689864B (zh) * 2021-10-27 2022-01-18 北京百瑞互联技术有限公司 一种音频数据处理方法、装置及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
DE60039662D1 (de) 1999-03-25 2008-09-11 Sagem Comm Spracherkenungsgerät zur erkennung eines sprachsignals in einem eingangssignal
CN100527225C (zh) * 2002-01-08 2009-08-12 迪里辛姆网络控股有限公司 基于celp的语音代码之间的代码转换方案
JP4263412B2 (ja) 2002-01-29 2009-05-13 富士通株式会社 音声符号変換方法
EP1483758A4 (en) * 2002-03-12 2007-04-11 Dilithium Networks Pty Ltd METHOD OF CALCULATING THE DELAY OF ADAPTIVE CODES BOOK PASTE IN AUDIO TRANSCODERS
DE10217297A1 (de) 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
US7363230B2 (en) * 2002-08-01 2008-04-22 Yamaha Corporation Audio data processing apparatus and audio data distributing apparatus
TW573293B (en) * 2002-09-13 2004-01-21 Univ Nat Central Nonlinear operation method suitable for audio encoding/decoding and an applied hardware thereof
KR20050122240A (ko) * 2003-04-08 2005-12-28 닛본 덴끼 가부시끼가이샤 부호 변환 방법 및 장치
KR20060132697A (ko) * 2004-02-16 2006-12-21 코닌클리케 필립스 일렉트로닉스 엔.브이. 트랜스코더 및 트랜스코딩 방법
WO2006024977A1 (en) * 2004-08-31 2006-03-09 Koninklijke Philips Electronics N.V. Method and device for transcoding
TWI270236B (en) * 2005-08-12 2007-01-01 Advanced Connectek Inc Loop antenna with capacitive structure

Also Published As

Publication number Publication date
CN101563726A (zh) 2009-10-21
WO2008034723A1 (en) 2008-03-27
TWI423251B (zh) 2014-01-11
JP2010504544A (ja) 2010-02-12
KR20090055579A (ko) 2009-06-02
CA2662910C (en) 2015-12-15
EP2064700B1 (en) 2012-09-05
EP2064700A1 (en) 2009-06-03
EP1903559A1 (en) 2008-03-26
JP5324450B2 (ja) 2013-10-23
CA2662910A1 (en) 2008-03-27
ZA200901367B (en) 2010-05-26
BRPI0718465A2 (pt) 2013-12-03
KR101341317B1 (ko) 2013-12-12
US9093065B2 (en) 2015-07-28
US20090240507A1 (en) 2009-09-24

Similar Documents

Publication Publication Date Title
TW200816167A (en) Method and device for transcoding audio signals
US8634577B2 (en) Audio decoder
KR100954179B1 (ko) 근접-투명 또는 투명 멀티-채널 인코더/디코더 구성
Herre et al. Psychoacoustic models for perceptual audio coding—A tutorial review
EP2279562B1 (en) Factorization of overlapping transforms into two block transforms
US11074920B2 (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
TW200931397A (en) An encoder
CN100571043C (zh) 一种空间参数立体声编解码方法及其装置
TWI342515B (en) Methods, apparatus and machine accessible mediums for embedding watermarks
EP3040988B1 (en) Audio decoding based on an efficient representation of auto-regressive coefficients
TW200926148A (en) An encoder
CN102063905A (zh) 一种用于音频解码的盲噪声填充方法及其装置
EP2595147A1 (en) Audio data encoding method and device
Kim et al. Highly efficient audio coding with blind spectral recovery based on machine learning
Wu et al. High quality audio object coding framework based on non-negative matrix factorization
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
CN105096958A (zh) 音频编码方法及相关装置
Jia et al. A psychoacoustic-based multiple audio object coding approach via intra-object sparsity
CN108417219B (zh) 一种适应于流媒体的音频对象编解码方法
Kim et al. Towards an Ultra-Low-Delay Neural Audio Coding with Computational Efficiency
Chen et al. Fast time-frequency transform algorithms and their applications to real-time software implementation of AC-3 audio codec
Lin et al. Audio Bandwidth Extension Using Audio Super-Resolution
HK40088493A (zh) 依赖混合噪声信号的多声道信号产生器、音频编码器及相关方法
CN110534119A (zh) 一种基于人耳听觉频率尺度信号分解的音频编解码方法

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees