TW526470B - Scalable coding process, method of processing data carried by a multi-layer data channel, processing system for a standard data channel, processing system for a multi-layer data channel, and a machine readable medium - Google Patents
Scalable coding process, method of processing data carried by a multi-layer data channel, processing system for a standard data channel, processing system for a multi-layer data channel, and a machine readable medium Download PDFInfo
- Publication number
- TW526470B TW526470B TW089115054A TW89115054A TW526470B TW 526470 B TW526470 B TW 526470B TW 089115054 A TW089115054 A TW 089115054A TW 89115054 A TW89115054 A TW 89115054A TW 526470 B TW526470 B TW 526470B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- data
- sub
- level
- item
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims description 98
- 230000008569 process Effects 0.000 title claims description 53
- 238000001228 spectrum Methods 0.000 claims abstract description 73
- 230000005236 sound signal Effects 0.000 claims abstract description 52
- 230000004044 response Effects 0.000 claims abstract description 16
- 230000005540 biological transmission Effects 0.000 claims abstract description 7
- 238000013139 quantization Methods 0.000 claims description 58
- 238000011049 filling Methods 0.000 claims description 43
- 238000001514 detection method Methods 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 20
- 239000000463 material Substances 0.000 claims description 13
- 230000008447 perception Effects 0.000 claims description 10
- 230000000873 masking effect Effects 0.000 claims description 6
- 238000004445 quantitative analysis Methods 0.000 claims description 3
- 239000011257 shell material Substances 0.000 claims description 2
- 239000004575 stone Substances 0.000 claims description 2
- 206010011469 Crying Diseases 0.000 claims 1
- 241000282376 Panthera tigris Species 0.000 claims 1
- 239000010410 layer Substances 0.000 abstract description 12
- 239000012792 core layer Substances 0.000 abstract description 7
- 238000001914 filtration Methods 0.000 abstract description 3
- 230000003595 spectral effect Effects 0.000 abstract description 2
- 230000003416 augmentation Effects 0.000 abstract 3
- 230000000875 corresponding effect Effects 0.000 description 27
- 230000002079 cooperative effect Effects 0.000 description 23
- 230000009471 action Effects 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 238000006073 displacement reaction Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000009434 installation Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 1
- 241001247287 Pentalinon luteum Species 0.000 description 1
- 229910052778 Plutonium Inorganic materials 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- OYEHPCDNVJXUIW-UHFFFAOYSA-N plutonium atom Chemical compound [Pu] OYEHPCDNVJXUIW-UHFFFAOYSA-N 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000010963 scalable process Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
526470 91. 7. 1 8
五、發明說明(:) 技術領域 本發明係有關於聲音訊號的編碼與解碼,特別是關於 將聲資料可標度編碼加入至一標準資料頻道的複數個層級 (Layer)以及從一標準資料頻道可標度解碼聲音資料。 技術背景 由於過去二十多年來光碟(CD)技術在商業上的廣泛 成功 ’ 16位元脈碼調變(puise Code Modulation,PCM)已 經成為流通與播放錄音的工業標準。在這段期間,唱片工 業以光碟提供較乙烯基唱片以及錄音帶高品質的聲音招攬 顧客’而許多人也相信藉由增加聲音的解析度到超過16位 兀PCM所能提供的,對於實際上可聽覺聲音的品質幫助 很少。 過去幾年來這個信念由於幾個原因遭受質疑與挑 戰。對於所有音樂的無雜訊重現而言,16位元PCM的動 〜範圍太過限細。當聲音被量化為16位元的PCM時,會 失去聲音微妙的細節。而且,在考慮到降低量化解析度的 只施,付出在降低訊號雜訊比(SNR)以及訊號解析度的代 ^ 以提供額外的前置空間(Headroom)時,此一信念也會 經不起挑戰。基於這些考量,現在市場對於提供較16位元 pCM更高的聲音解析度有強烈的商業需求。 目月il對於多頻道聲音也是有強烈的商業需求。多頻道 聲曰係提供聲音的多個頻道,相對於傳統的單聲道以及立 體聲,可以改善重現聲音的空間感(Spatialization)。一般 本紙張尺度適财國規格⑵q x挪公爱)---^― -----------^ ^--------^--------- (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 526470 9i 年月 Α7 Β7 ,OJ/. 3 、·.·>— 销夕Ο 五、發明說明(3 的系統會提供聽場(Listening Field)前端以及後端的左右 分離的頻道’有許多也提供中央頻道以及次低音頻道。目 别的修正&供許多環繞(gurr〇unding)著聽場的頻道,以重 現或合成不同型別聲音資料在空間上的區隔。 感知(Perceptual)編碼是用於改善與相當位元率的 PCM訊號相對應的聲音訊號的感知解析度的諸多技巧種 類之一。感知編碼藉由移除與保有主體的品質確實無關的 資訊’可以降低編碼後訊號的位元率,但卻同時保有從編 碼後訊號回復的聲音的主要品質。這可以透過將一聲音訊 號切分為多個頻率子頻訊號,並將每一子頻以某一量化解 析度量化’此處的量化解析度會造成某一程度的量化雜 訊’但此量化雜訊應要小到解碼後訊號足以自行遮蔽 (Mask)。在某一給定位元率的限制下,要達到增加與某一 給定解析度的第一 PCM訊號相對應的感知訊號解析度, 可以藉由將一較高解析度的第二PCM訊號感知編碼,以 降低編碼後訊號的位元率到基本上與第一 pCM訊號相 同。第二個PCM訊號的編碼後版本可以用來取代第一個 PCM訊號,並在播放時解碼。 感知編碼的一個例子實現在遵循Advanced Television
Standards Committee(ATSC)A 52 document (1994)所規範 的ATSC AC-3位元串流規格的設備。此一特別的感知編碼 技術以及其它的感知編碼技術被實施在各種版本的Dolby Digital®編碼以及解碼器上。這些編碼以及解碼器可以從 美國加州舊金山的杜比實驗室公司處購得。感知編碼技術 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公髮) ^----------------- (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 526470 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(f 的另一個例子係實現在遵循MPEG-1聲編碼標準IS0 11172-3 (1993)的設備上。 傳統感知編碼技術的一個缺點是符合主體品質要求 的感知編碼後訊號的位元率可能會超過溝通頻道或是儲存 媒體的資料容量。例如24位元PCM聲音訊號的感知編碼 就會產生一需要較16位元寬的資料頻道所能提供的資料容 量大的感知編碼後訊號。嘗試將編碼後訊號的位元率降到 較低的水平,會降低從編碼後訊號回復的聲音的主要品 貝。傳統感知編碼技術的另一個缺點是它們並不支援單一 感知編碼後吼號的解碼,將一個聲音訊號以超過一個主體 品質來回復。 可標度編碼係可提供一範圍解碼品質的技術。可標度 編碼利用一或多個較低解析度編碼與附加資料 (Augmentation Data)提供聲音訊號的較高解析度編碼。較 低解析度編碼以及該附加資料可以藉由複數個層級提供。 對於可標度感知編碼,尤其是在解碼階段可以與商業上既 有的16位元訊號傳輸以及儲存方式相容的可標度感知編碼 是也有強烈地需求的。 發明概述 、,本專利說明書中揭露相對應於一第一需求雜訊頻 〇曰支k將¥日貝料編碼為_聲音資料頻道的核心層級 (Core Layer)的可標度聲音編碼。此一第一需求雜訊頻譜 最好是根據精神聲響學與資料容量原則建立。相應於額外 本紙張尺度適用中國國家標準UJNS)A4規格(210 x 297公董)------- 裝--------訂--------- (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 526470 A7 丨 ……:一 | B7 _____ _ \ ^ * —^____ 五、發明說明(f 的需求雜訊頻譜,附加資料可以編碼成資料頻道的一或多 個附加層級。可以利用如傳統的均勻(Uniform)量化等替 代的原則來編碼附加資料。 本專利說明書中的說明將揭露僅解碼資料頻道一核 心層級的系統以及方法。說明書中也同時揭露解碼資料頻 道的一核心層級以及一或多個附加層級的系統以及方法, 這些系統以及方法提供了相較於僅解碼核心層級更好的聲 音品質。 本發明的一些實施被應用到子頻訊號。依照此領域的 技術常識,子頻訊號可以透過許多方式產生,這包括運用 如九十度相位差鏡濾波器(Quadrature Mirror Filier)等數位 濾波器,或是透過許多種類的時域到頻域的轉換以及小波 (Wavelet)轉換。 運用本發明的資料頻道在較佳的情況下應有16個位 元寬的核心階層,以及兩個4位元寬的附加階層,以符合 AES3標準,此標準係由聲音工程學會(Audi〇 Engineedng
Society(AES))所頒佈。此一標準也即是American National Standard Institute(ANSI)的 ANSI S4.40標準。此資料頻道 在此處係以標準AES3資料頻道稱之。 根據本發明的各種態樣的可標度聲音編碼以及解 碼,可以籍由離散邏輯元件、一或多個ASIC、程式控制 處理器、以及商業上可購得的元件實施。對於本發明而言, 這些元件實施的方式並不重要。較佳的實施是利用程式控 制處理器,如Motorola(摩托羅拉)所提供的DSP563xx系列 本紙張尺度適用中國國家標準(CNS)A4規格(210 x 297公釐) ^--------^0-------- (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 526470 91. 7, is 丨 Α7 --‘....…一Β7 五、發明說明(f 數位訊號處理器。這些實施的程式可以包括經由機器可讀 取的媒體如基頻(Base Band)或是調變後的通訊路徑以及 儲存媒體傳遞。較好的通訊路徑係在由超音波到此外線頻 率之間的頻譜中。基本上所有的磁性或是光學記錄技術可 以用來作為儲存媒體,這包括磁帶、磁片、以及光碟。 根據本發明的各種態樣,依據本發明編碼的聲音資訊 可以經由機器可讀取媒體到路由器、解碼器以及其它的處 理器傳輸,且可以儲存在用來路由、解碼以及未來的其餘 處理的可機器讚取媒體上。在較佳的實施中,聲音資訊係 根據本發明編碼,並儲存在如光碟等可機器讀取的媒體。 這些資料在較佳的情形中,應該依照各種框架(Frame)、 以及/或其它揭露的資料結構格式化(Format)。在未來,解 馬叩就了以凟取儲存的資訊進行解碼並播放。此等解碼器 不需要包含編碼功能在内。 根據本發明的一種態樣,可標度編碼處理利用一具有 核心層級與一或多個附加層級的資料頻道。接收複數個子 頻訊號。根據一第一需求雜訊頻譜為每一子頻決定一個別 的第一里化解析度,而每一子頻訊號則依照各自的第一量 化解析度里化,產生一第一編碼後訊號。根據一第二需求 雜訊頻譜為每-子頻決定一個別的第二量化解析度,且根 據各自的第二量化解析度將每一子頻訊號量化,產生一第 爲I後Λ號。產生一指示第一與第二編碼後訊號餘數 (Residue)的餘數訊號(Residue恤叫,第一編碼後訊號在 核心層級中輪出,*餘數訊號則在附加層、級中輪出。 本紙張尺度適用中關豕標準(CNS)A4規彳^^ χ撕公爱)------ (請先閱讀背面之注意事項再填寫本頁) 裝 ----訂--------- 五、發明說明(罗 根據本發明的另一種態樣,一編碼聲音訊號的流程使 用具有稷數個層級的標準資料頻道。接收複數個子頻訊 唬★。產生子頻訊號的一感知編碼以及第二編碼。產生一標 二第扁馬相對於该感知編碼的餘數訊號。該感知編碼在 資料巧C的第層級中輸出,且該餘數訊號在資料頻道的 第二層級輸出。 根據本發明的另一種態樣,標準資料頻道的處理系統 包括-記憶體單元以及—程式控制處理器。該記憶體單元 儲存依照本發明編碼聲音資訊的指令(Instructi叫的程 式。該程式控制處理器則與記憶體單元相搭配以接收指令 程式,並且進一步地搭配以接收複數個子頻訊號來處理。 依…、扣々耘式,程式控制處理器依照本發明處理子頻訊 號。在-個實施中,這包括輸出一第一編碼後或是感知編 碼後訊號到資料頻道的-個層級,並輸出—餘數訊號到資 料頻道的另—層級,例如,根據前述揭露的可標度編碼流 程。 根據本發明的另一種態樣,一個處理資料的方式使用 -多層級資料頻道,該資料頻道具有一攜載一聲音訊號感 知編碼的第一層級,以及搭載用以增加該聲音訊號感知編 碼解析度的附加資料的第二層級。根據此一方法,聲音訊 號的感知編碼以及附加資料係透過資料頻道接收。該感知 編碼經路由到一解碼器或是其它的處理器以進行進一步地 處理。這可包括解碼該感知編碼,而不進一步地考慮附加 資料以產生一第一解碼後訊號。或是,將該附加資料路由 9 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 526470 m
正 I 經濟部智慧財產局員工消費合作社印製
本紙張尺度適财0國家標準(CNS)A4規; 五、發明說明( =碼為或是其它的處理器,並在該處理器與感知編碼在 起產生一第二編碼後訊號,該訊號經過解碼以產生一具 有解析度向於第一解碼後訊號的第二解碼後訊號。 /根據本發明的另-種態樣,對於-標準資料頻道的處 理系統其包括_記憶體單元,以及—程式控制處理器。根 康本U而δ ’此記憶體單元係儲存—指令程式用以編碼 聲音資訊。 一而程式制處理器則被搭配到記憶體單元上,用以接收 心7私式’並且在處理過程上將被更進-步搭配,以接收 :複數子頻訊號。相對於指令程式而言,此程式控制處理 器根據本發明來處理子頻訊號。在—實施例中,這包括輸 出一第一編碼或是感知編碼訊號到資料頻道的一個層級 内,並且在另一資料頻道的層級内輸出剩餘訊號,例如, 根據前述揭露的可標度編碼流程。 根據本發明的另一種態樣,揭露了一處理系統,此系 統處理多層級資料頻道上的資料。該多層級資料頻道具有 拕載s λ號的感知編碼的第一層級,以及搭載用以增 加該聲音訊號感知編碼解析度的附加資料的第二層級。該 處理系統包括訊號路由電路、一記憶體單元、以及一程式 控制處理器。該訊號路由電路經由資料頻道接收感知編碼 以及附加貧料,並將感知編碼以及(可選或不選地)附加資 訊路由到程式控制處理器。該記憶體單元根據本發明儲存 處理聲音貧訊的指令程式。f亥矛呈式控制處理器與訊號路由 電路相搭配以接收感知編碼,並與記憶體單元搭配以接收 297公釐) Μ--------^--------- (請先閱讀背面之注意事項再填寫本頁) l9l 7. is B7 五、發明說明(^ 理今去=n W ’程式控制處理器根據本發明處 以及(可選或不選)附加資料。在一實施例中, 包^由以及解碼如上所揭露的—或多個層級的資訊。 哉“叮 檀心、樣一可由機器讀取的媒體搭 =以由機器執行之指令程式以執行—根據本發明之編 =!。根據本發明的另-部份,-可由機器讀取的媒體 ==由機器執行之指令程式,以進行搭載在根據本 日級貧料頻道的資料的路由、以及/或解碼方法。 專、扁碼、路由、以及解碼的範例在上文中以及以下詳細 =Γ揭露:根據本發明的另-部份,-機器可由機器 ㈣㈣本發明的編碼後聲音資訊,例如根據 揭路k程或是方法處理的任何資訊。 康本^月的另-種悲樣,本發明的編碼以及解碼流 ^以透過許多方式實施。例如’指令程式可藉由一機器 1執行’如可程式數位訊號處理器或是電腦處理器,用以 $仃此核程,可以經由該機器可讀取的媒體傳輸,且該 ,可以讀取該媒體以取得該程式,以相對應地執行此一 &程。此機器可以專用來執行此等流程的—部分,例如僅 透過此等媒體傳輸對應的程式材料。 本發明的各項特徵以及其較佳實施例,透過參考下列 的說明以及伴隨的圖形可以得到最佳的了解,在圖形中相 同的參考數子對應到幾個圖形中相同的元件。下列說明的 内^以及圖形僅是用來作為範例’不應被視作本發明的限 制範圍。 本紙張尺度翻fiik鮮(C:NS)A4規格(2$ x 297公釐)
<Ό4/〇
A7 B7 經濟部智慧財產局員工消費合作社印製 圖式簡介 第1A圖係編碼以及/或解碼聲音訊號的處理系統的 塊概圖,其包括一專屬數位訊號處理器。 、方 第1B圖係利用電腦實施的編碼以及/或解碼聲音气。 系統的方塊示意圖。 9 °喊 第2Α圖係根據精神聲響學原則以及一資料容量準則 的聲音頻道編碼流程的流程圖。 ' 第2Β圖係一資料頻道的概圖,此資料頻道包括一序 列的框架,而母一框架包含一序列的字,每一個字是16位 元寬。 第3Α圖係一可標度資料頻道的概圖,此資料頻道包 括複數個層級,該層級以框架、區段、以及部分的方式組 織安排。 第3Β圖係一可標度資料頻道的框架的示意圖。 第4 Α圖係一可標度編碼流程的流程圖。 第4B圖係一用以決定第4A圖中的可標度編碼流程的 合適量化解析度的流程的流程圖。 苐5圖係一流程圖’其介紹一可標度解碼流程。 第6 A圖係可標度資料頻道的框架的示意圖。 第6B圖係第6A圖中所示的聲音區段以及聲音延伸區 段的較佳結構的示意圖。 苐6C圖係苐6A圖中所不的標註資料(meta-data)區段 的較佳結構的示意圖。 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 12 -----—------裝--------訂--------- (請先閱讀背面之注意事項再填寫本頁) 526470
五、發明說明(j0 經濟部智慧財產局員工消費合作社印製 第6D圖係第6 A圖所示的標註資料延伸區段的較佳結 構的示意圖。 較佳實施例之詳細說明 本發明係與聲音訊號的可標度編碼有關。可標度編碼 利用具有複數個層級的資料頻道。這包含一核心層級,其 用以搭載表示遵循第一解析度的聲音訊號的資料,以及一 或多個附加層級,此等層級所搭載的資料與在核心層所搭 載的資料相組合後用以表示根據一較高解析度的聲音訊 號。本發明可以應用到聲音子頻訊號上。每一子頻訊號通 常代表聲音頻譜的一頻率帶(Band)。這些頻率帶可能會彼 此重疊,每一子頻通常包含一或多個子頻訊號元素。 子頻可以經由各種技術產生。其中一個技術係利用對 聲音資料施以頻譜轉換,產生頻譜領域子頻訊號元素。一 或多個相鄰的子頻訊號元素可以組合成群組以定義該等子 頻訊號。組成一給定子頻訊號的子頻訊號元素的數目以及 識別可以事先決定,或是根據欲進行編碼的聲音資料的特 性決定。合適的頻譜轉換的例子包括:離散傅立葉轉換 (Discrete Fourier Transform,DFT)、以及各種離散餘弦轉 換(Discrete Cosine Transform,DCT),此等餘弦轉換包括 一特別的修正後離散餘弦轉換(Modified Discrete Cosine Transform,MDCT),此一轉換有時被稱為時間領域鋸齒 消除轉換(Time Domain Aliasing Cancellation,TDAC), 此轉換的說明可以在Princen,Johnson and Bradley, 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 13 — — — — — — — — — — ·1111111 ^ --------I (請先閱讀背面之注意事項再填寫本頁) 526470 I1·! -/TCi A7 B7 五、發明說明(j1 “Subband/Transform Coding Using Filter Back Designs Based on Time Domain Aliasing Cancellation,,’ Proc· Int· Conf. Acoust·· Speech· and Signal Proc·,May 1987,第 2161-2164頁中找到。另一個產生子頻訊號的技術是:對 聲音資料施以一序列集合的九十度相位差鏡濾波器(QMF) 或是其它帶通濾波器以產生子頻訊號。雖然實施方式的選 擇對於一編碼系統的效益有深遠的影響,但是對於本發明 而言,在觀念上沒有任何一個特定的實施方式是重要的。 「子頻」這個詞彙在此說明書中係意指一聲音訊號頻 寬的一部分。而詞彙「子頻訊號」則是指代表某子頻的訊 號。詞彙「子頻訊號元素」在此處則是表示一子頻訊號的 組成或是元素。例如在採用頻譜轉換的實施中,子頻訊號 元素即是轉換係數。為了簡單起見,不管子頻訊號的產生 係透過頻譜轉換或是其其它型別的濾波器,在此處都以子 頻過濾來代表子頻訊號的產生。在此處濾波器本身是以濾 波器組這個名稱提及,或是更精確地說成是一分析濾波器 組(Analysis Filter Bank)。在傳統的方式上,一合成濾波 器組係意指一分析濾波器組的反函數或實際上的反函數。 可以在依照本發明進行處理的資料中,提供錯誤校正 資訊,以偵測一個或多個錯誤的發生。錯誤可能在這些資 料傳輸或是緩衝暫存時發生,而且在播放這些資料之前, 先偵測這些錯誤與校正這些錯誤通常是有益的。錯誤校正 這個語彙基本上係指如同位位元、循環冗碼、檢查和、李 得所羅門(Reed_Sol〇mon)碼等任何的錯誤偵測以及/或糾 ----------· 11---- —訂·-----11 (請先閱讀背面之注咅?事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製
526470
五、發明說明()12 經濟部智慧財產局員工消費合作社印製 正方案。 請參照第1A圖,圖中所示的是處理系統1〇〇的一個實 例,#亥糸統根據本發明編碼與解碼聲音資料。處理系統 100包括程式控制處理器110、唯讀記憶體12〇、隨機存取 記憶體130、以及傳統方式透過匯流排丨丨6連結的聲音輸入 /輸出介面140。此處的程式控制處理器11〇係一可由從 Motorola處購得的DSP563xx型數位訊號處理器。唯讀記 憶體120與隨機存取記憶體13〇係依照傳統的設計方式設 計。唯讀記憶體120儲存一指令程式,該程式可以讓程= 才二制處理器11 〇依照第2 A圖到第6D圖所介紹的方式,進行 分析與合成過濾,以及處理聲音訊號。當處理系統1〇〇處 於關機狀態時,程式仍會完好無缺地存在唯讀記憶體 中。根據本發明,唯讀記憶體12〇實際上可以選擇性地以 任何磁性或是光學記錄技術,如磁帶、磁片或是光碟等取 代。隨機存取記憶體130依照一般的方式為程式控制處理 器110緩衝暫存指令以及包括接收到以及處理過訊號在内 的資料。聲音輸入/輸出介面丨4〇包括用以將接到的訊號的 一或多個層級路由到例如程式控制處理器110等其餘元件 的路由線路,對於輸出以及輸入訊號,該訊號路由線路可 以使用分開的接頭或是使用相同的接頭。透過省略合成以 及解碼指令,處理系統1〇〇可以選擇性地專用來進行編碼, 或是透過省略分析以及編碼指令,選擇性地專用來進行解 碼。處理系統100係對有利於實施本發明的典型處理動作 的一個表示,並不做為某一特別硬體實施的描繪。 本紙張尺度適财_ ii^7CNS)A4規格⑽x 297公髮) 15 t--------IT--------- (請先閲讀背面之注意事項再填寫本頁) 526470 18 ΑΊ 五、發明說明(ρ t程式控制處理器110存取從唯讀記憶體12〇處取得的編 馬心7私式。聲音訊號被送到處理系統100的聲音輸入/輸 出"面140,亚路由到程式控制處理器11〇以進行編碼。根 據、、扁碼‘令程式,該聲音訊號經由一分析滤波器組過滤以 產生子頻訊號,該子頻訊號經過編碼以產生編碼後訊號。 編碼後讯唬透過聲音輸入/輸出介面14〇提供給其它的設 備’或是儲存在隨機記憶體13()中。 在進行解碼時,程式控制處理器110從唯讀記憶體12〇 處存取解碼指令程式。聲音訊號被傳送到處理系統100的 聲音輸入/輸出介面140,並路由到程式控制處理器11〇以 進行解碼,此處的聲音訊號比較好的實施方式是根據本發 明編碼過。聲音訊號被根據解碼指令程式解碼,以取得相 對應的子頻訊號,且經過一合成濾波庫處理該等子頻訊號 以取得一輸出訊號。該輸出訊號經由聲音輸入/輸出介面 140提供給其它的設備,或是儲存在隨機記憶體13〇中。 現在請參照第1B圖,其中所顯示的是根據本發明進 行聲音訊號編碼以及解碼的系統丨5(),藉由電腦實施的一 個實施例的方塊簡圖。電腦實施的系統15〇包括一中央處 理單元152、隨機存取記憶體丨53、硬碟丨54、輸入設備丨55、 接頭156、以及輸出設備157,並且藉由匯流排158以一般 的方式連接。中央處理單元152比較好的方式是採用intei ® x86指令集架構(Instruction Set Architecture),而且最好 包括浮點運算處理的硬體支援,可以使用例如Intel⑫ Pentium ® III徽處理器,此微處理器可以從Intel⑫ 16 請 訂 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公爱) 526470 五、 經濟部智慧財產局員工消費合作社印製 rm:T—is 發明說明(”
Corporation 〇f Santa Clara Calif〇rnia處購得。聲音資訊透 過接頭156提供給電腦實施的系統15〇,並且路由到中央广 理單元152。儲存在硬碟154上的指令程式可以讓電腦實= 的系統150根據本發明處理聲音資料。經過處理的數位型 式聲音資料可以經由接頭156提供,或是寫入儲存到硬碟 154 中。 ' 可預期地,處理系統100藉由電腦實施的系統15〇以及 本發明的其它實施有可能會被應用在同時包括聲音以及視 訊處理的應用上。典型的視訊應用會將它的動作與視訊時 序訊號以及聲音時序訊號同步。視訊時序訊號提供視訊框 架的同步參考,視訊時序訊號可以提供如NTSC、PAL、 或疋ATSC視訊訊號的參考框架。聲音時序訊號提供聲音 樣本的同步參考。時序訊號大體上可以是任何頻率的。例 如在專業的應用中48KHz是常見的聲音時序頻率。對於本 發明的實施而言,並沒有任何特定的時序訊號或是時序訊 號頻率會是重要的。 現在請參考第2 A圖,圖中顯示流程200的流程圖,該 流程根據精神聲響學以及資料容量方案將聲音資料編碼成 聲音頻道。現在請同時參考第2B圖,其中顯示的是資料 頻道250的方塊圖。資料頻道250包括一序列的框架260, 而每一個框架260則包括一序列的字。每一個字指定為 bits(n)序列,其中η係介於〇與15之間的整數,且bits(n〜m) 係表示該字的bit(n)到bit(m)。每一個框架260包括一控制 區段270與一聲音區段280,其皆包括與框架260相同整數 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 裝--------訂--------- (請先閱讀背面之注意事項再填寫本頁) 17 526470 經濟部智慧財產局員工消費合作社印製 *•^’•0·»’《ΜΙ· 島.泰, Μ."7, !:i^rc 年;] π ' :.- 五、發明說明(尸 數目的字。 代表一聲音訊號第一方塊的複數個子頻訊號在步驟 210處接收。每一個子頻訊號包括一或多個子頻元素,而 每一個子頻元素則由一個字代表。每一個子頻訊號在步驟 212分析以決定一聽覺遮罩曲線(Audit〇ry Masking Curve)。聽覺遮罩曲線決定了在每一個個別的子頻中可以 加入而不會使該雜訊被聽覺的最大量雜訊。在此處什麼是 可聽覺的,係以人類聽覺精神聲響學模型為基礎,而且可 能包括跨頻道遮罩特徵(Cross-channel Masking Characteristics),在該處子頻訊號代表超過一個的聲音頻 道。覺遮罩曲線是需求雜訊頻譜(Desired Noise Spectrum) 的第一個估計。步驟214處分析需求雜頻譜,決定每一個 子頻訊號個別的量化解析度,以讓當子頻訊號依其量化, 接著解量化與轉換為聲音波動後,產生的編碼雜訊維持在 所要求的雜訊頻譜以下。依循原則量化的子頻訊號是否可 以填入以及大體上填滿聲音區段280的決定在步驟216被確 定。如果不行的話,在步驟218中所要求的雜訊頻譜在步 驟218調整,並且重複步驟214與216。如果可以的話,在 步驟220處,子頻訊號就依循原則量化,並在步驟222處輸 出到聲音區段280。 生成框架260的控制區段270的控制資料。這包括在控 制區段270的第一個字272處所輸出的一同步樣式 (Pattern)。該同步樣式讓解碼器得以同步在資料頻道250 中接續的框架260。標示框架260之框架頻率的額外控制資 本紙張尺度適用中國國家標準(CNS)A4規格(210 x 297公釐) 18 -----------裝--------訂--------- (請先閱讀背面之注意事項再填寫本頁) 526470 五、發明說明(尸 料、區段270的界線、編碼動作的參數、以及錯誤偵測資 訊皆被輸出到控制區段270的其餘部分274。可以針對聲= 讯號的每一個方塊重複進行此一流程,最好是每一接續的 方塊都編碼成資料頻道2 5 0中對應的接續框架2 6 〇。 區 第 流程2 0 0可以運用來將資料編碼成一多層級聲音頻道 的一或多個層級。根據流程2〇〇進行多於一個層級的編= 時,層級所搭載的資料與相應的多層級聲音頻道資料容量 的浪費間可此會有所關聯。在下文中所要討論的是藉由輸 出附加資料到一資料頻道的第二層級以改善此等資料頻‘ 第-層級所搭載資料的解析度的可標度流程。在解析度上 的改善最好是可以表示為與第—層級的編碼參數間的:式 關係(Function Relati〇nship),例如一個偏移量當此偏 移量加入到編碼第一層級的需求雜訊頻谱時,生成用於編 碼第二層級的第二需求雜訊頻譜。此一偏移量可以輸出在 資料頻道-個已經建立的位置上,例如第二層級的一個 段或是攔位中,以指示解碼器改善值。這可以用來決定 二層級中的每—個子頻訊號元素或是相關資訊的位置 結 經濟部智慧財產局員工消費合作社印製 下來要討論的是有關用於組織可標度資料頻道的框架 構。 道 見在明參考第3Ab],其中顯示的是可標度資料頻· 則的個貫施例的簡圖,該資料頻道包括核心層級310 >附力層、、及320與第二附加層級33〇。核心層級則係[ ^寬’第-附加層級32(^M位元寬,而第二附加層級33〇 位7"寬,此處L、M、N皆為正整數。核心層級310 526470 ΎΤ Ι^Τ ' 526470 ΎΤ Ι^Τ ' 財 印 Α7 Β7 五、發明說明(f 包括一序列L-位元的字。核心層級3 10與第一附加層級的 組合包括一序列的(L + M)-位元的字,而核心層級310、第 一附加層級3 2 0、與第二附加層級3 3 0的組合則包括一序列 的(L + Μ + Ν)-位元的字。標記bits(n〜m)在此處係用以表 示一個字從bits(n)到bits(m)的位元,其中η以及m是整數且 m>n,而且m,η可以是〇到23在内的數目。比方說可標度 資料頻道300可以是24位元寬的標準AES3資料頻道,其L, Μ,Ν分別專於16, 4, 4。 根據本發明可標度資料頻道300可以組織安排成一序 列的框架340。每一個框架340被切分成一個控制區段35〇 接續著一聲音區段360。控制區段35〇包括由控制區段35〇 與核心層級310的交點所定義的核心層級部分352、由控制 區段350與第一附加層級32〇的交點所定義的第一附加層級 部分354、以及由控制區段35〇與第二附加層級33〇的交點 所疋義的第二附加層級部分356。鼙音區段36〇包括第一以 及第一子區段370,38〇。第一子區段37〇包括由第一子區 段37^與核心層級31〇的交點戶斤定義的核心層級部分仍、 由第-子區段370與第-附加層級32〇的交點所定義的第 一附加層級部分374、以及一由第一子區段37〇興第二附加 :級330的交點所定義的第二附加層級部分376。同樣地, ^ 一子區段則包括由第二子區段咖與核心層級310的交 點所定義的核心層級部分382、一 .,.„ , 田弟一子區段380與第一 =級糊,點所定義的第一附加層級部分384、以及 —子以38。與第二附加層級33〇的交點所定義的第 (CNS)A4STiio x 297 (請先閱讀背面之注意事項再填寫本頁) 裝--------訂---------· 526470 A7 B7 乳7., 年月 五、發明說雨 二附加層級部分386。 (請先閱讀背面之注意事項再填寫本頁) 經 濟 部 智 慧 財 產 局 員 工 消 費 合 作 社 印 製 在此一實施例中,核心層級部分372與382搭載編碼後 聲音資料’其係根撐精神聲響學原則壓縮以讓編碼後聲音 資料能適合於核心層級310。提供給編碼系統作為輸入的 聲音資料可以包括由P位元寬的字表示的子頻訊號元素, 其中的整數P大於L。接著便可以應用精神聲響學原則將 子頻訊號元素編碼成平均寬度為L位元的編碼值或是符 號。這些子頻訊號元素所佔的資料量,因此被充分地壓縮 以方便地經由核心層級3 10傳輸。編碼動作最好是與一般 在L位元寬資料頻道上的聲音資料傳輸原則相容,以讓核 心層級3 10可以依循一般的方式解碼。第一附加層級部分 374、3 84所搭載的附加資料可以與核心層級3丨〇中的編碼 後訊息組合起來回復成一聲音訊號,其具有較僅由核心層 級3 10上的編碼後訊息作回復得來的聲音訊號高的解析 度。第二附加層級部分376、3 86所搭載的額外附加資料可 以與核心層級310中的編碼後訊息以及第一層級32〇共同組 &起來回设成一聲音訊號,其具有較僅由核心層級3 1 〇上 的編碼後訊息與第一附加層級320作回復得來的聲音訊號 更高的解析度。在此一實施例中,第一子區段37〇搭載左 聲音頻道CH一L的編碼後聲音資料,而第二子區段38〇搭載 右聲音頻道CH_fU々編碼後資料。 控制區段350的核心層級部分352攜載控制解碼流程 動作的控制資料。這些控制資料可包括指示框架34〇起始 位置的同步資料、指示程式設定以及框架率的袼式資料、
526470 ) % 7. 18 j · y j 五、發明說明(j9 指示框架340内區段與子區段邊界的區段資料、指示解碼 動作參數的參數資料、以及保護核心層級部分说内資料 的錯誤價測資訊,每一種類的控制資料事先決定或是建立 的位置最好都在核心層級部分352内提供,以讓解碼器可 以=核心層級部分352中快速地剖析每一個種類。根據此 κ施例,解碼以及處理核心層級3丨〇所必須的控制資料 都包括在核心層級部分352。如此可以在不喪失必須的控 制資料的$提下,透過如訊號路由線路將附加層級與 330去除或是丟棄,以支援對設計用來接收資料格式化成 L位元的子的數位訊號處理器的相容性。附加層級、%〇 的額外控制資料,可以根據本發明包括在附加層級部分 中。 在控制區段350裡的每一個層級31〇、320、330最好是 刀別格載聲音區段360裡編碼後聲音資料的對應部分的解 碼參數以及其餘資訊。例如核心層級部分352即可搭載一 弟舄求雜汛頻譜的編輯遮罩曲線的一偏移量,以產生第 一需求雜訊頻譜,用來將資訊感知地編碼成核心層級部分 372、3 82。同樣地,第一附加層級部分354也可以搭載第 一需求雜訊頻譜的一偏移量,以產生一第二需求雞訊頻 邊’用以將資訊編碼成附加層級部分374、384 ;相同地, 第二附加層級部分356也可以搭載第二需求雜訊頻譜的一 偏移1 ’以產生一第三需求雜訊頻譜,用以將資訊編碼成 第二附加層級部分376、3 86。 現在請參照第3B圖,其中所顯示的是可標度資料 本紙張尺度細+ ®國家標準(CNS)A4規格(21G X 297公董) -裝 -----訂-! ------ (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 22 526470 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(f 道300的一可能框架390的概圖。框架390包括框架340的控 制區段350以及聲音區段360。在框架390,控制區段350也 包括核心層級310裡的攔位392、394、396,以及第一附加 層級320與第二附加層級330。 欄位392搭載一旗標指示附加資料的組織。根據一第 一旗標值,附加責料根據一事先決定的設定組織。這最好 是框架340的設定,以使得左聲音頻道CH—L的附加資料在 第一子區段370中搭載,而右聲音頻道CH-R的附加資料則 搭載在第二子區段3 80。每一個頻道的核心以及附加資料 搭載在同一個子區段的設定此處稱之為切齊設定(Aligned Configuration)。根據一第二旗標值,附加資料係以適應 地方式分佈在附加層級320與330,而在欄位394以及390中 則为別彳合載一指示,指示每一個個別資料頻道的附加資料 位置的所在。 攔位392最好有足夠的大小可以搭載控制區段35〇的 核心層級部分3 52中的資料的錯誤偵測碼。由於此控制資 料控制核心層級3 10的解碼動作,因此保護該控制資料是 需要的。欄位392可以選擇性地搭載保護聲音區段36〇的核 心層級部分3 7 2、3 8 2的錯誤偵測碼。對於在附加層級3 2 〇、 330的資料並沒有必要提供錯誤偵測保護,這是因為在核 心層級310的寬度L足夠的情況下,此等錯誤的效應通常 僅能勉強聽得到。例如在核心層級3丨〇是以丨6位元字深 (word depth)感知編碼時,附加資料主要是提供細微的細 節而在附加 > 料的錯誤通常在解碼以及播放時很難聽得 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 X 297公爱) 23 -------丨丨丨裝-----訂---------^一^" (請先閱讀背面之注意事項再填寫本頁)
到。 經濟部智慧財產局員工消費合作社印製 攔位394與396可以分別搭載一錯誤偵測碼。每一個碼 提供它本身所被搭載的附加層級32〇與33〇保護。這最好是 包括控制資料的錯誤偵測,但也可以改為包括聲音資料的 錯誤價測或是控制與聲音資料的兩者皆有錯誤偵測。針對 每一個附加層級320與330可以指定兩個不同的錯誤偵測 碼。一第一錯誤偵測碼指定對應附加層級的附加資料根據 一事先決定的設定(C〇nfigUrati〇n),如框架34〇,的方式組 織安排。而針對每一層級的一第二錯誤偵測碼則指定對應 層級的附加資料係分佈在對應的層級中,且在控制區段350 中I括4曰“ 4曰示该附加資料的位置。附加責料最好同核心 層級3 10中對應的資料一般係在資料頻道300的同一框架 390中。一事先決定的設定可以用來組織安排一附加層級, 而才曰彳示則女排組織另一個附加層級。上述的錯誤债測碼可 以改用錯誤校正碼。 現在請參照第4A圖,其中所顯示的係一依循本發明 的可標度編碼流程4〇〇的一個實施例的流程圖。此一實施 例採用第3A圖中的核心層級3 10與資料頻道3〇〇的第一附 加層級320。在步驟402中接收了複數個子頻訊號,而每一 個子頻訊號則包括一或多個子頻訊號元素。在步驟404中, 根據一第一需求雜訊頻譜,針對每一個子頻訊號決定各自 的第一量化解析度。此第一需求雜訊頻譜係根據精神聲響 學源則所建立,且最好也呼應核心層級31 〇的資料容量要 求。例如此一要求可能是核心層級部分372與382的整體資 本紙張尺度適用中國國家標準(CNS)A4規格(210 x 297公釐) 24 ------------裝--------訂--------- (請先閱讀背面之注意事項再填寫本頁) 526470 A7 Β7 五、發明說明(尸 料容量上限。子頻訊號根據對應的第—量化解析卢進行旦 =生一第一編碼碼訊號。第一編碼後訊號係;出二 在聲音區段360的核心層級部分372與382中。 在步驟408中,針對每一子頻訊號決定—各自的第二 量化解析度。此第三量化解析度最好相應於核心、層、級^ 一附加層級3 10與320的聯集的資料容量需求建立,而且= 好也依循精神聲響原則。比方說,f料容量要求可 心與第-附加層級部分372、374的聯集的總資料容量限 2。子頻訊號根據各自的第二量化解析度進行量化以產生 一第二編碼後訊號。步驟41G處產生_餘數訊號,該訊號 攜載第-與第二編碼後訊號間的某—剩餘度量(Resldual Measure)或是差異。餘數訊號的產生較佳的實施方式是根 據2補數或是其它型式的二進位算數將第一編碼後訊號減 去第二編碼後訊號。步驟412將第二餘數訊號輸出在聲音 區段360的第一附加層級部分374、384中。 在步驟414中,針對每一子頻訊號決定一各自的第三 虿化解析度。此一第三解析度較佳的情況是依循層級31〇、 320、330的聯集的資料容量來建立。當然最好在建立第三 量化解析度時,也利用精神聲響學原則。子頻訊號根據各 自的第三量化解析度量化,產生一第三編碼後訊號。步驟 416處產生一餘數訊號,該訊號攜載第二與第三編碼後訊 唬間的某一剩餘度量或是差異。第二餘數訊號的較佳實施 方式疋根據2補數(或是其它型式的二進位算數)來產生第 二和第三編碼後訊號間的差異。上述第二餘數訊號可以改 請 濟 部 智 慧 局 員 工 消 費 合 作 社 印 製 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐 526470 91: 7. 18 經濟部智慧財產局員工消費合作社印製 I P、v A7 i ------—......... . ·.…~ J B7 _ 五、發明說明( 為攜载第一與第三編碼後訊號間的某一剩餘度量或是差 異。步驟418將第二餘數訊號輸出在聲音區段36〇的第二附 加層級部分376、386中。 在步驟404、408、414中,當一子頻訊號包括多於一 個的子頻訊號元素時,將子頻訊號量化成一特定解析度可 能包括均勻地量化子頻訊號的每一個元素到一特定的解析 度。因此如果一個子頻訊號(ss)包括三個子頻訊號元素 (sei,Se2,Se3) ’透過根據量化解析度q,均勻地將子頻訊號 的的每一個子頻訊號元素量化,可以做到將該子頻訊號依 循量化解析度Q量化。量化後的子頻訊號可以寫成q(ss), 而量化後子頻訊號元素則可以寫成Q(sei)、Q(se2)、與 Q(se3)。所以量化後子頻訊號q(ss)包括量化後子頻訊號元 素的聚集(collectionXQGe!)、Q(se2)、Q(se3))。一 編碼範 圍’其標示子頻訊號元素相對於一基準點(base p〇int)允許 的量化範圍,可以指定作為編碼參數,基準點較佳的情況 下係量化水平,其產生的雜訊大體上符合編輯遮罩曲線。 編碼範圍相對於編輯遮罩曲線,可以是約在移除雜訊後的 144分貝與注入雜訊後的48分貝之間,或是簡要地說在_ 144dB 到 + 48dB 間。 在本發明的一個替代實施例中,同一子頻訊號内的子 頻訊號元素被平均起來量化到一特定的解析度Q,但是個 別的子頻訊號元素係被不均句地量化到不同的解析度。在 提供子頻訊號内非均勻量化的另一個替代實施例中,一增 益適應(Gain-adaptive)量化技術將同一子頻内的一些子頻 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 26 -----------裝--------訂--------- (請先閱讀背面之注意事項再填寫本頁) 526470 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(:?4 訊號元素量化到一特定的量化解析度(5,而將該子頻内的 其餘子頻汛號元素量化到另一個與解析度Q相較下更為精 細或是粗糙一可以決定的量的不同解析度。實現一特定子 頻内的非均勻量化的較佳方式揭露在〇心1(18〇11等人於1999 年7月提出申請 and Non.Uniform.Symbol Lengths for Improved Audio Coding”的專利申請案中,在此提出做為參考。 步驟402中,接收到的子頻訊號在較佳的情況裡,應 包括一組代表左聲音頻道CH—L的左子頻訊號ss_l,以及 一組代表右聲音頻道CH-R的右子頻訊號SS-R。這些聲音 頻道可以是-組立體配對,或是基本上彼此互不相干。聲 音訊號頻道CH_L、CH—R的感知編碼,較佳的實施方式係 利用一對需求雜訊頻譜,CH 一L與CH__R各提供一頻譜。集 合SS 一L的一子頻訊號就可以量化到與8§—R集合内相對應 的子頻訊號不同的解析度。當考慮到跨頻道遮罩效應時, -聲音頻道的需求雜訊頻譜就可能受另—頻道的訊號内容 影響。在較佳的實施例中,跨頻道遮罩效應係是被忽略的。 左聲音頻道CH—L的第一需求雜訊頻譜係根據子頻訊 號SS—L們的編輯遮罩特徵,或是選擇地加上子頻訊號ss_r 們的跨頻這遮罩特性,以及如核心層級部分372有的資料 合里等額外的方案,就如同以下所介紹的。左子頻訊號 SS 一L們或是加上右子頻訊號“—&經過分析決定出左聲音 頻道CH—L的編輯遮罩曲線AMC—L。、編輯遮罩曲線表示在 噪音沒有達到可以被聽覺的前提下,可以被加入到左聲音 本紙張尺度適时關家標準(CNS)A4規格⑽X 297公» ) 27 — — — — — — i^w- 1111111 ^ 1111111 (請先閱讀背面之注意事項再填寫本頁) 526470 規 7.請 . A7 ' - - … --------— B7___ 五、發明說明(j5 (請先閱讀背面之注意事項再填寫本頁) 頻道CH—L的每-個個別子頻的最大量雜訊。此處什麼是 可聽覺,係依照人類聽覺的精神聲響學,以及可能包括右 聲音頻道CH—R的跨頻道遮罩特徵。編輯遮罩曲線amc l 被當作左聲音頻道…的一第一需求雜訊頻譜的起始 值一工過刀析决疋集合SS—L的每一個子頻訊號的各自 里化解析度Q1 一L,使得集合ss—L的子頻訊號根據 Q1 一 L(SS—L)量化’接著解量化以及轉換成聲音波動時, 產生的編碼雜訊是人類聽覺感受不到的。為了清楚起見, Q1-L係代表一組的量化解析度,在這樣的每一個集合裡, 都包括了子頻訊號SSJL集合中個別訊號ss對應的量化解 析度值Q1 一Lss在此處應該明白的是,標記L(ss—L)係 表不集合SS—L内的每一個子頻訊號都根據各自的量化解 析度進行量化。如上文中所闡釋,每一個子頻訊號内的子 頻訊號元素都可以被均勻地或是不均勻地量化。 經濟部智慧財產局員工消費合作社印製 透過相似的方式,分析右子頻訊號ss—r以及最好包 括左子頻訊號SS 一L在内,產生右聲音頻道CH_R的編輯遮 罩曲線AMC—R。此編輯遮罩曲線amc_R可以作為右聲音 頻道CH—R的初始第一需求雜訊頻譜,右聲音頻道 過分析以決定集合SS一R内的每一個子頻訊號各自的量化 解析度Q1_R。 現在也請參照第4B圖,圖中是根據本發明決定量化 解析度的一個流程的流程圖。流程420可以用來找出例如 根據流程400編碼每一層級時合適的量化解析度。在此將 對流程420處理左聲音頻道CH_L的部分作說明,而右聲音 28 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 526470
五、發明說明(户 經濟部智慧財產局員工消費合作社印製 頻道CH_R係透過相似的方式進行。 在步驟422中將-第_需求雜訊頻譜的初始值 FDNS_LS定為與編輯遮罩曲線AMC—L相等。在步驟“A 中決定集合SS—L的每一個子頻訊號各自的量化解析度, 使得子頻訊號皆據其量化,接著解量化並且轉換成聲音波 動’且所產生的量化雜訊基本上符合第—需求雜訊頻譜 FDNS—L。在步驟426中決定依此量化的子頻訊號是否符 合核心層級31〇的資料容量要求。在此流程42〇的實施例 中,資料容量要求係指定為如此量化的子頻訊號是否可以 融入及基本上利用完核心層級部分372的資料容量。如果 步驟426的決定係是負面的,那麼在步驟428中進行第一需 求雜訊頻譜FDNS一L的調整。此一調整包括將第一需求雜 訊頻譜FDNS_L位移一個最好大體上均勻跨過左聲音頻道 CH—L的子頻的量。當步驟426處如此量化的子頻訊號無法 置入核心層級部分372時,位移的方向係是向上的,此對 應到品質粗糙一點的量化。而當步驟426處經過此等量化 的子頻訊號可以置入核心層級部分372時,位移的方向係 是向上的,此對應到品質精細一點的量化。第一位移的量 較佳的情況是約略等於到位移方向的極值的距離的一半。 因此在編碼範圍指定為-144dB到+48dB的情況中,這種第 一位移可以是將FDNS_L向上位移約24dB。每一個接續的 位移量最好約略是前一個位移量的一半。只要第一需求雜 訊頻譜FDNS_L在步驟428中經過調整,就重複步驟424與 426。當進行步驟426時,如果得到正面的決定,在步驟430 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 29 --------——I 裝 -- -----訂--------- (請先閱讀背面之注意事項再填寫本頁) 526470 7, 18 A7 B7 經 濟 部 智 慧 財 產 局 員 工 消 費 合 作 社 印 製
五、發明說明(V 處就停止該流程,而決定的量化解析度Q1JL就是合適的。 集合SS—L的子頻訊號根據決定的量化解析度QLL進 行量化產生量化後子頻訊號Q1_L(SS_L)。量化後子頻訊 號Q1_L(SS—L)係作為左聲音頻道CH—L的一第一編碼後訊 號FCS—。量化後子頻訊號可以以任何事先決 定的順序方便地在核心層級部分372中輸出,例如依照子 頻訊號元素的頻譜頻率遞增排列。因此量化後子頻訊號 Q1_L(SSJL)的核心層級部分372的資料容量的配置,係在 給定核心層級3 10的此一部份的資料容量的情況下,儘可 能地隱藏量化雜訊。右聲音頻道CH—R的子頻訊號SS__R經 過類似的方式處理,產生該頻道CH—R的第一編碼後訊號 FCS_R,並輸出到核心層級部分382。 編碼第一附加層級部分374的適合量化解析度Q2_Lw 下所述,根據流程420決定。左聲音頻道ch一L·的一第二需 求雜訊頻譜SDNS—L的初始值,在步驟422中,設定成與 第一需求雜訊頻譜FDNS—L·相等。第二需求雜訊頻譜 SDNS—L經過分析以決定集合SSJL中每一個子頻訊號各 自的量化解析度Q2 一Lss,使得集合^^的子頻訊號皆根 據Q2—L(SS—L)量化,接著解量化並且轉換成聲音波動, 且所產生的里化雜訊基本上符合第二需求雜訊頻譜 SDNS一L在步驟426中決定如此量化的子頻訊號是否符 合第一附加層級320的資料容料要求。在流程420的此一實 施例中、料谷畺需求係指定為一餘數訊號是否可以置入 (fit)以及大體上用完第一附加層級部分374的資料容量。 I ^———tr--------- (請先閱讀背面之注意事項再填寫本頁)
526470
五、發明說明(严 經濟部智慧財產局員工消費合作社印製 ,、數Λ號係指定成循此方式量化的子頻訊號q2_L(SS_L) 與由核心層級部分372決定的量化後子頻訊號QiLptL) 之間的餘數度量或是差異。 如果步驟426的決定係是負面的,那麼在步驟428中進 仃第二需求訊頻譜SDNS—L的調整。此一調整包括將第二 而求雜訊頻譜SDNS一L位移一個最好大體上均勻跨過左聲 音頻道CH—L的子頻的量。當步驟426處的餘數訊號無法第 一附加層級部分374時,位移的方向係是向上的,否則則 是向下位移,第一位移的量較佳的情況是約略等於到位移 方向的極值的距離的一半。而每一個接續的位移量最好約 略是前一個位移量的一半。,只要第二需求雜訊頻譜 SDNS—L在步驟428中經過調整,就重複步驟424與426。 田進行步驟426時,如果得到正面的決定,在步驟43〇處就 停止該流程,而決定的量化解析度卩2一乙就是合適的。 集合SS—L的子頻訊號根據決定的量化解析度Q2_l進 行f化以產生各自的量化後子頻訊號q2_l(ss—l)。量化 後子頻訊號Q2一L(SS—L)係作為左聲音頻道ch_L的一第二 編碼後訊號SCS—L。生成對應的左聲音頻道CH—L的第一 餘數訊號FRSJL。一個較佳的方法是針對每一個子頻訊號 元素皆形成一餘數,並在第一附加層級部分374中,將這 些餘數的位元表示以預先建立的順序,例如依照子頻訊號 元素的頻率遞增,相連接後輸出。因此量化後子頻訊號 Q2_L(S2_L)的第一附加層級部分374的資料容量的配置, 係在給定第一附加層級的此一 374部份的資料容量的情況 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 X 297公爱) 31 --------tr---------0 (請先閱讀背面之注意事項再填寫本頁) 526470 »1. 7. !8
五、發明說明(f 經 濟 部 智 慧 財 產 局 員 工 消 費 合 作 社 印 製 下,儘可能地隱藏量化雜訊。右聲音頻道CH_R的子頻訊 號SS_R經過類似的方式處理,產生該頻道第二編 碼後訊號SCS_R«及頻道CH_R的第一餘數訊號FRS_r。 右聲音頻道CH一R的第一餘數訊號FRS—R係輸出在第一附 加層級部分384。 量化子頻訊號Q2—L(SS_L)與Ql—L(SS_L)可以平行同 時決定。這最好是透過將左聲音頻道CH一L的第二需求雜 訊頻譜SDNS—L的初始值,設定為相等於編輯遮罩曲線 AMC一L或是其它與為核心層級編碼所決定的第一需求雜 讯頻譜FDNS—L間沒有相依關係的規格。資料容量要求係 被指定為循此量化的子頻訊號Q2一l(SS一L)是否可置入以 及大體上完全利用完核心層級部分372與第一附加層級部 分374的聯集。 取得聲音頻道CH 一 L的第三需求雜訊頻譜的初始值, 就像取得第二需求雜訊頻譜時所做的一樣,實施流程42〇 以取得各自的第三量化解析度Q3—L。循此量化的子頻訊 號Q3—L(SS—L)係作為左聲音頻道CHJUij第三編碼後訊 TCS一L。可以利用近似於針對第一附加層級所進行的 式,產生左聲音頻道CH-L的第二餘數訊號SRS—L·。但是 在此處,餘數訊號係透過將第三編碼後訊號子頻訊號 SCS—L的子頻訊號元素減去在第二編碼後訊號scs一乙中對 應的子頻訊號元素取得。第二餘數訊號3113一乙係輸出在 二附加層級部分376。右聲音頻道CH—R的子頻訊號Μ— 經過類似的方式處理,產生該頻道ch—r&第三編碼後訊 號 方
第 R (請先閱讀背面之注意事項再填寫本頁) 裝 ----訂---------. 丨本紙張尺度適Γ中關家標準 1^^.·規格(別χ297公髮 526470 五、發明說明(严 唬TCS—R以及第二餘數訊號SRS—r。右聲音頻道⑶』的 第二餘數訊號SRS—R係輸出在第二附加層級部分撕中。 核心層級部分352的控制資料被產生。通常控制資料 了以讓解碼器與編碼後框架串流中每—個框架同步,以及 士曰示解碼裔如何剖析與解碼每一個如框架3仙的框架所提 供的貝料。因為提供了複數個編碼後解析度,因此控制資 料通常比非可標度編碼實施中的控制資料複雜。在本發明 的一個較佳實施例中,控制資料包括一同步樣式、格式資 料、區段資料、參數資料、以及一錯誤偵測碼,所有的這 些資料都會在下文中說明。針對附加層級320與330,會產 生額外的控制資訊指定如何將層級32〇與33〇解碼。 可以產生一事先決定的同步字’以標示框架的起始位 置。在每-個框架的第一個字的前L個位元輸出此一同步 樣式,以標示框架的起始處。同步樣式最好沒有出現在框 架的其餘位置。同步樣式指示解碼器如何從一編碼後串流 剖析框架。 經濟部智慧財產局員工消費合作社印製 可以產生指程式設定、位元串流剖面⑼版咖 Profile)以及框架率用的格式資料。程式設定指示包括在 編碼後位元串流中的到數目以及分佈。位元串流剖面則指 示框架的哪些層級被利用到。一第一位元串流剖面值表^ 編碼僅在核心層級310中提供。在這個情況中,附加層級“Ο 與330最好是予以忽略,以節省資料頻道的資料容量。— 第二位元串流剖面值表示編碼在核心層級3丨〇與第一附加 層級320中提供。在此情況裡,第二附加層級33〇最好是予口 33 本紙張尺度細+關家標準(CNS)A4規格(210 X 297公爱)
、發明說明 526470 以心略。一第三位元串流剖面值表示編碼在310、320與330 每一個層級中提供。位元串流剖面值的第一、第二以及第 三個值最好是根據AES3規格決定。框架率可以利用單位 時間内框的數目或是大略數目表示,例如3〇赫茲,對於標 準AES3而言約略對應到每3,2〇〇個字一個框架。框架率幫 助解碼H維持同步以及輸人編碼後資料的有效緩衝暫存。 產生用以指示區段與區段間邊界的區段資料。這包括 指示控制區段350、聲音區段36〇、第一子區段37〇與第二 子區段3 80的邊界。在可標度編碼流程4〇〇的替代實施例 中,包括例如多頻道聲音框架的額外子區段。可以提供額 外的聲音區段以降低框架中控制資料的平均容積,這可以 透過將多數個框架的聲音資訊組合到一較大的框架中達 成。對於例如需要聲音頻道較少的聲音應用可以將一子區 段省略。與額外子區段或是省略子區段相關的資料可以經 由區段資料提供。層級31〇、32〇與33〇各自的深产 (depth)L,Μ,N可以經由相似的方式指定。較佳的情況 疋將日疋為16以支援與一般的丨6位元數位訊號處理界的 向後相谷性(Backward Compatibility)。在較佳的情況中 應將Μ以及N都指定為4以支援AES3標準指定的可標度資 料頻道準則。為了能在解碼架構中適當地建構,指定 度最好不以框架資料的方式直接傳載,而是在編碼時推 定。 生成指示編碼動作參數的參數資料。這些參數指示利 用哪一個種類的編碼動作將資料編碼成框架。參數資料的 本紙張尺度適用中國國家標準(CNS)A4規格(21Q X 297公董) '"""I""""34 '— ------- ^--------^--------- (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 526470
經濟部智慧財產局員工消費合作社印製 五、發明說明(:?2 第一個可能的值可以是用來指示核心層級3 i 0係根據公開 的ATSC AC-3位元串流規格編碼,ATSC AC-3規格係在文 件 Advanced Television Standards Committee (ATSC) A52 (1994)中規範。參數資料的第二個可能的值,可以是用來 指示核心層級31〇係根據實現在1)〇11^1)4忖810解碼器與 編碼器上的感知編碼技術編碼。Dolby Digital®解碼器血 編碼器可以從美國加州舊金山的杜比實驗室公司公司處購 得。本發明可與許多種類的感知編碼與解碼技術相配合利 用。關於這些感知編碼與解碼技術各個方面的資訊係揭露 在美國專利號碼 5,913,191(Fielder),5,222,189(Fielder), 5,109,417(Fielder 等人),5,632,003 (Davidson 等人), 5,583,962(Davis 等人),5,623,577 (Fielder),與 Ubale 等人 所提出申請的美國專利申請序號〇9/289,865申請案中。對 於貫施本發明而言,並沒有哪一種特別的感知編碼或解碼 技術是一定必須的。 產生一或多個錯誤偵測碼保護在核心層級部分3 $ 2的 資料,如果資料容量允許的話,也同時保護核心層級31〇 的核心層級部分372與382。相對於框架340的其餘部分, 核心層級部分352最好是有較為周到的保護,因為所有在 編碼後資料串流中與框架340同步,以及剖析每一個框架 340的核心層級310所需的重要資料,都包括在核心層級部 分352裡。 在本發明的此一實施例中,資料係透過以下方式輪出 到一個框架中。第一編碼後訊號FCS—L與FCS—R係分別輸 -----------^--------^--------- (請先閱讀背面之注意事項再填寫本頁) 526470
五、發明說明(尸 (請先閱讀背面之注意事項再填寫本頁) 出到核。層級部分372與382。第_餘數訊號frs_L,frs—r 係分別輸出到第—附加層級部分372,384,而第二餘數訊 號SRS—L,SRS—R則分別輸出到帛二附加層級部分376, 386這可以透過將訊號FCS—L fcs l,fRS R, — — _ -SRS—R起進行多工選擇(muitipiex),產生每一 個字的長度為L+M+N的串流,例如訊號FCS—:由前:位元 攜載,FRS—L則由接著的峰元攜載,而从8』則由最後 的N位元攜載’訊號Fcs一R,frs—r,srs—r也透過相同 的方式傳遞。此字的串流序列性地輸出至聲音區段36〇。 同步字、格式資料、區度資料、參數資料與資料保護資訊 則輸出到核心層級部分352。附加層級32〇與33〇的額外控 制貧訊則在它們各自的層級32〇與33〇中提供。 經濟部智慧財產局員工消費合作社印製 根據可標度編碼流程4〇〇的較佳實施例,核心層級的 每一個子頻訊號表示成包括一縮放係數與一或多個經過縮 放代表每一個子頻訊號元素的值在内的方塊縮放型式 (Block-scaled Form)。例如每一個子頻訊號可以表示成方 塊浮點(Block-floating Point),其中方塊浮點的指數部分 疋縮放係數,而每一個子頻訊號則表示成浮點的整數部 分。基本上任何型式的縮放都可以用。為了幫助編碼後資 料串流的剖析以回復縮放係數以及縮放後數值(Scaled Value),可以將縮放係數編碼到資料串流的各個框架裡預 先建立的位置上’例如在聲音區段360的每一個子區段37〇 與380的起始處。 在較佳的實施例中,縮放係數提供子頻訊號的能量度 36 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 526470 A7
I
I
I
I
I 訂 526470 A7 B7
經濟部智慧財產局員工消費合作社印製
K-!個層級的資料高的解析度,丨中〖為―大以且不大於 總層級數的整數。 在步驟511中根據流程選擇_解碼的解析度,並決 定出與選定的解析度相搭配的層級。如果資料串流有經過 修正以移除㈣或是禁止資料樣式,應要將修正的效應反 轉。在步驟5 13處,搭載於選定層級上的資料與每—前續 (predecessor)層級的資料組合,並在步驟515處根據將聲 音訊號編碼成對應解析度的編碼流程的相反動作,進行解 碼。與較選定的解析度高的解析度相關聯的層級可以透 過,例如訊號路由線路將其移除或是忽略。在解碼之前, 應先進行所有反轉縮放效應所需的動作。 現在要言兒明的是透過處理系統1〇〇將可標度解碼流程 實施到經由標準AES3資料頻道接收的聲音資料的一個實 施例。標準AES3資料頻道經由一系歹,24位元寬的字元 的提供資料,字元的每-個位元可以方便地利用範圍從〇_ 表示最高效位元--到23 _最低效位元—的位元數目表示。 標記bits(n〜m)在此處係用以表示一個字元的到 b^m) ’其中為整數,且m>n,·3資料頻道根據 本發明的可標度資料頻道3〇〇切分成—系列如框架34〇的框 架。核心層級M0包括bits(0〜15),第一附加層級32〇包括 bits(16〜19)而第二附加層級33〇則包括bits(2〇〜23)。 層級310,320,330的資料經由處理系統1〇〇的聲音輸 入/輸出介面140接收。依照解碼指令程式,處理系統1〇〇 在資料串流中搜尋16位元同步樣式,以將其處理動作
本紙張尺度適用中國國家標準(CNS)A4規格(21〇 χ 297公釐)
^--------tr---------. (請先閱讀背面之注意事項再填寫本頁) 526470 經濟部智慧財產局員工消費合作社印製 A7 B7 五、發明說明(严 " 個框架的邊界切齊(align),並連續地(serially)將由同步樣 式起始的資料切分成表示為^以(〇〜23)的24位元寬字元i 任何反轉避免保留樣式所做修正的效應所需的處理都可以 在這時候進行。 讀進核心層級310中事先建立的位置以取得格式資 料、區段資料、參數資料、偏移量、以及資料保護資訊。、 處理錯誤偵測碼以偵測核心層級部分3 5 2内之資料的任何 錯誤。如果發現錯誤,可以將對應的聲音閉鎖或是重新傳 輸資料,接著剖析框架340以取得接續解碼動作的資料。 僅解碼核心層級310時,在步驟511選擇16位元解析 度。讀取第一與第二聲音子區段37〇 , 38〇的核心層級部分 372與382中建立的位置以取得編碼後子頻訊號元素,在利 用方塊縮放表示的較佳實施例中,先取得每一子頻訊號的 方塊縮放係數,並利用這些係數產生與編碼時所用的相同 編輯遮罩曲線AMC一L,AMC一R。針對從核心層級部分352 項出的母一個頻道,經由將編輯遮罩曲線Amc L與 AMC一R偏移對應的偏移量〇丨—l與Oi—R,產生聲音頻道 CH-R與CH—L的第一需求雜訊頻譜。透過與編碼流程4〇〇 相同的方式為聲音頻道決定第一量化解析度q丨_L與 Q1 —R。到此處’處理糸統1 〇〇就可以分別決定聲音子區段 370與380的核心層級部分372與3 82的編碼後縮放值的位置 以及長度’該編碼後縮放值係表示子頻訊號元素的縮放 值。接著編碼後縮放值從子區段370與380經過剖析,並與 相對應的子頻道縮放係數組合以取得聲音頻道CHJL與 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 39 Μ--------tr--------- (請先閱讀背面之注意事項再填寫本頁) 526470
經濟部智慧財產局員工消費合作社印製 CH—R的置化後子頻訊號元素,量化後子頻訊號元素接著 被轉換成數位聲音帛流。此轉換係透過運用_與編碼處理 時所用的分析濾波器組相互補的合成過濾器庫達成。數位 聲音串流代表左右聲音頻道CH—L與CH—R。這些數位訊號 可以經由數位到類比轉換,轉換成類比訊號,此等轉換可 以藉助一般的方式實施。 核心以及第一附加層級31〇、32〇可以透過以下方式解 碼。在步驟511處,選擇2〇位元編碼解析度。如之前所描 述的方式取得核心層級31〇的子頻訊號元素。從控制區段 350的附加層級部分354讀出額外的偏移量〇2一乙。經由將 左聲音頻道CH一L的第一需求雜訊頻譜偏移〇2jl產生第二 需求雜訊頻譜。根據得到的雜訊頻譜,藉由與之前描述過 的根據編碼流程400進行的第一附加層級感知編碼相同的 方式,決定第二量化解析度(^2—L。這些量化解析度q2_l 指不附加層級部分374中,餘數訊號RES1—L的每一個組成 的長度以及位置。處理系統丨〇〇讀取各自的餘數訊號,並 且在步驟513處,透過將餘數訊號RES1JL與從核心層級310 處取得的量化後表示組合,取得量化後子頻訊號元素的縮 放後表示。在本發明的此一實施例中,此係透過2的補數 加法完成,其中加法係藉由子頻訊號元素基底實施在一子 頻Λ唬tl素上。量化後子頻訊號元素從每一子頻訊號的縮 放後表示中取出,並接著經過適當的訊號合成流程轉換, 產生每一頻道的數位聲音串流,藉由數位到類比轉換,可 以將數位聲g串流轉換成類比訊號。核心層級與一以及 本紙張尺度適时國國家標準(CNS)A4規格(21〇 χ撕公髮)---~4〇 --- 裝--------訂--------- (請先閱讀背面之注意事項再填寫本頁) 526470 經濟部智慧財產局員工消費合作社印製 A7 五、發明說明(f 第二附加層級310,320,330可以經過與上述方式相似的 方式解碼。 現在請參照第6 A圖’其中顯示的是根據本發明的可 標度聲音編碼框架的一個替代實施例700。框架700定義一 24位元寬的AES3資料頻道701的資料容量配置。aES3資 料頻道包括一系列的24位元寬字元。AES3資料頻道包括 一核心層級710與標示為中間層級720與細微層級730的兩 個附加層級。核心層級710佔有各字元的bits(l〜15),而中 間層級720佔有各字元的bits(l6〜19)而細微層級730則佔有 各字元的bits(20〜23)。因此細微層級730佔有AES3資料頻 道的最低效4位元,而中間層級720則是該資料頻道的接續 4個低效位元。 資料頻道7 01的資料容量被配置支援在複數個解析度 解碼聲音,這些解析度在此處分別指由核心層級71〇所支 援的16位兀解析度,核心層級71〇與中間層級72〇的聯集所 支援的20位元解析度,以及由三個層級71〇,72〇,了川的 集合所支援的24位元解析度。應該瞭解的是上述每一個解 析度的位元數指的是每一層級在傳輸或儲存時各自的容 里,而非罝化解析度或是攜載在各個層級中用以表示編碼 後聲音訊號的符號的位元長度。因此所謂的「16位元解析 度」係對應到基本解析度的感知編碼,而且通常在解碼與 播放時可以察覺到較16位元PCM聲音訊號精準。同樣地了 2〇輿24位元解析度分別對應到解析度漸高的感知編碼,而 且通常可以分別出比對應的2〇與24位元峨聲音編碼精 本紙張尺度適用中國國家標準(CNS)A4規格(21G X 297公髮)" ------- -----------^裝--------訂--------- (請先閱讀背面之注意事項再填寫本頁) 526470 A7 經濟部智慧財產局員工消費合作社印製
五、發明說明(f 準。 框架700係分成一連串的區段,其包括一同步區段 740 ,標注資料區段75〇,聲音區段76〇,以及可選擇性包 括一標註資料延伸區段77〇,聲音延伸區段78〇與一計量區 段790。標註資料延伸區段77〇和聲音延伸區段78〇相互依 存且適當地,其可兩者都包括到也可都沒包括到。在這框 架700的實施例中,每個層級71〇、72〇、73〇中的個區段均 包括這些部分。現在再參考第6]8、6C、6D圖所示概圖, 其為聲音以及聲音延伸區段76〇和78〇,標註資料區段75〇 和標註資料延伸區段77〇的較佳結構概圖。 在同步區段740中,bits(0〜15)搭載一 16位元的同步 式,bits(16〜19)搭載中間層級72〇的一或多個錯誤偵測碼 而bits(20〜23)則搭載細微層級73〇的一或多個錯誤偵 碼。發生在附加資料的錯誤通常僅會產生徽弱的可聽覺… 應,因此每一附加層級的的資料保護僅限 己節省鳩3資料頻道的資料容量。附加層級72〇;;= 料的額外保護可以透過下述方式藉由標註資料區段75〇與 標註資料延伸區段770提供。對於每一個別的附加層級72〇 與730可以選擇性地指定兩個不同的資料保護值。每― 都對各自的層級720與730提供資料保護◊資料保護的第 個值表示聲音區段760各自的層級以預先決定的方式 如切齊後設定--設定,資料保護的第二個值表示,搭載: 標註資料區段750上的指標係指示附加資料在聲音區段彻 各自的層級中儲存的位置,而且如果包括聲音延伸區段彻 本紙張尺度ΐΐ用中國國家標準(CNS)A4規格(210 X 樣 測 效 個 例 ------------裝--------訂---------- (請先閱讀背面之注意事項再填寫本頁) 526470
經濟部智慧財產局員工消費合作社印製
本紙張尺度_中國國家標準(CNS)A4規格(21G X 297公爱) 在内’標註資料延伸區段770裡的指標指示的是附加資料 係搭載在聲音延伸區段780各自的層級的哪裡。 聲音區段760大體上與前面介紹的框架390的聲音區 段3 60相似。聲音區段760包括第一子區段761與第二子區 段7610,第一子區段761包括一資料保護區段767,四個頻 道子區段(CS—0,CSJ,CS一 2,C—3),分別構成第一子區 段761的子區段763,764,765,766,且選擇性地包括一 月!I置762。頻迢子區段對應到多頻道聲音訊號的四個個別 的聲音頻道(CH_0,CHJ,CH_2,。 在選擇性的前置762中,核心層級71 〇搭載一禁止樣式 鍵值(ΚΕΥ1 一 C),避免藉由核心層級71〇搭載的第一子區段 的該部分有禁止樣式,中間層級720搭載一禁止樣式鍵值 (ΚΕΥ1 一I),避免籍由中間層級72〇搭載的第一子區段的該 部分出現禁止樣式,細微層級73〇搭載一禁止樣式鍵值 (ΚΕΥ1 一F),避免藉由細微層級73〇搭載的第一子區段的該 部分出現禁止樣式。 在頻道子區段CS一0中,核心層級710搭載聲音頻道 CH一0的第一編碼後訊號,中間層級72〇搭載聲音頻道〇 的第一餘數訊號,而細微層級73〇則搭載聲音頻道ch—〇的 第二餘數訊號。在較佳的情況中,它們應利用經過以下方 式修改過的流程400編碼到每一個對應的層級。頻道區段 CSJ’ CS 一2, CS—3以相似的方式分別搭載聲音頻道, CH一2,CH—3 的資料。 在資料保護區段767中,核心層級71〇搭載藉由核心層 43
Μ--------tr---------^w- (請先閱讀背面之注意事項再填寫本頁) 526470 經濟部智慧財產局員工消費合作社印製 A7 五、發明說明(fi 、、及7101合載的第一子區段的該部分的一或多個錯誤摘測 碼,中間層級720搭載藉由中間層級720搭載的第一子區段 的該部分的一或多個錯誤偵測碼,細微層級73〇則搭載藉 由細徽層級730搭載的第一子區段的該部分的一或多個錯 誤债測碼。在此實施例中,資料保護較佳的方式是利用循 環冗碼(Cyclic Redundancy Code,CRC) 〇 第二子區段7610類似地包括一資料保護區段767〇,四 個頻道子區段(CH一4,CH_5,CH_6,CH—7),其分別構 成第一子區段7610的子區段7630,7640,7650,與7660, 且選擇性地包括一前置7620。第二子區段7610以類似於子 區段761的方式設定。聲音延伸區段78〇像聲音區段76〇類 似地設定,且在單 個框架中,允許有兩個或更多的聲 音區段,所以可能會減少標準AES3資料頻道的延伸資料 容量。 標註資料區段750的設定方式如下。經由核心層級71〇 格載的该部分標註資料區段7 5 0包括一標頭區段7 51、一框 架控制區段752、一標註資料子區段753、以及一資料保護 子區段754。經由中間層級720搭載的該部分標註資料區段 750包括一中間標註資料(intermediate metadata)子區段 755、 以及一資料保護區段757 ’而經由細微層級730搭載 的該部分標註資料區段750則包括一中間標註資料子區段 756、 以及一資料保護區段758。層級間的資料保護子區段 754,757,758不見得需要切齊,但是最好是位於各自層 級的末端或是預先決定的位置。 ------------裝--------訂--------- (請先閱讀背面之注意事項再填寫本頁) 526470 A7 經濟部智慧財產局員工消費合作社印製 五、發明說明(f 私頭75 U合載指示程式設定以及框架率的格式資料。 框架控制區段752則搭載指定區段間邊界,同步、標註資 料子區段的邊界,以及聲音區段74〇, 75〇, 76〇的邊界= 區段資料。標註資料子區段753,755,756則分別搭載參 數資料,該參數資料指示將聲音資料編碼到核心、中間、 與細微層級710,720 , 73〇的編碼動作的參數。這指示該 利用何種型別的編碼動作編碼各層級。較佳的情況是對各 層級利用相同型別的編碼動作,並調整解析度以反應各層 、’及的相對為料谷畺,可以選擇性地藉由核心層級搭載 中間以及細微層級720,730的參數資料。但核心層級71〇 的所有參數資料最好僅包含在核心層級71〇中,以讓我們 可以透過例如訊號路由線路將附加層級72〇,〇移除或是 忽略,而不影響到我們解碼核心層級71〇。資料保護區段 754,757,758分別搭載保護核心、中間、細微層級71(), 720 ’ 730的一或多個錯誤偵測碼。 標註資料延伸區段77〇大體上是與標註資料區段75〇 相類似,所不同的僅在於標註資料延伸區段77〇不包括一 框架控制區段752。區段間的邊界與標註資料延伸子區段 以及聲音延伸區段770,780的邊界係藉由它們與標註資料 以及聲音區段750,760大體上的相似加上搭載於標註資料 #又7 5 0的框架控制區段7 5 2上的區段資料決定。 選擇性的計量區段790搭載框架700上編碼後聲音資 料的平均振幅。尤其當聲音延伸區段78〇省略時,計量區 段790的bits(0〜15),係記錄聲音區段760的bits(0〜15)所搭 本紙張尺度適用中國國家標準(CNS)A4規格(21〇 χ 297公釐) 45 (請先閱讀背面之注意事項再填寫本頁) 裝--------訂---
I I I 五、發明說明(f 載的編碼後聲音資料的平均振幅表示,而bits(16〜19)與 bltS(20〜23)則分別搭載指定為中間計量器(Μ-e Meter,IM)與細微計量器(fine酬…FM)的延伸資料。 例如麗可以是搭載在聲音區段的bits〇6〜i9)的編碼後 聲音資料的平均振幅,而FM則是搭載在聲音區段76〇的 bltS(20〜23)的編碼後聲音資料的平均振幅。如果是包括聲 音延伸區段780在内,平均振幅麗以及請較佳的情況是 反應該區段780對應的層級搭載的編碼後聲音。計量區段 790支援解碼時平均聲音振幅的顯示。這對於正確解碼而 言並不那麼重要,因此可以省略以節省AES3資料頻道的 資料容量。 要將聲音資料編碼到框架7〇〇中,最好是藉由經過下 述方式修正的可標度編碼流程4〇〇與42〇進行。接收到8個 頻道的每-頻道的聲音子頻訊號。這些子頻訊號最好是藉 由對時域聲音資料人個對應頻道的樣本的方塊施以方塊轉 換,並且將轉換係數兜成群組以形成子頻訊號。每一個子 頻訊號都表示成針對子頻的每一係數都有一方塊指數與整 數的方塊浮點型式。 具有某一位元長度的子頻指數的動態範圍可以藉由 為一群組子頻訊號建立一「主控指數」做到。屬於該群組 的子頻的指數與某一門檻值作比較,決定相關聯的主控指 數的值例如’若該群組的每一子頻指數都較門檻值3大, 則主控指數的值設定為〗,而相關的子頻指數則減去3,不 然’主控指數的值則設定為0。 526470 A7 ------ B7 經濟部智慧財產局員工消費合作社印製 五、發明說明(f 在前面簡單介紹過的「增益-適應」量化技術也可以 使用,在一個實施例中,依照每一子頻訊號的整數部分是 否在強度上大於1/2,將整數部分分配給兩個群組。小於 或等於1 /2的整數部分被放大兩倍以減少表示它們所需的 位元數’整數部分的量化經過調整以反應此一兩倍放大。 整數部分也可以分配給多於兩個群組。例如可以根據整數 口P刀的值係介於〇〜1/4,1/4〜1/2,1/2〜1分配到3個不同的 群組’在每一群組分別放大4,2,1倍,並依照此進行量 化以節省額外的資料容量。進一步的資訊可以由前述的美 國專利申請案中取得。 產生每一頻道的編輯遮罩曲線。每一編輯遮罩曲線可 能取決於多個頻道的聲音資料—在此實施例中,最多有8 個頻道-而不僅是一或兩個頻道而已。利用這些編輯遮罩 曲線以及前述對整數部分量化的修正,對每一頻道施以可 標度編碼流程400。利用迭代流程420決定每一層級編碼的 適合量化解析度。在此一實施例中,編碼範圍指定為相對 於對應的編輯遮罩曲線約-144 dB到+48 dB的範圍。流程 400與420所產生的每一頻道的第一編碼後訊號以及第一與 第二餘數訊號接著經過分析已決定聲音區段76〇的第一子 區段761 -同樣地第二子區段761〇也以相似的方式―的禁 止樣式鍵值KEY1—C,KEY1一I,KEY1 F。 為多頻道聲音的第一方塊產生標註資料區段75〇的控 制資料。以除了忽略第二方塊的區段資料外,相似於上= 的方式為多頻道聲音的第二方塊產生標註資料延伸區段
(請先閱讀背面之注意事項再填寫本頁) 裝--------訂
讎 I I I MM I p. 526470 A7 B7 五、發明說明(f 濟 部 智 慧 財 產 局 員 工 消 費 合 作 社 印 製 7 7 0的控制資料。如前所述,這些分別經過各自的禁止樣 式鍵值修正,並分別輸出到標註資料區段與標註資料 延伸區段770。 别述的流程也對八個聲音頻道的第二方塊實施,並且 以類似於在聲音延伸區段78〇的方式輸出產生的編瑪後聲 音。除了沒有為第二方塊產生區段資料外,也以基本上相 同於此等第-個方塊的方式為多頻道聲音的第二方塊產生 控制料。此控制資料輸出在標註延伸資料區段77〇。 在同步區段740的bits(G〜15)輸出—同步樣式“分別產 生兩個4位元寬的中問層級以及細微層級720, 730的錯誤 债測碼’並且分別輸出到同步區段74〇的一16〜19)以及 bitS(2〇〜23)。發生在附加層級的錯誤通常僅會產生微弱的 可L見效應’因此每-附加層級的資料保護僅限定在*位 元的碼已節省AES3資料頻道的資料容量。 根據本發明’錯誤偵測石馬可以具有預先設定且要保 貢料的位元樣式無關的值’如“〇〇〇1'透過檢驗錯誤伯 碼本身是否毀損以提供錯誤❹彳,如果錯㈣測碼毀損 讀’便假設在層級中的盆它眘极L曰丁幻^、匕貝枓也是毀損的,此時系統 新取得該資料或是錯誤閉鎖’―較佳的實_,針對每一 附加層級會指定多個預先決定的錯誤價測碼,料碼也只 是該層級的設定’ 一第一錯誤谓測碼,例如“刪”,指示 f層級具有預先決定的設定,例如切齊的設定。-第二錯 誤偵測碼,例如“ 100 1 ”,砉+兮 表不该層級具有分散式設定,且 指標或是其餘的資料被輸出到標註資料區段750或是其它 訂 護 測 的 重 % 本紙張尺度翻+關家鮮(CNS)A4規格(21G x 的位置以指示該層級資料 程中俨指,而η 2 政樣式。-個碼在傳輸的過 又、 另一個碼的可能性相當地低,因為兮 的兩個位元必須在不毁損其餘的位元的情況下毁 :-實施例基本上係能免除單—位元的傳輸錯誤。、此外, 解碼附加層級時的錯誤通常最多僅會造成細微的可聽覺效 果。 在本發明的另一個實施例中,利用其餘型式的滴編碼 ntr〇Py Codlng)進行聲音資料的壓缩。例如在—個替代 的實施例中’―16位元的熵壓縮流程產生輸出在核心層級 輯縮聲音資料。在較高解析度的資料編碼重複上述流 程以產生-試驗編碼後訊號(Trialc〇ded si㈣)。將此試 驗編碼後訊號與壓縮後聲音資料組合產生一試驗餘數訊 號。重複這流程直到試驗餘數訊號有效地利用完第一附加 層級的資料容量,並將試驗餘數訊號輸出到第—附加層 級,透過再次增力口熵編碼的解析&,為一第二層級或是更 多額外的附加層級重複上述流程。 經濟部智慧財產局員工消費合作社印製 當在檢閱此一專利申請案時,對於熟悉此領域技藝的 人而言,許多本發明的修正以及本發明的各種變化是相當 顯而易見的。此等修正以及變化都當包括在本發明中,而 本备明當僅受限於以下的申請專利範圍。 元件標號對照表 處理系統 匯流排 100 116 110 程式控制處理器 120 唯讀記憶體 526470 !
五、發明說明(f 140 聲音輸入/輪出介面 152 中央處理單元 154 硬碟 156 接頭 158 匯流排 250 資料頻道 、220、222 步驟 270 控制區段 272 字 經濟部智慧財產局員工消費合作社印製 130 隨機存取記憶體 150 電腦實施系統 153 隨機存取記憶體 155 輸入設備 157 輸出設備 200 流程 210、212、214、216、218 260 框架 280 聲音區段 274 其餘部分 310 核心層級 330 苐二附加層級 350 控制區段 354 第一附加層級部分 360 聲音區段 372 核心層級部分 376 第二附加層級部分 382 核心層級部分 386 第一附加層級部分 392、394、396 攔位 402 、 404 、 406 、 408 、 410 420 流程 422 、 424 、 426 、 428 、 430 511、513、515 步驟 300 可標度資料頻道 320 第一附加層級 340 框架 352 核心層級部分 356 第二附加層級部分 370 第一子區段 374 第一附加層級部分 380 第二子區段 384 第一附加層級部分 390 框架 400 可標度編碼流程 、412、414、416、418 步驟 500 可標度解碼流程 步驟 ------------^ --------訂--------- (請先閱讀背面之注意事項再填寫本頁) 50 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 526470 ; .V': κι _Β7 五、發明說明(f 經濟部智慧財產局員工消費合作社印製 700 框架 701 資料頻道 710 核心層級 720 中間層級 730 細微層級 740 同步區段 750 標註資料區段 751 標頭區段 752 框架控制區段 754、 757、758 資料保護子區段 753、 755、756 標註資料子區段 760 聲音區段 761 第一子區段 7610 第二子區段 762 前置 7620 前置 763〜766 子區段 7630 、7640 、 7650 、 7660 子區段 767 資料保護區段 7670 資料保護區段 770 標註資料延伸區段 780 聲音延伸區段 790 計量區段 (請先閱讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 51
Claims (1)
- 種可標度編碼方法,此方法使用具有一核心層級與 一附加層級的標準資料頻道,此方法包含·· 接收複數個子頻訊號; 回應一第一需求雜訊韻譜對每一個子頻訊號決定 一第一量化解析度,並根據各自的第一量化解析度量 化每一子頻訊號以產生一第一編碼後訊號; A回應一第二需求雜訊頻譜對每一個子頻訊號決定 二量化解析度,並根據各自的第二量化解析度量 化母一子頻訊號以產生一第二編碼後訊號; 產生指不第一與第二編碼後訊號間之餘數的一餘 數訊號;以及 與附加層級中 輸出核心層級中第一編碼後訊號 餘數訊號。 2. ’其中第一需求雜訊 決定的子頻訊號編輯 如申請專利範圍第1項所述之方法 頻譜係回應根據精神聲響學原則 遮罩特徵而建立。 3·如申睛專利範圍第1項所 .^ ^ ^ ^ K方去,其中第一量化解析 度的決定應使得根據所決定的 工相j g 第一量化解析度量化的 4 虎,都能符合核心層級的資料容量要求。 4·如申請專利範圍第1項所述之 號與餘數訊號以切齊設定的方式輪出、中第、、扁碼後Λ 5·如申請專利範圍第1項所述之方⑴。 料以指示有關第一編碼後訊^’其中輸出額外的資 (Configuration Pattern)。〜的餘數訊號的設定樣式-52 - 526470 !S 進一步 、申請專利範圍 6·如二請專利範圍第!項所述之方法,其中第:需求雜訊 頻暗偏移第—需求雜訊頻譜—實質地均量⑴训咖 ’並輸出此實質地均量的一個指示到標準資 料頻道。 7. 如申請專利範圍第i項所述之方法’其中第—編碼後訊 號包含複數個縮放係數(ScaleFact〇r),且餘數訊號藉 由第一編碼後訊號的縮放係數表示。 8. 如申請專利範圍第i項所述之方法,其中—被量化到對 應第二量化解析度的子頻訊號藉由包含-序列位元的 縮放值表示,且被量化到對應第一量化解析度的子頻 訊號藉由包含-子序列前述位元的縮放值表示。 9· 一種可標度編碼方法,此方法制—包含複數個層級 的標準資料頻道,此方法包含·· 接收複數個子頻訊號; 產生子頻訊號的-感知編碼以及_第二編碼; 產生-標示第二編碼相對於感知編碼餘數的餘數 訊號;以及 將感知編碼輸出到一第一層級,並將餘數訊號輸 出到一第二層級。 10.如申請專利範圍第9項所述之可標度編碼方法, 包含: 產生子頻汛號的一第三編碼; 產生-第二餘數訊號’此餘數訊號代表第三編碼 相對於至少感知編碼與第二編碼之一的餘數;以及 本紙張尺度適财關家標準(CNS) Μ規格⑵GX29?jjy•騫! (請先閱讀背面之注意事項再填寫本頁) .訂— 53 526470 'Ίτ: 補无 一一— _丨丨· 丨—申請專利範園 將第二餘數訊號輸出到-第三層級。 11·如申請專利範圍第9項眘祖相、音从人± I之了才示度編碼方法,其中的、λ ’、、付3聲音工程學合A · 的 AES3 標準,n ( ° Englneer-8 Society) 級,且第β ㈣料頻道的―16位元寬層 級。 與第三層級分別是資料頻道的4位元寬層 12.如申請專利範圍第9項所述之可標度編碼方法’進一 包含: 產生一錯誤偵測碼資料,此錯誤谓測碼資料指 與感知編碼相關的餘數訊號的設定;以及 將錯誤_碼資料輸出到標準資料頻道, 13’如申5月專利範圍第9項所述之可標度編碼方法丸合: 示 進一步 序列; 產生一序列的位元; 將该位元序列在標準資料頻道中輸出; 在一接收器處接收與輸出位元序列相對應的位 元 分析接受到的位元序列,決定該位元序列是否與 產生的位元序列相匹配;以及 曰應於分析結果,決定感知編碼與餘數訊號是否 包括傳輸錯誤。 女申明專利範圍第9項所述之可標度編碼方法,其中第 二編碼係響應於第一與第二層級聯集的資料容量產 生0 本紙張尺度適用中國國家標準(CNS) M規格⑵㈣幻公爱) 步、可| #: (請先閲讀背面之注意事項再填寫本頁) 、申請專利範圍 15·:種處理由多層級資料頻道搭載的資料的方法 責料頻道的-第-層級搭載—聲音 : 碼,且資料頻道的一第1級㈣附、的一感知編 m 載附加資料,用以增 加聲日訊號感知編碼的解析度,此方 且包含·· 用-解碼為, 經由資料頻道接收感知編碼與附加資料;以及 將聲音訊號的感知編碼路由到解碼哭。 Ή請專利範圍第15項所述之方法,進°—步包含解碼 聲音訊號的感知編碼。 Π.如申請專利範圍第15項所述之方法,進—步包含: 組合感知編碼與附加資料,產生一具有較聲音訊 號感知編碼解析度高的-第二聲音訊號編碼;以及 解碼聲音訊號的第二編碼。 队如申請專利範圍第17項所述之方法,其中感知編碼係 經由一遵守聲音工程學會(Audio Engineering s〇ciety) 的AES3標準的資料頻道的—核心16位元層級接收,且 其中附加資料至少經由資料頻道的一 4位元寬附加層級 接收。 19·如申請專利範圍第15項所述之方法,其中組合感知編 碼與附加資料包含: 辨識沿著資料頻道的複數個區段,此處的每一資 料頻道對應到一個別的聲音頻道;以及 將區段之一所搭載的感知編碼的每一部分與該區 段所搭載的附加層級的每一部分組合,產生代表其中 本紙張尺度適用中國國家標準(CNS) A4規格(210X297公釐) 55 (請先閲讀背面之注意事項再填寫本頁) 訂· Φ! 之一聲音頻道的一中間訊號。 士申明專利車已圍第17項所述之方法,其中組合感知4 碼與附加資料包含: 辨識〜著 > 料頻道的一個區段,此處的資料頻道 對應到單一聲音頻道; 處理附加資料,決定前述聲音頻道的一餘數的位 置,並且回復該餘數;以及 將此區段所搭載的感知編碼的每一部分與此餘數 Λ號組合,產生_中間訊號,此中間訊號以較聲音訊 號感知編碼高的解析度表示前述聲音頻道。 21· —種標準資料頻道的處理系統,此標準資料頻道具有 一核心層級與一附加層級,此處理系統包含: 一記憶體單元,儲存指令程式; 私式控制處理器,搭配來接收複數個子頻訊號, 以及與記憶體單元搭配接收程式,根據該程式,程式 控制處理器依照一第一需求雜訊頻譜為每一頻道決定 一各自的第一量化解析度,並且根據各自的第一量化 解析度將每一子頻訊號量化,產生一第一編碼後訊號, 依照一第二需求雜訊頻譜為每一頻道決定一各自的第 二量化解析度,並且根據各自的第二量化解析度將每 一子頻訊號量化,產生一第二編碼後訊號,產生一指 示第一編碼後訊號與第二編碼後訊號餘數的餘數訊 號,以及將第一編碼後訊號輸出到核心層級,將餘數 訊號輸出到附加層級。 56 本紙張尺度適用中國國家標準(CNS) Α4規格(210X297公釐) 526470 A8 1 B8 C8 ------------------ D8 六、申請專矛~ —-- 22·如申請專利範圍第21項所述之處理系統,其中響應於 程式,程式控制處理器依照精神聲響學原則決定子鎖 訊號的編輯遮罩特徵,並響應於決定的編輯遮罩特徵 建立第一需求雜訊頻譜。 23.如申請專利範圍第21項所述之處理系統,其中響應於 私式,程式控制處理器決定第一量化解析度,使得根 據所決定的第一量化解析度量化的子頻訊號,都能符 合核心層級的資料容量要求。 24·如申請專利範圍第21項所述之處理系統,其中響應於 程式,程式控制處理器以切齊設定的方式輸出第一編 碼後訊號以及餘數訊號。 25·如申請專利範圍第21項所述之處理系統,其中響應於 程式,程式控制處理器在資料頻道上輸出額外的資料, 這二額外 > 料扎示餘數訊號相對於第一編碼後訊號的 一設定樣式。 26.如申請專利範圍第21項所述之處理系統,其中響應於 程式,程式控制處理器藉由偏移第一需求雜訊頻譜一 個大體上均量決定一第二需求雜訊頻譜,並在標準資 料頻道上輸出一指示此一大體上均量的指示。 27·如申請專利範圍第21項所述之處理系統,其中響應於 程式,程式控制處理器產生代表第一編碼後訊號的複 數個縮放係數,並利用產生的縮放係數代表第一編碼 後訊號的縮放係數。 28.如申請專利範圍第21項所述之處理系統,其中量化到 本紙張尺度適用中國國家標準(CNS) A4規格(210X 297公楚) (請先閲讀背面之注意事項再填寫本頁) 訂· 57 六、申請專利範圍 各自的量化解析纟的一子頻訊號藉由包含一序列 位元的縮放值表示,且量化至各自的第_量化解析度 的子頻訊號藉由包含前述位元的子序列的另一縮放值 表不。 29.:種多層級資料頻道的處理系統,其中資料頻道的一 第層、、及搭載一聲音.訊號一感知編碼,資料頻道的一 第二層級搭载用於增加聲音訊號感知編碼的解析度附 加資料,此處理系統包含: 路由電路,經由資料頻道接收感知編碼與附加資 料的訊號; 一把憶體單元,儲存指令程式;以及 一程式控制處理器,與訊號路由線路搭配接收感 知編碼與附加資料,以及與記憶體單元搭配接收程式, 根據該程式,產生一解碼後訊號。 30·如申請專利範園第29項所述之處理系統,其中程式控 制處理器解碼聲音訊號的感知編碼,產生解碼後訊號。 31·如申請專利範園第29項所述之處理系統,其中程式控 制處理器: 組合感知編碼與附加資料,產生一具有較聲音訊 5虎感知編碼解折度高的一第二聲音訊號編碼;以及 解碼聲音訊號的第二編碼產生編碼後訊號。 32·如申請專利範園第29項所述之處理系統,其中訊號路 由練路係經由一遵守聲音工程學會(Audi〇 Engineering Society)的AES3標準的資料頻道的一核心16位元層、級 58 本紙張尺度適用中國國家標準(CNS) A4規格(210X297公楚:) /、、申清專利範圍 且左由至J身料頻道的一 4位元寬附加層級接收 附加資料。 33·如申請專利範圍第29項所述之處理系統,其中程式控 制處理器: 辨識著貝料頻道的複數個區段,此處的每一資 料頻道對應到-個別的聲音頻道;以及 ^將區知之一所搭載的感知編碼的每一部分與該區 段所搭載的附加層級的每一部分組合,產生代表其中 之一聲音頻道的一中間訊號。 士申明專利耗園第29項所述之處理系統,其中程式控 制處理器: 辨識沿著資料頻道的一個區段,此處的資料頻道 對應到單一聲音頻道; 處理附加資料,決定前述聲音頻道的一餘數的位 置,並且回復該餘數;以及 將此區段所搭載的感知編碼的每一部分與此餘數 K號、、且&,產生一中間訊號,此中間訊號以較聲音訊 唬感知編碼高的解析度表示前述聲音頻道。 35· —種可由機器讀取之媒體,此媒體搭載一可藉由機器 執仃的指令程式實施一編碼方法,此編碼方法利用具 有一核心層級與一附加層級的一標準資料頻道,此方 法包含: 接收複數個子頻訊號; 依照一第一需求雜訊頻譜為每一子頻道訊號決定 526470、申請專利範厕 -各自的第-量化解析度,並且根據各自的第一量化 解析度將每—子頻訊號量化,產生一第一編碼後訊號; 依知、第一需求雜訊頻譜為每一頻道決定一各自 的第二量化解析度,並且.根據各自的第二量化解析度 將每一子頻訊號量化,產生一第二編碼後訊號; 產生一指示第一編碼後訊號與第二編碼後訊號餘 數的餘數訊號;以及 將第一編碼後訊號檢出到核心層級,將餘數訊號 輸出到附加層級。 36·如申請專利範園第35項所述之媒體,子頻訊號的編輯 遮罩特徵的決定係是依照精神聲響學原則,且響應於 決定的編輯遮罩特徵建立第一需求雜訊頻譜。 37·如申請專利範圍第35項所述之媒體,其中第一量化解 析度的决疋應使得根據所決定的第一量化解析度量化 的子頻汛號,都能符合核心層級的資料容量要求。 38. 如申請專利範圍第35項所述之媒體,其中以切齊設定 的方式輸出第一編碼後訊號以及餘數訊號。 39. 如申請專利範圍第35項所述之媒體,#中輸出額外的 貧料,這些額外資料指示餘數訊號相對於第一編碼後 訊號的一設定樣式。 40. 如申請專利範圍第35項所述之媒體,其中第二需求雜 讯頻譜係是偏移第一需求雜訊頻譜一個大體上均量, 亚在標準資料頻道上輸出一此一大體上均量的指示。 41·如申請專利範圍第35項所述之媒體,其中第一編碼後 -60 (請先閲讀背面之注意事項再填寫本頁) 、tr— 本紙國國家標準赠丁 526470 A8 B8 C8 m4 訊號包含複數個縮放係數,並利用第一編石馬後訊號的 縮放係數表示餘數訊號。 42·如申請專利範園第35項所述之媒體,其中量化到各自 的第二量化解析度的一子頻訊號藉由包含一序列位元 的一縮放值表示,且其中量化至各自的第_量化解析 度的子頻訊號藉由包含前述位元的子序列的另一縮放 值表示。 43. —種可由機器讀取之媒體,此媒體搭載一可藉由機器 執行的指令程式以進行一種處理藉由一多層級資料頻 道搭載的資料的方法,其中資料頻道的一第一層級搭 載一聲音頻道的一感知編碼,且資料頻道的一第二層 級格載附加資料,用以增加聲音訊號感知編碼的解析 度,此方法利用一解碼器,且包含: 經由資料頻道接收感知編碼與附加資料;以及 將聲音訊號的感知編碼路由到解碼器。 44. 如申請專利範園第43項所述之媒體,進一步包含解碼 聲音訊號的感知編碼。 45·如申請專利範圍第43項所述之媒體,進一步包含: 組合感知編碼與附加資料,產生一具有較聲音訊 號感知編碼解析度高的一第二聲音訊號編碼;以及 解碼聲音訊號的第二編碼。 且 46·如申請專利範圍第43項所述之媒體,其中感知編碼係 經由一遵寸聲音工程學會(AU(ji〇 Engineering Society) 的AES3標準的資料頻道的一核心16位元層級接收, 61 (請先閲讀背面之注意事項再填寫本頁) 、^τ· 本紙張尺度適用中國國家標準(cns) A4規格(21〇><297公楚) 526470 申請專利範園 其中附加資料至少您+ · 、、、由貝料頻道的一4位元寬附加層級 接收。 47.如申請專利範圍第 罘45項所述之媒體,其中組合感知編 碼與附加資料包含: 辨識沿著資料頻道的複數個區段,此處的每一資 料頻道對應到-個別的聲音頻道;以及 將區段之一所攜載的感知編碼的每一部分與該區 段所攜载的附加層級的每一部分組合,產生代表其^ 之一聲音頻道的一中間訊號。 48·如申請專利範圍第45項所述之媒體,其中組合感知編 碼與附加資料包含·· 辨識沿著資料頻道的一個區段,此處的資料頻道 對應到單一聲音頻道; 處理附加資料,決定前述聲音頻道的一餘數的位 置,並且回復該餘數;以及 將此區&所攜載的感知編碼的每一部分與此餘數 訊號組合,產生一中間訊號,此中間訊號以較第一編 碼後訊號高的解析度表示前述聲音頻道。 49. -種可由機器讀取之媒體,此媒體攜載編碼後聲音資 訊,此編碼後聲音資料係以一包含下列步驟的編碼方 法產生: 接收複數個子頻訊號; 回應一第一需求雜訊頻譜分別為每—個子頻訊號 決定-第-量化解析度,並根據各自的第一量化解析 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297&^)訂— (請先閲讀背面之注意事項再填窝本頁) 62 526470 A8 B8 C8 D8 申請專利範圍 度量化每一子頻訊號以產生一第一編碼後訊號; 回應一第二需求雜訊頻譜分別為每一個子頻訊號 決定一第二量化解析度,並根據各自的第二量化解析 度量化每一子頻訊號以產生一第二編碼後訊號; 產生指示第一與第二編碼後訊號間餘數的一餘數 訊號;以及 輸出第一編碼後訊號到核心層級,並且將餘數訊 號檢出到附加層級。 50.如申請專利範園第49項所述之媒體,其中第一需求雜 訊頻譜係回應根據精神聲響學原則決定的子頻訊號編 輯遮罩特徵而建立。 51·如申請專利範圍第49項所述之媒體,其中第一量化解 析度的決定應使得根據所決定的第一量化解析度量化 的責料容量要求。 52. 如申請專利範園第49項所述之媒體,#中第一編碼後 訊號與餘數訊號以切齊設定的方式輪出。 53. 如申請專利範園第49項所述之媒體,纟中輸出額外的 資料以私示有關第一編碼後訊號的餘數訊號的設定樣 式。 54. 如申請專利範圍第49項所述之媒體,丨中第二需求雜 訊頻譜偏移第-需求雜訊頻譜一基本上均量,並輸出 此基本上均量的π個指示到標準資料頻道。 55•如申請專利範園第49項所述之媒體,丨中第—編碼後 訊號包含複數個縮放係數,且餘數訊號藉由第一編瑪 (請先閲讀背面之注意事項再填寫本頁) -訂— •9,63 526470 年月η 常止補无 Α8 Β8 C8 D8本紙張尺度適用中國國家標準(CNS) Α4規格(210 X 297公釐) 64 Ψ (請先閲讀背面之注意事項再填寫本頁) 訂— Φ 526470 狀面影1/7 100 處理系統J 第1A圖 電腦實施系統第1B圖 340 526470 '7. 可標度資料頻道 300' K- 3/7 340, 360 350 370 380 Λ 310 Λ 320 330 352 372 382 '核心層級部分 核心層級部分 核心層級部分 第一附加層級部分 第一附加層級部分 第一附加層級部分 354 374 384 第二附加層級部分 第二附加層級部分 第二附加層級部分 356 376 386 352 354 356 第3Α圖 -390- 360 350 370 380 Λ 310 一 ΖΙ 一 320 330 352 392 372 382 352 354 394 374 384 354 ——356 396 376 386 356 第3B圖 ^-4225264705/7^ 420流程 可標度解碼流程 第4B圖 750 526470 91 T. 18 7/7 位元 位元15 位元19 位元23 755 756 標頭 751 框架控制 標註資料子區段 752 753 754 中間標註資料 細微標註資料 757 758 710 >r 八 720 730 第6C圖 770 標頭 751 標註資料子區段 753 754 710 755 756 中間標註資料延伸 細微標註資料延伸 y— 第6D圖 757 758 Λ Λ 720 730
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US09/370,562 US6446037B1 (en) | 1999-08-09 | 1999-08-09 | Scalable coding method for high quality audio |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| TW526470B true TW526470B (en) | 2003-04-01 |
Family
ID=23460204
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW089115054A TW526470B (en) | 1999-08-09 | 2000-07-27 | Scalable coding process, method of processing data carried by a multi-layer data channel, processing system for a standard data channel, processing system for a multi-layer data channel, and a machine readable medium |
Country Status (13)
| Country | Link |
|---|---|
| US (1) | US6446037B1 (zh) |
| EP (1) | EP1210712B1 (zh) |
| JP (1) | JP4731774B2 (zh) |
| KR (1) | KR100903017B1 (zh) |
| CN (1) | CN1153191C (zh) |
| AT (1) | ATE239291T1 (zh) |
| AU (1) | AU774862B2 (zh) |
| CA (1) | CA2378991A1 (zh) |
| DE (1) | DE60002483T2 (zh) |
| DK (1) | DK1210712T3 (zh) |
| ES (1) | ES2194765T3 (zh) |
| TW (1) | TW526470B (zh) |
| WO (1) | WO2001011609A1 (zh) |
Families Citing this family (96)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19743662A1 (de) * | 1997-10-02 | 1999-04-08 | Bosch Gmbh Robert | Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms |
| US7283965B1 (en) * | 1999-06-30 | 2007-10-16 | The Directv Group, Inc. | Delivery and transmission of dolby digital AC-3 over television broadcast |
| NL1016478C2 (nl) * | 1999-10-28 | 2001-11-29 | Sennheiser Electronic | Inrichting voor het in twee richtingen zenden van audio- en/of videosignalen. |
| JP4595150B2 (ja) * | 1999-12-20 | 2010-12-08 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム格納媒体 |
| JP3468183B2 (ja) * | 1999-12-22 | 2003-11-17 | 日本電気株式会社 | 音声再生記録装置および方法 |
| DE60042335D1 (de) * | 1999-12-24 | 2009-07-16 | Koninkl Philips Electronics Nv | Mehrkanal-audiosignalverarbeitungsgerät |
| WO2001052549A1 (en) * | 2000-01-14 | 2001-07-19 | Koninklijke Philips Electronics N.V. | Transcoding method and device |
| US7043312B1 (en) * | 2000-02-17 | 2006-05-09 | Sonic Solutions | CD playback augmentation for higher resolution and multi-channel sound |
| JP2002016925A (ja) * | 2000-04-27 | 2002-01-18 | Canon Inc | 符号化装置及び符号化方法 |
| DE10102155C2 (de) * | 2001-01-18 | 2003-01-09 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms |
| DE10102154C2 (de) * | 2001-01-18 | 2003-02-13 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkassenfunktion |
| US7848929B2 (en) * | 2001-02-06 | 2010-12-07 | Harris Systems Limited | Method and apparatus for packing and decoding audio and other data |
| US7020811B2 (en) * | 2001-04-24 | 2006-03-28 | Sun Microsystems, Inc. | System and method for verifying error detection/correction logic |
| US7333929B1 (en) | 2001-09-13 | 2008-02-19 | Chmounk Dmitri V | Modular scalable compressed audio data stream |
| JP2003250155A (ja) * | 2002-02-25 | 2003-09-05 | Ando Electric Co Ltd | 動画符号評価装置及び課金システム |
| KR100711989B1 (ko) * | 2002-03-12 | 2007-05-02 | 노키아 코포레이션 | 효율적으로 개선된 스케일러블 오디오 부호화 |
| DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
| JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
| ES2278192T3 (es) * | 2002-11-28 | 2007-08-01 | Koninklijke Philips Electronics N.V. | Codificacion de una señal de audio. |
| KR20040060718A (ko) * | 2002-12-28 | 2004-07-06 | 삼성전자주식회사 | 오디오 스트림 믹싱 방법, 그 장치 및 그 정보저장매체 |
| AU2003285787A1 (en) * | 2002-12-28 | 2004-07-22 | Samsung Electronics Co., Ltd. | Method and apparatus for mixing audio stream and information storage medium |
| US7277427B1 (en) * | 2003-02-10 | 2007-10-02 | Nvision, Inc. | Spatially distributed routing switch |
| GB2400254A (en) * | 2003-03-31 | 2004-10-06 | Sony Uk Ltd | Video processing |
| US7657429B2 (en) * | 2003-06-16 | 2010-02-02 | Panasonic Corporation | Coding apparatus and coding method for coding with reference to a codebook |
| DE10328777A1 (de) * | 2003-06-25 | 2005-01-27 | Coding Technologies Ab | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
| EP1673764B1 (en) * | 2003-10-10 | 2008-04-09 | Agency for Science, Technology and Research | Method for encoding a digital signal into a scalable bitstream, method for decoding a scalable bitstream |
| US7725324B2 (en) * | 2003-12-19 | 2010-05-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Constrained filter encoding of polyphonic signals |
| US7809579B2 (en) * | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
| DE102004009955B3 (de) * | 2004-03-01 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite |
| US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
| EP1756807B1 (en) * | 2004-06-08 | 2007-11-14 | Koninklijke Philips Electronics N.V. | Audio encoding |
| US7536302B2 (en) * | 2004-07-13 | 2009-05-19 | Industrial Technology Research Institute | Method, process and device for coding audio signals |
| JP4771674B2 (ja) * | 2004-09-02 | 2011-09-14 | パナソニック株式会社 | 音声符号化装置、音声復号化装置及びこれらの方法 |
| WO2006041055A1 (ja) * | 2004-10-13 | 2006-04-20 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法 |
| US20060088093A1 (en) * | 2004-10-26 | 2006-04-27 | Nokia Corporation | Packet loss compensation |
| JP2006126482A (ja) * | 2004-10-28 | 2006-05-18 | Seiko Epson Corp | 音声データ処理装置 |
| CN101091208B (zh) * | 2004-12-27 | 2011-07-13 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
| WO2006082790A1 (ja) * | 2005-02-01 | 2006-08-10 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置およびスケーラブル符号化方法 |
| US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
| WO2006091139A1 (en) * | 2005-02-23 | 2006-08-31 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
| US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
| US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
| FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
| KR100755471B1 (ko) * | 2005-07-19 | 2007-09-05 | 한국전자통신연구원 | 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법 |
| US8074248B2 (en) | 2005-07-26 | 2011-12-06 | Activevideo Networks, Inc. | System and method for providing video content associated with a source image to a television in a communication network |
| KR100738077B1 (ko) * | 2005-09-28 | 2007-07-12 | 삼성전자주식회사 | 계층적 오디오 부호화 및 복호화 장치와 방법 |
| KR100754389B1 (ko) * | 2005-09-29 | 2007-08-31 | 삼성전자주식회사 | 음성 및 오디오 신호 부호화 장치 및 방법 |
| WO2007043811A1 (en) * | 2005-10-12 | 2007-04-19 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding audio data and extension data |
| EP1987513B1 (fr) * | 2006-02-06 | 2009-09-09 | France Telecom | Procede et dispositif de codage hierarchique d'un signal audio source, procede et dispositif de decodage, programmes et signal correspondants |
| JP5117407B2 (ja) * | 2006-02-14 | 2013-01-16 | フランス・テレコム | オーディオ符号化/復号化で知覚的に重み付けするための装置 |
| US7835904B2 (en) * | 2006-03-03 | 2010-11-16 | Microsoft Corp. | Perceptual, scalable audio compression |
| CN101395661B (zh) * | 2006-03-07 | 2013-02-06 | 艾利森电话股份有限公司 | 音频编码和解码的方法和设备 |
| JP5058152B2 (ja) * | 2006-03-10 | 2012-10-24 | パナソニック株式会社 | 符号化装置および符号化方法 |
| WO2007119368A1 (ja) * | 2006-03-17 | 2007-10-25 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置およびスケーラブル符号化方法 |
| JP4193865B2 (ja) * | 2006-04-27 | 2008-12-10 | ソニー株式会社 | デジタル信号切換え装置及びその切換え方法 |
| KR101322392B1 (ko) * | 2006-06-16 | 2013-10-29 | 삼성전자주식회사 | 스케일러블 코덱의 부호화 및 복호화 방법 및 장치 |
| CN101501761B (zh) * | 2006-08-15 | 2012-02-08 | 杜比实验室特许公司 | 无需边信息对时域噪声包络的任意整形 |
| US20080059154A1 (en) * | 2006-09-01 | 2008-03-06 | Nokia Corporation | Encoding an audio signal |
| WO2008056280A1 (en) * | 2006-11-06 | 2008-05-15 | Nokia Corporation | Dynamic quantizer structures for efficient compression |
| US9826197B2 (en) | 2007-01-12 | 2017-11-21 | Activevideo Networks, Inc. | Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device |
| US9355681B2 (en) | 2007-01-12 | 2016-05-31 | Activevideo Networks, Inc. | MPEG objects and systems and methods for using MPEG objects |
| US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
| US8908873B2 (en) * | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
| JP5355387B2 (ja) * | 2007-03-30 | 2013-11-27 | パナソニック株式会社 | 符号化装置および符号化方法 |
| US8315398B2 (en) | 2007-12-21 | 2012-11-20 | Dts Llc | System for adjusting perceived loudness of audio signals |
| CN101281748B (zh) * | 2008-05-14 | 2011-06-15 | 武汉大学 | 用编码索引实现的空缺子带填充方法及编码索引生成方法 |
| JP4784653B2 (ja) * | 2009-01-23 | 2011-10-05 | ソニー株式会社 | 音声データ送信装置、音声データ送信方法、音声データ受信装置および音声データ受信方法 |
| BRPI1005300B1 (pt) * | 2009-01-28 | 2021-06-29 | Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Ten Forschung E.V. | Codificador de áudio, decodificador de áudio, informações de áudio codificado e métodos para codificar e decodificar um sinal de áudio com base em uma informação de áudio codificado e em uma informação de áudio de entrada. |
| US8194862B2 (en) * | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
| US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
| EP2490216B1 (en) * | 2009-10-14 | 2019-04-24 | III Holdings 12, LLC | Layered speech coding |
| US8374858B2 (en) * | 2010-03-09 | 2013-02-12 | Dts, Inc. | Scalable lossless audio codec and authoring tool |
| CN101859569B (zh) * | 2010-05-27 | 2012-08-15 | 上海朗谷电子科技有限公司 | 数字音频信号处理降噪的方法 |
| US8862465B2 (en) * | 2010-09-17 | 2014-10-14 | Qualcomm Incorporated | Determining pitch cycle energy and scaling an excitation signal |
| KR20130138263A (ko) | 2010-10-14 | 2013-12-18 | 액티브비디오 네트웍스, 인코포레이티드 | 케이블 텔레비전 시스템을 이용하는 비디오 장치들 간의 디지털 비디오의 스트리밍 |
| WO2014124377A2 (en) | 2013-02-11 | 2014-08-14 | Dolby Laboratories Licensing Corporation | Audio bitstreams with supplementary data and encoding and decoding of such bitstreams |
| WO2012138660A2 (en) | 2011-04-07 | 2012-10-11 | Activevideo Networks, Inc. | Reduction of latency in video distribution networks using adaptive bit rates |
| WO2013106390A1 (en) | 2012-01-09 | 2013-07-18 | Activevideo Networks, Inc. | Rendering of an interactive lean-backward user interface on a television |
| US9800945B2 (en) | 2012-04-03 | 2017-10-24 | Activevideo Networks, Inc. | Class-based intelligent multiplexing over unmanaged networks |
| US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
| US9123084B2 (en) | 2012-04-12 | 2015-09-01 | Activevideo Networks, Inc. | Graphical application integration with MPEG objects |
| UA129991C2 (uk) | 2013-01-21 | 2025-10-08 | Долбі Лабораторіс Лайсензін Корпорейшн | Блок та спосіб обробки звукового сигналу, носій інформації |
| CN109102815B (zh) * | 2013-01-21 | 2023-09-19 | 杜比实验室特许公司 | 编码装置和方法、转码方法和转码器、非暂态介质 |
| WO2014145921A1 (en) | 2013-03-15 | 2014-09-18 | Activevideo Networks, Inc. | A multiple-mode system and method for providing user selectable video content |
| WO2014184618A1 (en) | 2013-05-17 | 2014-11-20 | Nokia Corporation | Spatial object oriented audio apparatus |
| US9219922B2 (en) | 2013-06-06 | 2015-12-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
| US9294785B2 (en) | 2013-06-06 | 2016-03-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
| WO2014197879A1 (en) | 2013-06-06 | 2014-12-11 | Activevideo Networks, Inc. | Overlay rendering of user interface onto source video |
| KR102244613B1 (ko) | 2013-10-28 | 2021-04-26 | 삼성전자주식회사 | Qmf 필터링 방법 및 이를 수행하는 장치 |
| US9788029B2 (en) | 2014-04-25 | 2017-10-10 | Activevideo Networks, Inc. | Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks |
| US10015612B2 (en) | 2016-05-25 | 2018-07-03 | Dolby Laboratories Licensing Corporation | Measurement, verification and correction of time alignment of multiple audio channels and associated metadata |
| SG11202004389VA (en) * | 2017-11-17 | 2020-06-29 | Fraunhofer Ges Forschung | Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding |
| WO2020146868A1 (en) * | 2019-01-13 | 2020-07-16 | Huawei Technologies Co., Ltd. | High resolution audio coding |
| US11051115B2 (en) * | 2019-06-27 | 2021-06-29 | Olga Sheymov | Customizable audio signal spectrum shifting system and method for telephones and other audio-capable devices |
| US11606230B2 (en) | 2021-03-03 | 2023-03-14 | Apple Inc. | Channel equalization |
| US11784731B2 (en) * | 2021-03-09 | 2023-10-10 | Apple Inc. | Multi-phase-level signaling to improve data bandwidth over lossy channels |
Family Cites Families (27)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
| NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
| DE4136825C1 (zh) * | 1991-11-08 | 1993-03-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De | |
| US5369724A (en) * | 1992-01-17 | 1994-11-29 | Massachusetts Institute Of Technology | Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients |
| US5253056A (en) | 1992-07-02 | 1993-10-12 | At&T Bell Laboratories | Spatial/frequency hybrid video coding facilitating the derivatives of variable-resolution images |
| US5270813A (en) | 1992-07-02 | 1993-12-14 | At&T Bell Laboratories | Spatially scalable video coding facilitating the derivation of variable-resolution images |
| US5253055A (en) | 1992-07-02 | 1993-10-12 | At&T Bell Laboratories | Efficient frequency scalable video encoding with coefficient selection |
| DE4241068C2 (de) * | 1992-12-05 | 2003-11-13 | Thomson Brandt Gmbh | Verfahren zum Übertragen, Speichern oder Decodieren eines digitalen Zusatzsignals in einem digitalen Tonsignal |
| US5537510A (en) * | 1994-12-30 | 1996-07-16 | Daewoo Electronics Co., Ltd. | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
| KR0144011B1 (ko) * | 1994-12-31 | 1998-07-15 | 김주용 | 엠펙 오디오 데이타 고속 비트 할당 및 최적 비트 할당 방법 |
| EP0734021A3 (en) | 1995-03-23 | 1999-05-26 | SICAN, GESELLSCHAFT FÜR SILIZIUM-ANWENDUNGEN UND CAD/CAT NIEDERSACHSEN mbH | Method and apparatus for decoding of digital audio data coded in layer 1 or 2 of MPEG format |
| JP3139602B2 (ja) * | 1995-03-24 | 2001-03-05 | 日本電信電話株式会社 | 音響信号符号化方法及び復号化方法 |
| JP2776300B2 (ja) * | 1995-05-31 | 1998-07-16 | 日本電気株式会社 | 音声信号処理回路 |
| DE19549621B4 (de) | 1995-10-06 | 2004-07-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung zum Codieren von Audiosignalen |
| IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
| JP3189660B2 (ja) * | 1996-01-30 | 2001-07-16 | ソニー株式会社 | 信号符号化方法 |
| JP3344944B2 (ja) | 1997-05-15 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 |
| US6092041A (en) * | 1996-08-22 | 2000-07-18 | Motorola, Inc. | System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder |
| JP3622365B2 (ja) * | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
| JP3283200B2 (ja) | 1996-12-19 | 2002-05-20 | ケイディーディーアイ株式会社 | 符号化音声データの符号化レート変換方法および装置 |
| DE19706516C1 (de) | 1997-02-19 | 1998-01-15 | Fraunhofer Ges Forschung | Verfahren und Vorricntungen zum Codieren von diskreten Signalen bzw. zum Decodieren von codierten diskreten Signalen |
| KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
| KR100261254B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
| JP3134817B2 (ja) * | 1997-07-11 | 2001-02-13 | 日本電気株式会社 | 音声符号化復号装置 |
| DE19743662A1 (de) * | 1997-10-02 | 1999-04-08 | Bosch Gmbh Robert | Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms |
| KR100335609B1 (ko) | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
| KR100335611B1 (ko) | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
-
1999
- 1999-08-09 US US09/370,562 patent/US6446037B1/en not_active Expired - Lifetime
-
2000
- 2000-07-27 TW TW089115054A patent/TW526470B/zh not_active IP Right Cessation
- 2000-08-04 ES ES00955365T patent/ES2194765T3/es not_active Expired - Lifetime
- 2000-08-04 CA CA002378991A patent/CA2378991A1/en not_active Abandoned
- 2000-08-04 AT AT00955365T patent/ATE239291T1/de not_active IP Right Cessation
- 2000-08-04 CN CNB008113289A patent/CN1153191C/zh not_active Expired - Fee Related
- 2000-08-04 WO PCT/US2000/021303 patent/WO2001011609A1/en not_active Ceased
- 2000-08-04 DK DK00955365T patent/DK1210712T3/da active
- 2000-08-04 DE DE60002483T patent/DE60002483T2/de not_active Expired - Lifetime
- 2000-08-04 KR KR1020027001558A patent/KR100903017B1/ko not_active Expired - Fee Related
- 2000-08-04 EP EP00955365A patent/EP1210712B1/en not_active Expired - Lifetime
- 2000-08-04 AU AU67584/00A patent/AU774862B2/en not_active Ceased
- 2000-08-04 JP JP2001516180A patent/JP4731774B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| AU6758400A (en) | 2001-03-05 |
| WO2001011609A1 (en) | 2001-02-15 |
| EP1210712A1 (en) | 2002-06-05 |
| AU774862B2 (en) | 2004-07-08 |
| CN1153191C (zh) | 2004-06-09 |
| DK1210712T3 (da) | 2003-08-11 |
| DE60002483D1 (de) | 2003-06-05 |
| EP1210712B1 (en) | 2003-05-02 |
| KR20020035116A (ko) | 2002-05-09 |
| JP4731774B2 (ja) | 2011-07-27 |
| DE60002483T2 (de) | 2004-03-25 |
| ES2194765T3 (es) | 2003-12-01 |
| CA2378991A1 (en) | 2001-02-15 |
| CN1369092A (zh) | 2002-09-11 |
| JP2003506763A (ja) | 2003-02-18 |
| US6446037B1 (en) | 2002-09-03 |
| ATE239291T1 (de) | 2003-05-15 |
| KR100903017B1 (ko) | 2009-06-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TW526470B (en) | Scalable coding process, method of processing data carried by a multi-layer data channel, processing system for a standard data channel, processing system for a multi-layer data channel, and a machine readable medium | |
| Levine | Audio representations for data compression and compressed domain processing | |
| TW519629B (en) | Data framing for adaptive-block-length coding system | |
| TWI498881B (zh) | 使用適應性混成轉換之多聲道音訊編碼位元串流的改良解碼技術 | |
| JP5266234B2 (ja) | 情報信号の符号化 | |
| JP7413418B2 (ja) | 信号をインタリーブするためのオーディオ復号器 | |
| US7937271B2 (en) | Audio decoding using variable-length codebook application ranges | |
| KR100310214B1 (ko) | 신호인코딩또는디코딩장치와레코딩매체 | |
| JP2005533271A (ja) | オーディオ符号化 | |
| TW486886B (en) | Encoding device and method, recording medium and decoding device and method | |
| JP4359499B2 (ja) | オーディオ信号の編集 | |
| EP1107233B1 (en) | Compatible formatting for encoding audio signals | |
| KR20080073926A (ko) | 오디오 신호를 복호화하는 장치에서 이퀄라이저를 구현하는방법 및 이를 위한 장치 | |
| KR100300887B1 (ko) | 디지털 오디오 데이터의 역방향 디코딩 방법 | |
| US6463405B1 (en) | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband | |
| JP3572817B2 (ja) | 情報符号化方法及び情報復号化装置 | |
| Ribbrock et al. | An Embedding Codec for Multiple Generations Compression Based on MPEG-1 Layer III | |
| KR100247348B1 (ko) | 엠펙 오디오 디코더에서 메모리 사이즈를 최소화하기 위한 회로 및 방법 | |
| Quackenbush et al. | Digital Audio Compression Technologies | |
| Brandenburg et al. | MPEG Layer-3 | |
| JPH07334937A (ja) | データ記録方法及びディスク媒体 | |
| HK1048555B (zh) | 高质量音频的可缩放编码方法 | |
| HK1125750B (zh) | 用於编码/解码的方法和装置 | |
| HK1125750A1 (zh) | 用於编码/解码的方法和装置 | |
| JPH10302405A (ja) | 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| GD4A | Issue of patent certificate for granted invention patent | ||
| MM4A | Annulment or lapse of patent due to non-payment of fees |