[go: up one dir, main page]

JP2009501948A - パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念 - Google Patents

パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念 Download PDF

Info

Publication number
JP2009501948A
JP2009501948A JP2008521820A JP2008521820A JP2009501948A JP 2009501948 A JP2009501948 A JP 2009501948A JP 2008521820 A JP2008521820 A JP 2008521820A JP 2008521820 A JP2008521820 A JP 2008521820A JP 2009501948 A JP2009501948 A JP 2009501948A
Authority
JP
Japan
Prior art keywords
signal
channel
parametric data
parametric
representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008521820A
Other languages
English (en)
Other versions
JP5265358B2 (ja
Inventor
ジョーハン ヒルペアト
クリストフ フォーラー
カルステン リンツマイアー
ラルフ スペルシュナイダー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agere Systems LLC
Original Assignee
Agere Systems LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36873210&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2009501948(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Agere Systems LLC filed Critical Agere Systems LLC
Publication of JP2009501948A publication Critical patent/JP2009501948A/ja
Application granted granted Critical
Publication of JP5265358B2 publication Critical patent/JP5265358B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0806Multiuser, multiprocessor or multiprocessing cache systems
    • G06F12/0815Cache consistency protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

本発明の目的は、サイド情報によって費やされるビットレートを0から始めてパラメトリック方法のビットレートまで上げながら、アップミックス信号のサウンドを徐々に改善することによって、パラメトリックマルチチャネルオーディオ符号化およびマトリックスサラウンドマルチチャネル符号化の間のギャップを埋めることである。さらに具体的には、本発明は、マトリックスサラウンド(サイド情報なし、低品質オーディオ)と全面的なパラメトリック再構成(フルサイド情報レートが必要、良品質)との間のどこかの「作動点」をフレキシブルに選択する方法を提供する。この作動点は、動的に(すなわち時間とともに変化するように)、そして、個別のアプリケーションによって決められるように、許容されるサイド情報レートに応じて、選択できる。
【選択図】図4

Description

本発明は、マルチチャネルオーディオ符号化および送信に関し、特に、マルチチャネルオーディオの効率的な符号化を可能にしながら、ステレオ装置およびフォーマットと完全に後方互換性のある形でマルチチャネルオーディオを符号化する技術に関する。
マルチチャネルオーディオ信号のパラメトリック符号化は、現在進行中の研究テーマである。一般に、マルチチャネルオーディオ信号を符号化するアプローチを2つに区分できる。国際標準化機構(ISO)のサブグループであるエムペグ(MPEG)は、現在、ダウンミックス信号にわずかのヘルパー情報を加えることによって、ステレオさらにはモノラルのダウンミックス信号からマルチチャネルオーディオコンテントを再構成する技術の標準化作業を行っている。
並行して、元のマルチチャネルオーディオ信号の空間イメージを再構成するために、ダウンミックス信号に既に(間接的に)含まれる以外の一切の追加のサイド情報を必要としない、ステレオからマルチチャネルへのアップミックス方法が開発中である。
追加のサイド情報を用いない、ステレオ互換性のあるマルチチャネル送信の実用性のある既存の方法のほとんどは、Dolby Pro Logic(Dolby Pro Logic II)およびLogic−7などのマトリックスサラウンド方法として特徴付けられ、これらは、「ドルビー(登録商標)サラウンドプロロジックIIデコーダ−動作の原理)(Dolby Surround Pro Logic II Decorder − Principles of Operation)」、インターネット<URL:http://www.dolby.com/assets/pdf/tech_library/209_Dolby_Surround_Pro_Logic_II_Decorder_Principles_of_Operation.pdf>、およびD.グリージンガー(Griesiger)の「両耳聴取者のためのマルチチャネルサラウンドデコーダ(Multichannel Matrix Surround Decoders for Two−Eared Listeners)」、第101回AESコンベンション、米国、ロサンジェルス、1996年、プレプリント4402に、さらに詳しく記載されている。これらの方法の共通の原理は、エンコーダが、ステレオダウンミックス信号を形成するために、前および中央チャネルと一緒にミキシングする前に、サラウンドチャネルに位相シフトを適用するという、マルチチャネルまたはステレオダウンミキシングの専用の方法を用いることである。このダウンミックス信号(Lt、Rt)の生成は、次式
Figure 2009501948
で表される。
左ダウンミックス信号(Lt)は、左前信号(Lf)、ファクタqを乗じた中央信号(C)、90度位相回転され(j)かつファクタaでスケールされた左サラウンド信号(Ls)、および同様に90度位相回転されかつファクタbでスケールされた右サラウンド信号(Rs)で構成される。右ダウンミックス信号(Rt)も、同様に生成される。典型的なダウンミックスファクタは、qおよびaについては0.707であり、さらにbについては0.408である。右ダウンミックス信号(Rt)のサラウンドチャネルの符号と左ダウンミックス信号(Lt)のサラウンドチャネルの符号とが異なっている理由は、サラウンドチャネルをダウンミックスペア(Lt、Rt)に逆位相でミックスすると都合がよいからである。この特性は、デコーダが、ダウンミックス信号ペアから前チャネルと後チャネルとを区分けする助けになる。このため、ダウンミックスマトリックスは、逆マトリックス演算を適用することによってデコーダ内でステレオダウンミックスから出力されるマルチチャネル出力信号の部分的な再構成を可能にする。しかしながら、再生成されたマルチチャネル信号が元のエンコーダ入力信号にどれほど近似しているかは、マルチチャネルオーディオコンテントの特定の特性による。
サイド情報とも呼ばれるヘルパー情報を付加する符号化方法の例に、MPEGサラウンドオーディオ符号化がある。このパラメトリックマルチチャネルオーディオ符号化の効率的な方法については、例えば、J.ヘレ(Herre)、H.パーンハーゲン(Purnhagen)、J.ブリーバート(Breebaart)、C.ファラー(Faller)、S.ディシュ(Disch)、K.ケアリング(Kjoerling)、E.シュイージャー(Schuijers)、J.ヒルペルト(Hilpert)、F.マイバーグ(Myburg)の「MPEG空間オーディオ符号化に対する基準モデルアーキテクチャ(The Reference Model Architecture for MPEG Spatial Audio Coding)」、第118回AESコンベンション、スペイン、バルセロナ、2005年、および「空間オーディオ符号化(SAC)についての作業草案本文(Text of Working Draft for Spatial Audio Coding(SAC))」、ISO/IEC JTC1/SC29/WG11(MPEG)、文書N7136、韓国、釜山、2005年に、記載されている。
空間オーディオ符号化に用いられるエンコーダの概略図が図6に示される。このエンコーダは、直交ミラーフィルタ(QMF)12によって、入力信号10(入力1、・・・入力N)を別々の時間周波数タイルに分割する。得られる周波数タイル(バンド)のグループは、「パラメータバンド」といわれる。あらゆるパラメータバンドに対して、例えば、チャネルのペア間のレベル差(CLD)、チャネルのペア間の相互相関(ICC)または信号包絡線の情報(CPC)などの空間イメージの特性を表現する多数の空間パラメータ14が、パラメータ推定器16によって決定される。これらのパラメータは、続いて量子化され、一緒に空間データのビットストリームにまとめられる。動作モードに応じて、このビットストリームは、良品質のマルチチャネルオーディオに対する数kビット/秒から始まり、ほぼ透明な品質の数十kビット/秒までの幅広い範囲のビットレートをカバーする。
パラメータの抽出に加えて、エンコーダは、マルチチャネル入力信号からモノラルまたはステレオダウンミックスを生成する。さらに、ステレオダウンミックスの場合、ユーザは、従来(ITUスタイル)のステレオダウンミックスまたはマトリックスサラウンドシステムと互換性のあるダウンミックスを選択できる。最後に、ステレオダウンミックスは、QMF合成バンク18によって時間ドメインに変換される。得られたダウンミックスは、空間パラメータまたは空間パラメータビットストリーム14とともに、デコーダに送信できる。望ましくは、ダウンミックスは、(従来のモノラルまたはステレオのコアコーダを用いて)送信前に符号化され、さらに、コアコーダのビットストリームと空間パラメータのビットストリームとは、単一の出力ビットストリームを形成するために組み合わされ(多重化され)てもよい。
図7に描かれたデコーダは、原理的にエンコーダとは逆の処理を実行する。入力ストリームは、コアコーダのビットストリームとパラメータのビットストリームとに分割される。これは、図7に示されていない。次に、復号化されたダウンミックス20は、エンコーダで適用されるのと同一のパラメータバンドを導出するためにQMF分析バンク22によって処理される。空間合成ステージ24は、制御データ26(すなわち送信された空間パラメータ)によって、マルチチャネル信号を再構成する。最後に、QMFドメイン信号は、最終的なマルチチャネル出力信号28を導出するQMF合成バンク27によって、時間ドメインに変換される。
図8は、図6の従来技術のエンコーダおよび図7の従来技術のデコーダ内で実行されるQMF分析の簡単な例を示す。時間ドメインでサンプルされかつ4つのサンプル値を有するオーディオサンプル30が、フィルタバンク32に入力される。フィルタバンク32は、各々が4つのサンプル値を有する3つの出力サンプル34a、34bおよび34cを導出する。理想的な場合として、フィルタバンク32は、出力信号中のサンプルが、基礎をなすオーディオ信号30の離散周波数範囲に関する情報だけを含むように、出力サンプル34a〜34cを導出する。図8に示される場合では、サンプル34aは、f0からf1の範囲の周波数間隔に関する情報を有し、サンプル34bは、周波数間隔[f1、f2]の情報を有し、サンプル34cは、周波数間隔[f2、f3]の情報を有する。図8の周波数間隔は、オーバーラップしていないが、もっと一般的な場合では、フィルタバンクから出力される出力サンプルの周波数間隔は、周波数オーバーラップを有することが極めて多い。
上述のように、従来技術のエンコーダは、2チャネルダウンミックスが求められる場合、ITUスタイルのダウンミックスまたはマトリックスサラウンドに互換性のあるダウンミックスを送る。(例えば、式1で与えられるマトリックスアプローチを用いる)マトリックスサラウンドに互換性のあるダウンミックスの場合、1つの可能性としては、エンコーダがマトリックスサラウンドに互換性のあるダウンミックスを直接生成することである。
図9は、標準的なステレオダウンミックス32を処理するダウンミックス後処理ユニット30を用いてマトリックスサラウンドに互換性のあるダウンミックスを生成する別のアプローチを示す。マトリックスサラウンドプロセッサ30(MTXエンコーダ)は、標準的なステレオダウンミックス32を、それがパラメータ抽出ステージ16で抽出される空間パラメータ14によって導かれるマトリックスサラウンドに互換性のあるように修正する。送信のために、マトリックスサラウンドに互換性のあるダウンミックス34は、QMF合成バンク18を用いてQMS合成によって時間ドメインに変換される。
標準的なステレオダウンミックスを後処理することによってマトリックスサラウンドに互換性のある信号を導出する方法には、空間パラメータが利用可能であれば、そのマトリックスサラウンドに互換性のある処理がデコーダ側で完全に逆処理できるという利点がある。
両方のアプローチともマルチチャネル信号を送信するために適してはいるが、これらの最先端のシステムには特有の欠点がある。マトリックスサラウンド方法は、非常に効率的であるが、(というのは、パラメータを追加する必要ないので、)非常に限られたマルチチャネル再構成品質という代償を払った上でのことである。
他方では、パラメトリックマルチチャネルアプローチは、サイド情報のために高いビットレートを必要とし、制限がパラメトリック表現に対する最大許容ビットレートに設定される場合に、これが問題になる。符号化されたパラメータが相当に高いレベルのビットレートを必要とする場合、そのようなビットレート限度を可能にするただ1つの方法は、チャネルの圧縮率を上げることによって、符号化されたダウンミックスチャネルの品質を低下することである。このため、オーディオ品質において全体的な損失となり、それは受け入れ難いほど高くなることがある。言い換えれば、パラメトリックマルチチャネルアプローチでは、多くの場合、空間パラメータレイヤに必要とされる最少ビットレートに厳しい限度があり、それは場合によって受け入れ難いほど高いことがある。
マトリックスサラウンド方法と空間オーディオ方法との間での原理的な後方互換性は、図9に示されるように、従来技術のエンコーダによって達成できるが、このアプローチでは、マトリックスベースの復号化しか必要とされない場合でも追加のビットを節減できることはない。その場合でも、空間パラメータのフルセットは、送信されなければならなく、送信バンド幅の浪費である。
特定のアプリケーションシナリオの場合、パラメトリック方法を適用する場合に用いられなければならないビットレートが高くなりすぎることがあり、サイド情報を送信しない方法によって送られるオーディオ品質が不十分となる可能性がある。
米国特許出願公開第2005/157883号は、入力信号およびパラメトリックサイド情報を用いてマルチチャネルオーディオを構成するための装置を示し、その入力信号は、元のマルチチャネル信号から導出される第1の入力チャネルおよび第2の入力チャネルを含み、そのパラメトリックサイド情報は、マルチチャネルの元の信号のチャネルの間の相互関係を表現している。
米国特許出願公開第2005/157883号 「ドルビー(登録商標)サラウンドプロロジックIIデコーダ−動作の原理)(Dolby Surround Pro Logic II Decorder−Principles of Operation)」、インターネット<URL:http://www.dolby.com/assets/pdf/tech_library/209_Dolby_Surround_Pro_Logic_II_Decorder_Principles_of_Operation.pdf> D.グリージンガー(Griesiger)の「両耳聴取者のためのマルチチャネルサラウンドデコーダ(Multichannel Matrix Surround Decoders for Two−Eared Listeners)」、第101回AESコンベンション、米国、ロサンジェルス、1996年、プレプリント4402 J.ヘレ(Herre)、H.パーンハーゲン(Purnhagen)、J.ブリーバート(Breebaart)、C.ファラー(Faller)、S.ディシュ(Disch)、K.ケアリング(Kjoerling)、E.シュイージャー(Schuijers)、J.ヒルペルト(Hilpert)、F.マイバーグ(Myburg)の「MPEG空間オーディオ符号化に対する基準モデルアーキテクチャ(The Reference Model Architecture for MPEG Spatial Audio Coding)」、第118回AESコンベンション、スペイン、バルセロナ、2005年 「空間オーディオ符号化(SAC)についての作業草案本文(Text of Working Draft for Spatial Audio Coding(SAC))」、ISO/IEC JTC1/SC29/WG11(MPEG)、文書N7136、韓国、釜山、2005年
本発明の目的は、マトリックスベースの符号化解決策に後方互換性がある、マルチチャネルオーディオ信号をより効率的に符号化するための概念を提供することである。
本発明の第1の態様によれば、この目的は、オーディオ信号を処理しさらにマルチチャネル信号の第1の部分を表現する第1のパラメトリックデータを処理するためのマルチチャネルオーディオデコーダによって達成され、マルチチャネル信号の第2の部分に対して、パラメトリックデータが処理されないかまたは第2のパラメトリックデータが処理され、第2のパラメトリックデータは、マルチチャネル信号の同一の部分を表現する場合に、第1のパラメトリックデータよりも少ない情報ユニットを必要とし、マルチチャネルオーディオデコーダは、オーディオ信号から中間信号を導出するためのプロセッサを含み、プロセッサは、中間信号の第1の部分を導出するための第1の導出ルールを用い、中間信号の第1の部分はマルチチャネルオーディオ信号の第1の部分に対応し、第1の導出ルールは第1のパラメトリックデータにより決まり、さらに中間信号の第2の部分を導出するための第2の導出ルールを用い、第2の導出ルールはパラメトリックデータを用いないかまたは第2のパラメトリックデータを用いる。
本発明の第2の態様によれば、この目的は、マルチチャネルオーディオ信号の空間特性を表現するパラメトリック表現を生成するためのマルチチャネルエンコーダによって達成され、マルチチャネルエンコーダは、空間パラメータを生成するためのパラメータ生成器と、パラメトリック表現を生成するための出力インタフェースとを含み、パラメータ生成器または出力インタフェースは、パラメトリック表現がマルチチャネル信号の第1の部分に対する第1のパラメトリックデータを含むように、パラメトリック表現を生成するように適応され、さらに、マルチチャネル信号の第2の部分に対して、パラメトリック表現にパラメトリックデータが含まれないかまたは第2のパラメトリックデータが含まれ、第2のパラメトリックデータは、マルチチャネル信号の同一の部分を表現する場合に、第1のパラメトリックデータよりも少ない情報ユニットを必要とする。
本発明の第3の態様によれば、この目的は、オーディオ信号を処理しさらにマルチチャネル信号の第1の部分を表現する第1のパラメトリックデータを処理するための方法によって達成され、マルチチャネル信号の第2の部分に対して、パラメトリックデータが処理されないかまたは第2のパラメトリックデータが処理され、第2のパラメトリックデータは、マルチチャネル信号の同一の部分を表現する場合に、第1のパラメトリックデータよりも少ない情報ユニットを必要とし、その方法は、中間信号の第1の部分を導出するための第1のパラメトリックデータにより決まる第1の導出ルールを用いてダウンミックス信号から中間信号を導出する工程であって、中間信号の第1の部分はマルチチャネルオーディオ信号の第1の部分に対応する、工程と、第2の導出ルールを用いて中間信号の第2の部分を導出する工程であって、第2の導出ルールは第2のパラメトリックデータを用いるかまたはパラメトリックデータを用いない、工程とを含む。
本発明の第4の態様によれば、この目的は、マルチチャネルオーディオ信号の空間特性を表現するパラメトリック表現を生成するための方法によって達成され、その方法は、空間パラメータを生成する工程と、パラメトリック表現がマルチチャネル信号の第1の部分に対する第1のパラメトリックデータを含むように、パラメトリック表現を生成する工程であって、マルチチャネル信号の第2の部分に対して、パラメトリック表現にパラメトリックデータが含まれないかまたは第2のパラメトリックデータが含まれ、第2のパラメトリックデータは、マルチチャネル信号の同一の部分を表現する場合に、第1のパラメトリックデータよりも少ない情報ユニットを必要とする、工程とを含む。
本発明の第5の態様によれば、この目的は、マルチチャネルオーディオ信号の空間特性を表現するパラメトリック表現によって達成され、そのパラメトリック表現はマルチチャネル信号の第1の部分に対する第1のパラメトリックデータを含み、さらに、そのパラメトリック表現はパラメトリックデータを含まないかまたはマルチチャネル信号の第2の部分に対して第2のパラメトリックデータを含み、第2のパラメトリックデータは、マルチチャネル信号の同一の部分に対して、第1のパラメトリックデータよりも少ない情報ユニットを必要とする。
本発明の第6の態様によれば、この目的は、コンピュータ上で実行される場合に、オーディオ信号を処理しさらにマルチチャネル信号の第1の部分を表現する第1のパラメトリックデータを処理するための方法を実行するためのプログラムコードを有するコンピュータプログラムによって達成され、マルチチャネル信号の第2の部分に対して、パラメトリックデータが処理されないかまたは第2のパラメトリックデータが処理され、第2のパラメトリックデータは、マルチチャネル信号の同一の部分を表現する場合に、第1のパラメトリックデータよりも少ない情報ユニットを必要とし、その方法は、中間信号の第1の部分を導出するための第1のパラメトリックデータにより決まる第1の導出ルールを用いてダウンミックス信号から中間信号を導出する工程であって、中間信号の第1の部分はマルチチャネルオーディオ信号の第1の部分に対応する、工程と、第2の導出ルールを用いて中間信号の第2の部分を導出する工程であって、第2の導出ルールは第2のパラメトリックデータを用いるかまたはパラメトリックデータを用いない、工程とを含む。
本発明の第7の態様によれは、この目的は、コンピュータ上で実行される場合に、マルチチャネルオーディオ信号の空間特性を表現するパラメトリック表現を生成するための方法を実行するためのプログラムコードを有するコンピュータプログラムによって達成され、その方法は、空間パラメータを生成する工程と、パラメトリック表現がマルチチャネル信号の第1の部分に対する第1のパラメトリックデータを含むように、パラメトリック表現を生成する工程であって、マルチチャネル信号の第2の部分に対して、パラメトリック表現にパラメトリックデータが含まれないかまたは第2のパラメトリックデータが含まれ、第2のパラメトリックデータは、マルチチャネル信号の同一の部分を表現する場合に、第1のパラメトリックデータよりも少ない情報ユニットを必要とする、工程とを含む。
本発明の第8の態様によれば、この目的は、マルチチャネルオーディオ信号の空間特性を表現する空間パラメータを用いてマルチチャネルオーディオ信号のパラメトリック表現を生成するためのトランスコーダによって達成され、パラメトリック表現がマルチチャネル信号の第1の部分に対して空間パラメータから導出される第1のパラメトリックデータを含むように、パラメトリック表現を生成するパラメータ生成器であって、マルチチャネル信号の第2の部分に対して、パラメトリック表現にパラメトリックデータが含まれないかまたは第2のパラメトリックデータが含まれ、第2のパラメトリックデータは、マルチチャネル信号の同一の部分を表現する場合に、第1のパラメトリックデータよりも少ない情報ユニットを必要とする、パラメータ生成器を含む。
本発明は、第1の導出ルールがマルチチャネル信号の第1の部分を表現するパラメトリック表現の第1のパラメトリックデータを導出するために用いられ、さらに、マルチチャネル信号の第2の部分に対して、パラメトリック表現に第2のパラメトリックデータが含まれるかまたはパラメトリックデータが含まれなく、第2のパラメトリックデータは、マルチチャネル信号の同一の部分を表現する場合に、第1のパラメトリックデータよりも少ない情報ユニットを必要とするようにすれば、マルチチャネルオーディオ信号がパラメトリック表現によって効率的に表現できるという発見に基づいている。
したがって、マルチチャネル信号の第1の部分は、第1のパラメータによって表現され、より高品質のマルチチャネル信号の再構成が可能になり、さらに、第2の部分は、第2のパラメータで表現され、やや低い品質の再構成が可能となる。第1のパラメトリックデータによって費やされるビットレートは、両方のパラメトリックデータがマルチチャネル信号の同一の部分を表現する場合、結果として第2のパラメトリックデータによって費やされるビットレートよりも高くなる。言い換えれば、第1のパラメータは、信号部分あたり、第2のパラメータよりも高いビットレートを必要とする。
本発明の目的は、サイド情報によって費やされるビットレートを0から始めてパラメトリック方法のビットレートまで上げながら、アップミックス信号のサウンドを徐々に改善することによって、両方の従来技術界の間のギャップを埋めることである。すなわち、本発明は、全面的なパラメトリック方法とマトリックスサラウンド方法との間でのビットレートと知覚品質とにおけるギャップを埋めることを目指している。さらに具体的には、本発明は、マトリックスサラウンド(サイド情報なし、低品質オーディオ)と全面的なパラメトリック再構成(フルサイド情報レートが必要、良品質)との間のどこかの「作動点」をフレキシブルに選択する方法を提供する。この作動点は、動的に(すなわち時間とともに変化するように)、そして、個別のアプリケーションによって決められるように、許容されるサイド情報レートに応じて、選択できる。
空間オーディオパラメータによって表現される、マルチチャネルオーディオ信号の部分である、マルチチャネルオーディオの第1の部分のサイズを動的に選択することによって、必要なビットレートは、広範囲に変化できる。空間オーディオパラメータによるマルチチャネル信号の大部分の表現は、良好な知覚品質の利点で比較的高いビットレートを費やす。マルチチャネルオーディオ信号の第2の部分に対して、パラメータ導出ルールが、より低いビットレートを費やすパラメータで済むように選択されるので、全ビットレートは、マルチチャネル信号の第2の部分のサイズを増加することによって低減できる。本発明の好適な実施の形態において、パラメトリックデータはマルチチャネル信号の第2の部分に対して全く送信されず、当然これは最大のビット節約となる。したがって、第2の部分のサイズに対して第1の部分のサイズを動的にシフトすることによって、ビットレート(または知覚品質)は、ニーズに動的に調整できる。
本発明の好適な実施の形態において、ダウンミックス信号は、マトリックスに互換性のある方法で導出される。その結果、マルチチャネルオーディオ信号の第1の部分は、空間オーディオパラメータを用いて高い知覚品質で再生でき、さらに、マルチチャネル信号の第2の部分は、マトリックスベースの解決策を用いて再生できる。これにより、高品質を必要とする信号の部分に対して高品質の再生が可能になる。同時に、再生された信号の品質がそれほど重要でない信号部分に対しては、マトリックスベースの再生を利用することによって、全体的なビットレートが削減される。
本発明のさらなる好適な実施の形態において、本発明の概念が、デコーダ側で、受信されたダウンミックス信号のQMF表現に適用される。アップミキシング処理は、主として、
相関除去前処理マトリックスの適用による入力信号(QMFドメインで受信されるダウンミックス信号)の前処理ステップ、
前処理された信号の部分の相関除去のステップ、および
このようにして導出された信号(前処理された信号および相関除去された信号)を混合マトリックス内でミキシングするステップであって、そのミキシングの出力がアップミックス信号のチャネルとなるステップ
の3つのステップに再分割できる。
相関除去前処理マトリックスおよび混合マトリックスの双方は、一方に「タイムスロットの数」の次元を、他方に「パラメータバンドの数」の次元を有する2次元マトリックスである。復号化処理中に、これらのマトリックスのエレメントは、空間ビットストリームから読み取られるパラメータから、すなわち第1のパラメータデータによって導出される値で満たされる。第1のパラメトリックデータだけがマルチチャネル信号の第1の部分に対して受信される場合、マルチチャネル信号の再構成の部分だけが、送信される第1のパラメトリックデータを用いて導出できる。本発明によれば、マルチチャネル信号の再構成の第2の部分を導出するためのマトリックスエレメントは、マトリックスに互換性のある符号化スキームを用いて導出される。したがって、これらのマトリックスエレメントは、ダウンミックス信号から得られる知識だけに基づいて導出されるか、または所定の値と置き換えられるかとすることができる。
好適な実施の形態において、本発明によるマルチチャネルオーディオデコーダは、送信された第1のパラメトリックデータの量によって、マトリックスのどの部分をまたはマルチチャネルオーディオ信号のどの部分が、空間パラメータに依存するルールによって処理されるか、さらに、どの部分がマトリックスベースの解決策によって処理されるかを認識する。
本発明の別の実施の形態において、オーディオエンコーダは、マルチチャネル信号のどの部分がマトリックスベースの解決策によってまたは空間オーディオに互換性のあるアプローチによって処理されるかを表示するウィンドウ情報を生成する。そのウィンドウ情報は、マルチチャネル信号のパラメトリック表現に含まれる。
したがって、本発明のデコーダは、ウィンドウ情報によって示されるマルチチャネルオーディオ信号の各部分に適切なアップミキシングルールを適用するために、生成されるウィンドウ情報を受信し、さらに、処理することができる。
本発明の好適な実施の形態において、本発明の概念は、信号処理中のQMFドメインに、すなわち、信号が複数の表現によって表されかつ各表現が特定の周波数バンドに関する情報を有するドメインに適用される。
本発明のさらなる好適な実施の形態において、サイド情報が要らない方法(マトリックスベースのアプローチ)は、より高い周波数部分だけに適用され、低周波部分の適切な再生のために(明示された)パラメータ情報(すなわち、第1の符号化および復号化ルール)が適用される。これには、人間の聴力が、高い周波数に対するよりも低い周波数に対して、2つの類似した信号の間の小さな偏差(例えば位相ずれ)に気付きやすいので、利点がある。
本発明の大きな利点は、空間オーディオコーダの符号化および復号化ルールが適切に選択される場合、追加のハードまたはソフトウエアを持ち込まなくても、空間オーディオ符号化および復号化スキームとマトリックスベースの解決策との後方互換性が達成されることである。
さらに、他の従来技術の試みのように、追加のデータを送る必要なく、互換性が実現される。さらに、本発明による符号化スキームは、ビットレートまたは品質のシームレスな調整、すなわち、所定の信号の全面的なマトリックスベースの符号化と全面的な空間オーディオ符号化との間でのスムースな移行を可能にするように、非常にフレキシブルである。すなわち、適用される符号化スキームは、必要なビットレートまたは望まれる品質に関して、実際のニーズに応じて調整できる。
本発明の好適な実施の形態が添付図面を参照して以下に説明され、これらの図面としては:
図1は、本発明のエンコーダを示し、
図2は、本発明の概念によって生成されるパラメータビットストリームの例を示し、
図2aは、本発明のトランスコーダを示し、
図3は、本発明のデコーダを示し、
図4は、本発明の概念を実施する空間オーディオデコーダの例を示し、
図5は、デコーダ側の別の符号化スキームの使用を図解し、
図6は、従来技術のエンコーダを示し、
図7は、従来技術のデコーダを示し、
図8は、フィルタバンクのブロック図を示し、
図9は、従来技術のエンコーダのさらなる例を示す。
図1は、本発明のマルチチャネルエンコーダを示す。マルチチャネルエンコーダ100は、パラメータ生成器102および出力インタフェース104を有する。
マルチチャネルオーディオ信号106がエンコーダ100に入力され、マルチチャネル信号106の第1の部分108および第2の部分110が処理される。パラメータ生成器102は、第1の部分108および第2の部分110を受信し、マルチチャネル信号106の空間特性を表現する空間パラメータを導出する。
空間パラメータは出力インタフェース104に送信され、出力インタフェースは、パラメトリック表現112がマルチチャネル信号の第1の部分108に対する第1のパラメトリックデータを含むように、マルチチャネル信号106のパラメトリック表現112を導出し、マルチチャネル信号106の第2の部分110に対して、パラメトリック表現112には、第1のパラメトリックデータよりも少ない情報を必要とする第2のパラメトリックデータが含まれるかまたはパラメータが含まれない。
同一の目的を達成するために、マルチチャネルエンコーダ100のいくつかの変形が可能である。例えば、パラメータ生成器102は、第1の部分108と第2の部分110とに対する2つの異なるパラメータ導出ルールを適用でき、異なるパラメータセットを生成し、次に、これらは出力インタフェース104に送信され、インタフェースは、これらの異なったパラメータセットをパラメトリック表現112に組み合わせる。特定の好適な場合では、第2の部分110に対してパラメータが、パラメトリック表現に含まれず(したがって、パラメータ生成器102によって導出されず)、これは、デコーダ側において、デコーダがある発見的なルールによって必要な復号化パラメータを導出するからである。
別の可能性では、パラメータ生成器102は、第1の部分108と同様に第2の部分110に対しても空間オーディオパラメータのフルセットを導出する。このため、出力インタフェース104は、第2のパラメトリックデータが第1のパラメトリックデータよりも少ないビットを必要とするように、空間パラメータを処理しなければならない。
さらに、出力インタフェース104は、符号化の過程でマルチチャネル信号106がどのように第1の部分108と第2の部分110とに分割されたのかを、デコーダに信号伝達すべき追加のウィンドウ信号をパラメトリック表現112に加えることができる。マルチチャネルエンコーダ100のこの好適な実施の形態の変形において、マルチチャネルエンコーダ100は、マルチチャネル信号106のどの部分が第1の部分108として用いられ、さらに、どの部分が第2の部分110として用いられるかを、品質基準に基づいて決定するための部分決定器をさらに有することができる。
その品質基準は、パラメトリック表現112の結果として得られる全ビットレートに関してまたは品質面に関して、パラメトリック表現112に基づくマルチチャネル信号106の再生の知覚品質を考慮に入れて導出できる。
主な利点は、このようにパラメトリック表現によって費やされるビットレートが時間とともに変化でき、品質基準が符号化の過程のいつでも満たされていることを確実にしながら、従来技術の方法と比べて必要なビットレートの全体的な削減を可能にすることができることである。
図2は、本発明のエンコーダによって生成されるパラメトリック表現112の例を示す。
上述のように、オーディオ信号の処理は、ブロック単位で行われ、すなわち、時間ドメインにおけるマルチチャネル信号の多数の連続するサンプル、いわゆるフレームが、1つのステップで処理される。図2は、パラメータビットストリーム、すなわち2つの連続するフレームに対するパラメトリック表現を示す。パラメータビットストリームは、高品質フレーム120の表現と低品質フレーム122の表現とを有する。高品質フレーム120の符号化においては、パラメトリックデータによって表現される第1の部分108が、第2の部分に比べて大きくなければならないとの決定がされ、これは、例えば、符号化されるオーディオシーンがかなり複雑な場合に行われる。さらに、図2のパラメータビットストリームは、本発明のエンコーダの好適な実施の形態がマルチチャネル信号106の第2の部分110に対していかなるパラメトリックデータも導出しないように用いられるとの前提の下に生成される。図2から分かるように、28個の空間パラメータICCおよびICLDが、高品質フレーム120を表現するために、パラメトリック表現に含まれる。例として、28個の空間パラメータは、マルチチャネル信号のQMF表現の低い周波数バンドを表現する。
低品質フレーム122は、所望の知覚品質にために十分であることが分かったので、ICCおよびICLDパラメータを有する21個の空間パラメータセットしか含まない。
図2aは、本発明のトランスコーダ150を示す。本発明のトランスコーダは、入力として、マルチチャネルオーディオ信号の第1のフレーム154および第2のフレーム156を表現する空間パラメータのフルセットを有する入力ビットストリーム152を受信する。
トランスコーダ150は、マルチチャネルオーディオ信号の空間特性を表現するパラメトリック表現を有するビットストリーム158を生成する。図2aに示される例では、トランスコーダ150は、第1のフレームに対してパラメータ160の数が僅かだけ少なくなるように、パラメトリック表現を導出する。入力パラメータ156に対応する第2のフレームを表現するパラメータ162の数は大きく低減され、これにより、得られるパラメトリック表現に対して必要なビットレートの量は大幅に削減される。したがって、本発明のトランスコーダ150は、送信過程ではより少ないビットレートをまたはコンピュータ読み取り可能な媒体に記憶する場合にはより小さな記憶スペースを必要とする、本発明のパラメトリック表現を導出するために、既に存在する空間パラメータのビットストリームを後処理するために用いることができる。ここで、空間パラメータを生成するために、もう一方の方向にトランスコードする、すなわち、パラメトリック表現を用いるトランスコーダを実施することも当然に可能であることに注意されたい。
本発明のトランスコーダ150は、例えば、所定のルールを用いてパラメータの量を削減したり、知覚品質が許容限度を超えて損なわれることなく可能なビットレートの低減量を分析するためにマルチチャネル信号をさらに受信したりするように、さまざまな異なった方法で実施することができる。
図3は、プロセッサ202を有する本発明のマルチチャネルオーディオデコーダ200を示す。
プロセッサは、入力として、マルチチャネルオーディオ信号から導出されるダウンミックス信号204、マルチチャネル信号の第1の部分を表現する第1のパラメトリックデータ206、および、マルチチャネル信号の第2の部分に対しては第1のパラメトリックデータ206よりも少ないビットを必要とする任意の第2のパラメトリックデータ208を受信する。プロセッサ202は、中間信号の高品質部分212を導出するための第1の導出ルールを用いてダウンミックス信号204から中間信号210を導出し、中間信号212の高品質部分212は、マルチチャネルオーディオ信号の第1の部分に対応する。プロセッサ202は、中間信号210の第2の部分214に対して第2の導出ルールを用い、第2の導出ルールは、第2のパラメトリックデータを用いるかまたはパラメータデータを用いず、第1の導出ルールは、第1のパラメトリックデータ206により決まる。
プロセッサ202によって導出される中間信号210は、高品質部分212と第2の部分214との組み合わせで構成される。
マルチチャネルオーディオデコーダ200は、例えば、第1のパラメトリックデータ206中に含まれる空間パラメータの数をカウントするなど、何らかの適切なルールを適用することによって、ダウンミックス信号204のどの部分が第1のパラメトリックデータ206で処理されるのかを、それ自体で導出することができる。あるいは、プロセッサ202には、エンコーダ側で導出されかつマルチチャネルオーディオ信号デコーダ200にさらに送信される何らかの追加のウィンドウ情報によって、ダウンミックス信号204内の高品質部分212と第2の部分214との割合を信号伝達できる。
好適な実施の形態において、第2のパラメトリックデータ208は省略され、プロセッサ202は、ダウンミックス信号204に既に含まれる情報から第2の導出ルールを導出する。
図4は、本発明のマトリックス互換性の特徴を空間オーディオデコーダ中に組み合わせる本発明のさらなる実施の形態を示す。マルチチャネルオーディオデコーダ600は、相関除去前処理器601、相関除去器602、および混合マトリックス603を含む。
マルチチャネルオーディオデコーダ600はフレキシブルな装置であり、相関除去前処理器601に入力される入力信号605の構成に応じて異なった方法で作動することができる。一般に、相関除去前処理器601は中間信号607を導出し、中間信号は、相関除去器602の入力となり、さらに、中間信号は、相関除去器602によって計算される相関除去された信号と一緒に入力信号608を形成するために、部分的に変更されないまま送信される。入力信号608は、入力チャネル構成605に応じて、出力チャネル構成610aまたは610bを導出する混合マトリックス603に入力される信号である。
1対5構成において、ダウンミックス信号および任意の残留信号が相関除去前処理器601に供給され、相関除去前処理器は相関除去器の入力として用いられる4つの中間信号(e1〜e4)を導出し、相関除去器は4つの相関除去された信号(d1〜d4)を導出し、これらは入力信号から導出される直接送信された信号mとともに入力パラメータ608を形成する。
なお、追加の残留信号が入力として供給される場合、一般にサブバンドドメインにおいて作動する相関除去器602は、相関除去された信号を導出する代わりに残留信号をそのまま転送するように作動できることに注意されたい。これは、特定の周波数バンドだけを選択して行うこともできる。
2対5構成において、入力信号605は、左チャネル、右チャネル、および任意に残留信号を含む。この構成において、相関除去前処理マトリックス601は、左、右および中央チャネルと、さらに2つの中間チャネル(e1、e2)とを導出する。このため、混合マトリックス603への入力信号は、左チャネル、右チャネル、中央チャネル、および2つの相関除去された信号(d1およびd2)によって形成される。
さらなる変形において、相関解除前処理マトリックスは、追加の中間信号(e5)を導出でき、これは相関除去器(D5)の入力として用いられ、それの出力は、信号(e5)から導出される相関除去された信号(d5)と相関除去された信号(d1およびd2)との組み合わせとなる。この場合、追加の相関除去が中央チャネルと左および右チャネルとの間で保証できる。
本発明のオーディオデコーダ600は、2対5構成において本発明の概念を実施する。送信されたパラメトリック表現は、相関除去前処理マトリックス601および混合マトリックス603において用いられる。本発明の概念は、図5にさらに詳細に示されるように、いろいろな方法で実施できる。
図5は、相関除去前処理マトリックス601として実施される相関除去前処理器および混合マトリックス603を原理的なスケッチで示し、マルチチャネルオーディオデコーダ600の他のコンポーネントは省略される。
相関除去前処理およびミキシングを実行するために用いられるマトリックスは、タイムスロット、すなわち信号の個別の時間サンプルを表現する縦列と、異なるパラメータバンドを表現する横列、すなわちオーディオ信号の1つのパラメータバンドに関連付けられる各横列とを有する。
本発明の概念によれば、マトリックス601および603のマトリックスエレメントは、送信されたパラメトリックデータから部分的にだけ導出され、残りのマトリックスエレメントは、例えばダウンミックス信号の知識などに基づいて、デコータによって導出される。図5は、所定の周波数境界線622から下側では、相関除去前処理マトリックス601および混合マトリックス603のエレメントが、ビットストリームから読み取られるパラメータ620から、すなわちエンコーダから送信される情報に基づいて導出されるという1つの例を示す。周波数境界線622の上側では、マトリックスエレメントは、ダウンミックス信号からの知識だけに基づいてデコーダにおいて導出される。
境界周波数(または、一般的に、送信されたデータから導出されるマトリックスエレメントの量)は、特定のアプリケーションシナリオに対して満たさなければならない品質上および/またはビットレート上の制約に従って自由に適応できる。
本明細書に概説する新規の符号化方法に対しては、MPEGの空間オーディオ符号化参照モデル0(MPEG Spatial Audio Coding Reference Model 0)に概説されたものと同一構造を用いてサイド情報なしのアップミックス処理が実施できることが望ましい。本発明は、サイド情報なしのアップミックスの方法を表現することにあるといえるが、望ましくは、そのような概念とサイド情報支援のアップミックスとをシームレスで好都合に組み合わせる方法を提供する。
MPEGの空間オーディオ符号化参照モデル0(MPEG Spatial Audio Coding Reference Model 0)と違って、サイド情報なしのアップミックス処理において、マトリックスM1(601)およびM2(603)のエレメントは、望ましくは、ビットストリームで送信されるデータから導出されるのではなく、サイド情報の助けを受けない異なる手段によって、例えば、ダウンミックス信号から得られる知識だけに基づく発見的なルールを適用することによって導出される。
このように、ビットレートおよびオーディオ品質に関して、送信されたパラメータに基づくマトリックスの部分だけを得ること、および、残りの部分を満たすためにサイド情報なしの方法のルールを適用することによって、両方の技術の間で漸進的なスケーリングを実現することが可能である。概念的に言えば、このことは、マトリックスの部分に対しては空間パラメータを送信することに、他の部分いついてはデコーダでそれらを生成することに対応する。
マトリックスの部分が一方または他方の方法によって導出されるかの決定は、
・所定の水平境界線の下側のマトリックスの部分を1つの方法によって導出し、さらに、この境界線の上側を他の方法によって導出する、
・所定の垂直境界線の左側のマトリックスの部分を1つの方法によって導出し、さらに、この境界線の右側を他の方法によって導出する、
・両方のマトリックスのエレメントが1つの方法によって導出される両方のマトリックス内の任意の時間・周波数タイルを決定し、さらに、残りの時間・周波数タイルのエレメントを他の方法によって導出する、
というように、いろいろな多くの方法で行うことができる。
上述のパラグラフにおいて、ある境界周波数までのマルチチャネル信号の全ての周波数部分を空間パラメータによって表現するが、マルチチャネル信号の残りの周波数部分は空間パラメータによって表現されないことが有利であることを詳述した。これには、高い周波数よりも低い周波数に対してより良好な知覚を有する人間の耳の特質が考慮に入れられている。もちろん、本発明は、第1の部分および第2の部分へのマルチチャネル信号のこの分割に決して限定されるものではなく、信号の高周波部分をより良い精度で表現することが有利で適切な場合もある。これは、オーディオ信号のエネルギーの大部分が高周波ドメインに含まれていて、信号の低周波領域にはわずかのエネルギーしか含まれていない場合には特にそうである。この場合、マスキング効果のために、低周波部分は高周波部分に圧倒されることになり、信号の高周波部分の高品質再生の可能性を提供することが有利である。
本発明の方法の特定の実現要求によっては、本発明の方法は、ハードウェアまたはソフトウェアで実施することができる。この実施は、本発明の方法が実行されるように、プログラム可能なコンピュータシステムと協働する、それに記憶された電子的に読み取り可能な制御信号を有する、デジタル記憶媒体、特に、ディスク、DVDまたはCDを用いて実行することができる。そのため、本発明は、一般に、コンピュータプログラム製品がコンピュータ上で実行される場合に、機械で読み取り可能なキャリアに記憶された本発明の方法を実行するためのプログラムコードを有するコンピュータプログラム製品である。言い換えると、本発明は、コンピュータプログラムがコンピュータ上で実行される場合に、少なくとも1つの本発明の方法を実行するためのプログラムコードを有するコンピュータプログラムである。
上述には本発明の特定の実施の形態に関して特に示され説明されたが、形式や詳細のさまざまな他の変更が本発明の精神および範囲から逸脱することなくできるということは、当業者にとって理解されよう。さまざまな変更が本願明細書において開示されさらに特許請求の範囲によって理解される上位概念から逸脱することなく異なる実施の形態に適応する際にできることを理解すべきである。
図1は、本発明のエンコーダを示す。 図2は、本発明の概念によって生成されるパラメータビットストリームの例を示す。 図2aは、本発明のトランスコーダを示す。 図3は、本発明のデコーダを示す。 図4は、本発明の概念を実施する空間オーディオデコーダの例を示す。 図5は、デコーダ側の別の符号化スキームの使用を図解する。 図6は、従来技術のエンコーダを示す。 図7は、従来技術のデコーダを示す。 図8は、フィルタバンクのブロック図を示す。 図9は、従来技術のエンコーダのさらなる例を示す。

Claims (26)

  1. オーディオ信号を処理しさらにマルチチャネル信号の第1の部分を表現する第1のパラメトリックデータを処理するためのマルチチャネルオーディオデコーダであって、前記マルチチャネル信号の第2の部分に対して、パラメトリックデータが処理されないかまたは第2のパラメトリックデータが処理され、前記第2のパラメトリックデータは、前記マルチチャネル信号の同一の部分を表現する場合に、前記第1のパラメトリックデータよりも少ない情報ユニットを必要とし、前記マルチチャネルオーディオデコーダは、
    前記オーディオ信号から中間信号を導出するためのプロセッサを含み、前記プロセッサは、
    前記中間信号の第1の部分を導出するための第1の導出ルールを用い、前記中間信号の前記第1の部分は前記マルチチャネルオーディオ信号の前記第1の部分に対応し、前記第1の導出ルールは前記第1のパラメトリックデータにより決まり、さらに
    前記中間信号の第2の部分を導出するための第2の導出ルールを用い、前記第2の導出ルールはパラメトリックデータを用いないかまたは前記第2のパラメトリックデータを用いる、マルチチャネルオーディオデコーダ。
  2. 前記マルチチャネル信号の時間部分または周波数部分を表現している第1のパラメトリックデータを処理するように作動する、請求項1に記載のマルチチャネルオーディオデコーダ。
  3. 前記マルチチャネルオーディオ信号の時間部分の表現を含んでいる第1のパラメトリックデータを処理するように作動し、前記マルチチャネルオーディオ信号の所定の周波数バンドに関する情報だけが前記表現に含まれる、請求項1に記載のマルチチャネルオーディオデコーダ。
  4. 前記プロセッサは、下限周波数から上限周波数の範囲の前記中間信号の周波数部分を導出するために前記第1の導出ルールを用いるように作動する、請求項1に記載のマルチチャネルオーディオデコーダ。
  5. 少なくとも前記上限周波数を信号伝達するウィンドウ情報をさらに処理するように作動する、請求項4に記載のマルチチャネルオーディオデコーダ。
  6. ウィンドウ推定ルールを用いて前記第1のパラメトリックデータから少なくとも前記上限周波数を導出するように作動する、請求項4に記載のマルチチャネルオーディオデコーダ。
  7. 前記ウィンドウ推定ルールは、ダウンミックス信号の信号部分に対して送信されるパラメトリックデータの量のカウント、およびパラメトリックデータの前記カウントされた量とパラメトリックデータの基準量との比較を含む、請求項6に記載のマルチチャネルオーディオデコーダ。
  8. 前記プロセッサは、ダウンミックス信号に関する情報からまたは前記第2のパラメトリックデータから、前記第2の導出ルールを計算するように作動する、請求項1に記載のマルチチャネルオーディオデコーダ。
  9. 前記プロセッサは、前記第2の導出ルールとして所定のルールを用いるように作動する、請求項1に記載のマルチチャネルオーディオデコーダ。
  10. 以下の空間オーディオパラメータのリスト
    ICC(チャネル間相関)
    CLD(チャネルレベル差)
    CPC(チャネル予測係数)
    から選択される1つ以上の空間オーディオパラメータを含むパラメトリックデータを処理するように作動する、請求項1に記載のマルチチャネルオーディオデコーダ。
  11. 相関除去フィルタを用いて前記中間周波数から相関除去された信号を導出する相関除去器をさらに含む、請求項1に記載のマルチチャネルオーディオデコーダ。
  12. 前記マルチチャネル信号の再構成を計算するためのアップミキサをさらに含み、前記アップミキサは、
    前記マルチチャネル信号の前記第1の部分に対応する前記マルチチャネル信号の前記再構成の第1の部分を計算するための第1のアップミキシングルールを用い、前記第1のアップミキシングルールは前記第1のパラメトリックデータにより決まり、さらに
    前記マルチチャネル信号の前記再構成の第2の部分を計算するための第2のアップミキシングルールを用い、前記第2のアップミキシングルールはパラメトリックデータを用いないかまたは前記第2のパラメトリックデータを用いる、請求項1に記載のマルチチャネルオーディオデコーダ。
  13. マルチチャネルオーディオ信号の空間特性を表現するパラメトリック表現を生成するためのマルチチャネルエンコーダであって、前記マルチチャネルエンコーダは、
    空間パラメータを生成するためのパラメータ生成器と、
    前記パラメトリック表現を生成するための出力インタフェースとを含み、
    前記パラメータ生成器または前記出力インタフェースは、前記パラメトリック表現が前記マルチチャネル信号の第1の部分に対する第1のパラメトリックデータを含むように、前記パラメトリック表現を生成するように適応され、さらに、前記マルチチャネル信号の第2の部分に対して、前記パラメトリック表現にパラメトリックデータが含まれないかまたは第2のパラメトリックデータが含まれ、前記第2のパラメトリックデータは、前記マルチチャネル信号の同一の部分を表現する場合に、前記第1のパラメトリックデータよりも少ない情報ユニットを必要とする、マルチチャネルエンコーダ。
  14. 前記出力インタフェースは、前記パラメトリック表現中にウィンドウ情報を含むようにさらに適応され、前記ウィンドウ情報は、前記マルチチャネルオーディオ信号の前記第1の部分を示す、請求項13に記載のマルチチャネルエンコーダ。
  15. 品質基準を用いて、前記マルチチャネル信号のどの部分が前記第1の部分として用いられるのかを決定するための部分決定器をさらに含む、請求項13に記載のマルチチャネルエンコーダ。
  16. 前記部分決定器は、前記パラメトリック表現を用いる前記マルチチャネル信号の再構成の品質が品質許容範囲内にとどまるように決定するように作動する、請求項15に記載のマルチチャネルエンコーダ。
  17. 前記部分決定器は、前記パラメトリック表現によって費やされる記憶スペースの最大量が超過されないように決定するように作動する、請求項15に記載のマルチチャネルエンコーダ。
  18. 前記マルチチャネル信号からダウンミックス信号を導出するためのダウンミキサをさらに含み、
    前記出力インタフェースは、前記ダウンミックス信号を出力するようにさらに適応される、請求項13に記載のマルチチャネルエンコーダ。
  19. 前記パラメータ生成器は、前記マルチチャネル信号の前記第1の部分および前記第2の部分に対する空間パラメータのフルセットを生成するように作動し、
    前記ダウンミキサは、空間パラメータの前記フルセットにより決まるフルダウンミキシングルールを用いて前記ダウンミックス信号を導出するように作動し、さらに
    前記出力インタフェースは、少なくとも、前記マルチチャネル信号の前記第1の部分に対応する前記空間パラメータを用いて、前記パラメトリック表現を生成するように作動する、請求項18に記載のマルチチャネルエンコーダ。
  20. オーディオ信号を処理しさらにマルチチャネル信号の第1の部分を表現する第1のパラメトリックデータを処理するための方法であって、前記マルチチャネル信号の第2の部分に対して、パラメトリックデータが処理されないかまたは第2のパラメトリックデータが処理され、前記第2のパラメトリックデータは、前記マルチチャネル信号の同一の部分を表現する場合に、前記第1のパラメトリックデータよりも少ない情報ユニットを必要とし、前記方法は、
    中間信号の第1の部分を導出するための前記第1のパラメトリックデータにより決まる第1の導出ルールを用いて前記ダウンミックス信号から前記中間信号を導出する工程であって、前記中間信号の前記第1の部分は前記マルチチャネルオーディオ信号の前記第1の部分に対応する、工程と、
    第2の導出ルールを用いて前記中間信号の第2の部分を導出する工程であって、前記第2の導出ルールは前記第2のパラメトリックデータを用いるかまたはパラメトリックデータを用いない、工程とを含む、方法。
  21. マルチチャネルオーディオ信号の空間特性を表現するパラメトリック表現を生成するための方法であって、前記方法は、
    空間パラメータを生成する工程と、
    前記パラメトリック表現が前記マルチチャネル信号の第1の部分に対する第1のパラメトリックデータを含むように、前記パラメトリック表現を生成する工程であって、前記マルチチャネル信号の第2の部分に対して、前記パラメトリック表現にパラメトリックデータが含まれないかまたは第2のパラメトリックデータが含まれ、前記第2のパラメトリックデータは、前記マルチチャネル信号の同一の部分を表現する場合に、前記第1のパラメトリックデータよりも少ない情報ユニットを必要とする、工程とを含む、方法。
  22. マルチチャネルオーディオ信号の空間特性を表現するパラメトリック表現であって、前記パラメトリック表現は前記マルチチャネル信号の第1の部分に対する第1のパラメトリックデータを含み、さらに、前記マルチチャネル信号の第2の部分に対して、パラメトリックデータが含まれないかまたは第2のパラメトリックデータが含まれ、前記第2のパラメトリックデータは、前記マルチチャネル信号の同一の部分に対して、前記第1のパラメトリックデータよりも少ない情報ユニットを必要とする、パラメトリック表現。
  23. コンピュータ読み取り可能な記憶媒体に記憶された、請求項23に記載のパラメトリック表現。
  24. コンピュータ上で実行される場合に、オーディオ信号を処理しさらにマルチチャネル信号の第1の部分を表現する第1のパラメトリックデータを処理するための方法を実行するためのプログラムコードを有するコンピュータプログラムであって、前記マルチチャネル信号の第2の部分に対して、パラメトリックデータが処理されないかまたは第2のパラメトリックデータが処理され、前記第2のパラメトリックデータは、前記マルチチャネル信号の同一の部分を表現する場合に、前記第1のパラメトリックデータよりも少ない情報ユニットを必要とし、前記方法は、
    中間信号の第1の部分を導出するための前記第1のパラメトリックデータにより決まる第1の導出ルールを用いて前記ダウンミックス信号から前記中間信号を導出する工程であって、前記中間信号の前記第1の部分は前記マルチチャネルオーディオ信号の前記第1の部分に対応する、工程と、
    第2の導出ルールを用いて前記中間信号の第2の部分を導出する工程であって、前記第2の導出ルールは前記第2のパラメトリックデータを用いるかまたはパラメトリックデータを用いない、工程とを含む、コンピュータプログラム。
  25. コンピュータ上で実行される場合に、マルチチャネルオーディオ信号の空間特性を表現するパラメトリック表現を生成するための方法を実行するためのプログラムコードを有するコンピュータプログラムであって、前記方法は、
    空間パラメータを生成する工程と、
    前記パラメトリック表現が前記マルチチャネル信号の第1の部分に対する第1のパラメトリックデータを含むように、前記パラメトリック表現を生成する工程であって、前記マルチチャネル信号の第2の部分に対して、前記パラメトリック表現にパラメトリックデータが含まれないかまたは第2のパラメトリックデータが含まれ、前記第2のパラメトリックデータは、前記マルチチャネル信号の同一の部分を表現する場合に、前記第1のパラメトリックデータよりも少ない情報ユニットを必要とする、工程とを含む、コンピュータプログラム。
  26. マルチチャネルオーディオ信号の空間特性を表現する空間パラメータを用いて前記マルチチャネルオーディオ信号のパラメトリック表現を生成するためのトランスコーダであって、
    前記パラメトリック表現が前記マルチチャネル信号の第1の部分に対して前記空間パラメータから導出される第1のパラメトリックデータを含むように、前記パラメトリック表現を生成するパラメータ生成器であって、前記マルチチャネル信号の第2の部分に対して、前記パラメトリック表現にパラメトリックデータが含まれないかまたは第2のパラメトリックデータが含まれ、前記第2のパラメトリックデータは、前記マルチチャネル信号の同一の部分を表現する場合に、前記第1のパラメトリックデータよりも少ない情報ユニットを必要とする、パラメータ生成器を含む、トランスコーダ。
JP2008521820A 2005-07-19 2006-06-21 パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念 Active JP5265358B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US70100105P 2005-07-19 2005-07-19
US60/701,001 2005-07-19
US11/323,965 2005-12-29
US11/323,965 US20070055510A1 (en) 2005-07-19 2005-12-29 Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
PCT/EP2006/005971 WO2007009548A1 (en) 2005-07-19 2006-06-21 Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding

Publications (2)

Publication Number Publication Date
JP2009501948A true JP2009501948A (ja) 2009-01-22
JP5265358B2 JP5265358B2 (ja) 2013-08-14

Family

ID=36873210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008521820A Active JP5265358B2 (ja) 2005-07-19 2006-06-21 パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念

Country Status (21)

Country Link
US (2) US20070055510A1 (ja)
EP (6) EP4307125B1 (ja)
JP (1) JP5265358B2 (ja)
KR (1) KR100946688B1 (ja)
CN (1) CN101223578B (ja)
AU (1) AU2006272127B2 (ja)
BR (1) BRPI0616019B1 (ja)
CA (1) CA2614384C (ja)
DK (5) DK4307125T3 (ja)
ES (6) ES2995055T3 (ja)
FI (5) FI4235440T3 (ja)
HU (5) HUE064455T2 (ja)
IL (1) IL188425A0 (ja)
MX (1) MX2008000828A (ja)
MY (1) MY149198A (ja)
NO (1) NO342863B1 (ja)
PL (6) PL4307124T3 (ja)
PT (6) PT4235440T (ja)
RU (1) RU2382418C2 (ja)
TW (1) TWI339028B (ja)
WO (1) WO2007009548A1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009506371A (ja) * 2005-08-30 2009-02-12 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
JP2009272849A (ja) * 2008-05-07 2009-11-19 Alpine Electronics Inc サラウンド生成装置
JP2010511909A (ja) * 2006-12-07 2010-04-15 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
JP2011509429A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
JP2012073351A (ja) * 2010-09-28 2012-04-12 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP2012513138A (ja) * 2008-12-19 2012-06-07 ドルビー インターナショナル アーベー 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置
JP4992979B2 (ja) * 2007-11-06 2012-08-08 富士通株式会社 多地点間音声通話装置
JP2013517687A (ja) * 2010-01-22 2013-05-16 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャネル脱相関を使った改善されたマルチチャネル上方混合
JP2016509260A (ja) * 2013-02-21 2016-03-24 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
JP2021513108A (ja) * 2018-02-01 2021-05-20 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハイブリッドエンコーダ/デコーダ空間解析を使用する音響シーンエンコーダ、音響シーンデコーダおよびその方法

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI393121B (zh) * 2004-08-25 2013-04-11 杜比實驗室特許公司 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
RU2416129C2 (ru) * 2005-03-30 2011-04-10 Конинклейке Филипс Электроникс Н.В. Масштабируемое многоканальное кодирование звука
EP1905006B1 (en) * 2005-07-19 2013-09-04 Koninklijke Philips Electronics N.V. Generation of multi-channel audio signals
CA2621664C (en) * 2005-09-14 2012-10-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP4976304B2 (ja) * 2005-10-07 2012-07-18 パナソニック株式会社 音響信号処理装置、音響信号処理方法およびプログラム
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
KR100773560B1 (ko) * 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
TWI340600B (en) * 2006-03-30 2011-04-11 Lg Electronics Inc Method for processing an audio signal, method of encoding an audio signal and apparatus thereof
US7873424B1 (en) * 2006-04-13 2011-01-18 Honda Motor Co., Ltd. System and method for optimizing digital audio playback
ATE539434T1 (de) * 2006-10-16 2012-01-15 Fraunhofer Ges Forschung Vorrichtung und verfahren für mehrkanalparameterumwandlung
PL2068307T3 (pl) * 2006-10-16 2012-07-31 Dolby Int Ab Udoskonalony sposób kodowania i odtwarzania parametrów w wielokanałowym kodowaniu obiektów poddanych procesowi downmiksu
JP5355387B2 (ja) * 2007-03-30 2013-11-27 パナソニック株式会社 符号化装置および符号化方法
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
WO2009068085A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation An encoder
EP2301017B1 (en) * 2008-05-09 2016-12-21 Nokia Technologies Oy Audio apparatus
ES2657393T3 (es) * 2008-07-11 2018-03-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y descodificador de audio para codificar y descodificar muestras de audio
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
EP2214161A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
EP2394268B1 (en) * 2009-04-08 2014-01-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
CN102802112B (zh) * 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
US9183842B2 (en) * 2011-11-08 2015-11-10 Vixs Systems Inc. Transcoder with dynamic audio channel changing
US9516446B2 (en) 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
EP2922053B1 (en) * 2012-11-15 2019-08-28 NTT Docomo, Inc. Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
WO2014108738A1 (en) * 2013-01-08 2014-07-17 Nokia Corporation Audio signal multi-channel parameter encoder
JP6096934B2 (ja) * 2013-01-29 2017-03-15 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 周波数拡張されたオーディオ信号を生成するためのデコーダ、復号化方法、符号化された信号を生成するためのエンコーダ、およびコンパクトな選択サイド情報を使用する符号化方法
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
MY199032A (en) 2013-05-24 2023-10-10 Dolby Int Ab Audio encoder and decoder
US20160111100A1 (en) * 2013-05-28 2016-04-21 Nokia Technologies Oy Audio signal encoder
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
CN110648674B (zh) 2013-09-12 2023-09-22 杜比国际公司 多声道音频内容的编码
US9911423B2 (en) 2014-01-13 2018-03-06 Nokia Technologies Oy Multi-channel audio signal classifier
WO2015173422A1 (de) * 2014-05-15 2015-11-19 Stormingswiss Sàrl Verfahren und vorrichtung zur residualfreien erzeugung eines upmix aus einem downmix
KR102144332B1 (ko) * 2014-07-01 2020-08-13 한국전자통신연구원 다채널 오디오 신호 처리 방법 및 장치
MY181992A (en) 2016-01-22 2021-01-18 Fraunhofer Ges Forschung Apparatus and method for encoding or decoding a multi-channel signal using spectral-domain resampling
DE102016214923B4 (de) 2016-08-11 2023-08-17 Continental Reifen Deutschland Gmbh Schwefelvernetzbare Kautschukmischung und deren Verwendung
WO2019076739A1 (en) * 2017-10-16 2019-04-25 Sony Europe Limited AUDIO PROCESSING
KR102799690B1 (ko) * 2019-06-14 2025-04-23 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 매개변수 인코딩 및 디코딩
CA3186590A1 (en) 2020-06-11 2021-12-16 Dolby Laboratories Licensing Corporation Encoding of multi-channel audio signals comprising downmixing of a primary and two or more scaled non-primary input channels

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
JP2002311994A (ja) * 2001-04-18 2002-10-25 Matsushita Electric Ind Co Ltd ステレオオーディオ信号符号化方法及び装置
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化
JP2004252068A (ja) * 2003-02-19 2004-09-09 Matsushita Electric Ind Co Ltd デジタルオーディオ信号の符号化装置及び方法
JP2007501441A (ja) * 2003-05-08 2007-01-25 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション スペクトル成分結合およびスペクトル成分再生を用いた改良オーディオコード化システム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4799260A (en) * 1985-03-07 1989-01-17 Dolby Laboratories Licensing Corporation Variable matrix decoder
KR960012475B1 (ko) * 1994-01-18 1996-09-20 대우전자 주식회사 디지탈 오디오 부호화장치의 채널별 비트 할당 장치
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
DE19900961A1 (de) 1999-01-13 2000-07-20 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Wiedergabe von Mehrkanaltonsignalen
TW510143B (en) * 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
AU8852801A (en) * 2000-08-31 2002-03-13 Dolby Lab Licensing Corp Method for apparatus for audio matrix decoding
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ATE332003T1 (de) * 2002-04-22 2006-07-15 Koninkl Philips Electronics Nv Parametrische beschreibung von mehrkanal-audio
EP1523862B1 (en) 2002-07-12 2007-10-31 Koninklijke Philips Electronics N.V. Audio coding
BR0305555A (pt) 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado
WO2004086817A2 (en) * 2003-03-24 2004-10-07 Koninklijke Philips Electronics N.V. Coding of main and side signal representing a multichannel signal
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
ATE474310T1 (de) * 2004-05-28 2010-07-15 Nokia Corp Mehrkanalige audio-erweiterung
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US8214221B2 (en) * 2005-06-30 2012-07-03 Lg Electronics Inc. Method and apparatus for decoding an audio signal and identifying information included in the audio signal

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
JP2002311994A (ja) * 2001-04-18 2002-10-25 Matsushita Electric Ind Co Ltd ステレオオーディオ信号符号化方法及び装置
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化
JP2004252068A (ja) * 2003-02-19 2004-09-09 Matsushita Electric Ind Co Ltd デジタルオーディオ信号の符号化装置及び方法
JP2007501441A (ja) * 2003-05-08 2007-01-25 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション スペクトル成分結合およびスペクトル成分再生を用いた改良オーディオコード化システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200100410001; 守谷健弘: '"音声と楽音の情報圧縮の原理と標準化"' 電子情報通信学会技術研究報告 Vol.99,No.299, 19990916, p.1-6 *
JPN6011017433; 守谷健弘: '"音声と楽音の情報圧縮の原理と標準化"' 電子情報通信学会技術研究報告 Vol.99,No.299, 19990916, p.1-6 *

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009506371A (ja) * 2005-08-30 2009-02-12 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US8103513B2 (en) 2005-08-30 2012-01-24 Lg Electronics Inc. Slot position coding of syntax of spatial audio application
US8165889B2 (en) 2005-08-30 2012-04-24 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
US8103514B2 (en) 2005-08-30 2012-01-24 Lg Electronics Inc. Slot position coding of OTT syntax of spatial audio coding application
US8060374B2 (en) 2005-08-30 2011-11-15 Lg Electronics Inc. Slot position coding of residual signals of spatial audio coding application
US8082158B2 (en) 2005-08-30 2011-12-20 Lg Electronics Inc. Time slot position coding of multiple frame types
US8340325B2 (en) 2006-12-07 2012-12-25 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
JP2010511909A (ja) * 2006-12-07 2010-04-15 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
US8311227B2 (en) 2006-12-07 2012-11-13 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US8428267B2 (en) 2006-12-07 2013-04-23 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US8488797B2 (en) 2006-12-07 2013-07-16 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
JP4992979B2 (ja) * 2007-11-06 2012-08-08 富士通株式会社 多地点間音声通話装置
JP2011509429A (ja) * 2008-01-01 2011-03-24 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
US8483411B2 (en) 2008-01-01 2013-07-09 Lg Electronics Inc. Method and an apparatus for processing a signal
JP2009272849A (ja) * 2008-05-07 2009-11-19 Alpine Electronics Inc サラウンド生成装置
JP2012513138A (ja) * 2008-12-19 2012-06-07 ドルビー インターナショナル アーベー 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置
US9269360B2 (en) 2010-01-22 2016-02-23 Dolby Laboratories Licensing Corporation Using multichannel decorrelation for improved multichannel upmixing
JP2013517687A (ja) * 2010-01-22 2013-05-16 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャネル脱相関を使った改善されたマルチチャネル上方混合
JP2012073351A (ja) * 2010-09-28 2012-04-12 Fujitsu Ltd オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US11488611B2 (en) 2013-02-21 2022-11-01 Dolby International Ab Methods for parametric multi-channel encoding
US9715880B2 (en) 2013-02-21 2017-07-25 Dolby International Ab Methods for parametric multi-channel encoding
US10360919B2 (en) 2013-02-21 2019-07-23 Dolby International Ab Methods for parametric multi-channel encoding
US10643626B2 (en) 2013-02-21 2020-05-05 Dolby International Ab Methods for parametric multi-channel encoding
US10930291B2 (en) 2013-02-21 2021-02-23 Dolby International Ab Methods for parametric multi-channel encoding
JP2016509260A (ja) * 2013-02-21 2016-03-24 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
US11817108B2 (en) 2013-02-21 2023-11-14 Dolby International Ab Methods for parametric multi-channel encoding
US12100404B2 (en) 2013-02-21 2024-09-24 Dolby International Ab Methods for parametric multi-channel encoding
JP2021513108A (ja) * 2018-02-01 2021-05-20 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハイブリッドエンコーダ/デコーダ空間解析を使用する音響シーンエンコーダ、音響シーンデコーダおよびその方法
JP7261807B2 (ja) 2018-02-01 2023-04-20 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハイブリッドエンコーダ/デコーダ空間解析を使用する音響シーンエンコーダ、音響シーンデコーダおよびその方法
JP2023085524A (ja) * 2018-02-01 2023-06-20 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハイブリッドエンコーダ/デコーダ空間解析を使用する音響シーンエンコーダ、音響シーンデコーダおよびその方法
JP7711124B2 (ja) 2018-02-01 2025-07-22 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハイブリッドエンコーダ/デコーダ空間解析を使用する音響シーンエンコーダ、音響シーンデコーダおよびその方法
US12537011B2 (en) 2018-02-01 2026-01-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio scene encoder, audio scene decoder and related methods using hybrid encoder-decoder spatial analysis

Also Published As

Publication number Publication date
PT4307125T (pt) 2024-09-26
WO2007009548A1 (en) 2007-01-25
ES2995055T3 (en) 2025-02-05
TWI339028B (en) 2011-03-11
EP4235440A3 (en) 2023-10-25
EP4307126A3 (en) 2024-03-27
DK4235440T3 (da) 2025-01-20
FI4307124T3 (fi) 2024-08-27
EP4307125A2 (en) 2024-01-17
KR100946688B1 (ko) 2010-03-12
CN101223578B (zh) 2011-12-14
NO342863B1 (no) 2018-08-20
FI4307125T3 (fi) 2024-08-27
ES2690278T3 (es) 2018-11-20
PL4307126T3 (pl) 2024-10-28
PL4307125T3 (pl) 2024-10-28
US20070055510A1 (en) 2007-03-08
EP4235440A2 (en) 2023-08-30
FI3404656T3 (fi) 2023-09-25
EP4307126A2 (en) 2024-01-17
AU2006272127B2 (en) 2010-02-04
CN101223578A (zh) 2008-07-16
US20070019813A1 (en) 2007-01-25
PL1908056T3 (pl) 2019-01-31
EP1908056A1 (en) 2008-04-09
DK4307126T3 (da) 2024-11-04
EP4307126B1 (en) 2024-07-31
PL4235440T3 (pl) 2025-03-10
RU2008106225A (ru) 2009-08-27
EP4307125B1 (en) 2024-08-07
MX2008000828A (es) 2008-03-19
US8180061B2 (en) 2012-05-15
HUE064455T2 (hu) 2024-03-28
AU2006272127A1 (en) 2007-01-25
HUE067925T2 (hu) 2024-11-28
PL3404656T3 (pl) 2024-06-17
HUE068233T2 (hu) 2024-12-28
ES3002034T3 (en) 2025-03-06
PT4307126T (pt) 2024-09-26
RU2382418C2 (ru) 2010-02-20
EP3404656A1 (en) 2018-11-21
ES2995111T3 (en) 2025-02-06
TW200723712A (en) 2007-06-16
ES2952871T3 (es) 2023-11-06
DK4307124T3 (da) 2024-11-04
PT4235440T (pt) 2025-01-07
EP4307125A3 (en) 2024-03-27
IL188425A0 (en) 2008-11-03
HUE068230T2 (hu) 2024-12-28
HUE069874T2 (hu) 2025-04-28
DK4307125T3 (da) 2024-11-04
PT1908056T (pt) 2018-11-07
EP4307124B1 (en) 2024-08-07
EP4307124A2 (en) 2024-01-17
KR20080032146A (ko) 2008-04-14
CA2614384C (en) 2012-07-24
DK3404656T3 (da) 2023-09-25
EP4235440B1 (en) 2024-11-27
CA2614384A1 (en) 2007-01-25
ES2995054T3 (en) 2025-02-05
FI4307126T3 (fi) 2024-08-27
EP1908056B1 (en) 2018-08-01
NO20080850L (no) 2008-04-17
EP3404656B1 (en) 2023-06-28
EP4307124A3 (en) 2024-03-27
PL4307124T3 (pl) 2024-10-28
JP5265358B2 (ja) 2013-08-14
FI4235440T3 (fi) 2024-12-30
BRPI0616019A2 (pt) 2011-06-07
MY149198A (en) 2013-07-31
PT4307124T (pt) 2024-09-05
PT3404656T (pt) 2023-10-09
BRPI0616019B1 (pt) 2019-11-19

Similar Documents

Publication Publication Date Title
JP5265358B2 (ja) パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念
RU2618383C2 (ru) Кодирование и декодирование аудиообъектов
TWI544479B (zh) 音訊解碼器、音訊編碼器、用以基於已編碼表示型態提供至少四音訊聲道信號的方法、用以基於至少四音訊聲道信號提供已編碼表示型態的方法、及使用頻寬擴展的電腦程式
JP5185337B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
CN101228575B (zh) 利用侧向信息的声道重新配置
RU2382419C2 (ru) Многоканальный кодер
HK40098875A (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
HK40098875B (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
HK40097401A (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
HK40097401B (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
HK40098877B (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
HK40098877A (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
HK40098876A (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
HK40098876B (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
HK1262409B (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
HK1262409A1 (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
HK1112096B (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
HK1112096A (en) Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110412

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110708

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110715

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111213

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120307

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120314

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130315

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130501

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5265358

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250