[go: up one dir, main page]

JP2010518460A - オーディオ信号の処理方法及び装置 - Google Patents

オーディオ信号の処理方法及び装置 Download PDF

Info

Publication number
JP2010518460A
JP2010518460A JP2009550086A JP2009550086A JP2010518460A JP 2010518460 A JP2010518460 A JP 2010518460A JP 2009550086 A JP2009550086 A JP 2009550086A JP 2009550086 A JP2009550086 A JP 2009550086A JP 2010518460 A JP2010518460 A JP 2010518460A
Authority
JP
Japan
Prior art keywords
information
parameter
audio signal
gain range
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009550086A
Other languages
English (en)
Inventor
オ オー,ヒェン
ウォン ジュン,ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2010518460A publication Critical patent/JP2010518460A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する段階と、比率情報及び利得範囲情報に基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、を含むオーディオ信号処理方法が開示される。
オブジェクト情報を用いて比率情報を生成する段階と、比率情報を用いてオブジェクトの利得範囲情報を生成する段階と、利得範囲情報に基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、を含むオーディオ信号処理方法が開示される。

Description

本発明は、オーディオ信号の処理方法及び装置に係り、より詳細には、デジタル媒体、放送信号などを通じて受信したオーディオ信号を処理できるオーディオ信号の処理方法及び装置に関する。
一般に、複数個のオブジェクトをモノラルまたはステレオ信号にダウンミックスする過程において、それぞれのオブジェクト信号からパラメータが抽出される。これらのパラメータはデコーダで用いることができ、それぞれのオブジェクトのパニング(panning)及び利得(gain)は、ユーザーの選択によって制御されてもよい。
それぞれのオブジェクトシグナルを制御するためには、ダウンミックスに含まれているそれぞれのソースが適切にポジショニングまたはパニングされなければならない。
また、チャネル基盤(channel-oriented)デコーディング方式で下位互換性を有するためには、オブジェクトパラメータをアップミキシングのためのマルチチャネルパラメータに柔軟に変換しなければならない。
本発明は上記の点に鑑みてなされたもので、その目的は、オブジェクトの利得及びパニングを無制限に制御できるオーディオ信号処理方法及び装置を提供することにある。
本発明の他の目的は、ユーザの選択に基づいてオブジェクトの利得及びパニングを制御できるオーディオ信号処理方法及び装置を提供することにある。
本発明のさらに他の目的は、一定の制限範囲内において、ユーザの選択に基づいてオブジェクトの利得及びパニングを制御できるオーディオ信号処理方法及び装置を提供することにある。
本発明は、下記の効果及び利点を提供する。
第一に、オブジェクトの利得及びパニングを無制限に制御することができる。
第二に、ユーザの選択に基づいてオブジェクトの利得及びパニングを制御することができる。
第三に、オブジェクトの利得を調整する場合、利得調整に対する利得範囲を提供することによって、利得調整によって音質が歪むことを防止することができる。
本発明の実施例によるオーディオ信号処理装置の構成図である。 本発明の実施例によるオーディオ信号処理装置における情報生成ユニットの細部構成図の一例である。 本発明の一実施例によるオーディオ信号処理方法のフローチャートである。 本発明の実施例によるオーディオ信号処理装置における情報生成ユニットの細部構成図の他の例である。 本発明の他の実施例によるオーディオ信号処理方法のフローチャートである。
上記の目的を達成するために本発明によるオーディオ信号処理方法は、メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する段階と、前記比率情報及び前記利得範囲情報に基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、を含む。
本発明によれば、前記比率情報は、オーディオ信号ビットストリームから取得されてもよい。
本発明によれば、上記の方法は、前記比率情報及び前記利得範囲情報が送信されたか否かを表す送信フラグ情報を取得する段階をさらに含み、前記比率情報及び前記利得範囲情報は、前記送信フラグ情報に基づいて前記オーディオ信号ビットストリームから取得されてもよい。
本発明によれば、上記の方法は、オブジェクト信号が関係信号に該当するか否かを表す関係フラグ情報を取得する段階をさらに含み、前記送信フラグ情報を取得する段階は、前記関係フラグ情報に基づいて行われてもよい。
本発明によれば、前記関係フラグ情報は、オブジェクト信号が関係信号に該当するか否かをオブジェクト別に表すことができる。
本発明によれば、上記の方法は、周波数分解能情報を受信する段階をさらに含み、前記パラメータ情報を変形する段階は、前記周波数分解能情報に基づいて行われてもよい。
本発明によれば、前記利得範囲情報は、特定オブジェクトに対する絶対的な利得値、オブジェクト間の相対的な利得差値のうち少なくとも一つを含んでもよい。
本発明によれば、前記利得範囲情報は、時間別サブバンド別に変化してもよい。
本発明によれば、上記の方法は、前記利得範囲情報を表示する段階と、オブジェクト別利得調整に関するユーザ制御情報を受信する段階と、を含み、前記制御パラメータは、前記ユーザ制御情報に基づいて生成されてもよい。
本発明によれば、 上記の方法は、前記変形されたパラメータ情報を用いてマルチチャネル情報を生成する段階をさらに含んでもよい。
本発明によれば、上記の方法は、前記メイン信号及び前記サブ信号を含むダウンミックス情報を受信する段階と、前記ダウンミックス情報及び前記マルチチャネル情報を用いてマルチチャネル信号を生成する段階をさらに含んでもよい。
本発明によれば、上記の方法は、前記制御パラメータを含むミックス情報を受信する段階をさらに含み、前記ミックス情報は、オブジェクト位置情報、オブジェクト利得情報、及び再生環境情報のうち少なくとも一つに基づいて生成されてもよい。
本発明によれば、前記オーディオ信号は、放送信号を通じて受信されてもよい。
本発明によれば、前記オーディオ信号は、デジタル媒体を通じて受信されてもよい。
本発明の他の側面によれば、メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する段階と、前記比率情報及び前記利得範囲情報に基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、を行うためのプログラムが記録されたコンピュータ読み取り可能な記録媒体が提供される。
本発明のさらに他の側面によれば、メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する情報送受信部と、前記比率情報及び前記利得範囲情報に基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する情報変形部と、を含むオーディオ信号処理装置が提供される。
本発明のさらに他の側面によれば、第1レベル情報を含むオブジェクト情報を取得する段階と、メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する段階と、前記第1レベル情報及び第2レベル情報のうち一つに基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、を含み、前記第2レベル情報は、前記比率情報及び前記利得範囲情報を用いて生成されることを特徴とするオーディオ信号処理方法が提供される。
本発明によれば、この方法は、前記変形されたパラメータ情報を用いてマルチチャネル情報を生成する段階をさらに含んでもよい。
本発明のさらに他の側面によれば、第1レベル情報を含むオブジェクト情報を取得する段階と、メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する段階と、前記第1レベル情報及び第2レベル情報のうち一つに基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、を行うためのプログラムが記録され、前記第2レベル情報は、前記比率情報及び前記利得範囲情報を用いて生成されるコンピュータ読み取り可能な記録媒体が提供される。
本発明のさらに他の側面によれば、第1レベル情報を含むオブジェクト情報を取得し、メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する情報送受信部と、前記第1レベル情報及び第2レベル情報のうち一つに基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する情報変形部と、を含み、前記第2レベル情報は、前記比率情報及び前記利得範囲情報を用いて生成されるオーディオ信号処理装置が提供される。
本発明のさらに他の側面によれば、オブジェクト情報を用いて比率情報を生成する段階と、前記比率情報を用いてオブジェクトの利得範囲情報を生成する段階と、前記利得範囲情報に基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、を含むオーディオ信号処理方法が提供される。
本発明によれば、前記比率情報を生成する段階は、オブジェクト信号のオブジェクトレベル情報を用いて行われてもよい。
本発明によれば、前記比率情報を生成する段階は、特定オブジェクト信号のオブジェクトレベル情報、及び他のオブジェクト信号のオブジェクトレベル情報との比率を用いて行われてもよい。
本発明によれば、前記他のオブジェクト信号のオブジェクトレベル情報は、二つ以上の他のオブジェクト信号のオブジェクトレベル情報の和でありうる。
本発明によれば、前記利得範囲情報を生成する段階は、デフォルトガイド情報、ユーザガイド情報、及びエンコーダガイド情報のうち少なくとも一つを用いて行われてもよい。
本発明によれば、前記利得範囲情報は、特定オブジェクトに対する絶対的な利得値、オブジェクト間の相対的な利得差値のうち少なくとも一つを含んでもよい。
本発明によれば、前記利得範囲情報は、時間別サブバンド別に変化してもよい。
本発明によれば、上記の方法は、メイン信号及びサブ信号を含むダウンミックス情報を受信する段階をさらに含み、前記比率情報は、前記メイン信号と前記サブ信号との間の相対的な比率を含んでもよい。
本発明によれば、上記の方法は、前記変形されたパラメータ情報を用いてマルチチャネル情報を生成する段階をさらに含んでもよい。
本発明によれば、上記の方法は、前記制御パラメータを含むミックス情報を受信する段階をさらに含み、前記ミックス情報は、オブジェクト位置情報、オブジェクト利得情報、及び再生環境情報のうち少なくとも一つに基づいて生成されてもよい。
本発明によれば、前記オーディオ信号は、放送信号を通じて受信されてもよい。
本発明によれば、前記オーディオ信号は、デジタル媒体を通じて受信されてもよい。
本発明のさらに他の側面によれば、オブジェクト情報を用いて比率情報を生成する段階と、前記比率情報を用いてオブジェクトの利得範囲情報を生成する段階と、前記利得範囲情報に基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、を行うためのプログラムが記録されたコンピュータ読み取り可能な記録媒体が提供される。
本発明のさらに他の側面によれば、オブジェクト情報を用いて比率情報を生成し、前記比率情報を用いてオブジェクトの利得範囲情報を生成する情報生成部と、前記利得範囲情報に基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する情報変形部と、を含むオーディオ信号処理装置が提供される。
以下の概略説明とそれに続く詳細説明は、実施例と説明であり、特許請求の範囲に記載された本発明をさらに説明するものであることを理解されたい。
次に、本発明の好ましい実施形態について詳細に説明する。添付の図面には、これらの実施形態の例が示されている。
特に、本明細書で、情報(information)は、値(values)、パラメータ(parameters)、係数(coefficients)、成分(elements)などを総称する用語で、その意味は場合によって別々に解釈できるため、これに本発明が限定されることはない。
図1は、本発明の実施例によるオーディオ信号処理装置の構成を示す図である。図1を参照すると、まず、本発明の実施例によるオーディオ信号処理装置100は、情報生成ユニット110、ダウンミックス処理ユニット120、マルチチャネルデコーダ130を含む。
情報生成ユニット(information generating unit)110は、オブジェクト情報(object information:OI)などを含む付加情報(side information)を、オーディオ信号ビットストリームを通じて受信し、ユーザインターフェースを介してミックス情報(mix information:MXI)を受信する。ここで、オブジェクト情報(OI)は、ダウンミックス信号中に含まれているオブジェクトに関する情報であり、オブジェクトレベル情報(object level information)、オブジェクト相関情報(object correlation information)などを含んでもよい。このオブジェクト情報(OI)は、オブジェクト特性を表すパラメータであるオブジェクトパラメータ(object parameter:OP)を含んでもよい。一方、ミックス情報(MXI)とは、オブジェクト位置情報(object position information)、オブジェクト利得情報(object gain information)、及び再生環境情報(playback configuration information)などに基づいて生成された情報のことをいう。ここで、オブジェクト位置情報は、ユーザが各オブジェクトの位置またはパニング(panning)を制御するために入力した情報であり、オブジェクト利得情報は、ユーザが各オブジェクトの利得(gain)を制御するために入力した情報である。また、再生環境情報は、スピーカの個数、スピーカの位置、アンビエント情報(スピーカの仮想位置)などを含む情報であり、ユーザから入力されても良く、あらかじめ保存されていても良く、他の装置から受信しても良い。このミックス情報(MXI)は制御パラメータ(control parameter:CP)を含んでもよく、この場合、制御パラメータ(CP)は、特に、オブジェクト利得情報に該当するパラメータとすることができるが、本発明がこれに限定されることはない。
一方、情報生成ユニット110は、比率情報(RI)及び利得範囲情報(GI)などをビットストリームから受信する、または、自動的に生成する。比率情報(RI)、利得範囲情報(GI)などに関する具体的な説明は、図2〜図5に基づいて後述する。比率情報(RI)及び利得範囲情報(GI)を用いてオブジェクトパラメータ(OP)及び制御パラメータ(CP)のうち一つ以上を含むパラメータ情報(PI)を変形することによって、変形されたパラメータ情報(MPI)を生成し、これを用いてマルチチャネル情報(multi-channel information:MI)を生成する。ここで、マルチチャネル情報(MI)は、ダウンミックス信号(DMX)をアップミキシングするための情報であり、チャネルレベル情報(channel level information)、チャネル相関情報(channel correlation information)などを含んでもよい。これについても図2〜図5を用いて具体的に後述する。
一方、情報生成ユニット110は、変形されたパラメータ情報(MPI)などを用いてダウンミックス処理情報(downmix processing information:DPI)を生成することができる。一方、ダウンミックス処理ユニット120がオブジェクト利得を調節するためのものではなく、オブジェクトパニングのみを調節するためのものであるとすれば、情報生成ユニット110は、変形されたパラメータ情報(MPI)ではなく、変形されていないパラメータ情報(PI)を用いてダウンミックス処理情報(DPI)を生成することができる。
ダウンミックス処理ユニット120は、ダウンミックス情報(以下、‘ダウンミックス信号(DMX)’という。)を受信し、ダウンミックス処理情報(DPI)を用いてダウンミックス信号(DMX)を処理する。オブジェクトのパニングまたは利得を調節するためにダウンミックス信号(DMX)を処理することができる。
マルチチャネルデコーダ(multi-channel decoder)130は、処理されたダウンミックス(processed downmix)を受信し、該処理されたダウンミックス信号をマルチチャネル情報(MI)を用いてアップミキシングすることでマルチチャネル信号を生成する。
以下では、図2〜図5を参照して、情報生成ユニット110が比率情報(RI)及び利得範囲情報(GI)などをビットストリームから受信する、または、自動的に生成し、これを用いてマルチチャネル情報(MI)を生成する過程について具体的に説明する。
図2は、本発明の実施例によるオーディオ信号処理装置における情報生成ユニットの細部構成図の一例であり、図3は、本発明の一実施例によるオーディオ信号処理方法のフローチャートである。図2及び図3は、比率情報(RI)をビットストリームから受信する方式の実施例に関する。まず、図2を参照すると、情報生成ユニット110は、情報送受信部112a、情報変形部114a、及びマルチチャネル情報生成部116aを含む。以下、図2及び図3を参照しつつ、各構成要素及び各段階について具体的に説明する。
情報送受信部112aは、先ず、オーディオ信号ビットストリームから、オブジェクトパラメータ(OP)を含むオブジェクト情報(OI)を取得し、ユーザインターフェースなどから、制御パラメータ(CP)を含むミックス情報(MXI)を取得する(S110段階)。ここで、オブジェクト情報(OI)は、図1で説明されたオブジェクト情報と同じものとすることができ、このオブジェクト情報(OI)にオブジェクトレベル情報が含まれて送信された場合、この送信されたオブジェクトレベル情報を第1オブジェクトレベル情報(OL1)と称する。
そして、情報送受信部112aは、オーディオ信号ビットストリームから関係フラグ情報を取得する(S120段階)。
関係フラグ情報のうち第1関係フラグ情報がビットストリームに含まれてもよい。この第1関係フラグ情報は、ダウンミックス信号に含まれているオブジェクト信号が全て独立している信号なのか、それとも関係信号に該当する信号が一つ以上存在するかを表す情報である。例えば、第1関係フラグ情報が‘0’の時は、全てのオブジェクト信号が独立している信号であるということを意味し、第1関係フラグ情報が‘1’の時は、関係信号に該当するオブジェクト信号が一つ以上存在するということを意味するように設定できるが、本発明はこれに限定されない。ここで、関係信号は、オブジェクトレベルを調節する際に、他のオブジェクト信号との相対的なレベルが一定レベル以下または以上になる時、音質の劣化が生じうる信号のことを指す。
一方、第1関係フラグ情報によって、関係信号に該当するオブジェクト信号が一つ以上存在する場合(例えば、第1関係フラグ情報が‘1’である場合)、オブジェクト別に該当のオブジェクトが関係信号に該当するかを表す第2関係フラグ情報を抽出することができる。逆に、関係信号に該当するオブジェクト信号が全く存在しない場合(例えば、第1関係フラグ情報が‘0’である場合)、各オブジェクト別に関係信号に該当するか否かを表す第2関係フラグ情報を抽出する必要はない。
取得された第2関係フラグ情報によって、該当のオブジェクト信号が関係信号に該当するか否かがわかる。例えば、第2関係フラグ情報が‘0’である場合は、該当のオブジェクト信号が関係信号に該当しないということを意味し、第2関係フラグ情報が‘1’である場合は該当のオブジェクト信号が関係信号に該当するということを意味するように設定できるが、本発明はこれに限定されない。
このように、S120段階で取得された関係フラグ情報に基づいて、比率情報(RI)及び利得範囲情報(GI)が送信されたか否かを表す送信フラグ情報を取得する(S130段階)。具体的には、第2関係フラグ情報を参照した結果、該当のオブジェクトが関係信号に該当する場合(例えば、第2関係フラグ情報が‘1’である場合)、該当のオブジェクトに対して送信フラグ情報を抽出することができる。
S130段階で取得された送信フラグ情報に基づいて、該当のオブジェクトに対して比率情報(RI)及び利得範囲情報(GI)が送信されたか否かがわかる。例えば、送信フラグ情報が0の場合、比率情報及び利得範囲情報が送信されていないことを意味し、送信フラグ情報が1の場合は比率情報及び利得範囲情報が送信されていることを意味してもよい。
これに限定されず、本発明は、第1関係フラグ情報及び第2関係フラグ情報はビットストリームに含まれず、送信フラグ情報のみがビットストリームに含まれる実施例も具現可能である。
その後、S130段階で取得された送信フラグ情報を参照した結果、比率情報及び利得範囲情報が送信された場合(例えば、送信フラグ情報が‘1’である場合)、利得範囲情報(GI)が存在する周波数の分解能を表す周波数分解能情報を取得する(S140段階)。例えば、周波数分解能情報が‘1’である場合、利得範囲情報が存在する周波数の分解能が‘28’であることを意味し、周波数分解能情報が‘2’である場合、利得範囲情報が存在する周波数の分解能が‘20’であるということを意味するように設定できるが、本発明はこれに限定されない。
また、S130段階で取得された送信フラグ情報を参照した結果、比率情報(RI)及び利得範囲情報(GI)が送信される場合(例えば、送信フラグ情報が‘1’である場合)、比率情報(RI)及び利得範囲情報(GI)を取得する(S150段階)。一方、比率情報(RI)は、該当のオブジェクト信号がメイン信号に近いか、または、サブ信号に近いかを表す情報であり、具体的には、メイン信号とサブ信号との間の相対的な比率を含んでもよい。例えば、メイン信号は音声信号に、サブ信号は雑音信号に対応することができる、または、メイン信号はメインボーカル信号に、サブ信号はバックコーラス信号に対応することができるが、本発明はこれに限定されない。例えば、比率情報が‘0’である場合、該当のオブジェクト信号がサブ信号に非常に近いということを意味し、‘1’である場合は、該当のオブジェクト信号がサブ信号に近いということを意味し、‘2’である場合は、該当のオブジェクト信号がメイン信号に近いということを意味し、‘3’である場合は、該当のオブジェクト信号がメイン信号に非常に近いということを意味するように設定できるが、本発明はこれに限定されない。
一方、利得範囲情報(GI)は、オブジェクトの利得調整に対する範囲を含んでもよい。この場合、上記範囲は、上限値または下限値などの制限値を含んでもよい。この制限値は、特定オブジェクトに対する絶対的な利得値に該当してもよく、オブジェクト間の相対的な利得差値に該当してもよい。制限値が絶対的な利得値に該当する場合、例えば、ボーカル信号の利得調整範囲が10dB以内になることがある。制限値が相対的な利得差値に該当する場合、例えば、ボーカル信号の利得調整範囲がピアノ信号を基準に10dB以内になることがある。このような場合、ボーカル信号のみを10dB程度強調することもでき、または、ボーカル信号を5dB程度強調するとともにピアノ信号を5dB程度抑圧することもできる。このような利得範囲情報(GI)は、時間及び周波数帯域に対して不変な値であっても良いが、時間別サブバンド別に変化しても良い。
さらに、利得範囲情報(GI)は、相対的な利得調整連動情報に該当してもよい。相対的な利得調整連動情報とは、特定オブジェクトが強調または抑圧される場合、それに応じて他のオブジェクトも強調または抑圧されなければならないかに関する情報のことをいう。例えば、ボーカル信号及びバックコーラス信号の場合、ボーカル信号が10dB強調された時、それに応じてバックコーラス信号も5〜15dB程度強調し、音質の歪曲を低減させなければならない。
S150段階で、比率情報(RI)は、各オブジェクト別パラメータセット別に抽出することができ、利得範囲情報(GI)は、各オブジェクト別に周波数分解能によって抽出することができるが、本発明はこれに限定されない。
一方、S150段階で、比率情報(RI)のみをオーディオ信号ビットストリームから抽出し、利得範囲情報(GI)は抽出せずに自動的に生成することもできる。この利得範囲情報(GI)の生成においては、後ほど図4及び図5と共に説明される方式が利用されてもよい。
情報送受信部112aは、S150段階で取得された比率情報(RI)及び利得範囲情報(GI)をユーザインターフェース200を通じて表示することができる(S160段階)。例えば、ボーカル信号が他の信号との関係信号であるか、ボーカル信号の利得調整において10dB以上調整すると音質の歪曲が生じる可能性があるというメッセージをユーザが見ることができるように画面に表示できる。その後、ユーザがこのようなメッセージを確認した後に、オブジェクト別利得調整に関するユーザ制御情報をユーザインターフェース200を通じて入力できる。この場合、ユーザ制御情報は、オブジェクト信号の制限値(10dB)を超過した値(例:20dB)が入力されても、制限値以内に強制的に調整されてもよく、または、制限値を超過してもユーザ制御情報(20dB)をそのまま反映することができる。この場合、S110段階で受信されたミックス情報(MXI)は、このようなユーザ制御情報に基づいて生成されてもよい。
情報変形部114aは、S150段階で取得された比率情報(RI)及び利得範囲情報(GI)を用いて、S110段階で取得されたオブジェクトパラメータ(OP)及び制御パラメータ(CP)のうち一つ以上を含むパラメータ情報(PI)を変形する(S170段階)。具体的には、先ず、ミックス情報(MXI)、比率情報(RI)を用いて利得範囲情報(GI)を変形した後、変形された利得範囲情報(GI)をオブジェクトパラメータ(OP)に適用することによって、変形されたパラメータ情報(MPI)を生成できるが、本発明はこれに限定されない。上記S170段階は、S140段階で抽出された周波数分解能情報に基づいて行われてもよい。具体的には、S140段階で抽出された周波数分解能情報によって、各周波数帯域に該当する利得範囲情報を抽出し、該当の利得範囲情報を全体周波数帯域にマッピングさせた後、上記S180段階を行うことができる。一方、変形されたパラメータ情報(MPI)は、S110段階で受信した第1オブジェクトレベル情報(OL1)とは異なる第2オブジェクトレベル情報(OL2)を含んでもよい。
マルチチャネル情報生成部116aは、マルチチャネル情報(MI)を生成する(S180段階)。この場合、S110段階で送信された第1オブジェクトレベル情報(OL1)を用いてマルチチャネル情報(MI)を生成することもでき、S170段階で生成された変形パラメータ情報(MPI)の第2オブジェクトレベル情報(OL2)を用いてマルチチャネル情報(MI)を生成することもできる。もちろん、第1オブジェクトレベル情報(OL1)を用いる場合は、レベル調整におけるガイドが適用されない場合である。
図4は、本発明の実施例によるオーディオ信号処理装置における情報生成ユニットの細部構成図の他の例であり、図5は、本発明の他の実施例によるオーディオ信号処理方法のフローチャートである。図4及び図5は、比率情報(RI)をデコーダで自動的に生成する方式の実施例に該当する図である。先ず、図4を参照すると、情報生成ユニット110は、情報送受信部112b、情報生成部113b、情報変形部114b、及びマルチチャネル情報生成部116bを含む。以下、図4及び図5を参照しながら、各構成要素及び各段階について具体的に説明する。
先ず、情報送受信部112bは、オーディオ信号ビットストリームからオブジェクトパラメータ(OP)を含むオブジェクト情報(OI)を受信し、ユーザインターフェースなどから制御パラメータ(CP)を含むミックス情報(MXI)を受信する(S310段階)。さらに、情報送受信部112bは、エンコーダガイド情報(encoder guide information:EGI)を受信することができる。エンコーダガイド情報(EGI)は、エンコーダで生成されたガイド情報であり、オブジェクトの利得調整に対する範囲を含み、オーディオ信号ビットストリームを通じて受信された情報でありうる。
情報生成部113bは、S110段階で受信したオブジェクト情報(OI)を用いて比率情報を生成する(S320段階)。具体的に、オブジェクト情報(OI)のうちオブジェクトレベル情報(OLI)を用いて比率情報(RI)を生成することができる。ここで、比率情報(RI)は、メイン信号とサブ信号との間の相対的な比率に該当してもよく、他のオブジェクト信号とのレベル情報比率に該当してもよい。他のオブジェクト信号とのレベル情報の比率は、次のように定義されてもよい。
Figure 2010518460
ここで、OLDiは、i番目のオブジェクト信号のオブジェクトレベル情報、ODLkは他のオブジェクト信号のオブジェクトレベル情報(k≠i)を表す。
一方、他のオブジェクト信号が二つ以上である場合、比率情報(RI)は、他のオブジェクト信号全体とのレベル情報比率に該当してもよく、これは、下記の数式のように定義されてもよい。
Figure 2010518460
ここで、OLDiはi番目のオブジェクト信号のオブジェクトレベル情報、Nは総オブジェクト信号個数、k=0〜N(ただし、k≠i)を表す。
S320段階で生成した比率情報(RI)を用いて利得範囲情報(GI)を生成する(S330段階)。ここで、利得範囲情報(GI)は、図2及び図3で説明された利得範囲情報(GI)と同様に、オブジェクトの利得調整に対する範囲を含んでもよく、この範囲は、上限値または下限値などのような制限値を含んでもよい。この場合、制限値は、特定オブジェクトに対する絶対的な利得値に該当してもよく、オブジェクト間の相対的な利得差値に該当してもよい。利得範囲情報(GI)は、時間及び周波数帯域に対して不変な値であっても良いが、時間別サブバンド別に変化してもよい。
比率情報(RI)を用いて利得範囲情報(GI)を生成する方式には、様々なものがあり、OLDratioが非常に高い場合、利得範囲情報(GI)の利得制限値(Ggain)を大きい値に決定することができる。これは、OLDratioが高い場合、大きいレンダリング自由度を与えても音質の歪曲が少ないためである。例えば、ボーカル信号のOLDratio(vocal)が非常に高い値である場合、ボーカル信号に対する利得制限値(Ggain)は20dBにすることができる。ボーカル信号のOLDratioがピアノ信号に対してのみ大きい値を有する場合、ボーカル信号のピアノ信号に対する利得制限値(Ggain(back chorus))のみを大きい値にすることができる。
一方、より高精度の利得範囲情報(GI)を生成する目的で、エンコーダでオブジェクトレベル情報(OLD)を生成する時に特定の周波数の重み付けを付与することができる。例えば、最も低い周波数帯域に該当する0番目のバンドに対して特定周波数を強調する重み付けが与えられたフィルターを用いてOLDを求めた後、一般的な方法で求めたOLDとの差分情報を付加情報として含むことが可能である。音声信号などの場合、このような差分情報を、利得範囲情報(GI)を生成するのに用いることができる。
一方、S330段階で利得範囲情報(GI)を生成するときに、デフォルトガイド情報(DGI)、ユーザガイド情報(UGI)、及びエンコーダガイド情報(EGI)などが利用されてもよい。デフォルトガイド情報(default guide information:DGI)は、デコーダ自体であらかじめ定められたガイド情報を意味し、ユーザガイド情報(user guide information:UGI)は、ユーザインターフェース200を介して入力されたガイド情報に該当し、エンコーダガイド情報(encoder guide information:EGI)は、エンコーダで生成され、オーディオビットストリームから抽出されたガイド情報に該当する。利得範囲情報(GI)の生成において、デフォルトガイド情報(DGI)、ユーザガイド情報(UGI)、及びエンコーダガイド情報(EGI)などを参照でき、例えば、オブジェクトレベル情報のみに基づいて特定オブジェクトの利得制限値(Ggain)を10dBに定めることができるが、この時、ユーザガイド情報(UGI)が5dBである場合、このようなユーザガイド情報(UGI)を参照して利得範囲情報(GI)を生成することができる。
このようにS320段階で生成された比率情報(RI)、及びS330段階で生成された利得範囲情報(GI)は、上述のS160段階と同様に、ユーザインターフェース200を通じて表示されてもよい(S340段階)。
情報変形部114bは、上述のS170段階と同様に、オブジェクトパラメータ(OP)及び制御パラメータ(CP)のうち一つ以上を含むパラメータ情報(PI)を変形する(S350段階)。
そして、マルチチャネル情報生成部116bも、上述のS190段階と同様に、変形されたパラメータ情報(MPI)を用いてマルチチャネル情報(MI)を生成する(S360段階)。
以上、本発明の実施形態を参照しながら本発明について説明及び例示してきたが、当分野の技術者にとって、本発明の主旨及び範囲から逸脱することなく様々な修正及び変形が可能であることは明らかである。したがって、本発明は、添付の特許請求の範囲及びその均等範囲内の本発明の修正及び変形を含むものである。
本発明は、オーディオ信号をエンコーディング及びデコーディングするのに適用することができる。

Claims (20)

  1. メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する段階と、
    前記比率情報及び前記利得範囲情報に基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、
    を含むことを特徴とするオーディオ信号処理方法。
  2. 前記比率情報は、オーディオ信号ビットストリームから取得されることを特徴とする、請求項1に記載のオーディオ信号処理方法。
  3. 前記比率情報及び前記利得範囲情報が送信されたか否かを表す送信フラグ情報を取得する段階をさらに含み、
    前記比率情報及び前記利得範囲情報は、前記送信フラグ情報に基づいて前記オーディオ信号ビットストリームから取得されることを特徴とする、請求項2に記載のオーディオ信号処理方法。
  4. オブジェクト信号が関係信号に該当するか否かを表す関係フラグ情報を取得する段階をさらに含み、
    前記送信フラグ情報を取得する段階は、前記関係フラグ情報に基づいて行われることを特徴とする、請求項3に記載のオーディオ信号処理方法。
  5. 前記関係フラグ情報は、オブジェクト信号が関係信号に該当するか否かをオブジェクト別に表すことを特徴とする、請求項3に記載のオーディオ信号処理方法。
  6. 周波数分解能情報を受信する段階をさらに含み、
    前記パラメータ情報を変形する段階は、前記周波数分解能情報に基づいて行われることを特徴とする、請求項2に記載のオーディオ信号処理方法。
  7. 前記利得範囲情報は、特定オブジェクトに対する絶対的な利得値、オブジェクト間の相対的な利得差値のうち少なくとも一つを含むことを特徴とする、請求項1に記載のオーディオ信号処理方法。
  8. 前記利得範囲情報は、時間別サブバンド別に変化することを特徴とする、請求項1に記載のオーディオ信号処理方法。
  9. 前記利得範囲情報を表示する段階と、
    オブジェクト別利得調整に関するユーザ制御情報を受信する段階と、
    を含み、
    前記制御パラメータは、前記ユーザ制御情報に基づいて生成されることを特徴とする、請求項1に記載のオーディオ信号処理方法。
  10. 前記変形されたパラメータ情報を用いてマルチチャネル情報を生成する段階をさらに含むことを特徴とする、請求項1に記載のオーディオ信号処理方法。
  11. 前記メイン信号及び前記サブ信号を含むダウンミックス情報を受信する段階と、
    前記ダウンミックス情報及び前記マルチチャネル情報を用いてマルチチャネル信号を生成する段階と、
    をさらに含むことを特徴とする、請求項10に記載のオーディオ信号処理方法。
  12. 前記制御パラメータを含むミックス情報を受信する段階をさらに含み、
    前記ミックス情報は、オブジェクト位置情報、オブジェクト利得情報、及び再生環境情報のうち少なくとも一つに基づいて生成されることを特徴とする、請求項1に記載のオーディオ信号処理方法。
  13. 前記オーディオ信号は、放送信号を通じて受信されることを特徴とする、請求項1に記載のオーディオ信号処理方法。
  14. 前記オーディオ信号は、デジタル媒体を通じて受信されることを特徴とする、請求項1に記載のオーディオ信号処理方法。
  15. メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する段階と、
    前記比率情報及び前記利得範囲情報に基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、
    を行うためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
  16. メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する情報送受信部と、
    前記比率情報及び前記利得範囲情報に基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する情報変形部と、
    を含むことを特徴とするオーディオ信号処理装置。
  17. 第1レベル情報を含むオブジェクト情報を取得する段階と、
    メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する段階と、
    前記第1レベル情報及び第2レベル情報のうち一つに基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、
    を含み、
    前記第2レベル情報は、前記比率情報及び前記利得範囲情報を用いて生成されることを特徴とするオーディオ信号処理方法。
  18. 前記変形されたパラメータ情報を用いてマルチチャネル情報を生成する段階をさらに含むことを特徴とする、請求項17に記載のオーディオ信号処理方法。
  19. 第1レベル情報を含むオブジェクト情報を取得する段階と、
    メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する段階と、
    前記第1レベル情報及び第2レベル情報のうち一つに基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する段階と、を行うためのプログラムが記録され、
    前記第2レベル情報は、前記比率情報及び前記利得範囲情報を用いて生成される、コンピュータ読み取り可能な記録媒体。
  20. 第1レベル情報を含むオブジェクト情報を取得し、メイン信号とサブ信号との間の比率情報と、オブジェクトの利得範囲情報とを取得する情報送受信部と、
    前記第1レベル情報及び第2レベル情報のうち一つに基づいて、オブジェクトパラメータ及び制御パラメータのうち少なくとも一つを含むパラメータ情報を変形する情報変形部と、
    を含み、
    前記第2レベル情報は、前記比率情報及び前記利得範囲情報を用いて生成されることを特徴とするオーディオ信号処理装置。
JP2009550086A 2007-02-13 2008-02-13 オーディオ信号の処理方法及び装置 Pending JP2010518460A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US88971507P 2007-02-13 2007-02-13
US2456208P 2008-01-30 2008-01-30
PCT/KR2008/000836 WO2008100067A1 (en) 2007-02-13 2008-02-13 A method and an apparatus for processing an audio signal

Publications (1)

Publication Number Publication Date
JP2010518460A true JP2010518460A (ja) 2010-05-27

Family

ID=39690253

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009549520A Pending JP2010518452A (ja) 2007-02-13 2008-02-13 オーディオ信号の処理方法及び装置
JP2009550086A Pending JP2010518460A (ja) 2007-02-13 2008-02-13 オーディオ信号の処理方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2009549520A Pending JP2010518452A (ja) 2007-02-13 2008-02-13 オーディオ信号の処理方法及び装置

Country Status (6)

Country Link
US (1) US20100119073A1 (ja)
EP (2) EP2118886A4 (ja)
JP (2) JP2010518452A (ja)
KR (2) KR20090122221A (ja)
CN (2) CN101627425A (ja)
WO (2) WO2008100068A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012525600A (ja) * 2009-04-28 2012-10-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム
JP2013511053A (ja) * 2009-10-20 2013-03-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ダウンミックス信号表現に基づいてアップミックス信号表現を生成するための装置、マルチチャネルオーディオ信号を表現するビットストリームを生成するための装置、歪制御信号化を用いる方法、コンピュータプログラム及びビットストリーム
JP2015535958A (ja) * 2012-10-05 2015-12-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 後方互換性のある多重分解能空間オーディオオブジェクト符号化のためのエンコーダ、デコーダおよび方法
WO2016038876A1 (ja) * 2014-09-08 2016-03-17 日本放送協会 符号化装置、復号化装置及び音声信号処理装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101137360B1 (ko) * 2009-01-28 2012-04-19 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN102549655B (zh) * 2009-08-14 2014-09-24 Dts有限责任公司 自适应成流音频对象的系统
TWI478149B (zh) * 2009-10-16 2015-03-21 Fraunhofer Ges Forschung 用以利用平均值而基於下混信號表示型態和與下混信號表示型態相關聯之參數側邊資訊來提供用於提供上混信號表示型態之一或多個經調整參數的裝置、方法與電腦程式
RU2607267C2 (ru) * 2009-11-20 2017-01-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство для обеспечения представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, устройство для обеспечения битового потока, представляющего многоканальный звуковой сигнал, способы, компьютерные программы и битовый поток, представляющий многоканальный звуковой сигнал посредством использования параметра линейной комбинации
WO2011083979A2 (en) 2010-01-06 2011-07-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
WO2014141577A1 (ja) 2013-03-13 2014-09-18 パナソニック株式会社 オーディオ再生装置およびオーディオ再生方法
TWI505724B (zh) * 2013-06-10 2015-10-21 Princeton Technology Corp 增益控制系統、聲音播放系統及其增益控制之方法
KR102465286B1 (ko) * 2015-06-17 2022-11-10 소니그룹주식회사 송신 장치, 송신 방법, 수신 장치 및 수신 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005101370A1 (en) * 2004-04-16 2005-10-27 Coding Technologies Ab Apparatus and method for generating a level parameter and apparatus and method for generating a multi-channel representation
WO2006089570A1 (en) * 2005-02-22 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP2006337767A (ja) * 2005-06-02 2006-12-14 Matsushita Electric Ind Co Ltd 低演算量パラメトリックマルチチャンネル復号装置および方法
WO2007010785A1 (ja) * 2005-07-15 2007-01-25 Matsushita Electric Industrial Co., Ltd. オーディオデコーダ

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5128597A (en) * 1990-06-14 1992-07-07 Kabushiki Kaisha Tokai-Rika-Denki-Seisakusho Control apparatus for power window regulator
US6141446A (en) * 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
US5838664A (en) * 1997-07-17 1998-11-17 Videoserver, Inc. Video teleconferencing system with digital transcoding
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6026168A (en) * 1997-11-14 2000-02-15 Microtek Lab, Inc. Methods and apparatus for automatically synchronizing and regulating volume in audio component systems
EP1072036B1 (en) * 1998-04-15 2004-09-22 STMicroelectronics Asia Pacific Pte Ltd. Fast frame optimisation in an audio encoder
US6122619A (en) * 1998-06-17 2000-09-19 Lsi Logic Corporation Audio decoder with programmable downmixing of MPEG/AC-3 and method therefor
US7103187B1 (en) * 1999-03-30 2006-09-05 Lsi Logic Corporation Audio calibration system
EP1295511A2 (en) * 2000-07-19 2003-03-26 Koninklijke Philips Electronics N.V. Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
KR100978018B1 (ko) * 2002-04-22 2010-08-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 공간 오디오의 파라메터적 표현
US7787632B2 (en) * 2003-03-04 2010-08-31 Nokia Corporation Support of a multichannel audio extension
US6937737B2 (en) * 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
TWI233091B (en) * 2003-11-18 2005-05-21 Ali Corp Audio mixing output device and method for dynamic range control
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
KR100663729B1 (ko) * 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US20070083365A1 (en) * 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal
EP2112652B1 (en) * 2006-07-07 2012-11-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for combining multiple parametrically coded audio sources

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005101370A1 (en) * 2004-04-16 2005-10-27 Coding Technologies Ab Apparatus and method for generating a level parameter and apparatus and method for generating a multi-channel representation
WO2005101371A1 (en) * 2004-04-16 2005-10-27 Coding Technologies Ab Method for representing multi-channel audio signals
WO2006089570A1 (en) * 2005-02-22 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP2006337767A (ja) * 2005-06-02 2006-12-14 Matsushita Electric Ind Co Ltd 低演算量パラメトリックマルチチャンネル復号装置および方法
WO2007010785A1 (ja) * 2005-07-15 2007-01-25 Matsushita Electric Industrial Co., Ltd. オーディオデコーダ

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012525600A (ja) * 2009-04-28 2012-10-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ダウンミックス信号表現に基づいたアップミックス信号表現の供給のための一つ以上の調整されたパラメータを供給するための装置、オブジェクト関連のパラメトリック情報を用いたオーディオ信号デコーダ、オーディオ信号トランスコーダ、オーディオ信号エンコーダ、オーディオビットストリーム、方法およびコンピュータ・プログラム
JP2013511053A (ja) * 2009-10-20 2013-03-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ダウンミックス信号表現に基づいてアップミックス信号表現を生成するための装置、マルチチャネルオーディオ信号を表現するビットストリームを生成するための装置、歪制御信号化を用いる方法、コンピュータプログラム及びビットストリーム
JP2015535958A (ja) * 2012-10-05 2015-12-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 後方互換性のある多重分解能空間オーディオオブジェクト符号化のためのエンコーダ、デコーダおよび方法
US11074920B2 (en) 2012-10-05 2021-07-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
WO2016038876A1 (ja) * 2014-09-08 2016-03-17 日本放送協会 符号化装置、復号化装置及び音声信号処理装置
JPWO2016038876A1 (ja) * 2014-09-08 2017-06-15 日本放送協会 符号化装置、復号化装置及び音声信号処理装置
JP2020101836A (ja) * 2014-09-08 2020-07-02 日本放送協会 音声信号処理装置
JP2020101837A (ja) * 2014-09-08 2020-07-02 日本放送協会 音声信号処理装置

Also Published As

Publication number Publication date
WO2008100068A1 (en) 2008-08-21
CN101627425A (zh) 2010-01-13
EP2111618A4 (en) 2010-04-21
EP2111618A1 (en) 2009-10-28
KR20090122221A (ko) 2009-11-26
CN101647060A (zh) 2010-02-10
EP2118886A4 (en) 2010-04-21
US20100119073A1 (en) 2010-05-13
WO2008100067A1 (en) 2008-08-21
KR20090115200A (ko) 2009-11-04
EP2118886A1 (en) 2009-11-18
JP2010518452A (ja) 2010-05-27

Similar Documents

Publication Publication Date Title
JP2010518460A (ja) オーディオ信号の処理方法及び装置
US10958229B2 (en) Metadata for loudness and dynamic range control
JP6778781B2 (ja) エンコードされたオーディオ拡張メタデータベースのダイナミックレンジ制御
JP5467105B2 (ja) オブジェクトベースのメタデータを用いてオーディオ出力信号を生成するための装置および方法
JP5149968B2 (ja) スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法
JP5635669B2 (ja) オーディオ入力信号の反響コンテンツを抽出および変更するためのシステム
KR101137361B1 (ko) 오디오 신호 처리 방법 및 장치
CA2908794C (en) Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
KR20100081300A (ko) 오디오 신호의 디코딩 방법 및 장치
JP2009288669A (ja) 音質補正装置、音質補正方法及び音質補正用プログラム
CN106796792A (zh) 用于增强音频信号的装置和方法、声音增强系统
JP2024028526A (ja) 音場関連レンダリング
TWI468031B (zh) 用以產生供提供額外輸出聲道的立體音響輸出信號之裝置、方法及電腦程式
JP2010118978A (ja) 音像定位制御装置および音像定位制御方法
JP5202021B2 (ja) 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体
US20100121470A1 (en) Method and an apparatus for processing an audio signal
CN103098494A (zh) 制作向下兼容声音格式的方法及装置
AU2013200578A1 (en) Apparatus and method for generating audio output signals using object based metadata
JP2010118977A (ja) 音像定位制御装置および音像定位制御方法
JP6905411B2 (ja) チャンネル数変換装置及びプログラム
KR20150124176A (ko) 다채널 오디오 신호의 채널 이득 제어 장치 및 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120731