[go: up one dir, main page]

CN101826326B - 一种立体声编码方法、装置和编码器 - Google Patents

一种立体声编码方法、装置和编码器 Download PDF

Info

Publication number
CN101826326B
CN101826326B CN2009101188708A CN200910118870A CN101826326B CN 101826326 B CN101826326 B CN 101826326B CN 2009101188708 A CN2009101188708 A CN 2009101188708A CN 200910118870 A CN200910118870 A CN 200910118870A CN 101826326 B CN101826326 B CN 101826326B
Authority
CN
China
Prior art keywords
energy
scaling factor
cross
signal
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009101188708A
Other languages
English (en)
Other versions
CN101826326A (zh
Inventor
郎玥
吴文海
苗磊
刘泽新
胡晨
张清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2009101188708A priority Critical patent/CN101826326B/zh
Priority to PCT/CN2010/070873 priority patent/WO2010099752A1/zh
Priority to EP14174097.7A priority patent/EP2793228B1/en
Priority to EP10748342.2A priority patent/EP2405424B1/en
Priority to ES10748342.2T priority patent/ES2529732T3/es
Publication of CN101826326A publication Critical patent/CN101826326A/zh
Priority to US13/224,806 priority patent/US9064488B2/en
Application granted granted Critical
Publication of CN101826326B publication Critical patent/CN101826326B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)

Abstract

本发明实施例公开了一种立体声编码方法、装置和编码器,涉及通信技术领域。本发明实施例提供的立体声编码方法包括:获得左声道能量关系系数以及与右声道能量关系系数;分别获得左能量和以及右能量和;根据所述左声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带;以及根据所述右声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带;采用所述左、右能量和以及互相关结果,获取缩放因子;根据所述缩放因子对所述立体声的左右声道信号进行编码。本发明实施例降低了确定缩放因子的复杂度,与现有技术相比,减小了立体声编码的计算量和复杂度,在较大程度上节省了系统资源。

Description

一种立体声编码方法、装置和编码器
技术领域
本发明涉及通信技术领域,尤其涉及一种立体声编码方法、装置和编码器。
背景技术
立体声编码技术将左、右声道信号下混成第一单声道信号;然后再对第一单声道信号与左右声道信号之间的能量关系进行编码;对第一单声道信号进行调整,得到第二单声道信号;对第二单声道信号与左,右声道的差值分别进行编码。在解码端用这些信息来重建声音信号,可以获得很好的立体声效果。
在现有的立体声编码技术中,需要确定缩放因子才能对第一单声道信号进行调整。为确定最佳的缩放因子,现有技术采用将所有可能的缩放因子进行计算和比较,因此,需要的计算量和复杂度非常高,占用了较多的系统资源。
发明内容
本发明实施例提供了一种立体声编码方法、装置和编码器,降低了确定缩放因子的复杂度,减小了需要的计算量和复杂度,从而在较大程度上节省了系统资源。
为实现上述目的,本发明实施例采用以下技术方案:
一方面,本发明实施例提供了一种立体声编码方法,包括:
获得第一单声道信号与左声道信号的左声道能量关系系数、以及所述第一单声道信号与右声道信号的右声道能量关系系数,所述第一单声道信号为立体声左右声道信号混合生成;
分别获得位于波谷位置的所述第一单声道信号各子带关于左声道能量关系系数的左能量和,以及位于波谷位置的所述第一单声道信号各子带关于右声道能量关系系数的右能量和;
根据所述左声道能量关系系数,对在波谷位置的第一单声道信号的各子带、和所述左声道信号的各子带进行互相关;以及根据所述右声道能量关系系数,对在波谷位置的第一单声道信号的各子带、和所述右声道信号的各子带进行互相关,得到互相关结果;
采用所述左、右能量和、以及所述互相关结果,获取缩放因子;
根据所述缩放因子对所述立体声的左右声道信号进行编码。
一方面,本发明实施例提供了一种立体声编码装置,包括:
能量关系获取模块,用于获得第一单声道信号与左声道信号的左声道能量关系系数、以及所述第一单声道信号与右声道信号的右声道能量关系系数,所述第一单声道信号为立体声左右声道信号混合生成;
能量和获取模块,用于分别获得位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块生成的左声道能量关系系数的左能量和,以及位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块生成的右声道能量关系系数的右能量和;
互相关模块,用于根据所述能量关系获取模块获得的左声道能量关系系数,对在波谷位置的第一单声道信号的各子带、和所述左声道信号的各子带进行互相关;以及根据所述能量关系获取模块获得的右声道能量关系系数,对在波谷位置的第一单声道信号的各子带、和所述右声道信号的各子带进行互相关,得到互相关结果;
缩放因子获取模块,用于根据所述能量和获取模块生成的左、右能量和、与互相关模块生成的互相关结果,获取缩放因子。
编码模块,用于根据所述缩放因子对所述立体声的左右声道信号进行编码。
另一方面,本发明实施例提供了一种编码器,包括:
能量关系获取模块,用于获得第一单声道信号与左声道信号的左声道能量关系系数、以及所述第一单声道信号与右声道信号的右声道能量关系系数,所述第一单声道信号为立体声左右声道信号混合生成;
能量和获取模块,用于分别获得位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块生成的左声道能量关系系数的左能量和,以及位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块生成的右声道能量关系系数的右能量和;
互相关模块,用于根据所述能量关系获取模块获得的左声道能量关系系数,对在波谷位置的第一单声道信号的各子带、和所述左声道信号的各子带进行互相关;以及根据所述能量关系获取模块获得的右声道能量关系系数,对在波谷位置的第一单声道信号的各子带、和所述右声道信号的各子带进行互相关,得到互相关结果;
缩放因子获取模块,用于根据所述能量和获取模块生成的左、右能量和、与互相关模块生成的互相关结果,获取缩放因子。
编码模块,用于根据所述缩放因子对所述立体声的左右声道信号进行编码。
本发明实施例提供的立体声编码方法、装置和编码器,通过降低确定缩放因子的复杂度,与现有技术相比,减小了立体声编码的计算量和复杂度,在较大程度上节省了系统资源。
附图说明
图1为本发明实施例一提供的一种立体声编码方法的流程图;
图2为本发明实施例二提供的确定最佳缩放因子的步骤的流程图;
图3为本发明实施例二提供的根据所述左、右能量和以及所述互相关结果,确定所述缩放因子所在的范围的步骤的流程图;
图4为本发明实施例二提供的在所述范围内确定最佳缩放因子的步骤的流程图;
图5为本发明实施例五提供的一种立体声编码装置的结构图;
图6为本发明实施例五提供的缩放因子获取模块的结构图;
图7为本发明实施例六提供的缩放因子范围确定单元的结构图;
图8为本发明实施例六提供的最佳缩放因子确定单元的结构图。
具体实施方式
为使本发明实施例的目的、技术方案及优点更加清楚明白,以下参照附图,对本发明实施例作进一步地详细说明。
如图1所示,本发明实施例一提供了一种立体声编码方法,包括:
101、获得第一单声道信号与左声道信号的左声道能量关系系数以及所述第一单声道信号与右声道信号的右声道能量关系系数,所述第一单声道信号为立体声左右声道信号混合生成;
在本发明实施例中,首先将左、右声道信号下混成一路单声道信号,并将所述单声道信号变换至MDCT域,对MDCT域的单声道信号进行编码后,再进行本地解码,从而得到单声道monoc信号,该单声道monoc信号即为第一单声道信号;计算所述第一单声道信号与左、右声道信号的能量关系(panning)系数,所述能量关系系数包括:左声道能量关系系数和右声道能量关系系数。
102、分别获得位于波谷位置的所述第一单声道信号各子带关于左声道能量关系系数的左能量和,以及位于波谷位置的所述第一单声道信号各子带关于右声道能量关系系数的右能量和;
利用下式获取左能量和,即波谷位置的所述第一单声道信号与左声道能量关系系数的乘积的能量和ml_e;
ml _ e = Σ n ( m ( n ) * wl ) 2
其中,m(n)为所述波谷位置的单声道信号,wl为波谷位置所在子带对应的左声道能量关系系数;
利用下式获取右能量和,即波谷位置的所述第一单声道信号与右声道能量关系系数的乘积的能量和mr_e
mr _ e = Σ n ( m ( n ) * wr ) 2
其中,m(n)为所述波谷位置的单声道信号,wr为波谷位置所在子带对应的右声道能量关系系数;
103、根据所述左声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带;以及根据所述右声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带,得到互相关结果;
利用下式使左声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带,得到左互相关结果l_m;
l _ m = Σ n m ( n ) * wl * l ( n )
其中,m(n)为所述波谷位置的单声道信号,wl为波谷位置所在子带对应的左声道能量关系系数,l(n)为所述波谷位置的左声道信号;
利用下式使所述右声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带,得到右互相关结果r_m;
r _ m = Σ n m ( n ) * wr * r ( n )
其中,m(n)为所述波谷位置的单声道信号,wr为波谷位置所在子带对应的右声道能量关系系数,r(n)为所述波谷位置的右声道信号;
104、采用所述左、右能量和以及所述互相关结果,获取缩放因子;
将步骤102、步骤103计算得到的ml_e、mr_e、l_m、r_m代入下式,计算得到缩放因子的值mult;
mult = l _ m + r _ m ml _ e + mr _ e
105、根据所述缩放因子对所述立体声的左右声道信号进行编码。
使用所述缩放因子和所述能量关系(panning)系数调整所述第一单声道信号,得到第二单声道信号,所述第二单声道信号包括:第二单声道左信号和第二单声道右信号;对左声道信号与所述第二左单声道信号的差值、右声道信号与所述第二右单声道信号的差值分别进行编码。
在本发明实施例一提供的立体声编码方法中,利用波谷位置的单声道信号与左声道能量关系系数、右声道能量关系系数的乘积的能量和,波谷位置的单声道信号与左、右声道信号的互相关值来直接计算缩放因子,大大简化了现有技术中确定缩放因子的复杂度,从而在整体上减小来立体声编码的计算量和复杂度,显著的节省了系统资源。
在本发明实施例一中计算得到的缩放因子可以直接用于对第一声道信号的调整过程。为了取得更好的调整效果,在本发明实施例二中,提供了一种更为精确的确定最佳缩放因子的方法,由于其他步骤均与本发明实施例一相同,因此,下面仅对本发明实施例二中确定最佳缩放因子的方法进行描述。
如图2所示,本发明实施例二确定最佳缩放因子的步骤包括:
201、根据所述左、右能量和以及所述互相关结果,确定所述缩放因子所在的范围;
202、在所述范围内确定最佳缩放因子。
从码本里所述范围内所有的缩放因子中选取一个最佳的缩放因子。下面将结合附图对上述步骤分别进行详细描述。
如图3所示,在本发明实施例二中,根据所述左、右能量和以及所述互相关结果,确定所述缩放因子所在的范围的步骤包括:
301、根据所述左、右能量和以及所述互相关结果,计算初始缩放因子的值;
将将步骤102、步骤103计算得到的ml_e、mr_e、l_m、r_m代入下式,计算得到初始缩放因子的值mult。
mult = l _ m + r _ m ml _ e + mr _ e
302、对所述初始缩放因子的值进行量化,得到量化索引;
利用缩放因子量化器对所述初始缩放因子的值进行量化,从而获得初始缩放因子的量化索引;
303、根据所述的量化索引,在缩放因子码本中,确定最佳缩放因子的搜索范围。
在所述缩放因子码本中,所有的缩放因子按照其对应的量化索引递增的顺序排列,因此可以确定,最佳的缩放因子为所得到的初始缩放因子、初始缩放因子的量化索引减一所对应的缩放因子、初始缩放因子的量化索引加一所对应的缩放因子三者中的其中一个;
或者还可以将所述搜索范围按照以下方式设定,先从初始缩放因子的量化索引减一所对应的缩放因子、初始缩放因子的量化索引加一所对应的缩放因子中找出与初始缩放因子距离最近的一个(即与初始缩放因子之差的绝对值最小的一个),将其与初始缩放因子一起作为缩放因子的搜索范围;
若所述初始缩放因子的量化索引为码本中的最小索引,则最佳的缩放因子为所得到的初始缩放因子、初始缩放因子的量化索引加一所对应的缩放因子两者中的其中一个;
若所述初始缩放因子的量化索引为码本中的最大索引,则最佳的缩放因子为所得到的初始缩放因子、初始缩放因子的量化索引减一所对应的缩放因子两者中的其中一个。
如图4所示,在本发明实施例二中,在所述范围内确定最佳缩放因子的步骤包括:
401、根据所述范围内的缩放因子,分别计算预测误差能量;
将所述范围内的缩放因子,分别代入下式,计算各个缩放因子所对应的预测误差能量dist;
dist = Σ n ( l ( n ) - wl * M ( n ) ) 2 + ( r ( n ) - wr * M ( n ) ) 2
其中,l(n)为波谷位置的左声道信号,r(n)为波谷位置的右声道信号,wl为波谷位置所在子带对应的左声道能量关系系数,wr为波谷位置所在子带对应的右声道能量关系系数,M(n)为所述波谷位置的第一单声道信号m(n)与缩放因子的乘积;
402、从所述预测误差能量中,选取最小的预测误差能量;
将根据上式得到的预测误差能量进行排序,获取最小的预测误差能量;
403、所述最小的预测误差能量所对应的缩放因子即为最佳缩放因子。
找到计算得到所述最小的预测误差能量所用到的缩放因子,所述缩放因子即为最佳缩放因子。
在本发明实施例二中,通过先确定缩放因子的搜索范围,然后从所述搜索范围内的缩放因子中选取最佳缩放因子,与现有技术相关系,简化了确定缩放因子的复杂度,从而在整体上减小来立体声编码的计算量和复杂度,显著的节省了系统资源。
在本发明实施例二计算初始缩放因子的过程中,需要用到左、右声道的能量关系系数。在本发明实施例三计算初始缩放因子的过程中,可以将所述左、右声道的能量关系系数均设为1,计算初始缩放因子,并最终确定最佳缩放因子。
在本发明实施例四计算初始缩放因子的过程中,可以将所述左声道的能量关系系数设为频带内左声道能量关系系数的平均值,将所述右声道能量关系系数设为频带内右声道能量关系系数的平均值,计算初始缩放因子,并最终确定最佳缩放因子。
由于本发明实施例三、本发明实施例四仅在左、右声道的能量关系系数的选取中,与本发明实施例一有所不同,其余步骤均与本发明实施例一相同,因此不再过多复述。
基于上述方法实施例,本发明实施例五提供了一种立体声编码装置,如图5所示,该装置包括:
能量关系获取模块501,用于获得第一单声道信号与左声道信号的左声道能量关系系数以及所述第一单声道信号与右声道信号的右声道能量关系系数,所述第一单声道信号为立体声左右声道信号混合生成;
能量和获取模块502,用于分别获得位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块501生成的左声道能量关系系数的左能量和,以及位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块501生成的右声道能量关系系数的右能量和;
互相关模块503,用于根据所述能量关系获取模块502获得的左声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带;以及根据所述能量关系获取模块502获得的右声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带,得到互相关结果;
缩放因子获取模块504,用于根据所述能量和获取模块502生成的左、右能量和与互相关模块503生成的左、右互相关,获取缩放因子的值。
编码模块505,用于根据所述缩放因子获取模块504得到的缩放因子对所述立体声的左右声道信号进行编码。
在本发明实施例五提供的立体声编码装置中,利用波谷位置的单声道信号与左、右声道能量关系系数的乘积的能量和,波谷位置的单声道信号与左、右声道信号的互相关值来直接计算缩放因子,大大简化了现有技术中确定缩放因子的复杂度,从而在整体上减小来立体声编码的计算量和复杂度,显著的节省了系统资源。
在所述缩放因子获取模块504中计算得到的缩放因子可以直接用于编码模块505中对所述立体声的左右声道信号进行编码。为了取得更好的效果,在本发明实施例六中,如图6所示,所述缩放因子获取模块504,包括:
缩放因子范围确定单元601,用于根据所述能量和获取模块502生成的左、右能量和与互相关模块503生成的互相关结果,确定所述缩放因子的所在范围;
最佳缩放因子确定单元602,用于在所述缩放因子范围确定单元601确定的范围内确定最佳缩放因子。
如图7所示,在本发明实施例六中,所述缩放因子范围确定单元601,包括:
初始缩放因子求取单元701,用于根据所述能量和获取模块生成的左、右能量和与互相关模块生成的互相关结果,计算初始缩放因子的值;
量化单元702,用于对所述初始缩放因子求取单元701所得到的初始缩放因子的值进行量化,得到量化索引;
范围确定单元703,用于根据所述量化单元702得到的量化索引,在缩放因子码本中,确定缩放因子的搜索范围。
如图8所示,在本发明实施例六中,所述最佳缩放因子确定单元602包括:
预测误差能量计算单元801,用于根据所述范围内的缩放因子,分别计算预测误差能量;
最小预测误差能量选取单元802,用于从所述预测误差能量计算单元801得到的预测误差能量中,选取最小的预测误差能量;
确定最佳缩放因子单元803,用于将所述最小预测误差能量选取单元802选取的最小的预测误差能量所对应的缩放因子确定为最佳缩放因子。
本发明实施例六提供的立体编码装置,通过先确定缩放因子的搜索范围,然后从所述搜索范围内的缩放因子中选取最佳缩放因子,与现有技术相比,简化了确定缩放因子的复杂度,从而在整体上减小来立体声编码的计算量和复杂度,显著的节省了系统资源。
本发明实施例七提供了一种编码器,包括:
能量关系获取模块501,用于获得第一单声道信号与左声道信号的左声道能量关系系数以及所述第一单声道信号与右声道信号的右声道能量关系系数,所述第一单声道信号为立体声左右声道信号混合生成;
能量和获取模块502,用于分别获得位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块501生成的左声道能量关系系数的左能量和,以及位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块501生成的右声道能量关系系数的右能量和;
互相关模块503,用于根据所述能量关系获取模块502获得的左声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带;以及根据所述能量关系获取模块502获得的右声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带,得到互相关结果;
缩放因子获取模块504,用于根据所述能量和获取模块502生成的左、右能量和与互相关模块503生成的左、右互相关,获取缩放因子的值。
编码模块505,用于根据所述缩放因子获取模块504得到的缩放因子对所述立体声的左右声道信号进行编码。
在本发明实施例七提供的编码器中,大大简化了现有技术中确定缩放因子的复杂度,从而在整体上减小来立体声编码的计算量和复杂度,显著的节省了系统资源。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于计算机可读存储介质中,如ROM/RAM、磁碟或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (11)

1.一种立体声编码方法,其特征在于,包括:
获得第一单声道信号与左声道信号的左声道能量关系系数、以及所述第一单声道信号与右声道信号的右声道能量关系系数,所述第一单声道信号为立体声左右声道信号混合生成;
分别获得位于波谷位置的所述第一单声道信号各子带关于左声道能量关系系数的左能量和,以及位于波谷位置的所述第一单声道信号各子带关于右声道能量关系系数的右能量和;
根据所述左声道能量关系系数,对在波谷位置的第一单声道信号的各子带、和所述左声道信号的各子带进行互相关;以及根据所述右声道能量关系系数,对在波谷位置的第一单声道信号的各子带、和所述右声道信号的各子带进行互相关,得到互相关结果;
采用所述左、右能量和、以及所述互相关结果,获取缩放因子;
根据所述缩放因子对所述立体声的左右声道信号进行编码。
2.根据权利要求1所述的立体声编码方法,其特征在于,所述根据所述左、右能量和以及所述互相关结果,获取缩放因子的步骤包括:
采用所述左、右能量和以及所述互相关结果,确定所述缩放因子所在的范围;
在所述范围内确定最佳缩放因子。
3.根据权利要求2所述的立体声编码方法,其特征在于,所述根据所述左、右能量和以及所述互相关结果,确定所述缩放因子的范围的步骤包括:
根据所述左、右能量和以及所述互相关结果,计算初始缩放因子的值;
对所述初始缩放因子的值进行量化,得到量化索引;
根据所述的量化索引,在缩放因子码本中,确定缩放因子的搜索范围。
4.根据权利要求3所述的立体声编码方法,其特征在于,所述在所述范围内确定最佳缩放因子的步骤包括:
根据所述范围内的缩放因子,分别计算预测误差能量;
从所述预测误差能量中,选取最小的预测误差能量;
所述最小的预测误差能量所对应的缩放因子即为最佳缩放因子。
5.根据权利要求4所述的立体声编码方法,其特征在于,所述左声道能量关系系数和右声道能量关系系数均为1。
6.根据权利要求4所述的立体声编码方法,其特征在于,所述左声道能量关系系数为频带内左声道能量关系系数的平均值,所述右声道能量关系系数为频带内右声道能量关系系数的平均值。
7.一种立体声编码装置,其特征在于,包括:
能量关系获取模块,用于获得第一单声道信号与左声道信号的左声道能量关系系数、以及所述第一单声道信号与右声道信号的右声道能量关系系数,所述第一单声道信号为立体声左右声道信号混合生成;
能量和获取模块,用于分别获得位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块生成的左声道能量关系系数的左能量和,以及位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块生成的右声道能量关系系数的右能量和;
互相关模块,用于根据所述能量关系获取模块获得的左声道能量关系系数,对在波谷位置的第一单声道信号的各子带、和所述左声道信号的各子带进行互相关;以及根据所述能量关系获取模块获得的右声道能量关系系数,对在波谷位置的第一单声道信号的各子带、和所述右声道信号的各子带进行互相关,得到互相关结果;
缩放因子获取模块,用于根据所述能量和获取模块生成的左、右能量和、与互相关模块生成的互相关结果,获取缩放因子。
编码模块,用于根据所述缩放因子获取模块得到的缩放因子对所述立体声的左右声道信号进行编码。
8.根据权利要求7所述的立体声编码装置,其特征在于,所述缩放因子获取模块包括:
缩放因子范围确定单元,用于根据所述能量和获取模块生成的左、右能量和与互相关模块生成的互相关结果,确定所述缩放因子的所在范围;
最佳缩放因子确定单元,用于在所述缩放因子范围确定单元确定的范围内确定最佳缩放因子。
9.根据权利要求8所述的立体声编码装置,其特征在于,所述缩放因子范围确定单元包括:
初始缩放因子求取单元,用于根据所述能量和获取模块生成的左、右能量和与互相关模块生成的互相关结果,计算初始缩放因子的值;
量化单元,用于对所述初始缩放因子求取单元所得到的初始缩放因子的值进行量化,得到量化索引;
范围确定单元,用于根据所述量化单元得到的量化索引,在缩放因子码本中,确定缩放因子的搜索范围。
10.根据权利要求8所述的立体声编码装置,其特征在于,所述最佳缩放因子确定单元包括:
预测误差能量计算单元,用于根据所述范围内的缩放因子,分别计算预测误差能量;
最小预测误差能量选取单元,用于从所述预测误差能量计算单元得到的预测误差能量中,选取最小的预测误差能量;
确定最佳缩放因子单元,用于将所述最小预测误差能量选取单元选取的最小的预测误差能量所对应的缩放因子确定为最佳缩放因子。
11.一种编码器,其特征在于,包括如权利要求7至权利要求10任意一项权利要求所述的立体声编码装置。
CN2009101188708A 2009-03-04 2009-03-04 一种立体声编码方法、装置和编码器 Active CN101826326B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN2009101188708A CN101826326B (zh) 2009-03-04 2009-03-04 一种立体声编码方法、装置和编码器
PCT/CN2010/070873 WO2010099752A1 (zh) 2009-03-04 2010-03-04 一种立体声编码方法、装置和编码器
EP14174097.7A EP2793228B1 (en) 2009-03-04 2010-03-04 Stereo encoding method, stereo encoding device
EP10748342.2A EP2405424B1 (en) 2009-03-04 2010-03-04 Stereo coding method, device and encoder
ES10748342.2T ES2529732T3 (es) 2009-03-04 2010-03-04 Método de codificación estéreo, dispositivo y codificador
US13/224,806 US9064488B2 (en) 2009-03-04 2011-09-02 Stereo encoding method, stereo encoding device, and encoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101188708A CN101826326B (zh) 2009-03-04 2009-03-04 一种立体声编码方法、装置和编码器

Publications (2)

Publication Number Publication Date
CN101826326A CN101826326A (zh) 2010-09-08
CN101826326B true CN101826326B (zh) 2012-04-04

Family

ID=42690218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101188708A Active CN101826326B (zh) 2009-03-04 2009-03-04 一种立体声编码方法、装置和编码器

Country Status (5)

Country Link
US (1) US9064488B2 (zh)
EP (2) EP2793228B1 (zh)
CN (1) CN101826326B (zh)
ES (1) ES2529732T3 (zh)
WO (1) WO2010099752A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826326B (zh) 2009-03-04 2012-04-04 华为技术有限公司 一种立体声编码方法、装置和编码器
WO2013149671A1 (en) 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal
ES2934591T3 (es) 2013-09-13 2023-02-23 Samsung Electronics Co Ltd Procedimiento de codificación sin pérdidas
ES2904275T3 (es) * 2015-09-25 2022-04-04 Voiceage Corp Método y sistema de decodificación de los canales izquierdo y derecho de una señal sonora estéreo
US12125492B2 (en) 2015-09-25 2024-10-22 Voiceage Coproration Method and system for decoding left and right channels of a stereo sound signal
CN117133297A (zh) * 2017-08-10 2023-11-28 华为技术有限公司 时域立体声参数的编码方法和相关产品
JP7396459B2 (ja) * 2020-03-09 2023-12-12 日本電信電話株式会社 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
US12170091B2 (en) * 2020-03-09 2024-12-17 Nippon Telegraph And Telephone Corporation Sound signal encoding method, sound signal decoding method, sound signal encoding apparatus, sound signal decoding apparatus, program, and recording medium
WO2024175187A1 (en) * 2023-02-21 2024-08-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder for encoding a multi-channel audio signal

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5636324A (en) * 1992-03-30 1997-06-03 Matsushita Electric Industrial Co., Ltd. Apparatus and method for stereo audio encoding of digital audio signal data
CN101188878A (zh) * 2007-12-05 2008-05-28 武汉大学 一种立体声音频信号的空间参数量化及熵编码方法及其所用系统结构

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3920104B2 (ja) * 2002-02-05 2007-05-30 松下電器産業株式会社 インテンシティステレオ符号化のための位相検出方法および装置
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
EP3561810B1 (en) * 2004-04-05 2023-03-29 Koninklijke Philips N.V. Method of encoding left and right audio input signals, corresponding encoder, decoder and computer program product
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
JP4999846B2 (ja) * 2006-08-04 2012-08-15 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
US8200351B2 (en) 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
US7949420B2 (en) * 2007-02-28 2011-05-24 Apple Inc. Methods and graphical user interfaces for displaying balance and correlation information of signals
WO2009141775A1 (en) * 2008-05-23 2009-11-26 Koninklijke Philips Electronics N.V. A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
US8023660B2 (en) * 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
CN101826326B (zh) 2009-03-04 2012-04-04 华为技术有限公司 一种立体声编码方法、装置和编码器

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5636324A (en) * 1992-03-30 1997-06-03 Matsushita Electric Industrial Co., Ltd. Apparatus and method for stereo audio encoding of digital audio signal data
CN101188878A (zh) * 2007-12-05 2008-05-28 武汉大学 一种立体声音频信号的空间参数量化及熵编码方法及其所用系统结构

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP特开2003-228397A 2003.08.15

Also Published As

Publication number Publication date
EP2405424B1 (en) 2014-11-12
CN101826326A (zh) 2010-09-08
US20110317843A1 (en) 2011-12-29
WO2010099752A1 (zh) 2010-09-10
EP2405424A1 (en) 2012-01-11
ES2529732T3 (es) 2015-02-25
EP2793228B1 (en) 2019-05-08
EP2405424A4 (en) 2012-01-25
US9064488B2 (en) 2015-06-23
EP2793228A1 (en) 2014-10-22

Similar Documents

Publication Publication Date Title
CN101826326B (zh) 一种立体声编码方法、装置和编码器
US20230319301A1 (en) Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
CN101371447B (zh) 使用扩展带频率编码的复变换信道编码
CN101120615B (zh) 多声道编码器和解码器以及相应的编码和解码方法
JP5705964B2 (ja) オーディオエンコーダ、オーディオデコーダ、及び複素数予測を使用したマルチチャンネルオーディオ信号処理方法
KR101809592B1 (ko) 지능형 갭 필링 프레임워크 내의 2-채널 프로세싱을 이용한 오디오 인코더, 오디오 디코더 및 관련 방법들
CN101067931B (zh) 一种高效可配置的频域参数立体声及多声道编解码方法与系统
TWI492224B (zh) 用以對音訊信號進行編碼之編碼器、設備、電腦程式產品及方法
JP7704802B2 (ja) 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法
KR101726205B1 (ko) 감소된 복잡성 변환기 snr 계산
KR20150110708A (ko) 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조
US9214158B2 (en) Audio decoding device and audio decoding method
CN102243876A (zh) 预测残差信号的量化编码方法及装置
CN104170007B (zh) 对单声道或立体声进行编码的方法
US9135921B2 (en) Audio coding device and method
CN105336334A (zh) 多声道声音信号编码方法、解码方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB03 Change of inventor or designer information

Inventor after: Lang Yue

Inventor after: Wu Wenhai

Inventor after: Miao Lei

Inventor after: Liu Zexin

Inventor after: Hu Chen

Inventor after: Zhang Qing

Inventor before: Lang Yue

Inventor before: Wu Wenhai

Inventor before: Miao Lei

Inventor before: Liu Zexin

Inventor before: Hu Chen

Inventor before: Harvey.Myhill.Tadee

Inventor before: Zhang Qing

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: LANG LANG WU WENHAI MIAO LEI LIU ZEXIN HU CHEN TATI HARVEY MYHILL ZHANG QING TO: LANG LANG WU WENHAI MIAO LEI LIU ZEXIN HU CHEN ZHANG QING

C14 Grant of patent or utility model
GR01 Patent grant