JP5694751B2 - 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 - Google Patents
符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 Download PDFInfo
- Publication number
- JP5694751B2 JP5694751B2 JP2010277180A JP2010277180A JP5694751B2 JP 5694751 B2 JP5694751 B2 JP 5694751B2 JP 2010277180 A JP2010277180 A JP 2010277180A JP 2010277180 A JP2010277180 A JP 2010277180A JP 5694751 B2 JP5694751 B2 JP 5694751B2
- Authority
- JP
- Japan
- Prior art keywords
- sample
- samples
- acoustic signal
- sequence
- sample sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
「符号化処理」
最初に図1〜図9を参照して符号化処理を説明する。
まず、周波数領域変換部1がフレーム単位で音声音響ディジタル信号を周波数領域のN点のMDCT係数列に変換する(ステップS1)。
重み付け包絡正規化部2が、フレーム単位の音声音響ディジタル信号に対する線形予測分析によって求められた線形予測係数を用いて推定された音声音響ディジタル信号のパワースペクトル包絡係数列によって、入力されたMDCT係数列の各係数を正規化し、重み付け正規化MDCT係数列を出力する(ステップS2)。ここでは聴覚的に歪が小さくなるような量子化の実現のために、重み付け包絡正規化部2は、パワースペクトル包絡係数列を鈍らせた重み付けパワースペクトル包絡係数列(図3参照)を用いて、フレーム単位でMDCT係数列の各係数を正規化する。この結果、重み付け正規化MDCT係数列は、入力されたMDCT係数列ほどの大きな振幅の傾きや振幅の凹凸を持たないものの、音声音響ディジタル信号のパワースペクトル包絡係数列と類似の大小関係を保つこととなる。なお、正確を期せば、ここでの「大小関係」は、「係数列に含まれる各係数の間の大小関係」を意味する。また、この正規化の具体的な処理内容に応じて、重み付け正規化MDCT係数列に含まれる各係数の間の大小関係は、音声音響ディジタル信号のパワースペクトル包絡係数列に含まれる各係数の間の大小関係と同じになる場合がある。従って、上記「類似の大小関係」は「同じ大小関係」を含む意味であることに留意されたい。
N点のMDCT係数列の各係数X(1),・・・,X(N)に対応するパワースペクトル包絡係数列の各係数W(1),・・・,W(N)は、線形予測係数を周波数領域に変換して得ることができる。例えば、全極型モデルであるp次自己回帰過程により、時刻tの時間信号x(t)は、p時点まで遡った過去の自分自身の値x(t-1),・・・,x(t-p)と予測残差e(t)と線形予測係数α1,・・・,αpによって式(1)で表される。このとき、パワースペクトル包絡係数列の各係数W(n)[1≦n≦N]は式(2)で表される。exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
<例1>
重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数の補正値Wγ(1),・・・,Wγ(N)で除算することによって、重み付け正規化MDCT係数列の各係数X(1)/Wγ(1),・・・,X(N)/Wγ(N)を得る処理を行う。補正値Wγ(n)[1≦n≦N]は式(3)で与えられる。但し、γは1未満の正の定数であり、パワースペクトル係数を鈍らせる定数である。
重み付け包絡正規化部2は、MDCT係数列の各係数X(1),・・・,X(N)を当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βで除算することによって、重み付け正規化MDCT係数列の各係数X(1)/W(1)β,・・・,X(N)/W(N)βを得る処理を行う。
(1)入力されたMDCT係数列に含まれる係数のうち絶対値が最大のものの絶対値|X(a)|と絶対値が最小のものの絶対値|X(b)|との差分|X(a)|-|X(b)|よりも、重み付け包絡正規化によって得られる重み付け正規化MDCT係数列に含まれる係数のうち絶対値が最大のものの絶対値|X(a)/Q(a)|と絶対値が最小のものの絶対値|X(b)/Q(b)|との差分|X(a)/Q(a)|-|X(b)/Q(b)|が小さくなり(ただし、Q(a),Q(b)は鈍らされたパワースペクトル包絡係数であり、上述の例であれば、Q(a)=Wγ(a),Q(b)=Wγ(b)あるいはQ(a)=W(a)β,Q(b)= W(b)βである)、
かつ、
(2)入力されたMDCT係数列に含まれる各係数の間の大小関係と、重み付け包絡正規化によって得られる重み付け正規化MDCT係数列に含まれる各係数の間の大小関係との類似性が保たれる。
次に、正規化利得計算部3が、フレームごとに、重み付け正規化MDCT係数列の各係数を与えられた総ビット数で量子化できるように、全周波数に亘る振幅値の和またはエネルギー値を用いて量子化ステップ幅を決定し、この量子化ステップ幅になるように重み付け正規化MDCT係数列の各係数を割り算する係数(以下、「利得」という。)を求める(ステップS3)。この利得を表す情報は、利得情報として復号側へ伝送される。正規化利得計算部3は、フレームごとに、重み付け正規化MDCT係数列の各係数をこの利得で正規化(除算)する。
次に、量子化部4が、フレームごとに、利得で正規化された重み付け正規化MDCT係数列の各係数をステップS3の処理で決定された量子化ステップ幅で量子化する(ステップS4)。
ステップS4の処理で得られたフレーム単位の量子化MDCT係数列は、本実施形態の要部である並べ替え部5の入力となるが、並べ替え部5の入力は、ステップS1〜ステップS4の各処理で得られた係数列に限定されない。例えば、重み付け包絡正規化部2による正規化が適用されていない係数列や量子化部4による量子化が適用されていない係数列であってもよい。このことを明示的に理解するため、以下、並べ替え部5の入力を音響信号に由来する「周波数領域のサンプル列」あるいは単に「サンプル列」と呼称することにする。この実施形態では、ステップS4の処理で得られた量子化MDCT係数列が「周波数領域のサンプル列」に相当し、この場合、周波数領域のサンプル列を構成するサンプルは量子化MDCT係数列に含まれる係数に相当する。
この並べ替え処理の具体例を説明する。N点のサンプル列F(1),・・・,F(N)に、音声音響ディジタル信号のパワースペクトル包絡係数列W(1),・・・,W(N)が低域側から1対1で対応しているとする(図4参照)。つまり、nが1からNまでの各整数を表すとして、F(n)にW(n)が対応しているとする。説明を具体的にするため、例として、N=16の場合を考える。パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の間に次のような大小関係があるとする。
---
W(1)> W(5)> W(3)> W(2)> W(6)> W(4)> W(8)> W(9)> W(7)> W(10)> W(11)> W(12)> W(13)> W(15)> W(14)> W(16)
---
この場合、周波数領域のサンプル列に含まれる全部のサンプルをパワースペクトル包絡係数列に基づく並べ替えの対象とするならば、並べ替え部5は、パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の大きい順の並びに一致するように、低域側から各係数W(n)[1≦n≦16]に対応するサンプルF(n)[1≦n≦16]を並べる。この場合、入力されたサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)の並びは、次のような並びに変更される。並べ替え部5は、この並びのサンプル列を「並べ替え後のサンプル列」として出力する。
---
F(1), F(5), F(3), F(2), F(6), F(4), F(8), F(9), F(7), F(10), F(11), F(12), F(13), F(15), F(14), F(16)
---
パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の間に上記のような大小関係があるとして、周波数領域のサンプル列に含まれる一部のサンプル(サンプル数をkとする。k<Nを満たす)をパワースペクトル包絡係数列に基づく並べ替えの対象とするならば、並べ替え部5は、パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の中から大きい順で選択されたk個の係数の大きい順の並びに一致するように、これらk個の係数W(n)[n∈R]に対応するサンプルW(n)[n∈R]を低域側から並べる。Rは、選択されたk個の係数のインデックスの集合である。説明を具体的にするため、例として、k=4の場合を考える。このとき、「パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の中から大きい順で選択された4個の係数の大きい順の並び」は次のとおりである。
---
W(1)> W(5)> W(3)> W(2)
---
従って、並べ替え部5は、W(1), W(2), W(3), W(5)に対応する4個のサンプルF(1), F(2), F(3), F(5)を「パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の中から大きい順で選択された4個の係数の大きい順の並び」に一致するように並べ替えるので、サンプルF(1), F(2), F(3), F(5)は次のような並びに変更される。
---
F(1), F(5), F(3), F(2)
---
この場合、パワースペクトル包絡係数列に基づく並べ替えの対象に含まれなかったサンプルF(4), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)は元の並びを維持して4個のサンプルの並びF(1), F(5), F(3), F(2)の後に(つまり、高域側に)連結されるため、結果として、入力されたサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)の並びは、次のような並びに変更される。並べ替え部5は、この並びのサンプル列を「並べ替え後のサンプル列」として出力する。
---
F(1), F(5), F(3), F(2), F(4), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)
---
サンプル列に含まれるサンプルの全部がパワースペクトル包絡係数列に基づく並べ替えの対象である場合:
---
F(16), F(14), F(15), F(13), F(12), F(11), F(10), F(7), F(9), F(8), F(4), F(6), F(2), F(3), F(5), F(1)
---
サンプル列に含まれるサンプルの一部がパワースペクトル包絡係数列に基づく並べ替えの対象である場合:
---
F(16), F(15), F(14), F(13), F(12), F(11), F(10), F(9), F(8), F(7), F(6), F(4), F(2), F(3), F(5), F(1)
---
まず、サンプル列に含まれるサンプルの全部がパワースペクトル包絡係数列に基づく並べ替えの対象である場合は、「パワースペクトル包絡係数列W(1),・・・,W(N)の大きい順」を規準としてサンプル列に含まれるサンプルを並べ替える既述の処理と結果的に同じ結果が得られる。この場合、サンプルを低域側から並べるようにしてもよいし、高域側から並べるようにしてもよい。
次に、サンプル列に含まれるサンプルの一部がパワースペクトル包絡係数列に基づく並べ替えの対象である場合について具体例を用いて説明する。パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の間に上記のような大小関係があるとして、周波数領域のサンプル列に含まれる一部のサンプル(サンプル数をkとする。k<Nを満たす)をパワースペクトル包絡係数列に基づく並べ替えの対象とするならば、並べ替え部5は、パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の中から小さい順で選択されたk個の係数の小さい順の並びに一致するように、これらk個の係数W(n)[n∈R]に対応するサンプルF(n)[n∈R]を低域側から並べる。Rは、選択されたk個の係数のインデックスの集合である。説明を具体的にするため、例として、k=8の場合を考える。このとき、「パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(N)の中から小さい順で選択された8個の係数の小さい順の並び」は次のとおりである。
---
W(16)< W(14)< W(15)< W(13)< W(12)< W(11)< W(10)< W(7)
---
従って、並べ替え部5は、W(7), W(10), W(11), W(12), W(13), W(14), W(15), W(16)に対応する8個のサンプルF(7), F(10), F(11), F(12), F(13), F(14), F(15), F(16)を「パワースペクトル包絡係数列に含まれる16個の係数W(1),・・・,W(16)の中から小さい順で選択された8個の係数の小さい順の並び」に一致するように並べ替えるので、サンプルF(7), F(10), F(11), F(12), F(13), F(14), F(15), F(16)は次のような並びに変更される。
---
F(16), F(14), F(15), F(13), F(12), F(11), F(10), F(7)
---
この場合、パワースペクトル包絡係数列に基づく並べ替え対象に含まれなかったサンプルF(1), F(2), F(3), F(4), F(5), F(6), F(8), F(9)は元の並びを維持して8個のサンプルの並びF(16), F(14), F(15), F(13), F(12), F(11), F(10), F(7)の後に(つまり、高域側に)連結されるため、結果として、入力されたサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)の並びは、次のような並びに変更される。
---
F(16), F(14), F(15), F(13), F(12), F(11), F(10), F(7), F(1), F(2), F(3), F(4), F(5), F(6), F(8), F(9)
---
サンプルを高域側から並べる並べ替え処理の場合は、逆の並びになるので、入力されたサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)の並びは、次のような並びに変更される。
---
F(9), F(8), F(6), F(5), F(4), F(3), F(2), F(1), F(7) F(10), F(11), F(12), F(13), F(15), F(14), F(16)
---
並べ替え処理の変形例1を説明するに先立ち、上述の並べ替え処理(以下、「スペクトル包絡並べ替え処理」という)と異なるコンセプトに基づく並べ替え処理(以下、「周期性並べ替え処理」という)を説明する。
周期性並べ替え処理では、フレームごとに、(1)周波数領域のサンプル列の全てのサンプルを含み、かつ、(2)サンプルの大きさを反映する指標が同等か同程度のサンプルが集まるように周波数領域のサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、が並べ替え後のサンプル列として出力される。ここで「サンプルの大きさを反映する指標」とは、例えばサンプルの振幅の絶対値やパワー(自乗値)であるが、これらに限定されない。なお、周期性並べ替え処理の実行主体は並べ替え部5であってもよいし、符号化装置100内に在る他の手段であってもよいが、説明の便宜から、並べ替え部5が周期性並べ替え処理を実行するとして説明する。
この周期性並べ替え処理の具体例を説明する。例えば、並べ替え部5は、(1)サンプル列の全てのサンプルを含み、かつ、(2)サンプル列のうちの音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、サンプル列のうちの音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるようにサンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、を並べ替え後のサンプル列として出力する。つまり、音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、当該音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプルが例えば低域側に集まるように、入力されたサンプル列に含まれる少なくとも一部のサンプルが並べ替えられる。
このように並べ替えられた後のサンプル列は、周波数を横軸とし、サンプルの指標を縦軸とした場合に、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すことになる。換言すれば、並べ替え部5は、サンプルの指標の包絡線が周波数の増大に伴って増大傾向を示すように入力されたサンプル列に含まれる少なくとも一部のサンプルを並べ替えると言ってもよい。
間隔Tは、入力されたサンプル列に応じて、つまりフレームごとに、値を設定することが好ましい。フレームごとに間隔Tを決定する方法として、例えば、サンプルの指標(絶対値や二乗値)の周期性を探索し、平均絶対値や平均二乗値の偏りが大きくなるように間隔Tを設定する方法を採用してもよい。
また、ここでは、各サンプル群に含まれるサンプルの個数が、周期性や基本周波数ないしその整数倍に対応するサンプル(以下、「中心サンプル」という)とその前後1サンプルの計3サンプルであるという固定された個数の例を示したが、サンプル群に含まれるサンプルの個数やサンプルインデックスを可変とする場合には、サンプル群に含まれるサンプルの個数とサンプルインデックスの組み合わせが異なる複数の選択肢の中から選択された一つを表す情報も補助情報に含める。
例えば、選択肢として、
(1)中心サンプルのみ、F(qT)
(2)中心サンプルとその前後1サンプルの計3サンプル、F(qT-1),F(qT),F(qT+1)
(3)中心サンプルとその前2サンプルの計3サンプル、F(qT-2),F(qT-1),F(qT)
(4)中心サンプルとその前3サンプルの計4サンプル、F(qT-3),F(qT-2),F(qT-1),F(qT)
(5)中心サンプルとその後2サンプルの計3サンプル、F(qT),F(qT+1),F(qT+2)
(6)中心サンプルとその後3サンプルの計4サンプル、F(qT),F(qT+1),F(qT+2),F(qT+3)
が設定されている場合に、(4)が選択されたならば、この(4)が選択されたことを表す情報が補助情報に含められる。この例であれば、選択された選択肢を表す情報として3ビットあれば十分である。
周期性並べ替え処理として、qに関する選択肢、間隔Tに関する選択肢、サンプル群に含まれるサンプルの個数に関する選択肢、サンプル群に含まれるサンプルのサンプルインデックスに関する選択肢などの組み合わせに応じて、種々の周期性並べ替え処理が考えられる。並べ替え処理の変形例2では、このように周期性並べ替え処理として複数のパターンが予め設定されている場合に、各パターンの周期性並べ替え処理を行い並べ替え後のサンプル列を得て、次いで各パターンの周期性並べ替え処理で得られたサンプル列に対してスペクトル包絡並べ替え処理を適用し、この結果の各サンプル列に対して後述の符号化部6によって求められた符号量のうち最小の符号量を与えた並べ替えを選択する。
並べ替え処理の変形例3では、並べ替え部5は、フレームごとに、周期性並べ替え処理とスペクトル包絡並べ替え処理を組み合わせて実行する。具体的には、並べ替え部5は、[1]まずスペクトル包絡並べ替え処理を行い並べ替え後のサンプル列を得て、[2]次いでスペクトル包絡並べ替え処理で得られたサンプル列に対して、周期性並べ替え処理を適用する。
並べ替え処理の変形例4では、並べ替え部5は、並べ替え処理の変形例1と並べ替え処理の変形例3を独立に行い、最終的に符号量が最小となる並べ替えを選択する。
並べ替え処理の変形例5では、並べ替え部5は、並べ替え処理の変形例3と周期性並べ替え処理を独立に行い、最終的に符号量が最小となる並べ替えを選択する。
並べ替え処理の変形例6では、並べ替え部5は、スペクトル包絡並べ替え処理と並べ替え処理の変形例1を独立に行い、最終的に符号量が最小となる並べ替えを選択する。
並べ替え処理の変形例7では、並べ替え部5は、スペクトル包絡並べ替え処理と周期性並べ替え処理を独立に行い、最終的に符号量が最小となる並べ替えを選択する。
周波数領域のサンプル列F(1),…,F(N)の振幅の絶対値の和Σn=1 NF(n)やパワー(振幅の二乗和)Σn=1 N(F(n))2の大きさによって、並べ替えを行うか否かを選択することができる。例えばパワーが予め設定された閾値以上の場合(あるいは、閾値より大きい場合)に並べ替えを行い、パワーが当該閾値未満(あるいは、閾値以下)の場合に並べ替えはしない。そこで、並べ替え処理の変形例8では、並べ替え部5は、符号化装置100内の図示しない別の手段が求めた周波数領域のサンプル列の振幅の絶対値の和やパワー(振幅の二乗和)が予め定められた閾値より大きい場合はサンプル列に対する並べ替えを行って並べ替え後のサンプル列を後述の符号化部6に出力し、そうでない場合はサンプル列に対する並べ替えを行なわずに並べ替え部5に入力されたサンプル列そのものを後述の符号化部6に出力し、後述の符号化部6では並べ替え部5から出力されたサンプル列を可変長符号化する構成としてもよい。この場合、並べ替えの前後によって絶対値の和やパワーは変わらないので、符号列に対応するサンプル列が並べ替えを行ったサンプル列であるか否かを表す情報を出力する必要は無い。ただし、閾値を符号化側と復号側とで共通の値として予め設定しておくこととする。
次に、符号化部6が、並べ替え部5が出力したサンプル列を符号化し、得られた符号列を出力する(ステップS6)。符号化部6は、並べ替え部5が出力したサンプル列に含まれるサンプルの振幅の偏りに応じて可変長符号化を切り替えて符号化する。つまり、並べ替え部5によってフレーム内で低域側(あるいは高域側)に振幅の大きなサンプルが集められているので、符号化部6はその偏りに適した可変長符号化を行う。並べ替え部5が出力したサンプル列のように、局所的な領域ごとに同等か同程度の振幅を持つサンプルが集まっていると、例えば領域ごとに異なるライスパラメータでライス符号化することによって平均符号量を削減できる。以下、フレーム内で低域側(フレームの先頭に近い側)に振幅の大きなサンプルが集められている場合を例に採って説明する。
具体例として、符号化部6は、大きな振幅を持つサンプルが集まっている領域ではサンプルごとにライス符号化(ゴロム-ライス符号化ともいう)を適用する。この領域以外の領域では、符号化部6は、複数のサンプルをまとめたサンプルの集合に対する符号化にも適するエントロピー符号化(ハフマン符号化や算術符号化など)を適用する。ライス符号化の適用に関して、ライス符号化の適用領域とライスパラメータが固定されていてもよいし、あるいは、ライス符号化の適用領域とライスパラメータの組み合わせが異なる複数の選択肢の中から一つを選択できる構成であってもよい。このような複数の選択肢から一つを選択する際、ライス符号化の選択情報として、例えば下記のような可変長符号(記号""で囲まれたバイナリ値)を使うことができ、符号化部6は選択情報も出力する。
"1":ライス符号化を適用しない
"01":ライス符号化を先頭から1/32の領域にライスパラメータを1として適用する。
"001":ライス符号化を先頭から1/32の領域にライスパラメータを2として適用する。
"0001":ライス符号化を先頭から1/16の領域にライスパラメータを1として適用する。
"00001":ライス符号化を先頭から1/16の領域にライスパラメータを2として適用する。
"00000":ライス符号化を先頭から1/32の領域にライスパラメータを3として適用する。
本発明の実施形態で説明されたサンプル列に含まれるサンプルの並べ替えはパワースペクトル包絡が比較的大きな傾きを持つ(すなわち予測利得が大きい)場合に有効であるので、予め予測利得またはその推定値がある定められた閾値より大きい場合のみサンプル列に含まれるサンプルの並べ替えを適用することに決めておくこともできる。これは予測利得が大きいときには声帯振動や楽器の振動が強く、周期性も高い場合が多いという音声や楽音の性質を利用するものである。予測利得は原音(音声音響ディジタル信号)のエネルギーを予測残差のエネルギーで割ったものである。線形予測係数やPARCOR係数をパラメータとして使う符号化においては、量子化済みのパラメータを符号化装置と復号装置で共通に使うことができる。そこで、例えば、符号化部6は、符号化装置100内の図示しない別の手段によって求めたi次の量子化済PARCOR係数k(i)を用いて、(1-k(i)*k(i))を次数ごとに乗算したものの逆数で表わされる予測利得の推定値を計算し、計算された推定値がある定められた閾値より大きい場合は並べ替え後のサンプル列を可変長符号化して得られた符号列を出力し、そうでない場合は並べ替え前のサンプル列を可変長符号化して得られた符号列を出力する。この場合は、符号列に対応するサンプル列が並べ替えを行ったサンプル列であるか否かを表す情報を出力する必要は無い。すなわち、予測がきかない雑音的音声や無音時には効果が小さい可能性が高いので並べ替えをしないと決めておくほうが復号側へ伝送する情報の符号量や計算の無駄が少なくなる。
変形例2では、符号化部6が、並べ替え部5が出力したサンプル列の可変長符号化に線形予測係数やパワースペクトル包絡係数列や予測利得を利用する。符号化部6は、並べ替え部5が出力したサンプル列に含まれるサンプルの振幅の偏りに応じて可変長符号化を切り替えて符号化する。この際、振幅の大きさによって適応的に符号化することによって符号長を短くすることができる。例えばライス符号を用いる場合、ライスパラメータの値を符号化する振幅によって決定し、周波数領域のサンプル列の振幅に応じて同一のライスパラメータの適用区間を最適に決めて適用区間情報として復号側へ送ってもよいし、同一のライスパラメータの適用区間を固定的に決めておき、スペクトル包絡情報や予測利得に応じて同一のライスパラメータを適用する適用区間を選択してもよい。
例えば予測利得GPを用いる場合、予め定められた閾値gと予測利得GPとの大小関係に基づいて適用区間の長短を下記のように切り替えることができる。なお、この構成の場合には、閾値を符号化側と復号側とで共通の値として予め設定しておくこととする。
GP≧gの場合:
"1":ライス符号化を適用しない
"01":ライス符号化を先頭から1/32の区間にライスパラメータを1として適用する。
"00":ライス符号化を先頭から1/32の区間にライスパラメータを2として適用する。
GP<gの場合:
"1":ライス符号化を適用しない
"01":ライス符号化を先頭から1/16の区間にライスパラメータを1として適用する。
"00":ライス符号化を先頭から1/16の区間にライスパラメータを2として適用する。
(参考文献1)David Salomon, "Data Compression : The Complete Reference," 3rdedition, Springer-Verlag, ISBN-10: 0-387-40697-2, 2004.
続いて図10〜図11を参照して復号処理を説明する。
復号装置200では、符号化装置100による符号化処理と逆順の処理でMDCT係数が再構成される。復号装置200には、フレームごとに、少なくとも、上記線形予測係数あるいは上記パワースペクトル包絡係数列が符号化されて得られた符号列(以下、「補助符号列」という)と、上記利得情報と、並べ替え後の(場合によっては並べ替え前の)上記サンプル列に対応する上記符号列(以下、単に「符号列」という)が入力される。並べ替え前の上記サンプル列に対応する上記符号列が復号装置200に入力される可能性がある実施形態では、サンプル列の並べ替えを行ったか否かを表す情報も復号装置200に入力される。また、符号化装置100から選択情報が出力された場合にはこの選択情報も復号装置200に入力される。また、並べ替え対象としてサンプル列に含まれるサンプルの全部または一部を選択可能な実施形態では、上記対象情報も復号装置200に入力される。このほか、符号化装置100から出力されえる既述の情報は復号装置200に入力され、必要に応じて後述の復号部11による処理や回復部12による処理などに用いられる。
まず、復号部11が、フレームごとに、入力された符号列を復号して周波数領域のサンプル列を出力する(ステップS11)。選択情報が復号装置200に入力されている場合には、復号部11は、フレームごとに、入力された符号列を選択情報に応じて復号して周波数領域のサンプル列を出力する。当然であるが、符号列を得るために実行された符号化方法に対応する復号方法が実行される。復号部11による復号処理の詳細は符号化装置100の符号化部6による符号化処理の詳細に対応するので、当該符号化処理の説明をここに援用し、実行された符号化に対応する復号が復号部11の行う復号処理であることを明記し、これをもって復号処理の詳細な説明とする。なお、どのような符号化方法が実行されたかは、選択情報が復号装置200に入力されている場合には当該選択情報によって特定され、選択情報が復号装置200に入力されない実施形態であれば事前に符号化側と復号側で符号化方法とそれに対応する復号方法が定められているので、この取り決めによって特定される。選択情報に、例えば、ライス符号化の適用領域とライスパラメータを特定する情報と、ランレングス符号化の適用領域を表す情報と、エントロピー符号化の種類を特定する情報が含まれている場合には、これらの符号化方法に応じた復号方法が入力された符号列の対応する領域に適用される。ライス符号化に対応する復号処理、エントロピー符号化に対応する復号処理、ランレングス符号化に対応する復号処理はいずれも周知であるから説明を省略する(例えば上記参考文献1参照)。
次に、回復部12が、フレームごとに、補助符号列を復号して得られた線形予測係数を周波数領域に変換して得られるパワースペクトル包絡係数列あるいは補助符号列を復号して得られたパワースペクトル包絡係数列を参照して、復号部11が出力した周波数領域のサンプル列から元のサンプルの並びを得る(ステップS12)。ここで「元のサンプルの並び」とは、符号化装置100の並べ替え部5に入力された「周波数領域のサンプル列」に相当する。補助符号列を復号して得られた線形予測係数を周波数領域に変換してパワースペクトル包絡係数列を得る処理あるいは補助符号列を復号してパワースペクトル包絡係数列を得る処理は、回復部12が行ってもよいし、復号装置200内に在る図示しない他の手段が行ってもよい。パワースペクトル包絡係数列は、後述するステップS15の処理でも用いられるため、再計算のコストを省く観点から、復号装置200内に在る図示しない記憶部に記憶しておけばよい。上述のとおり、符号化装置100の並べ替え部5による並べ替え方法や並べ替え方法に対応する並べ替えの選択肢は種々あるが、並べ替えが実行された場合には実行された並べ替えは一つであり、その並べ替えを特定する情報はパワースペクトル包絡係数列に含まれている。よって、回復部12はパワースペクトル包絡係数列に基づいて復号部11が出力した周波数領域のサンプル列を元のサンプルの並びに戻すことができる。
---
W(1), W(5), W(3), W(2), W(6), W(4), W(8), W(9), W(7), W(10), W(11), W(12), W(13), W(15), W(14), W(16)
---
この係数列Γの係数が、復号部11が出力した16個のサンプルを持つ周波数領域のサンプル列のサンプルに低域側から1対1で対応している。従って、回復部12は、係数列Γに含まれる係数の元の並びであるパワースペクトル包絡係数列W(1), W(2), W(3), W(4), W(5), W(6), W(7), W(8), W(9), W(10), W(11), W(12), W(13), W(14), W(15), W(16)に一致するように、係数列Γに対応するサンプル列に含まれる16個のサンプルを並べる。この結果、「元のサンプルの並び」であるサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)が得られる。
対象情報が、サンプル列に含まれるサンプルの一部が並べ替え対象であることを示し、例えばサンプル数kとしてk=4を指定している場合、パワースペクトル包絡係数列W(1), W(2), W(3), W(4), W(5), W(6), W(7), W(8), W(9), W(10), W(11), W(12), W(13), W(14), W(15), W(16)の中から大きい順で選択されたk個の係数の大きい順の並びとして次の係数列を得る。
---
W(1), W(5), W(3), W(2)
---
さらに、選択されなかった係数W(4), W(6), W(7), W(8), W(9), W(10), W(11), W(12), W(13), W(14), W(15), W(16)は元の並びを維持してk個のサンプルの並びW(1), W(5), W(3), W(2)の後に(つまり、高域側に)連結されるため、結果として、係数列Ξを得る。
---
W(1), W(5), W(3), W(2), W(4), W(6), W(7), W(8), W(9), W(10), W(11), W(12), W(13), W(14), W(15), W(16)
---
この係数列Ξの係数が、復号部11が出力した16個のサンプルを持つ周波数領域のサンプル列のサンプルに低域側から1対1で対応している。従って、回復部12は、係数列Ξに含まれる係数の元の並びであるパワースペクトル包絡係数列W(1), W(2), W(3), W(4), W(5), W(6), W(7), W(8), W(9), W(10), W(11), W(12), W(13), W(14), W(15), W(16)に一致するように、係数列Ξに対応するサンプル列に含まれる16個のサンプルを並べる。この結果、「元のサンプルの並び」であるサンプル列F(1), F(2), F(3), F(4), F(5), F(6), F(7), F(8), F(9), F(10), F(11), F(12), F(13), F(14), F(15), F(16)が得られる。
次に、逆量子化部13が、フレームごとに、回復部12が出力した元のサンプルの並びを逆量子化する(ステップS13)。上述の例に対応させて述べれば、逆量子化によって、符号化装置100の量子化部4に入力された「利得で正規化された重み付け正規化MDCT係数列」が得られる。
次に、利得乗算部14が、フレームごとに、逆量子化部13が出力した「利得で正規化された重み付け正規化MDCT係数列」の各係数に、上記利得情報で特定される利得を乗じて、「正規化された重み付け正規化MDCT係数列」を得る(ステップS14)。
次に、重み付け包絡逆正規化部15が、フレームごとに、利得乗算部14が出力した「正規化された重み付け正規化MDCT係数列」の各係数に、パワースペクトル包絡係数列から得られる補正係数を適用することで「MDCT係数列」を得る(ステップS15)。符号化装置100で実行された重み付け包絡正規化処理の例に対応させて具体例を説明すると、重み付け包絡逆正規化部15は、利得乗算部14が出力した「正規化された重み付け正規化MDCT係数列」の各係数に、当該各係数に対応するパワースペクトル包絡係数列の各係数のβ乗(0<β<1)の値W(1)β,・・・,W(N)βを乗算することによって、MDCT係数列の各係数X(1),・・・,X(N)を得る。
次に、時間領域変換部16が、フレームごとに、重み付け包絡逆正規化部15が出力した「MDCT係数列」を時間領域に変換してフレーム単位の音声音響ディジタル信号を得る(ステップS16)。
(参考文献2)守谷健弘著、「音声符号化」、社団法人電子情報通信学会、1998.
上述の実施形態に関わる符号化装置/復号装置は、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、CPU(Central Processing Unit)〔キャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)やROM(Read Only Memory)と、ハードディスクである外部記憶装置、並びにこれらの入力部、出力部、CPU、RAM、ROM、外部記憶装置間のデータのやり取りが可能なように接続するバスなどを備えている。また必要に応じて、符号化装置/復号装置に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
Claims (28)
- 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列(以下、暫定サンプル列という)とし、
(3)上記暫定サンプル列の全てのサンプルが含まれ、かつ、
(4)上記暫定サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替えステップと、
上記並べ替えステップで得られたサンプル列を符号化する符号化ステップと
を有する符号化方法。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列(以下、暫定サンプル列という)とし、
(3)上記暫定サンプル列の全てのサンプルが含まれ、かつ、
(4)上記暫定サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記暫定サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記暫定サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替えステップと、
上記並べ替えステップで得られたサンプル列を符号化する符号化ステップと
を有する符号化方法。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列(以下、第1サンプル列という)として出力し、
(3)上記サンプル列の全てのサンプルが含まれ、かつ、
(4)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列(以下、第2サンプル列という)として出力する並べ替えステップと、
上記第1サンプル列及び上記第2サンプル列をそれぞれ符号化して符号列を得て、得られた符号列のうち符号量が最小の符号列を出力する符号化ステップと
を有する符号化方法。 - 請求項1から請求項3のいずれかに記載の符号化方法であって、
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定められた閾値以上である場合に、上記並べ替えステップが実行され、
上記並べ替えステップが実行されない場合には、符号化ステップでは上記音響信号に由来する周波数領域の上記サンプル列が符号化される
ことを特徴とする符号化方法。 - 請求項1から請求項3のいずれかに記載の符号化方法であって、
上記音響信号に由来する周波数領域の上記サンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に、上記並べ替えステップが実行され、
上記並べ替えステップが実行されない場合には、符号化ステップでは上記音響信号に由来する周波数領域の上記サンプル列が符号化される
ことを特徴とする符号化方法。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定められた閾値以上である場合に実行される、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替えステップと、
上記並べ替えステップが実行された場合には、上記並べ替えステップで得られたサンプル列を符号化し、上記並べ替えステップが実行されなかった場合には、上記音響信号に由来する周波数領域の上記サンプル列を符号化する符号化ステップと
を有することを特徴とする符号化方法。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化方法であって、
上記音響信号に由来する周波数領域の上記サンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に実行される、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替えステップと、
上記並べ替えステップが実行された場合には、上記並べ替えステップで得られたサンプル列を符号化し、上記並べ替えステップが実行されなかった場合には、上記音響信号に由来する周波数領域の上記サンプル列を符号化する符号化ステップと
を有することを特徴とする符号化方法。 - 請求項1から請求項7のいずれかに記載の符号化方法であって、
上記符号化ステップでは、
上記並べ替えステップで得られたサンプル列のうち、上記所定の時間区間の音響信号に対応する予測利得またはその推定値と予め定められた閾値との大小関係に応じて定まる範囲に含まれるサンプルの集まりに対してライス符号化が適用される
ことを特徴とする符号化方法。 - 入力された符号列を復号する復号方法であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号ステップと、
(A)音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかと、(B)音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係とに従って、上記復号ステップで得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復ステップと
を有し、
上記復号ステップで得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたもの(以下、暫定サンプル列という)に対して、
(3)上記暫定サンプル列を構成する全てのサンプルを含み、かつ、
(4)上記暫定サンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものである
ことを特徴とする復号方法。 - 入力された符号列を復号する復号方法であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号ステップと、
(A)音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかと、(B)音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係とに従って、上記復号ステップで得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復ステップと
を有し、
上記復号ステップで得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたもの(以下、暫定サンプル列という)に対して、
(3)上記暫定サンプル列を構成する全てのサンプルを含み、かつ、
(4)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、上記暫定サンプル列に含まれる少なくとも一部のサンプルが並べられたものである
ことを特徴とする復号方法。 - 入力された符号列を復号する復号方法であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号ステップと、
上記復号ステップで得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて音響信号に由来するサンプル列を得る回復ステップと
を有し、
上記復号ステップで得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたもの(以下、第1サンプル列という)、
または、
(3)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(4)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたもの(以下、第2サンプル列という)、であり、
上記回復ステップは、
(A)上記復号ステップで得られたサンプル列が上記第1サンプル列である場合には、音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかに従って、上記第1サンプル列に含まれる少なくとも一部のサンプルを並べ替えて上記音響信号に由来するサンプル列を得て、(B)上記復号ステップで得られたサンプル列が上記第2サンプル列である場合には、音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記第2サンプル列に含まれる少なくとも一部のサンプルを並べ替えて上記音響信号に由来するサンプル列を得る
ことを特徴とする復号方法。 - 請求項9から請求項11のいずれかに記載の復号方法であって、
入力された量子化済PARCOR係数から計算される予測利得またはその推定値が予め定められた閾値以上である場合に、上記回復ステップが実行される
ことを特徴とする復号方法。 - 請求項9から請求項11のいずれかに記載の復号方法であって、
上記復号ステップで得られたサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に、上記回復ステップが実行される
ことを特徴とする復号方法。 - 入力された符号列を復号する復号方法であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号ステップと、
音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記復号ステップで得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復ステップと
を有し、
入力された量子化済PARCOR係数から計算される予測利得またはその推定値が予め定められた閾値以上である場合には、上記復号ステップで得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものであり、
入力された量子化済PARCOR係数から計算される予測利得またはその推定値が予め定められた閾値以上である場合に、上記回復ステップが実行される
ことを特徴とする復号方法。 - 入力された符号列を復号する復号方法であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号ステップと、
音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記復号ステップで得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復ステップと
を有し、
上記復号ステップで得られたサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合には、上記復号ステップで得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものであり、
上記復号ステップで得られたサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に、上記回復ステップが実行される
ことを特徴とする復号方法。 - 請求項9から請求項15のいずれかに記載の復号方法であって、
入力された符号列の少なくとも一部はライス符号化によって得られたものであり、
上記復号ステップでは、
入力された量子化済PARCOR係数から計算される予測利得またはその推定値と予め定められた閾値との大小関係に応じて定まる範囲の符号列に対して上記ライス符号化に対応する復号が行われる
ことを特徴とする復号方法。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列(以下、暫定サンプル列という)とし、
(3)上記暫定サンプル列の全てのサンプルが含まれ、かつ、
(4)上記暫定サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替え部と、
上記並べ替え部によって得られたサンプル列を符号化する符号化部と
を含む符号化装置。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列(以下、暫定サンプル列という)とし、
(3)上記暫定サンプル列の全てのサンプルが含まれ、かつ、
(4)上記暫定サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記暫定サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記暫定サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替え部と、
上記並べ替え部によって得られたサンプル列を符号化する符号化部と
を含む符号化装置。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列(以下、第1サンプル列という)として出力し、
(3)上記サンプル列の全てのサンプルが含まれ、かつ、
(4)上記サンプル列のうちの上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記サンプル列のうちの上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように上記サンプル列に含まれる少なくとも一部のサンプルを並べ替えたもの、
を並べ替え後のサンプル列(以下、第2サンプル列という)として出力する並べ替え部と、
上記第1サンプル列及び上記第2サンプル列をそれぞれ符号化して符号列を得て、得られた符号列のうち符号量が最小の符号列を出力する符号化部と
を含む符号化装置。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、
上記所定の時間区間の音響信号に対応する予測利得またはその推定値が予め定められた閾値以上である場合に実行される、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替え部と、
上記並べ替え部が実行された場合には、上記並べ替え部で得られたサンプル列を符号化し、上記並べ替え部が実行されなかった場合には、上記音響信号に由来する周波数領域の上記サンプル列を符号化する符号化部と
を含むことを特徴とする符号化装置。 - 所定の時間区間の音響信号に由来する周波数領域のサンプル列の符号化装置であって、
上記音響信号に由来する周波数領域の上記サンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に実行される、
(1)上記サンプル列の全てのサンプルが含まれ、かつ、
(2)上記サンプル列に含まれる少なくとも一部のサンプルを、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べ替えたもの、
を並べ替え後のサンプル列として出力する並べ替え部と、
上記並べ替え部が実行された場合には、上記並べ替え部で得られたサンプル列を符号化し、上記並べ替え部が実行されなかった場合には、上記音響信号に由来する周波数領域の上記サンプル列を符号化する符号化部と
を含むことを特徴とする符号化装置。 - 入力された符号列を復号する復号装置であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号部と、
(A)音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかと、(B)音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係とに従って、上記復号部によって得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復部と
を含み、
上記復号部によって得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたもの(以下、暫定サンプル列という)に対して、
(3)上記暫定サンプル列を構成する全てのサンプルを含み、かつ、
(4)上記暫定サンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものである
ことを特徴とする復号装置。 - 入力された符号列を復号する復号装置であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号部と、
(A)音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかと、(B)音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係とに従って、上記復号部によって得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復部と
を含み、
上記復号部によって得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたもの(以下、暫定サンプル列という)に対して、
(3)上記暫定サンプル列を構成する全てのサンプルを含み、かつ、
(4)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、上記暫定サンプル列に含まれる少なくとも一部のサンプルが並べられたものである
ことを特徴とする復号装置。 - 入力された符号列を復号する復号装置であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号部と、
上記復号部によって得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて音響信号に由来するサンプル列を得る回復部と
を含み、
上記復号部によって得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、上記音響信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルが集まるように、周波数領域のサンプルが並べられたもの(以下、第1サンプル列という)、
または、
(3)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(4)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記音響信号の線形予測係数に基づくパワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたもの(以下、第2サンプル列という)、であり、
上記回復部は、
(A)上記復号部によって得られたサンプル列が上記第1サンプル列である場合には、音響信号の周期性を表わす情報、音響信号の基本周波数を表す情報、音響信号の周期性または基本周波数に対応するサンプルと音響信号の周期性または基本周波数の整数倍に対応するサンプルとの間隔を表す情報、のいずれかに従って、上記第1サンプル列に含まれる少なくとも一部のサンプルを並べ替えて上記音響信号に由来するサンプル列を得て、(B)上記復号部によって得られたサンプル列が上記第2サンプル列である場合には、音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記第2サンプル列に含まれる少なくとも一部のサンプルを並べ替えて上記音響信号に由来するサンプル列を得る
ことを特徴とする復号装置。 - 入力された符号列を復号する復号装置であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号部と、
音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記復号部で得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復部と
を含み、
入力された量子化済PARCOR係数から計算される予測利得またはその推定値が予め定められた閾値以上である場合には、上記復号部で得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものであり、
入力された量子化済PARCOR係数から計算される予測利得またはその推定値が予め定められた閾値以上である場合に、上記回復部が実行される
ことを特徴とする復号装置。 - 入力された符号列を復号する復号装置であって、
所定の時間区間ごとに、
入力された符号列を復号して、周波数領域のサンプル列を得る復号部と、
音響信号の線形予測係数に基づくパワースペクトル包絡係数列の大小関係に従って、上記復号部で得られたサンプル列に含まれる少なくとも一部のサンプルを並べ替えて当該音響信号に由来するサンプル列を得る回復部と
を含み、
上記復号部で得られたサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合には、上記復号部で得られたサンプル列は、
(1)上記音響信号に由来するサンプル列を構成する全てのサンプルを含み、かつ、
(2)上記音響信号に由来するサンプル列に含まれる少なくとも一部のサンプルが、上記パワースペクトル包絡係数列のうちの当該サンプルに対応する値の絶対値が大きい順または小さい順に並べられたものであり、
上記復号部で得られたサンプル列に含まれるサンプルの絶対値和またはパワーが予め定められた閾値以上である場合に、上記回復部が実行される
ことを特徴とする復号装置。 - 請求項1から請求項8のいずれかに記載された符号化方法または請求項9から請求項16のいずれかに記載された復号方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項1から請求項8のいずれかに記載された符号化方法または請求項9から請求項16のいずれかに記載された復号方法の各ステップをコンピュータに実行させるためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010277180A JP5694751B2 (ja) | 2010-12-13 | 2010-12-13 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010277180A JP5694751B2 (ja) | 2010-12-13 | 2010-12-13 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2012128022A JP2012128022A (ja) | 2012-07-05 |
| JP5694751B2 true JP5694751B2 (ja) | 2015-04-01 |
Family
ID=46645161
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010277180A Active JP5694751B2 (ja) | 2010-12-13 | 2010-12-13 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5694751B2 (ja) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106847296B (zh) | 2012-07-12 | 2021-01-22 | 诺基亚技术有限公司 | 矢量量化 |
| EP3413306B1 (en) * | 2014-03-24 | 2019-10-30 | Nippon Telegraph and Telephone Corporation | Encoding method, encoder, program and recording medium |
| US10332533B2 (en) * | 2014-04-24 | 2019-06-25 | Nippon Telegraph And Telephone Corporation | Frequency domain parameter sequence generating method, encoding method, decoding method, frequency domain parameter sequence generating apparatus, encoding apparatus, decoding apparatus, program, and recording medium |
| CN106663437B (zh) * | 2014-05-01 | 2021-02-02 | 日本电信电话株式会社 | 编码装置、解码装置、编码方法、解码方法、记录介质 |
| JP6411509B2 (ja) * | 2014-07-28 | 2018-10-24 | 日本電信電話株式会社 | 符号化方法、装置、プログラム及び記録媒体 |
| CN113921021B (zh) * | 2015-01-30 | 2025-08-26 | 日本电信电话株式会社 | 解码装置、解码方法、记录介质以及计算机程序产品 |
| JP6712643B2 (ja) * | 2016-09-15 | 2020-06-24 | 日本電信電話株式会社 | サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム |
| JP6475273B2 (ja) * | 2017-02-16 | 2019-02-27 | ノキア テクノロジーズ オーユー | ベクトル量子化 |
| US20240144944A1 (en) * | 2021-03-09 | 2024-05-02 | Deepmind Technologies Limited | Generating output signals using variable-rate discrete representations |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3353868B2 (ja) * | 1995-10-09 | 2002-12-03 | 日本電信電話株式会社 | 音響信号変換符号化方法および復号化方法 |
| JPH10276095A (ja) * | 1997-03-28 | 1998-10-13 | Toshiba Corp | 符号化器及び復号化器 |
| JP5612698B2 (ja) * | 2010-10-05 | 2014-10-22 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
-
2010
- 2010-12-13 JP JP2010277180A patent/JP5694751B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2012128022A (ja) | 2012-07-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5612698B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
| JP5694751B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
| JP5596800B2 (ja) | 符号化方法、周期性特徴量決定方法、周期性特徴量決定装置、プログラム | |
| JP5603484B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 | |
| JP6053196B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 | |
| JP5893153B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
| JP5579932B2 (ja) | 符号化方法、装置、プログラム及び記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130731 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140728 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140805 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140916 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150127 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150205 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5694751 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |