[go: up one dir, main page]

JP2003108192A - オーディオ信号符号化方法 - Google Patents

オーディオ信号符号化方法

Info

Publication number
JP2003108192A
JP2003108192A JP2001296836A JP2001296836A JP2003108192A JP 2003108192 A JP2003108192 A JP 2003108192A JP 2001296836 A JP2001296836 A JP 2001296836A JP 2001296836 A JP2001296836 A JP 2001296836A JP 2003108192 A JP2003108192 A JP 2003108192A
Authority
JP
Japan
Prior art keywords
spectrum
variation index
integrated
integrated group
grouping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001296836A
Other languages
English (en)
Other versions
JP4635400B2 (ja
JP2003108192A5 (ja
Inventor
Kiyotaka Nagai
清隆 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001296836A priority Critical patent/JP4635400B2/ja
Publication of JP2003108192A publication Critical patent/JP2003108192A/ja
Publication of JP2003108192A5 publication Critical patent/JP2003108192A5/ja
Application granted granted Critical
Publication of JP4635400B2 publication Critical patent/JP4635400B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 オーディオ信号の複数の時間ブロックのスペ
クトルデータをグループ化して高能率符号化する時に、
グループ化が適切に行われていないことにより、音質が
劣化することがあるという課題があった。 【解決手段】 隣接するグループを統合した時の統合し
たグループに属する時間ブロック間のスペクトルデータ
の変動の最大あるいは平均を表す統合グループスペクト
ル変動指標を算出するステップ(103)と、すべての
隣接するグループの統合の中で前記統合グループスペク
トル変動指標の最小値を算出するステップ(104)
と、前記最小値が第1の閾値以下の場合に前記統合グル
ープスペクトル変動指標を最小とするグループを統合す
るステップ(106)とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オーディオ信号を
時間ブロック単位でスペクトルデータに変換し、複数の
時間ブロックのスペクトルデータをグループ化して高能
率符号化するオーディオ信号符号化方法に関する。
【0002】
【従来の技術】近年、オーディオ信号を時間ブロック単
位でスペクトルデータに変換し、複数の時間ブロックの
スペクトルデータをグループ化して高能率符号化するこ
とにより、符号化効率を改善する手法が提案されてい
る。
【0003】このような提案としては、MPEG−2
AAC(Advanced Audio Coding)の規格書(ISO/IEC 1
3818-7, Information technology - Generic coding of
moving pictures and associated audio information
- Part 7: Advanced AudioCoding (AAC))や日本国特許
番号第2739377号に記載されたものが知られてい
る。
【0004】しかしながら、これらの先行文献には、具
体的なグループ化の決定方法については、記載されてお
らず、このため、例えば、あらかじめ設定した固定のグ
ループ化方法で対応せざるを得なかった。
【0005】以下では、MPEG−2 AAC(以下A
ACと略す)のローコンプレキシティプロファイル(Lo
w Complexity Profile)を例にとって、複数の時間ブロ
ックのスペクトルデータをグループ化して高能率符号化
する従来例について説明する。
【0006】図5にAACエンコーダのブロック図を示
す。図5において、500と501はフィルタバンク、
510と511はブロック長決定部、520はジョイン
トステレオデータ生成部、530は短時間ブロックグル
ープ化決定部、540は量子化及び符号化部である。以
上のように構成されたAACエンコーダについて、その
動作を以下に述べる。
【0007】入力された左チャンネル(Lch)の時間
軸のオーディオ信号は、フィルタバンク500において
ブロック長決定部510で決定された長さのブロックに
分割され、MDCT(Modified Discrete Cosine Trans
form,変形離散コサイン変換)によりスペクトルデータ
(MDCT係数)に変換される。この変換は変換ブロッ
クを50%ずつオーバーラップして実行し、例えば20
48サンプルを1024本のMDCT係数に変換する。
同様に、入力された右チャンネル(Rch)の時間軸の
オーディオ信号は、フィルタバンク501においてブロ
ック長決定部511で決定された長さのブロックに分割
され、MDCTによりスペクトルデータに変換される。
【0008】ブロック長決定部510と511では、M
DCTのブロック長を決定し、出力する。ブロック長決
定部510と511で、それぞれのチャンネルの信号の
変化に応じてMDCTのブロック長を変化させることに
より、プリエコーと呼ばれる疑似信号の発生による音質
の劣化を防止する。すなわち、定常的な信号の場合に
は、MDCTのブロック長を2048サンプルの長時間
ブロックとし、1024本のスペクトルデータに変換す
る。一方、過渡的な信号の場合には256サンプルの短
時間ブロックとし、128本のスペクトルデータに変換
する。短時間ブロックでは、8個連続で短いブロック長
を用いて変換することにより、出力のスペクトルデータ
の本数を8×128=1024本として、長時間ブロッ
クと一致させる。この1024本のスペクトルデータか
ら成る符号化の単位をフレームと呼ぶ。
【0009】図6に短時間ブロックと長時間ブロックの
例を示す。同図で、第0フレーム(F0)、第2フレー
ム(F2)、第3フレーム(F3)は、長時間ブロック
のフレームであり、これに対して第1フレーム(F1)
は連続した8個の短時間ブロックから成る短時間ブロッ
クのフレームである。
【0010】次にジョイントステレオデータ生成部52
0では、左右のチャンネルの相関を利用して符号化効率
を向上させるため、左右のチャンネルのスペクトルデー
タを入力として、ジョイントステレオ(ミッド/サイド
ステレオあるいはインテンシティステレオ)符号化に必
要なジョイントステレオスペクトルデータを生成する。
ここで、ジョイントステレオスペクトルデータとは、ミ
ッド/サイド(和差)ステレオ符号化に必要な左チャン
ネルと右チャンネルのスペクトルデータの和と差、ある
いはインテンシティステレオ符号化に必要な左チャンネ
ルと右チャンネルのスペクトルデータの和(左右のチャ
ンネルの位相が逆相の場合には差)である。なお、イン
テンシティステレオ符号化の場合、もう一方のチャンネ
ルのスペクトルデータはゼロに設定される。
【0011】次に短時間ブロックグループ化決定部53
0では、短時間ブロックの符号化効率を向上するため、
短時間ブロックのグループ化を行う。短時間ブロックの
グループ化では、複数の連続する短時間ブロックをブロ
ック単位でまとめ、スケールファクタバンドと呼ばれる
複数のスペクトルデータから構成されるバンド単位で共
通のステップサイズを用いて量子化することにより、量
子化ステップサイズを表すスケールファクタ等のサイド
情報を削減し、符号化効率を改善する。AACの規格で
は、1フレーム当り、最小1個から最大8個のグループ
にグループ化することが可能である。ここでは、図7に
示すように、8個の短時間ブロックを2個ずつ1グルー
プとして、合計4個のグループ(G0,G1,G2,G
3)にグループ化する。なお、ジョイントステレオスペ
クトルデータの場合には、2つのチャンネルのスペクト
ルデータが対になっているので、グループ化に際して
も、図8に示すように、2つのチャンネルのグループ化
を共通に設定する必要がある。
【0012】量子化及び符号化部540では、左右のチ
ャンネルのスペクトルデータ、あるいはジョイントステ
レオデータ生成部520からのジョイントスペクトルデ
ータをスケールファクタバンド毎にまとめ、聴覚モデル
に基づいてスペクトルデータのマスキングレベル、すな
わち許容量子化ノイズレベルを算出し、算出された許容
量子化ノイズレベルに基づいてスケールファクタバンド
毎にスペクトルデータの量子化を行い、ハフマン符号化
等の符号化処理を行い、高能率符号化データを出力す
る。
【0013】
【発明が解決しようとする課題】しかしながら、上記従
来の複数の時間ブロックのスペクトルデータのグループ
化では、スペクトルデータに依存しない固定的なグルー
プ化であるため、符号化効率が劣化し、音質が劣化する
ことがあるという課題があった。すなわち、スペクトル
データの時間変化が緩やかなところでは、本来は、より
多くの時間ブロックを1グループとしてスケールファク
タ等のサイド情報を削減し、符号化効率を改善すべきで
あるのにこれができず、また、スペクトルデータの時間
変化が急激なところが、同一のグループにされると、同
一の量子化ステップサイズを用いるため、小さなレベル
の時間ブロックのスペクトルデータを十分表現すること
ができず、このため音質が劣化するという課題があっ
た。
【0014】本発明は上記問題点を解決するもので、時
間ブロック間のスペクトルデータの変動に基づく最適な
グループ化により、スペクトルデータとスケールファク
タ等のサイド情報に割り当てるビット数を最適化し、音
質の向上したオーディオ信号高能率符号化方法を提供す
ることを目的とする。
【0015】また、2つのチャンネルのグループ化を共
通に設定する必要のあるジョイントステレオスペクトル
データに対しても最適なグループ化を行い、スペクトル
データとスケールファクタ等のサイド情報に割り当てる
ビット数を最適化し、音質の向上したオーディオ信号高
能率符号化方法を提供することを目的とする。
【0016】また、時間変化の極めて激しいフレームに
対して、音質を大幅に劣化させることがないグループ化
を行うオーディオ信号の高能率符号化方法を提供するこ
とを目的とする。
【0017】また、広い範囲のビットレートに対して適
切なグループ化を行い、従来よりも音質の向上したオー
ディオ信号符号化方法を提供することを目的とする。
【0018】
【課題を解決するための手段】この課題を解決するため
に、本発明のオーディオ信号符号化方法は、オーディオ
信号を時間ブロック単位でスペクトルデータに変換し、
複数の時間ブロックのスペクトルデータをグループ化し
て高能率符号化する方法であって、隣接するグループを
統合した時の統合したグループに属する時間ブロック間
のスペクトルデータの変動の最大あるいは平均を表す統
合グループスペクトル変動指標を算出するステップと、
すべての隣接するグループの統合の中で前記統合グルー
プスペクトル変動指標の最小値を算出するステップと、
前記最小値が第1の閾値以下の場合に前記統合グループ
スペクトル変動指標を最小とするグループを統合するス
テップとを備えたものである。
【0019】また、本発明のオーディオ信号符号化方法
は、オーディオ信号を時間ブロック単位でスペクトルデ
ータに変換し、複数の時間ブロックのスペクトルデータ
をグループ化して高能率符号化する方法であって、隣接
するグループを統合した時の統合したグループに属する
時間ブロック間のスペクトルデータの変動の最大あるい
は平均を表す統合グループスペクトル変動指標を算出す
るステップと、すべての隣接するグループの統合の中で
前記統合グループスペクトル変動指標の最小値を算出す
るステップと、前記最小値が第1の閾値以下であるかあ
るいはグループ数が第2の閾値より大きい場合に前記統
合グループスペクトル変動指標を最小とするグループを
統合するステップとを備えたものである。
【0020】また、本発明のオーディオ信号符号化方法
は、オーディオ信号を時間ブロック単位でスペクトルデ
ータに変換し、複数の時間ブロックのスペクトルデータ
をグループ化して高能率符号化する方法であって、複数
のチャンネルのグループ化を共通に設定する場合に、隣
接するグループを統合した時の統合したグループに属す
る時間ブロック間のスペクトルデータの変動の最大ある
いは平均を表す統合グループスペクトル変動指標を複数
のチャンネルについてそれぞれ算出するステップと、前
記複数のチャンネルの統合グループスペクトル変動指標
の最大あるいは平均を複数チャンネル統合グループスペ
クトル変動指標として算出するステップと、すべての隣
接するグループの統合の中で前記複数チャンネル統合グ
ループスペクトル変動指標の最小値を算出するステップ
と、前記最小値が第1の閾値以下である場合に前記複数
チャンネル統合グループスペクトル変動指標を最小とす
るグループを統合するステップとを備えたものである。
【0021】また、本発明のオーディオ信号符号化方法
は、オーディオ信号を時間ブロック単位でスペクトルデ
ータに変換し、複数の時間ブロックのスペクトルデータ
をグループ化して高能率符号化する方法であって、複数
のチャンネルのグループ化を共通に設定する場合に、隣
接するグループを統合した時の統合したグループに属す
る時間ブロック間のスペクトルデータの変動の最大ある
いは平均を表す統合グループスペクトル変動指標を複数
のチャンネルについてそれぞれ算出するステップと、前
記複数のチャンネルの統合グループスペクトル変動指標
の最大あるいは平均を複数チャンネル統合グループスペ
クトル変動指標として算出するステップと、すべての隣
接するグループの統合の中で前記複数チャンネル統合グ
ループスペクトル変動指標の最小値を算出するステップ
と、前記最小値が第1の閾値以下であるかあるいはグル
ープ数が第2の閾値より大きい場合に前記複数チャンネ
ル統合グループスペクトル変動指標を最小とするグルー
プを統合するステップとを備えたものである。
【0022】また、本発明のオーディオ信号符号化方法
は、上記本発明のオーディオ信号符号化方法において、
符号化のビットレートに応じて前記第1あるいは第2の
閾値を設定するステップを備えたものである。
【0023】また、上記記載の本発明に係るオーディオ
信号符号化方法をコンピュータまたはデジタルシグナル
プロセッサに実行させるためのプログラムを記録したコ
ンピュータ読み取り可能な記録媒体としたものである。
【0024】また、上記記載の本発明に係るオーディオ
信号符号化方法をコンピュータまたはデジタルシグナル
プロセッサに実行させるためのプログラムとしたもので
ある。
【0025】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を用いて説明する。
【0026】以下の実施の形態の説明では、本発明の特
徴である複数の時間ブロックのスペクトルデータのグル
ープ化の方法について、AACエンコーダに適用した場
合を例として説明する。即ち、オーディオ信号符号化装
置(AACエンコーダ)の構成としては、図5に示した
通りである。
【0027】(実施の形態1)図1は、本発明の実施の
形態1のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
【0028】以下、図1を用いて実施の形態1における
特徴部分としてのグループ化の方法について説明する。
【0029】最初にステップ101で、1グループ1ブ
ロックに設定し、1フレームのグループ数を最大の8に
設定する。本実施の形態では、当初の8グループから適
宜グループを統合することにより、グループ化を決定す
る。
【0030】ステップ102で、第1の閾値の設定を行
う。第1の閾値は、隣接するグループを統合するときの
統合するグループに属する時間ブロックのスペクトルデ
ータの変動を表す統合グループスペクトル変動指標に対
する閾値である。
【0031】ステップ103で、隣接するグループを統
合した時の統合したグループに属するすべての時間ブロ
ック間のスペクトルデータの変動の最大を表すところの
統合グループスペクトル変動指標を以下のようにして算
出する。
【0032】最初に、時間ブロック番号i(0≦i<
8)でスケールファクタバンド番号k(0≦k<max
_sfb、ただし、max_sfbは最大スケールファ
クタバンド数)のバンドのスペクトルデータの絶対値の
最大であるmaxspec(i)(k)を算出し、次に
統合したグループに属する2つの時間ブロック、iとj
のブロック間のスペクトル変動を表すブロック間スペク
トル変動指標dev(i,j)を(数1)で算出する。
【0033】
【数1】
【0034】ここで、abs(x)はxの絶対値を表
し、また、log10(x)は10を底とするxの対数
を表す。
【0035】なお、以上の説明では、ブロック間スペク
トル変動指標の算出に時間ブロック番号とスケールファ
クタバンド番号で指定されるバンドのスペクトルデータ
の絶対値の最大を用いる例を示したが、前記スペクトル
データの絶対値の平均や、スペクトルデータの2乗和の
平均の平方根を用いても良い。また、2つのブロックの
前記スペクトルデータの絶対値の最大の比の対数の絶対
値のスケールファクタバンドに関する総和を用いる例を
示したが、前記2つのブロックの前記スペクトルデータ
の絶対値の最大の差の2乗のスケールファクタバンドに
関する総和を用いてもよい。
【0036】次に、統合したグループに属するすべての
時間ブロック間のブロック間スペクトル変動指標dev
(i,j)の最大を算出し、統合グループグループ変動
指標とする。
【0037】なお、以上の説明では、統合するグループ
に属するすべてのブロック間スペクトル変動指標の最大
を用いたが、平均を用いてもよい。
【0038】次にステップ104で、すべての隣接する
グループの統合の中で、統合グループスペクトル変動指
標の最小値を算出する。最初は、1グループ1ブロック
に設定されているので、[0,1]、[1,2]、
[2,3]、[3,4]、[4,5]、[5,6]、
[6,7](ここで[]の内は統合する短時間ブロック
の番号を表す。)の7通りのグループの統合の中で最小
値とそれを与えるグループ統合を算出する。
【0039】次にステップ105で、ステップ104で
算出した統合グループスペクトル変動指標の最小値と第
1の閾値とを比較し、上記統合グループスペクトル変動
指標の最小値が第1の閾値以下である場合にはステップ
106に行き、グループ統合を行い、そうでない場合に
はグループ化を終了する。したがって、統合したときの
グループ内の時間ブロックのスペクトル変動が小さい場
合においてのみグループ統合はなされ、前記時間ブロッ
クのスペクトル変動が大きい場合にはグループ統合はな
されない。
【0040】ステップ106では、ステップ104で算
出した統合グループスペクトル変動指標を最小とするグ
ループを統合する。
【0041】次にステップ107で、グループ数を1減
少してステップ103に戻る。
【0042】以上のように本実施の形態では、隣接する
グループを統合した時のグループ内のスペクトルデータ
の変動を表す統合グループスペクトル変動指標に基づ
き、前記統合グループスペクトル変動指標が第1の閾値
以下の場合には、最適な順序で(上記統合グループスペ
クトル変動指標の小さいものから順に)グループ化を行
うことにより、スペクトルデータとスケールファクタ等
のサイド情報に割り当てるビット数を最適化し、音質を
向上することができる。
【0043】(実施の形態2)図2は、本発明の実施の
形態2のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
【0044】図2で図1と同一番号を付したステップ
は、図1に示したステップと同一である。図2と図1の
相違点は、図2では、ステップ201とステップ202
が追加されている点にあるので、以下、これらのステッ
プの処理内容について説明し、それ以外のステップにつ
いては説明を省略する。
【0045】ステップ201では、第2の閾値の設定を
行う。第2の閾値は、グループ数に関する閾値であり、
時間変化の極めて激しいフレームでグループ数が大きく
なり過ぎて、サイド情報のビット数が増え、スペクトル
データのビット数が不足することによる音質劣化を抑え
るためのものである。
【0046】ステップ202では、その時点でのグルー
プ数と第2の閾値を比較し、グループ数が第2の閾値よ
り大きい場合には、ステップ106に行き、グループを
統合する。また、グループ数が第2の閾値以下である場
合にはステップ105に行き、統合グループスペクトル
変動指標の最小値が第1の閾値以下である場合のみ、ス
テップ106に行き、グループを統合する。
【0047】以上のように実施の形態2では、グループ
化の最大グループ数を第2の閾値で設定し、グループ数
を制限することにより、サイド情報に割り当てるビット
数を制限し、スペクトルデータに割り当てることによ
り、時間変化の極めて激しいフレームでの大幅な音質劣
化を抑えることができる。
【0048】(実施の形態3)図3は、本発明の実施の
形態3のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
【0049】図3で図2と同一番号を付したステップ
は、図2に示したステップと同一である。図3と図2の
相違点は、図3ではステップ301が追加されている点
にあるので、以下、追加されたステップとそれに関連す
るステップについて説明し、それ以外のステップについ
ては説明を省略する。
【0050】ステップ301では、ビットレートを入力
する。
【0051】次にステップ102では、ステップ301
で入力されたビットレートに応じて第1の閾値の設定を
行う。すなわち、ビットレートが高い場合には、使用可
能なビット数が増加するので、第1の閾値をより小さい
値に設定することにより、グループ数を増加させ、スペ
クトルデータの時間変化をより正確に表現できるように
する。
【0052】同様に、ステップ201では、ステップ3
01で入力されたビットレートに応じて第2の閾値の設
定を行う。すなわち、ビットレートが高い場合には、使
用可能なビット数が増加するので、第2の閾値をより大
きな値に設定することにより、最大グループ数を増加さ
せ、スペクトルデータの時間変化の激しい場合にもスペ
クトルデータをより正確に表現できるようにする。
【0053】以上のように実施の形態3では、第1ある
いは第2の閾値をビットレートに応じて設定することに
より、それぞれのビットレートに適したグループ化を行
い、広い範囲のビットレートに対して音質を向上するこ
とができる。
【0054】(実施の形態4)図4は、本発明の実施の
形態4のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
【0055】実施の形態4は、2つのチャンネルの時間
ブロックのグループ化を共通に設定する場合のグループ
化の方法である。
【0056】例えば、ジョイントステレオ符号化では、
2つのチャンネルのスペクトルデータを一対として取り
扱うので、2つのチャンネルの時間ブロックのグループ
化を共通に設定する必要がある。すなわち、実施の形態
4は、例えば、ミッド/サイドステレオ符号化やインテ
ンシティステレオ符号化に対して適用される。ただし、
インテンシティステレオ符号化に関しては、一方のチャ
ンネルのスペクトルデータはゼロに設定されているの
で、ゼロに設定されていないチャンネルのスペクトルデ
ータに対して、例えば、実施の形態1〜3のグループ化
を行い、それを2つのチャンネルに対して共通に適用し
てもよい。
【0057】以下、図4を用いて実施の形態4における
グループ化の方法について説明する。
【0058】最初に、ステップ401で、1グループ1
ブロックに設定し、1フレームのグループ数を最大の8
に設定する。本実施の形態では、当初の8グループから
グループを統合することにより、グループ化を決定す
る。
【0059】ステップ402で、ビットレートを入力す
る。
【0060】ステップ403で、ビットレートに応じて
第1の閾値の設定を行う。第1の閾値は、2つのチャン
ネルの隣接するグループを統合した時の統合したグルー
プに属する時間ブロックのスペクトルデータの変動を表
す2チャンネル統合グループスペクトル変動指標に対す
る閾値である。
【0061】ステップ404で、ビットレートに応じて
第2の閾値の設定を行う。第2の閾値は、グループ数に
対する閾値であり、グループ数が大きくなり過ぎて、サ
イド情報のビット数が増え、スペクトルデータのビット
数が不足することによる音質劣化を抑えるためのもので
ある。
【0062】ステップ405で、隣接するグループを統
合したときの統合したグループに属する時間ブロック間
のスペクトルデータの変動の最大を表す統合グループス
ペクトル変動指標を2つのチャンネルについてそれぞれ
算出する。各チャンネルの統合グループスペクトル変動
指標の算出に関しては、実施の形態1のステップ103
で説明した方法を用いる。
【0063】次にステップ406で、ステップ405で
算出した2つのチャンネルの統合グループスペクトル変
動指標の最大を算出し、2チャンネル統合グループスペ
クトルとする。
【0064】なお、以上の説明では、2つのチャンネル
の統合グループスペクトル変動指標の最大を2チャンネ
ル統合グループスペクトルとして用いる例を示したが、
前記統合グループスペクトル変動指標の平均を用いても
よい。
【0065】次にステップ407で、すべての隣接する
グループの統合の中で2チャンネル統合グループスペク
トル変動指標の最小値を算出する。最初は、1グループ
1ブロックに設定されているので、[0,1]、[1,
2]、[2,3]、[3,4]、[4,5]、[5,
6]、[6,7](ここで[]の内は統合する短時間ブ
ロックの番号を表す。)の7通りのグループの統合の中
で最小値とそれを与えるグループ統合を算出する。
【0066】次にステップ408で、この時点でのグル
ープ数と第2の閾値を比較し、グループ数が第2の閾値
より大きい場合には、ステップ410に行き、グループ
を統合する。また、グループ数が第2の閾値以下である
場合にはステップ409に行く。
【0067】ステップ409で、ステップ407で算出
した2チャンネル統合グループスペクトル変動指標の最
小値と第1の閾値とを比較し、上記2チャンネル統合グ
ループスペクトル変動指標の最小値が第1の閾値以下で
ある場合にはステップ410に行き、グループ統合を行
う。そうでない場合にはグループ化を終了する。したが
って、統合したときのグループ内の時間ブロックのスペ
クトル変動が小さい場合においてのみグループ統合はな
され、前記時間ブロックのスペクトル変動が大きい場合
にはグループ統合はなされない。
【0068】ステップ410では、ステップ407で算
出した2チャンネル統合グループスペクトル変動指標を
最小とするグループを統合する。
【0069】次にステップ411で、グループ数を1減
少してステップ405に戻る。
【0070】以上のように本実施の形態では、2つのチ
ャンネルで共通のグループ化を行う場合に、2つのチャ
ンネルの隣接するグループを統合した時のグループ内の
スペクトルデータの変動を表す2チャンネル統合グルー
プスペクトル変動指標に基づき、グループ数が第2の閾
値より大きいかあるいは前記2チャンネル統合グループ
スペクトル変動指標が第1の閾値以下の場合には、最適
な順序で(上記2チャンネル統合グループスペクトル変
動指標の小さいものから順に)グループ化を行うことに
より、スペクトルデータとスケールファクタ等のサイド
情報に割り当てるビット数を最適化し、音質を向上する
ことができる。
【0071】なお、以上の説明では、第2の閾値を設定
し、第2の閾値とグループ数を比較するステップを設け
る例を示したが、実施の形態1のように、これらのステ
ップを省いてもよい。
【0072】なお、上記各実施の形態におけるオーディ
オ信号符号化方法は、コンピュータまたはデジタルシグ
ナルプロセッサに実行させるためのプログラムとして実
現することができ、これをコンピュータ読み取り可能な
記録媒体に記録してもよい。
【0073】
【発明の効果】以上のように本発明によれば、隣接する
グループを統合したときのグループ内の時間ブロックの
スペクトルデータの変動を表す統合グループスペクトル
変動指標に基づき、統合グループスペクトル変動指標が
第1の閾値以下の場合に、最適な順序で(上記統合グル
ープスペクトル変動指標の小さいものから順に)グルー
プ化を行うことにより、スペクトルデータとスケールフ
ァクタ等のサイド情報に割り当てるビット数を最適化
し、音質を向上することができる。
【0074】また、グループ化の最大グループ数を第2
の閾値で設定し、グループ数を制限することにより、サ
イド情報に割り当てるビット数を制限し、スペクトルデ
ータに割り当てることにより、時間変化の極めて激しい
フレームに対する大幅な音質劣化を抑えることができ
る。
【0075】また、第1あるいは第2の閾値をビットレ
ートに応じて設定することにより、それぞれのビットレ
ートに適したグループ化を行い、広い範囲のビットレー
トに対して音質を向上することができる。
【0076】また、ミッド/サイドステレオ符号化のよ
うに2つのチャンネルで共通のグループ化を行う場合に
対して、2チャンネル統合グループスペクトル変動指標
に基づき、グループ数が第2の閾値より大きいかあるい
は前記2チャンネル統合グループスペクトル変動指標が
第1の閾値以下の場合には、最適な順序で(上記2チャ
ンネル統合グループスペクトル変動指標の小さいものか
ら順に)グループ化を行うことにより、スペクトルデー
タとスケールファクタ等のサイド情報に割り当てるビッ
ト数を最適化し、音質を向上することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1のオーディオ信号符号化
方法における複数の時間ブロックのグループ化の方法の
ステップを示すフローチャート
【図2】同実施の形態2のオーディオ信号符号化方法に
おける複数の時間ブロックのグループ化の方法のステッ
プを示すフローチャート
【図3】同実施の形態3のオーディオ信号符号化方法に
おける複数の時間ブロックのグループ化の方法のステッ
プを示すフローチャート
【図4】同実施の形態4のオーディオ信号符号化方法に
おける複数の時間ブロックのグループ化の方法のステッ
プを示すフローチャート
【図5】AACエンコーダの構成を示すブロック図
【図6】AACにおける短時間ブロックと長時間ブロッ
クの例を説明するための説明図
【図7】AACにおける短時間ブロックのグループ化の
例を説明するための説明図
【図8】AACにおけるジョイントステレオ符号化時の
短時間ブロックのグループ化の例を説明するための説明

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 オーディオ信号を時間ブロック単位でス
    ペクトルデータに変換し、複数の時間ブロックのスペク
    トルデータをグループ化して高能率符号化する方法であ
    って、隣接するグループを統合した時の統合したグルー
    プに属する時間ブロック間のスペクトルデータの変動の
    最大あるいは平均を表す統合グループスペクトル変動指
    標を算出するステップと、すべての隣接するグループの
    統合の中で前記統合グループスペクトル変動指標の最小
    値を算出するステップと、前記最小値が第1の閾値以下
    の場合に前記統合グループスペクトル変動指標を最小と
    するグループを統合するステップとを備えたことを特徴
    とするオーディオ信号符号化方法。
  2. 【請求項2】 オーディオ信号を時間ブロック単位でス
    ペクトルデータに変換し、複数の時間ブロックのスペク
    トルデータをグループ化して高能率符号化する方法であ
    って、隣接するグループを統合した時の統合したグルー
    プに属する時間ブロック間のスペクトルデータの変動の
    最大あるいは平均を表す統合グループスペクトル変動指
    標を算出するステップと、すべての隣接するグループの
    統合の中で前記統合グループスペクトル変動指標の最小
    値を算出するステップと、前記最小値が第1の閾値以下
    であるかあるいはグループ数が第2の閾値より大きい場
    合に前記統合グループスペクトル変動指標を最小とする
    グループを統合するステップとを備えたことを特徴とす
    るオーディオ信号符号化方法。
  3. 【請求項3】 オーディオ信号を時間ブロック単位でス
    ペクトルデータに変換し、複数の時間ブロックのスペク
    トルデータをグループ化して高能率符号化する方法であ
    って、複数のチャンネルのグループ化を共通に設定する
    場合に、隣接するグループを統合した時の統合したグル
    ープに属する時間ブロック間のスペクトルデータの変動
    の最大あるいは平均を表す統合グループスペクトル変動
    指標を複数のチャンネルについてそれぞれ算出するステ
    ップと、前記複数のチャンネルの統合グループスペクト
    ル変動指標の最大あるいは平均を複数チャンネル統合グ
    ループスペクトル変動指標として算出するステップと、
    すべての隣接するグループの統合の中で前記複数チャン
    ネル統合グループスペクトル変動指標の最小値を算出す
    るステップと、前記最小値が第1の閾値以下である場合
    に前記複数チャンネル統合グループスペクトル変動指標
    を最小とするグループを統合するステップとを備えたこ
    とを特徴とするオーディオ信号符号化方法。
  4. 【請求項4】 オーディオ信号を時間ブロック単位でス
    ペクトルデータに変換し、複数の時間ブロックのスペク
    トルデータをグループ化して高能率符号化する方法であ
    って、複数のチャンネルのグループ化を共通に設定する
    場合に、隣接するグループを統合した時の統合したグル
    ープに属する時間ブロック間のスペクトルデータの変動
    の最大あるいは平均を表す統合グループスペクトル変動
    指標を複数のチャンネルについてそれぞれ算出するステ
    ップと、前記複数のチャンネルの統合グループスペクト
    ル変動指標の最大あるいは平均を複数チャンネル統合グ
    ループスペクトル変動指標として算出するステップと、
    すべての隣接するグループの統合の中で前記複数チャン
    ネル統合グループスペクトル変動指標の最小値を算出す
    るステップと、前記最小値が第1の閾値以下であるかあ
    るいはグループ数が第2の閾値より大きい場合に前記複
    数チャンネル統合グループスペクトル変動指標を最小と
    するグループを統合するステップとを備えたことを特徴
    とするオーディオ信号符号化方法。
  5. 【請求項5】 符号化のビットレートに応じて前記第1
    あるいは第2の閾値を設定するステップを備えたことを
    特徴とする請求項1から請求項4のいずれかに記載のオ
    ーディオ信号符号化方法。
  6. 【請求項6】 請求項1ないし5のいずれかに記載のオ
    ーディオ信号符号化方法をコンピュータまたはデジタル
    シグナルプロセッサに実行させるためのプログラムを記
    録したコンピュータ読み取り可能な記録媒体。
  7. 【請求項7】 請求項1ないし5のいずれかに記載のオ
    ーディオ信号符号化方法をコンピュータまたはデジタル
    シグナルプロセッサに実行させるためのプログラム。
JP2001296836A 2001-09-27 2001-09-27 オーディオ信号符号化方法 Expired - Fee Related JP4635400B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001296836A JP4635400B2 (ja) 2001-09-27 2001-09-27 オーディオ信号符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001296836A JP4635400B2 (ja) 2001-09-27 2001-09-27 オーディオ信号符号化方法

Publications (3)

Publication Number Publication Date
JP2003108192A true JP2003108192A (ja) 2003-04-11
JP2003108192A5 JP2003108192A5 (ja) 2008-02-21
JP4635400B2 JP4635400B2 (ja) 2011-02-23

Family

ID=19118004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001296836A Expired - Fee Related JP4635400B2 (ja) 2001-09-27 2001-09-27 オーディオ信号符号化方法

Country Status (1)

Country Link
JP (1) JP4635400B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003098602A1 (en) * 2002-05-20 2003-11-27 Sony Corporation Acoustic signal encoding method and encoding device, acoustic signal decoding method and decoding device, program, and recording medium image display device
JP2007523366A (ja) * 2004-01-20 2007-08-16 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション ブロック系列化に基づくオーディオコーディング
WO2008004649A1 (fr) * 2006-07-07 2008-01-10 Nec Corporation Dispositif de codage audio, procédé de codage audio, et programme de ceux-ci

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000137497A (ja) * 1998-10-29 2000-05-16 Ricoh Co Ltd デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2001154698A (ja) * 1999-11-29 2001-06-08 Victor Co Of Japan Ltd オーディオ符号化装置及びその方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000137497A (ja) * 1998-10-29 2000-05-16 Ricoh Co Ltd デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2001154698A (ja) * 1999-11-29 2001-06-08 Victor Co Of Japan Ltd オーディオ符号化装置及びその方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003098602A1 (en) * 2002-05-20 2003-11-27 Sony Corporation Acoustic signal encoding method and encoding device, acoustic signal decoding method and decoding device, program, and recording medium image display device
US7627482B2 (en) 2002-05-20 2009-12-01 Sony Corporation Methods, storage medium, and apparatus for encoding and decoding sound signals from multiple channels
US7912731B2 (en) 2002-05-20 2011-03-22 Sony Corporation Methods, storage medium and apparatus for encoding and decoding sound signals from multiple channels
KR101144696B1 (ko) 2002-05-20 2012-05-25 소니 주식회사 음향 신호 부호화 방법 및 부호화 장치, 음향 신호 복호 방법 및 복호 장치, 및 기록 매체 화상 표시 장치
JP2007523366A (ja) * 2004-01-20 2007-08-16 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション ブロック系列化に基づくオーディオコーディング
WO2008004649A1 (fr) * 2006-07-07 2008-01-10 Nec Corporation Dispositif de codage audio, procédé de codage audio, et programme de ceux-ci
JP5093514B2 (ja) * 2006-07-07 2012-12-12 日本電気株式会社 オーディオ符号化装置、オーディオ符号化方法およびそのプログラム
US8818818B2 (en) 2006-07-07 2014-08-26 Nec Corporation Audio encoding device, method, and program which controls the number of time groups in a frame using three successive time group energies

Also Published As

Publication number Publication date
JP4635400B2 (ja) 2011-02-23

Similar Documents

Publication Publication Date Title
AU733156B2 (en) Audio coding method and apparatus
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
JP5326465B2 (ja) オーディオ復号方法、装置、及びプログラム
JP2001053617A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP3636094B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
KR100695125B1 (ko) 디지털 신호 부호화/복호화 방법 및 장치
KR102288111B1 (ko) 스테레오 신호의 인코딩 및 디코딩 방법과, 인코딩 및 디코딩 장치
JP3900000B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
JPH1084284A (ja) 信号再生方法および装置
JP2004309921A (ja) 符号化装置、符号化方法及びプログラム
JP4062971B2 (ja) オーディオ信号符号化方法
US8593321B2 (en) Computation apparatus and method, quantization apparatus and method, and program
JP4734859B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
KR100952065B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
JP2004325633A (ja) 信号符号化方法、信号符号化プログラム及びその記録媒体
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JP2006003580A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法
JP3894722B2 (ja) ステレオオーディオ信号高能率符号化装置
US8601039B2 (en) Computation apparatus and method, quantization apparatus and method, and program
JPH0969781A (ja) オーディオデータ符号化装置
US7181079B2 (en) Time signal analysis and derivation of scale factors
JP4635400B2 (ja) オーディオ信号符号化方法
JP2003233397A (ja) オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
JP4191503B2 (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP4369140B2 (ja) オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071225

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071225

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080115

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20091119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101026

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131203

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131203

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees