JPH1020888A - 音声符号化・復号化装置 - Google Patents
音声符号化・復号化装置Info
- Publication number
- JPH1020888A JPH1020888A JP8172650A JP17265096A JPH1020888A JP H1020888 A JPH1020888 A JP H1020888A JP 8172650 A JP8172650 A JP 8172650A JP 17265096 A JP17265096 A JP 17265096A JP H1020888 A JPH1020888 A JP H1020888A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- harmonic
- residual
- decoding
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】
【課題】 ディジタル通信において音声信号を圧縮する
音声符号化・復号化装置において、優れた出力音声信号
を得ることを目的とする。 【解決手段】 符号化装置100に、高調波振幅とピッ
チ周波数と有声無声判定からスペクトル包絡と高調波ス
ペクトルを算出する高調波スペクトル合成手段108
と、音声スペクトルと高調波スペクトルからスペクトル
残差を求めるスペクトル残差算出手段109と、スペク
トル残差を平滑化して符号化するスペクトル残差符号化
手段110を設け、復号化装置110に、高調波スペク
トル合成手段125と、スペクトル残差符号とスペクト
ル包絡からスペクトル残差を求め出力するスペクトル残
差復号化手段126を設けることにより、有声と判定さ
れた帯域を正弦波とその残差でモデル化し符号化・復号
化することで、より自然な合成音声を得ることができ
る。
音声符号化・復号化装置において、優れた出力音声信号
を得ることを目的とする。 【解決手段】 符号化装置100に、高調波振幅とピッ
チ周波数と有声無声判定からスペクトル包絡と高調波ス
ペクトルを算出する高調波スペクトル合成手段108
と、音声スペクトルと高調波スペクトルからスペクトル
残差を求めるスペクトル残差算出手段109と、スペク
トル残差を平滑化して符号化するスペクトル残差符号化
手段110を設け、復号化装置110に、高調波スペク
トル合成手段125と、スペクトル残差符号とスペクト
ル包絡からスペクトル残差を求め出力するスペクトル残
差復号化手段126を設けることにより、有声と判定さ
れた帯域を正弦波とその残差でモデル化し符号化・復号
化することで、より自然な合成音声を得ることができ
る。
Description
【0001】
【発明の属する技術分野】本発明は、ディジタル通信に
おいて音声信号を圧縮する音声符号化・復号化装置に関
する。
おいて音声信号を圧縮する音声符号化・復号化装置に関
する。
【0002】
【従来の技術】近年、ディジタル通信の発達にともな
い、音声を効率よく伝送・記録するための音声圧縮技術
への要望が大きい。IMBE符号化法は、低ビットレー
トで音質のよい符号化方法の1つとして知られている。
い、音声を効率よく伝送・記録するための音声圧縮技術
への要望が大きい。IMBE符号化法は、低ビットレー
トで音質のよい符号化方法の1つとして知られている。
【0003】従来、IMBE方式の音声符号化・復号化
装置としては、Digital Voice System Inc. 編の INMAR
SAT-M MODULE 1 Appendices に記載されたものが知られ
ている。
装置としては、Digital Voice System Inc. 編の INMAR
SAT-M MODULE 1 Appendices に記載されたものが知られ
ている。
【0004】図9に従来の音声符号化・復号化装置の構
成を示す。図9において、10は符号化装置、20は復
号化装置である。符号化装置10において、1は入力音
声信号を入力とし、フレーム音声信号を出力とするバッ
ファである。2はフレーム音声信号を入力とし、ピッチ
周波数を出力とするピッチ周波数推定手段である。3は
ピッチ周波数を入力とし、ピッチ周波数符号を出力とす
るピッチ周波数符号化手段である。4はフレーム音声信
号を入力とし、音声のスペクトルを出力とするスペクト
ル算出手段である。5はピッチ周波数と音声のスペクト
ルを入力とし、高調波の振幅と各高調波の有声無声判定
を出力とする高調波振幅推定手段である。6は高調波振
幅を入力とし、高調波振幅符号を出力とする高調波振幅
符号化手段である。7は有声無声判定を入力とし、有声
無声判定符号を出力とする有声無声判定符号化手段であ
る。8はピッチ周波数符号と高調波振幅符号と有声無声
判定符号を入力とし、多重化符号を出力とするマルチプ
レクサである。
成を示す。図9において、10は符号化装置、20は復
号化装置である。符号化装置10において、1は入力音
声信号を入力とし、フレーム音声信号を出力とするバッ
ファである。2はフレーム音声信号を入力とし、ピッチ
周波数を出力とするピッチ周波数推定手段である。3は
ピッチ周波数を入力とし、ピッチ周波数符号を出力とす
るピッチ周波数符号化手段である。4はフレーム音声信
号を入力とし、音声のスペクトルを出力とするスペクト
ル算出手段である。5はピッチ周波数と音声のスペクト
ルを入力とし、高調波の振幅と各高調波の有声無声判定
を出力とする高調波振幅推定手段である。6は高調波振
幅を入力とし、高調波振幅符号を出力とする高調波振幅
符号化手段である。7は有声無声判定を入力とし、有声
無声判定符号を出力とする有声無声判定符号化手段であ
る。8はピッチ周波数符号と高調波振幅符号と有声無声
判定符号を入力とし、多重化符号を出力とするマルチプ
レクサである。
【0005】復号化装置20において、11は多重化符
号を入力とし、ピッチ周波数符号と高調波振幅符号と有
声無声判定符号を出力とするデマルチプレクサである。
12はピッチ周波数符号を入力とし、ピッチ周波数を出
力とするピッチ周波数復号化手段である。13は高調波
振幅符号を入力とし、高調波振幅を出力とする高調波振
幅復号化手段である。14は有声無声判定符号を入力と
し、有声無声判定を出力とする有声無声判定復号化手段
である。15はピッチ周波数と高調波振幅と有声無声判
定を入力とし、合成音声を出力とする出力音声合成手段
である。
号を入力とし、ピッチ周波数符号と高調波振幅符号と有
声無声判定符号を出力とするデマルチプレクサである。
12はピッチ周波数符号を入力とし、ピッチ周波数を出
力とするピッチ周波数復号化手段である。13は高調波
振幅符号を入力とし、高調波振幅を出力とする高調波振
幅復号化手段である。14は有声無声判定符号を入力と
し、有声無声判定を出力とする有声無声判定復号化手段
である。15はピッチ周波数と高調波振幅と有声無声判
定を入力とし、合成音声を出力とする出力音声合成手段
である。
【0006】以上のように構成された音声符号化・復号
化装置について、図9、図10を用いてその動作を説明
する。はじめに符号化装置の動作を説明する。まず、バ
ッファ1では、入力音声信号を窓関数により切り出して
フレーム音声信号として出力する。ピッチ周波数推定手
段2では、フレーム音声信号を分析し、ピッチ周波数を
推定する。ピッチ周波数の推定方法としては、自己相関
やスペクトルなどを用いる手法が知られている。推定さ
れたピッチ周波数は、ピッチ周波数符号化手段3によっ
て符号化され、マルチプレクサ8を介して復号化装置2
0に送信されるとともに、高調波振幅推定手段5に入力
される。スペクトル算出手段4は、フレーム音声信号に
対し、離散フーリエ変換などの処理を行い、フレーム音
声信号のスペクトルS(w) を求める。高調波振幅推定手
段5は、(1)式に示すように、入力された音声スペク
トルS(w) と、推定されたピッチ周波数と高調波振幅か
ら合成されるスペクトルS'(w)の誤差E(w) の総和eが
最小になるように、高調波の振幅を推定する。
化装置について、図9、図10を用いてその動作を説明
する。はじめに符号化装置の動作を説明する。まず、バ
ッファ1では、入力音声信号を窓関数により切り出して
フレーム音声信号として出力する。ピッチ周波数推定手
段2では、フレーム音声信号を分析し、ピッチ周波数を
推定する。ピッチ周波数の推定方法としては、自己相関
やスペクトルなどを用いる手法が知られている。推定さ
れたピッチ周波数は、ピッチ周波数符号化手段3によっ
て符号化され、マルチプレクサ8を介して復号化装置2
0に送信されるとともに、高調波振幅推定手段5に入力
される。スペクトル算出手段4は、フレーム音声信号に
対し、離散フーリエ変換などの処理を行い、フレーム音
声信号のスペクトルS(w) を求める。高調波振幅推定手
段5は、(1)式に示すように、入力された音声スペク
トルS(w) と、推定されたピッチ周波数と高調波振幅か
ら合成されるスペクトルS'(w)の誤差E(w) の総和eが
最小になるように、高調波の振幅を推定する。
【0007】
【数1】 ・・・(1)
【0008】次に、(2)式に示すように、各高調波の
近傍において、この誤差を高調波振幅で正規化した誤差
が、あるしきい値Thより小さい場合は有声、大きい場
合は無声と判定する。
近傍において、この誤差を高調波振幅で正規化した誤差
が、あるしきい値Thより小さい場合は有声、大きい場
合は無声と判定する。
【0009】
【数2】 ・・・(2)
【0010】求められた高調波の振幅は、高調波振幅符
号化手段6、有声無声判定は有声無声判定符号化手段7
によってそれぞれ符号化される。マルチプレクサ8は、
入力されたピッチ周波数符号と高調波振幅符号と有声無
声判定符号をまとめ、多重化符号として復号装置20へ
出力する。
号化手段6、有声無声判定は有声無声判定符号化手段7
によってそれぞれ符号化される。マルチプレクサ8は、
入力されたピッチ周波数符号と高調波振幅符号と有声無
声判定符号をまとめ、多重化符号として復号装置20へ
出力する。
【0011】次に復号化装置20の動作を説明する。デ
マルチプレクサ11は、符号化装置10から送信された
多重化符号を、ピッチ周波数符号と高調波振幅符号と有
声無声符号に分解する。ピッチ周波数復号化手段12は
ピッチ周波数符号を、高調波振幅復号化手段13は高調
波振幅符号を、有声無声判定復号化手段14は有声無声
判定符号を、それぞれ復号化する。音声合成手段15
は、入力された各高調波の周波数、振幅、有声無声判定
をもとに、有声の高調波は正弦波、無声の高調波は白色
雑音による信号を合成し、出力音声信号を合成する。
マルチプレクサ11は、符号化装置10から送信された
多重化符号を、ピッチ周波数符号と高調波振幅符号と有
声無声符号に分解する。ピッチ周波数復号化手段12は
ピッチ周波数符号を、高調波振幅復号化手段13は高調
波振幅符号を、有声無声判定復号化手段14は有声無声
判定符号を、それぞれ復号化する。音声合成手段15
は、入力された各高調波の周波数、振幅、有声無声判定
をもとに、有声の高調波は正弦波、無声の高調波は白色
雑音による信号を合成し、出力音声信号を合成する。
【0012】図10は従来の音声符号化・復号化装置に
よって出力される合成音声スペクトルのモデルを示す。
図10に示すように、従来の音声符号化・復号化装置で
は、誤差E(w) が合成スペクトルS'(w)に対して、しき
い値Thより小さい部分では正弦波のみ、大きい部分で
は白色雑音のみで合成される。
よって出力される合成音声スペクトルのモデルを示す。
図10に示すように、従来の音声符号化・復号化装置で
は、誤差E(w) が合成スペクトルS'(w)に対して、しき
い値Thより小さい部分では正弦波のみ、大きい部分で
は白色雑音のみで合成される。
【0013】
【発明が解決しようとする課題】しかしながら、上記従
来の音声符号化・復号化装置においては、スペクトルの
誤差が大きい部分を白色雑音でモデル化していたが、こ
の誤差成分にも伝送すべき情報が含まれている場合があ
り、そのときに音質が劣化するという問題を有してい
た。
来の音声符号化・復号化装置においては、スペクトルの
誤差が大きい部分を白色雑音でモデル化していたが、こ
の誤差成分にも伝送すべき情報が含まれている場合があ
り、そのときに音質が劣化するという問題を有してい
た。
【0014】また、上記従来の音声符号化・復号化装置
においては、スペクトル領域での合成であり、特に無声
音が支配的な過渡部で重要と思われるフレーム内での時
間的なパワーの変化などが伝送されないため、合成音声
に反映されず、音質が劣化するという問題を有してい
た。
においては、スペクトル領域での合成であり、特に無声
音が支配的な過渡部で重要と思われるフレーム内での時
間的なパワーの変化などが伝送されないため、合成音声
に反映されず、音質が劣化するという問題を有してい
た。
【0015】また、上記従来の音声符号化・復号化装置
においては、有声無声がしきい値で決定され、有声から
無声、あるいは無声から有声に変化する過渡部分では、
十分にモデル化できておらず、異音などの原因となると
いう問題を有していた。
においては、有声無声がしきい値で決定され、有声から
無声、あるいは無声から有声に変化する過渡部分では、
十分にモデル化できておらず、異音などの原因となると
いう問題を有していた。
【0016】本発明は、上記従来の問題を解決するもの
で、復号化出力音声品質の良い優れた音声符号化・復号
化装置を提供することを目的とする。
で、復号化出力音声品質の良い優れた音声符号化・復号
化装置を提供することを目的とする。
【0017】
【課題を解決するための手段】上記問題を解決するため
に、本発明は、符号化装置に、ピッチ周波数と高調波振
幅と有声無声判定から高調波スペクトルとスペクトル包
絡を求める高調波スペクトル合成手段と、入力音声スペ
クトルと高調波スペクトルとの残差を求めるスペクトル
残差算出手段と、スペクトル残差を符号化するスペクト
ル残差符号化手段を設け、復号化装置に、ピッチ周波数
と高調波振幅と有声無声判定から高調波スペクトルとス
ペクトル包絡を求める高調波スペクトル合成手段と、ス
ペクトル残差符号を復号化してスペクトル包絡を乗じて
スペクトル残差を求めるスペクトル残差復号化手段を設
けたものである。この構成により、出力音声品質の良い
優れた音声符号化・復号化装置が得られる。
に、本発明は、符号化装置に、ピッチ周波数と高調波振
幅と有声無声判定から高調波スペクトルとスペクトル包
絡を求める高調波スペクトル合成手段と、入力音声スペ
クトルと高調波スペクトルとの残差を求めるスペクトル
残差算出手段と、スペクトル残差を符号化するスペクト
ル残差符号化手段を設け、復号化装置に、ピッチ周波数
と高調波振幅と有声無声判定から高調波スペクトルとス
ペクトル包絡を求める高調波スペクトル合成手段と、ス
ペクトル残差符号を復号化してスペクトル包絡を乗じて
スペクトル残差を求めるスペクトル残差復号化手段を設
けたものである。この構成により、出力音声品質の良い
優れた音声符号化・復号化装置が得られる。
【0018】
【発明の実施の形態】本発明の請求項1に記載の発明
は、符号化装置が、入力音声信号をフレームごとに切り
出すバッファと、ピッチ周波数を推定するピッチ周波数
推定手段と、推定されたピッチ周波数を符号化するピッ
チ周波数符号化手段と、音声信号のスペクトルを求める
スペクトル算出手段と、高調波の振幅と高調波の有声無
声判定を求める高調波振幅推定手段と、高調波振幅を符
号化する高調波振幅符号化手段と、有声無声判定を符号
化する有声無声判定符号化手段と、高調波による合成ス
ペクトルとスペクトル包絡を求める高調波スペクトル合
成手段と、入力音声と高調波合成音声のスペクトルの残
差を求めるスペクトル残差算出手段と、スペクトル残差
を平滑化して符号化するスペクトル残差符号化手段と、
各符号をまとめて多重化するマルチプレクサとを備え、
復号化装置が、多重化された符号を各符号に分解するデ
マルチプレクサと、ピッチ周波数符号を復号化するピッ
チ周波数復号化手段と、高調波振幅符号を復号化する高
調波振幅復号化手段と、有声無声判定符号を復号化する
有声無声復号化手段と、高調波スペクトルを合成しスペ
クトル包絡を求める高調波スペクトル合成手段と、スペ
クトル残差符号を復号化しスペクトル包絡を用いてスペ
クトル残差を求めるスペクトル残差復号化手段と、出力
音声を合成する出力音声合成手段とを備えた音声符号化
・復号化装置であり、有声と判定された帯域を正弦波と
その残差でモデル化し符号化・復号化することができ、
復号化装置の出力音声品質を高めるという作用を有す
る。
は、符号化装置が、入力音声信号をフレームごとに切り
出すバッファと、ピッチ周波数を推定するピッチ周波数
推定手段と、推定されたピッチ周波数を符号化するピッ
チ周波数符号化手段と、音声信号のスペクトルを求める
スペクトル算出手段と、高調波の振幅と高調波の有声無
声判定を求める高調波振幅推定手段と、高調波振幅を符
号化する高調波振幅符号化手段と、有声無声判定を符号
化する有声無声判定符号化手段と、高調波による合成ス
ペクトルとスペクトル包絡を求める高調波スペクトル合
成手段と、入力音声と高調波合成音声のスペクトルの残
差を求めるスペクトル残差算出手段と、スペクトル残差
を平滑化して符号化するスペクトル残差符号化手段と、
各符号をまとめて多重化するマルチプレクサとを備え、
復号化装置が、多重化された符号を各符号に分解するデ
マルチプレクサと、ピッチ周波数符号を復号化するピッ
チ周波数復号化手段と、高調波振幅符号を復号化する高
調波振幅復号化手段と、有声無声判定符号を復号化する
有声無声復号化手段と、高調波スペクトルを合成しスペ
クトル包絡を求める高調波スペクトル合成手段と、スペ
クトル残差符号を復号化しスペクトル包絡を用いてスペ
クトル残差を求めるスペクトル残差復号化手段と、出力
音声を合成する出力音声合成手段とを備えた音声符号化
・復号化装置であり、有声と判定された帯域を正弦波と
その残差でモデル化し符号化・復号化することができ、
復号化装置の出力音声品質を高めるという作用を有す
る。
【0019】本発明の請求項2に記載の発明は、符号化
装置が、入力音声信号をフレームごとに切り出すバッフ
ァと、ピッチ周波数を推定するピッチ周波数推定手段
と、推定されたピッチ周波数を符号化するピッチ周波数
符号化手段と、音声信号のスペクトルを求めるスペクト
ル算出手段と、高調波の振幅と高調波の有声無声判定を
求める高調波振幅推定手段と、高調波振幅を符号化する
高調波振幅符号化手段と、有声無声判定を符号化する有
声無声判定符号化手段と、高調波による合成スペクトル
とスペクトル包絡を求める高調波スペクトル合成手段
と、入力音声と高調波合成音声のスペクトルの残差を求
めるスペクトル残差算出手段と、スペクトル残差を時間
信号に変換する時間波形算出手段と、残差信号を平滑化
して符号化する残差符号化手段と、各符号をまとめて多
重化するマルチプレクサとを備え、復号化装置が、多重
化された符号を各符号に分解するデマルチプレクサと、
ピッチ周波数符号を復号化するピッチ周波数復号化手段
と、高調波振幅符号を復号化する高調波振幅復号化手段
と、有声無声判定符号を復号化する有声無声復号化手段
と、高調波スペクトルを合成しスペクトル包絡を求める
高調波スペクトル合成手段と、残差符号を復号化しスペ
クトル包絡を用いて残差信号を求める残差復号化手段
と、出力音声を合成する出力音声合成手段とを備えた音
声符号化・復号化装置であり、周波数領域で符号化する
場合と比較して、残差信号のパワーの変化などをより効
率よく符号化でき、特に音の立ち上がり部分などの過渡
部で復号化装置の出力音声品質を高めるという作用を有
する。
装置が、入力音声信号をフレームごとに切り出すバッフ
ァと、ピッチ周波数を推定するピッチ周波数推定手段
と、推定されたピッチ周波数を符号化するピッチ周波数
符号化手段と、音声信号のスペクトルを求めるスペクト
ル算出手段と、高調波の振幅と高調波の有声無声判定を
求める高調波振幅推定手段と、高調波振幅を符号化する
高調波振幅符号化手段と、有声無声判定を符号化する有
声無声判定符号化手段と、高調波による合成スペクトル
とスペクトル包絡を求める高調波スペクトル合成手段
と、入力音声と高調波合成音声のスペクトルの残差を求
めるスペクトル残差算出手段と、スペクトル残差を時間
信号に変換する時間波形算出手段と、残差信号を平滑化
して符号化する残差符号化手段と、各符号をまとめて多
重化するマルチプレクサとを備え、復号化装置が、多重
化された符号を各符号に分解するデマルチプレクサと、
ピッチ周波数符号を復号化するピッチ周波数復号化手段
と、高調波振幅符号を復号化する高調波振幅復号化手段
と、有声無声判定符号を復号化する有声無声復号化手段
と、高調波スペクトルを合成しスペクトル包絡を求める
高調波スペクトル合成手段と、残差符号を復号化しスペ
クトル包絡を用いて残差信号を求める残差復号化手段
と、出力音声を合成する出力音声合成手段とを備えた音
声符号化・復号化装置であり、周波数領域で符号化する
場合と比較して、残差信号のパワーの変化などをより効
率よく符号化でき、特に音の立ち上がり部分などの過渡
部で復号化装置の出力音声品質を高めるという作用を有
する。
【0020】本発明の請求項3に記載の発明は、符号化
装置が、入力音声信号をフレームごとに切り出すバッフ
ァと、ピッチ周波数を推定するピッチ周波数推定手段
と、推定されたピッチ周波数を符号化するピッチ周波数
符号化手段と、音声信号のスペクトルを求めるスペクト
ル算出手段と、高調波の振幅と高調波の有声無声判定を
求める高調波振幅推定手段と、高調波振幅を符号化する
高調波振幅符号化手段と、高調波による合成スペクトル
とスペクトル包絡を求める高調波スペクトル合成手段
と、入力音声と高調波合成音声のスペクトルの残差を求
めるスペクトル残差算出手段と、各高調波ごとの高調波
スペクトルとスペクトル残差のゲインを出力するゲイン
算出手段と、ゲインを符号化するゲイン符号化手段と、
残差スペクトルを平滑化し正規化して符号化するスペク
トル残差符号化手段と、各符号をまとめて多重化するマ
ルチプレクサとを備え、復号化装置が、多重化された符
号を各符号に分解するデマルチプレクサと、ピッチ周波
数符号を復号化するピッチ周波数復号化手段と、高調波
振幅符号を復号化する高調波振幅復号化手段と、ゲイン
を復号化するゲイン復号化手段と、高調波スペクトルを
合成しスペクトル包絡を求める高調波スペクトル合成手
段と、スペクトル残差符号を復号化しスペクトル包絡と
ゲインを用いてスペクトル残差を求めるスペクトル残差
復号化手段と、出力音声を合成する出力音声合成手段と
を備えた音声符号化・復号化装置であり、従来有声無声
判定情報として求められた各高調波の近傍における正弦
波成分と残差成分の比を一般化したゲイン情報として符
号化することで、より自由度の高いモデルで符号化で
き、復号化装置の出力音声品質を高めるという作用を有
する。
装置が、入力音声信号をフレームごとに切り出すバッフ
ァと、ピッチ周波数を推定するピッチ周波数推定手段
と、推定されたピッチ周波数を符号化するピッチ周波数
符号化手段と、音声信号のスペクトルを求めるスペクト
ル算出手段と、高調波の振幅と高調波の有声無声判定を
求める高調波振幅推定手段と、高調波振幅を符号化する
高調波振幅符号化手段と、高調波による合成スペクトル
とスペクトル包絡を求める高調波スペクトル合成手段
と、入力音声と高調波合成音声のスペクトルの残差を求
めるスペクトル残差算出手段と、各高調波ごとの高調波
スペクトルとスペクトル残差のゲインを出力するゲイン
算出手段と、ゲインを符号化するゲイン符号化手段と、
残差スペクトルを平滑化し正規化して符号化するスペク
トル残差符号化手段と、各符号をまとめて多重化するマ
ルチプレクサとを備え、復号化装置が、多重化された符
号を各符号に分解するデマルチプレクサと、ピッチ周波
数符号を復号化するピッチ周波数復号化手段と、高調波
振幅符号を復号化する高調波振幅復号化手段と、ゲイン
を復号化するゲイン復号化手段と、高調波スペクトルを
合成しスペクトル包絡を求める高調波スペクトル合成手
段と、スペクトル残差符号を復号化しスペクトル包絡と
ゲインを用いてスペクトル残差を求めるスペクトル残差
復号化手段と、出力音声を合成する出力音声合成手段と
を備えた音声符号化・復号化装置であり、従来有声無声
判定情報として求められた各高調波の近傍における正弦
波成分と残差成分の比を一般化したゲイン情報として符
号化することで、より自由度の高いモデルで符号化で
き、復号化装置の出力音声品質を高めるという作用を有
する。
【0021】本発明の請求項4に記載の発明は、符号化
装置が、入力音声信号をフレームごとに切り出すバッフ
ァと、ピッチ周波数を推定するピッチ周波数推定手段
と、推定されたピッチ周波数を符号化するピッチ周波数
符号化手段と、音声信号のスペクトルを求めるスペクト
ル算出手段と、高調波の振幅と高調波の有声無声判定を
求める高調波振幅推定手段と、高調波振幅を符号化する
高調波振幅符号化手段と、高調波による合成スペクトル
とスペクトル包絡を求める高調波スペクトル合成手段
と、入力音声と高調波合成音声のスペクトルの残差を求
めるスペクトル残差算出手段と、スペクトル残差を時間
信号に変換する時間波形算出手段と、フレームをM個に
分割したサブフレームごとに高調波スペクトルと残差信
号のゲインを求めるゲイン算出手段と、ゲインを符号化
するゲイン符号化手段と、残差信号を平滑化し正規化し
て符号化する残差符号化手段と、各符号をまとめて多重
化するマルチプレクサとを備え、復号化装置が、多重化
された符号を各符号に分解するデマルチプレクサと、ピ
ッチ周波数を復号化するピッチ周波数復号化手段と、高
調波振幅符号を復号化する高調波振幅復号化手段と、ゲ
イン符号を復号化するゲイン復号化手段と、高調波スペ
クトルを合成しスペクトル包絡を求める高調波スペクト
ル合成手段と、残差符号を復号化しスペクトル包絡とゲ
インを用いて残差信号を求める残差復号化手段と、出力
音声を合成する出力音声合成手段とを備えた音声符号化
・復号化装置であり、高調波によってモデル化できない
スペクトル残差を時間領域で符号化することで、残差信
号のパワーの変化をより効率よく符号化できると同時
に、フレーム内での高調波成分と残差信号成分の割合を
細かく制御でき、特に音の立ち上がり部分などで、復号
化装置の出力音声品質を高めるという作用を有する。
装置が、入力音声信号をフレームごとに切り出すバッフ
ァと、ピッチ周波数を推定するピッチ周波数推定手段
と、推定されたピッチ周波数を符号化するピッチ周波数
符号化手段と、音声信号のスペクトルを求めるスペクト
ル算出手段と、高調波の振幅と高調波の有声無声判定を
求める高調波振幅推定手段と、高調波振幅を符号化する
高調波振幅符号化手段と、高調波による合成スペクトル
とスペクトル包絡を求める高調波スペクトル合成手段
と、入力音声と高調波合成音声のスペクトルの残差を求
めるスペクトル残差算出手段と、スペクトル残差を時間
信号に変換する時間波形算出手段と、フレームをM個に
分割したサブフレームごとに高調波スペクトルと残差信
号のゲインを求めるゲイン算出手段と、ゲインを符号化
するゲイン符号化手段と、残差信号を平滑化し正規化し
て符号化する残差符号化手段と、各符号をまとめて多重
化するマルチプレクサとを備え、復号化装置が、多重化
された符号を各符号に分解するデマルチプレクサと、ピ
ッチ周波数を復号化するピッチ周波数復号化手段と、高
調波振幅符号を復号化する高調波振幅復号化手段と、ゲ
イン符号を復号化するゲイン復号化手段と、高調波スペ
クトルを合成しスペクトル包絡を求める高調波スペクト
ル合成手段と、残差符号を復号化しスペクトル包絡とゲ
インを用いて残差信号を求める残差復号化手段と、出力
音声を合成する出力音声合成手段とを備えた音声符号化
・復号化装置であり、高調波によってモデル化できない
スペクトル残差を時間領域で符号化することで、残差信
号のパワーの変化をより効率よく符号化できると同時
に、フレーム内での高調波成分と残差信号成分の割合を
細かく制御でき、特に音の立ち上がり部分などで、復号
化装置の出力音声品質を高めるという作用を有する。
【0022】本発明の請求項5に記載の発明は、符号化
装置が、入力音声信号をフレームごとに切り出すバッフ
ァと、ピッチ周波数を推定するピッチ周波数推定手段
と、推定されたピッチ周波数を符号化するピッチ周波数
符号化手段と、音声信号のスペクトルを求めるスペクト
ル算出手段と、高調波の振幅と高調波の有声無声判定を
求める高調波振幅推定手段と、高調波による合成スペク
トルとスペクトル包絡を求める高調波スペクトル合成手
段と、入力音声と高調波合成音声のスペクトルの残差を
求めるスペクトル残差算出手段と、スペクトル包絡を符
号化するスペクトル包絡符号化手段と、スペクトル包絡
と残差スペクトルより各高調波のゲインを求めそれをも
とに高調波補正振幅とスペクトル残差を符号化するため
のビットを割り当てるゲイン算出手段と、ゲインを符号
化するゲイン符号化手段と、高調波振幅とスペクトル包
絡から高調波補正振幅を求め、求められたビット数で符
号化する高調波補正振幅符号化手段と、スペクトル残差
を平滑化し正規化して求められたビット数で符号化する
残差スペクトル符号化手段と、各符号をまとめて多重化
するマルチプレクサとを備え、復号化装置が、多重化さ
れた符号を各符号に分解するデマルチプレクサと、ピッ
チ周波数符号を復号化するピッチ周波数復号化手段と、
スペクトル包絡符号を復号化するスペクトル包絡復号化
手段と、ゲイン符号を復号化しスペクトル包絡を用いて
高調波補正振幅およびスペクトル残差の割り当てビット
数を求めるゲイン復号化手段と、割り当てられたビット
数で高調波補正振幅符号を復号化しスペクトル包絡を用
いて高調波振幅を求める高調波振幅復号化手段と、高調
波スペクトルを合成する高調波スペクトル合成手段と、
割り当てられたビット数でスペクトル残差符号を復号化
しスペクトル包絡とゲインを用いてスペクトル残差を求
めるスペクトル残差復号化手段と、出力音声を合成する
出力音声合成手段とを備えた音声符号化・復号化装置で
あり、従来有声無声判定情報として求められた各高調波
の近傍における正弦波成分と残差成分の比を一般化した
ゲイン情報として符号化することで、より自由度の高い
モデルで符号化できるとともに、そのゲイン情報をもと
に高調波振幅とスペクトル残差のビット割り当てを行う
ことにより、ビット割り当て情報を伝送することなく、
適当なビット割り当てを行うことができ、復号化装置の
出力音声品質を高めるという作用を有する。
装置が、入力音声信号をフレームごとに切り出すバッフ
ァと、ピッチ周波数を推定するピッチ周波数推定手段
と、推定されたピッチ周波数を符号化するピッチ周波数
符号化手段と、音声信号のスペクトルを求めるスペクト
ル算出手段と、高調波の振幅と高調波の有声無声判定を
求める高調波振幅推定手段と、高調波による合成スペク
トルとスペクトル包絡を求める高調波スペクトル合成手
段と、入力音声と高調波合成音声のスペクトルの残差を
求めるスペクトル残差算出手段と、スペクトル包絡を符
号化するスペクトル包絡符号化手段と、スペクトル包絡
と残差スペクトルより各高調波のゲインを求めそれをも
とに高調波補正振幅とスペクトル残差を符号化するため
のビットを割り当てるゲイン算出手段と、ゲインを符号
化するゲイン符号化手段と、高調波振幅とスペクトル包
絡から高調波補正振幅を求め、求められたビット数で符
号化する高調波補正振幅符号化手段と、スペクトル残差
を平滑化し正規化して求められたビット数で符号化する
残差スペクトル符号化手段と、各符号をまとめて多重化
するマルチプレクサとを備え、復号化装置が、多重化さ
れた符号を各符号に分解するデマルチプレクサと、ピッ
チ周波数符号を復号化するピッチ周波数復号化手段と、
スペクトル包絡符号を復号化するスペクトル包絡復号化
手段と、ゲイン符号を復号化しスペクトル包絡を用いて
高調波補正振幅およびスペクトル残差の割り当てビット
数を求めるゲイン復号化手段と、割り当てられたビット
数で高調波補正振幅符号を復号化しスペクトル包絡を用
いて高調波振幅を求める高調波振幅復号化手段と、高調
波スペクトルを合成する高調波スペクトル合成手段と、
割り当てられたビット数でスペクトル残差符号を復号化
しスペクトル包絡とゲインを用いてスペクトル残差を求
めるスペクトル残差復号化手段と、出力音声を合成する
出力音声合成手段とを備えた音声符号化・復号化装置で
あり、従来有声無声判定情報として求められた各高調波
の近傍における正弦波成分と残差成分の比を一般化した
ゲイン情報として符号化することで、より自由度の高い
モデルで符号化できるとともに、そのゲイン情報をもと
に高調波振幅とスペクトル残差のビット割り当てを行う
ことにより、ビット割り当て情報を伝送することなく、
適当なビット割り当てを行うことができ、復号化装置の
出力音声品質を高めるという作用を有する。
【0023】本発明の請求項6に記載の発明は、符号化
装置が、入力音声信号をフレームごとに切り出すバッフ
ァと、ピッチ周波数を推定するピッチ周波数推定手段
と、推定されたピッチ周波数を符号化するピッチ周波数
符号化手段と、音声信号のスペクトルを求めるスペクト
ル算出手段と、高調波の振幅と高調波の有声無声判定を
求める高調波振幅推定手段と、高調波による合成スペク
トルとスペクトル包絡を求める高調波スペクトル合成手
段と、入力音声と高調波合成音声のスペクトルの残差を
求めるスペクトル残差算出手段と、スペクトル残差を時
間信号に変換する時間波形算出手段と、スペクトル包絡
を符号化するスペクトル包絡符号化手段と、スペクトル
包絡とフレームをM個に分割したサブフレームごとの残
差信号とのゲインを求め、それをもとに高調波補正振幅
と各サブフレームの残差信号に割り当てるビット数を求
めるゲイン算出手段と、ゲインを符号化するゲイン符号
化手段と、高調波振幅とスペクトル包絡から高調波補正
振幅を求め、求められたビット数で符号化する高調波補
正振幅符号化手段と、残差信号を平滑化し正規化して求
められたビット数で符号化する残差符号化手段と、各符
号をまとめて多重化するマルチプレクサとを備え、復号
化装置が、多重化された符号を各符号に分解するデマル
チプレクサと、ピッチ周波数符号を復号化するピッチ周
波数復号化手段と、スペクトル包絡符号を復号化するス
ペクトル包絡復号化手段と、ゲイン符号を復号化しスペ
クトル包絡を用いて高調波補正振幅およびスペクトル残
差の割り当てビット数を求めるゲイン復号化手段と、割
り当てられたビット数で高調波補正振幅符号を復号化し
スペクトル包絡を用いて高調波振幅を求める高調波振幅
復号化手段と、高調波スペクトルを合成する高調波スペ
クトル合成手段と、割り当てられたビット数で残差符号
を復号化しスペクトル包絡とゲインを用いて残差信号を
求める残差復号化手段と、出力音声を合成する出力音声
合成手段とを備えた音声符号化・復号化装置であり、残
差信号のパワーの変化をより効率よく符号化でき、フレ
ーム内での高調波成分と残差信号成分の割合を細かく制
御することにより、音の立ち上がり部分などの音質を向
上させることができ、同時にそのゲイン情報をもとに高
調波振幅とスペクトル残差のビット割り当てを行うこと
により、ビット割り当て情報を伝送することなく、適当
なビット割り当てを行うことができ、復号化装置の出力
音声品質を高めるという作用を有する。
装置が、入力音声信号をフレームごとに切り出すバッフ
ァと、ピッチ周波数を推定するピッチ周波数推定手段
と、推定されたピッチ周波数を符号化するピッチ周波数
符号化手段と、音声信号のスペクトルを求めるスペクト
ル算出手段と、高調波の振幅と高調波の有声無声判定を
求める高調波振幅推定手段と、高調波による合成スペク
トルとスペクトル包絡を求める高調波スペクトル合成手
段と、入力音声と高調波合成音声のスペクトルの残差を
求めるスペクトル残差算出手段と、スペクトル残差を時
間信号に変換する時間波形算出手段と、スペクトル包絡
を符号化するスペクトル包絡符号化手段と、スペクトル
包絡とフレームをM個に分割したサブフレームごとの残
差信号とのゲインを求め、それをもとに高調波補正振幅
と各サブフレームの残差信号に割り当てるビット数を求
めるゲイン算出手段と、ゲインを符号化するゲイン符号
化手段と、高調波振幅とスペクトル包絡から高調波補正
振幅を求め、求められたビット数で符号化する高調波補
正振幅符号化手段と、残差信号を平滑化し正規化して求
められたビット数で符号化する残差符号化手段と、各符
号をまとめて多重化するマルチプレクサとを備え、復号
化装置が、多重化された符号を各符号に分解するデマル
チプレクサと、ピッチ周波数符号を復号化するピッチ周
波数復号化手段と、スペクトル包絡符号を復号化するス
ペクトル包絡復号化手段と、ゲイン符号を復号化しスペ
クトル包絡を用いて高調波補正振幅およびスペクトル残
差の割り当てビット数を求めるゲイン復号化手段と、割
り当てられたビット数で高調波補正振幅符号を復号化し
スペクトル包絡を用いて高調波振幅を求める高調波振幅
復号化手段と、高調波スペクトルを合成する高調波スペ
クトル合成手段と、割り当てられたビット数で残差符号
を復号化しスペクトル包絡とゲインを用いて残差信号を
求める残差復号化手段と、出力音声を合成する出力音声
合成手段とを備えた音声符号化・復号化装置であり、残
差信号のパワーの変化をより効率よく符号化でき、フレ
ーム内での高調波成分と残差信号成分の割合を細かく制
御することにより、音の立ち上がり部分などの音質を向
上させることができ、同時にそのゲイン情報をもとに高
調波振幅とスペクトル残差のビット割り当てを行うこと
により、ビット割り当て情報を伝送することなく、適当
なビット割り当てを行うことができ、復号化装置の出力
音声品質を高めるという作用を有する。
【0024】以下、本発明の実施の形態について、図1
から図8を用いて説明する。(実施の形態1)図1は本
発明の請求項1に対応する第1の実施の形態における音
声符号化・復号化装置の構成を示す。図1において、1
00は符号化装置、120は復号化装置である。符号化
装置100において、101は入力音声信号を入力と
し、フレーム音声信号を出力とするバッファである。1
02はフレーム音声信号を入力とし、ピッチ周波数を出
力とするピッチ周波数推定手段である。103はピッチ
周波数を入力とし、ピッチ周波数符号を出力とするピッ
チ周波数符号化手段である。104はフレーム音声信号
を入力とし、音声のスペクトルを出力とするスペクトル
算出手段である。105はピッチ周波数と音声のスペク
トルを入力とし、高調波の振幅と各高調波の有声無声判
定を出力とする高調波振幅推定手段である。106は高
調波振幅を入力とし、高調波振幅符号を出力とする高調
波振幅符号化手段である。107は有声無声判定を入力
とし、有声無声判定符号を出力とする有声無声判定符号
化手段である。108はピッチ周波数と高調波振幅と有
声無声判定を入力とし、高調波スペクトルおよびスペク
トル包絡を出力とする高調波スペクトル合成手段であ
る。109は音声のスペクトルと高調波スペクトルを入
力とし、スペクトル残差を出力とするスペクトル残差算
出手段である。110はスペクトル残差とスペクトル包
絡を入力とし、スペクトル残差符号を出力とするスペク
トル残差符号化手段である。111はピッチ周波数符号
と高調波振幅符号と有声無声判定符号とスペクトル残差
符号を入力とし、多重化符号を出力とするマルチプレク
サである。
から図8を用いて説明する。(実施の形態1)図1は本
発明の請求項1に対応する第1の実施の形態における音
声符号化・復号化装置の構成を示す。図1において、1
00は符号化装置、120は復号化装置である。符号化
装置100において、101は入力音声信号を入力と
し、フレーム音声信号を出力とするバッファである。1
02はフレーム音声信号を入力とし、ピッチ周波数を出
力とするピッチ周波数推定手段である。103はピッチ
周波数を入力とし、ピッチ周波数符号を出力とするピッ
チ周波数符号化手段である。104はフレーム音声信号
を入力とし、音声のスペクトルを出力とするスペクトル
算出手段である。105はピッチ周波数と音声のスペク
トルを入力とし、高調波の振幅と各高調波の有声無声判
定を出力とする高調波振幅推定手段である。106は高
調波振幅を入力とし、高調波振幅符号を出力とする高調
波振幅符号化手段である。107は有声無声判定を入力
とし、有声無声判定符号を出力とする有声無声判定符号
化手段である。108はピッチ周波数と高調波振幅と有
声無声判定を入力とし、高調波スペクトルおよびスペク
トル包絡を出力とする高調波スペクトル合成手段であ
る。109は音声のスペクトルと高調波スペクトルを入
力とし、スペクトル残差を出力とするスペクトル残差算
出手段である。110はスペクトル残差とスペクトル包
絡を入力とし、スペクトル残差符号を出力とするスペク
トル残差符号化手段である。111はピッチ周波数符号
と高調波振幅符号と有声無声判定符号とスペクトル残差
符号を入力とし、多重化符号を出力とするマルチプレク
サである。
【0025】復号化装置120において、121は多重
化符号を入力とし、ピッチ周波数符号と高調波振幅符号
と有声無声判定符号とスペクトル残差符号を出力とする
デマルチプレクサである。122はピッチ周波数符号を
入力とし、ピッチ周波数を出力とするピッチ周波数復号
化手段である。123は、高調波振幅符号を入力とし、
高調波振幅を出力とする高調波振幅復号化手段である。
124は有声無声判定符号を入力とし、有声無声判定を
出力とする有声無声判定復号化手段である。126はピ
ッチ周波数と高調波振幅と有声無声判定を入力とし、高
調波スペクトルとスペクトル包絡を出力する高調波スペ
クトル合成手段である。125はスペクトル残差符号と
スペクトル包絡を入力とし、スペクトル残差を出力とす
るスペクトル残差復号化手段である。128は高調波ス
ペクトルとスペクトル残差を入力とし、合成音声を出力
とする出力音声合成手段である。
化符号を入力とし、ピッチ周波数符号と高調波振幅符号
と有声無声判定符号とスペクトル残差符号を出力とする
デマルチプレクサである。122はピッチ周波数符号を
入力とし、ピッチ周波数を出力とするピッチ周波数復号
化手段である。123は、高調波振幅符号を入力とし、
高調波振幅を出力とする高調波振幅復号化手段である。
124は有声無声判定符号を入力とし、有声無声判定を
出力とする有声無声判定復号化手段である。126はピ
ッチ周波数と高調波振幅と有声無声判定を入力とし、高
調波スペクトルとスペクトル包絡を出力する高調波スペ
クトル合成手段である。125はスペクトル残差符号と
スペクトル包絡を入力とし、スペクトル残差を出力とす
るスペクトル残差復号化手段である。128は高調波ス
ペクトルとスペクトル残差を入力とし、合成音声を出力
とする出力音声合成手段である。
【0026】以上のように構成された音声符号化・復号
化装置について、図1、図2、図3を用いてその動作を
説明する。はじめに符号化装置100の動作を説明す
る。まず、バッファ101では、入力音声信号を窓関数
により切り出してフレーム音声信号として出力する。ピ
ッチ周波数推定手段102では、フレーム音声信号を分
析し、ピッチ周波数を推定する。ピッチ周波数の推定方
法としては、自己相関やスペクトルなどを用いる手法が
知られている。推定されたピッチ周波数は、ピッチ周波
数符号化手段103によって符号化されるとともに、高
調波振幅推定手段105および高調波スペクトル合成手
段108に入力される。
化装置について、図1、図2、図3を用いてその動作を
説明する。はじめに符号化装置100の動作を説明す
る。まず、バッファ101では、入力音声信号を窓関数
により切り出してフレーム音声信号として出力する。ピ
ッチ周波数推定手段102では、フレーム音声信号を分
析し、ピッチ周波数を推定する。ピッチ周波数の推定方
法としては、自己相関やスペクトルなどを用いる手法が
知られている。推定されたピッチ周波数は、ピッチ周波
数符号化手段103によって符号化されるとともに、高
調波振幅推定手段105および高調波スペクトル合成手
段108に入力される。
【0027】スペクトル算出手段104は、フレーム音
声信号に対し、離散フーリエ変換などの処理を行い、フ
レーム音声信号のスペクトルS(w) を求める。高調波振
幅推定手段105は、(1)式に示すように、入力され
た音声スペクトルS(w) と、推定されたピッチ周波数と
高調波振幅から合成されるスペクトルS'(w)の誤差E
(w) の総和eが最小になるように、高調波の振幅を推定
する。次に、(2)式に示すように、各高調波の近傍に
おいて、この誤差を高調波振幅で正規化した誤差が、あ
るしきい値Thより小さい場合は有声、大きい場合は無
声と判定する。求められた高調波の振幅は、高調波振幅
符号化手段106によって符号化され、有声無声判定
は、有声無声判定符号化手段107によって符号化され
る。
声信号に対し、離散フーリエ変換などの処理を行い、フ
レーム音声信号のスペクトルS(w) を求める。高調波振
幅推定手段105は、(1)式に示すように、入力され
た音声スペクトルS(w) と、推定されたピッチ周波数と
高調波振幅から合成されるスペクトルS'(w)の誤差E
(w) の総和eが最小になるように、高調波の振幅を推定
する。次に、(2)式に示すように、各高調波の近傍に
おいて、この誤差を高調波振幅で正規化した誤差が、あ
るしきい値Thより小さい場合は有声、大きい場合は無
声と判定する。求められた高調波の振幅は、高調波振幅
符号化手段106によって符号化され、有声無声判定
は、有声無声判定符号化手段107によって符号化され
る。
【0028】高調波スペクトル合成手段108では、図
2に示すように、まず、ピッチ周波数と高調波振幅か
ら、高調波振幅推定手段105で求めた評価基準e最小
時の合成スペクトルS'(w)を求める。次に、そのスペク
トルから微細構造を取り除き、スペクトル包絡A(w) を
求める。このスペクトル包絡は、スペクトルの極大点を
線形補間する、あるいは帯域ごとにスペクトルの平均を
とるなどの手法により求められる。また、同時に、入力
された有声無声判定から、無声と判定された高調波の近
傍のスペクトルを0とした高調波スペクトルH(w) を求
める。このスペクトルは、音声から有声音のみを取りだ
したスペクトルである。求められたスペクトル包絡A
(w) と、高調波スペクトルH(w) を出力する。
2に示すように、まず、ピッチ周波数と高調波振幅か
ら、高調波振幅推定手段105で求めた評価基準e最小
時の合成スペクトルS'(w)を求める。次に、そのスペク
トルから微細構造を取り除き、スペクトル包絡A(w) を
求める。このスペクトル包絡は、スペクトルの極大点を
線形補間する、あるいは帯域ごとにスペクトルの平均を
とるなどの手法により求められる。また、同時に、入力
された有声無声判定から、無声と判定された高調波の近
傍のスペクトルを0とした高調波スペクトルH(w) を求
める。このスペクトルは、音声から有声音のみを取りだ
したスペクトルである。求められたスペクトル包絡A
(w) と、高調波スペクトルH(w) を出力する。
【0029】スペクトル残差算出手段109では、音声
スペクトルS(w)から高調波合成スペクトルH(w) を引
くことによりスペクトル残差R(w) を求める。高調波ス
ペクトル合成手段108の説明でも示したように、この
スペクトル残差は、有声と判定された高調波の近傍で
は、高調波振幅推定手段105で評価基準を求める際に
得られる誤差スペクトルE(w) 、無声と判定された高調
波の近傍では、入力音声スペクトルS(w) とそれぞれ同
一のものである。
スペクトルS(w)から高調波合成スペクトルH(w) を引
くことによりスペクトル残差R(w) を求める。高調波ス
ペクトル合成手段108の説明でも示したように、この
スペクトル残差は、有声と判定された高調波の近傍で
は、高調波振幅推定手段105で評価基準を求める際に
得られる誤差スペクトルE(w) 、無声と判定された高調
波の近傍では、入力音声スペクトルS(w) とそれぞれ同
一のものである。
【0030】図3は音声スペクトルS(w) 、高調波スペ
クトルS'(w)、スペクトル残差R(w)を示す。図10に
示した従来の音声符号化・復号化装置で用いられるモデ
ルと比較して、本発明におけるモデルは、有声と判定さ
れた高調波の近傍における誤差成分も考慮している。
クトルS'(w)、スペクトル残差R(w)を示す。図10に
示した従来の音声符号化・復号化装置で用いられるモデ
ルと比較して、本発明におけるモデルは、有声と判定さ
れた高調波の近傍における誤差成分も考慮している。
【0031】スペクトル残差符号化手段110では、ま
ず、スペクトル包絡を用いて入力されたスペクトル残差
を平滑化する。スペクトル残差R(w) の大きさは、スペ
クトル包絡A(w) にほぼ比例するため、入力されたスペ
クトル包絡A(w) を用いて、(3)式のようにスペクト
ル残差R(w) を平滑化する。この処理により、残差スペ
クトルはほぼ白色化される。
ず、スペクトル包絡を用いて入力されたスペクトル残差
を平滑化する。スペクトル残差R(w) の大きさは、スペ
クトル包絡A(w) にほぼ比例するため、入力されたスペ
クトル包絡A(w) を用いて、(3)式のようにスペクト
ル残差R(w) を平滑化する。この処理により、残差スペ
クトルはほぼ白色化される。
【0032】
【数3】 ・・・(3) 次に、白色化された雑音スペクトルを符号化する。この
符号化法としては、ベクトル量子化などの方法が考えら
れる。
符号化法としては、ベクトル量子化などの方法が考えら
れる。
【0033】マルチプレクサ111は、入力されたピッ
チ周波数符号と高調波振幅符号と有声無声判定符号とス
ペクトル残差符号をまとめ、多重化符号として復号化装
置120へ出力する。
チ周波数符号と高調波振幅符号と有声無声判定符号とス
ペクトル残差符号をまとめ、多重化符号として復号化装
置120へ出力する。
【0034】次に復号化装置120の動作を説明する。
デマルチプレクサ121は、符号化装置100から送信
された多重化符号を、ピッチ周波数符号と高調波振幅符
号と残差スペクトル符号と有声無声符号に分解する。ピ
ッチ周波数復号化手段122はピッチ周波数符号を、高
調波振幅復号化手段123は高調波振幅符号を、有声無
声判定復号化手段124は有声無声判定符号を、それぞ
れ復号化する。
デマルチプレクサ121は、符号化装置100から送信
された多重化符号を、ピッチ周波数符号と高調波振幅符
号と残差スペクトル符号と有声無声符号に分解する。ピ
ッチ周波数復号化手段122はピッチ周波数符号を、高
調波振幅復号化手段123は高調波振幅符号を、有声無
声判定復号化手段124は有声無声判定符号を、それぞ
れ復号化する。
【0035】高調波スペクトル合成手段125では、符
号化装置100における高調波スペクトル合成手段10
8と全く同様に、入力されたピッチ周波数と高調波振幅
と有声無声判定から、高調波スペクトルとスペクトル包
絡を求めて出力する。スペクトル残差復号化手段126
は、入力されたスペクトル残差符号を復号化し、それに
スペクトル包絡を乗じてスペクトル残差を求め、出力す
る。出力音声合成手段127では、高調波スペクトルと
スペクトル残差を加え、出力音声を合成し出力する。
号化装置100における高調波スペクトル合成手段10
8と全く同様に、入力されたピッチ周波数と高調波振幅
と有声無声判定から、高調波スペクトルとスペクトル包
絡を求めて出力する。スペクトル残差復号化手段126
は、入力されたスペクトル残差符号を復号化し、それに
スペクトル包絡を乗じてスペクトル残差を求め、出力す
る。出力音声合成手段127では、高調波スペクトルと
スペクトル残差を加え、出力音声を合成し出力する。
【0036】以上のように、本発明の実施の形態1によ
れば、符号化装置に、高調波振幅とピッチ周波数と有声
無声判定から、スペクトル包絡と高調波スペクトルを算
出する高調波スペクトル合成手段と、音声スペクトルと
高調波スペクトルからスペクトル残差を求めるスペクト
ル残差算出手段と、スペクトル残差をスペクトル包絡に
よって平滑化して符号化するスペクトル残差符号化手段
を設け、復号化装置に、高調波振幅とピッチ周波数と有
声無声判定から、スペクトル包絡と高調波合成スペクト
ルを算出する高調波スペクトル合成手段と、スペクトル
残差符号とスペクトル包絡からスペクトル残差を出力す
るスペクトル残差復号化手段を設けることにより、有声
と判定された帯域を正弦波とその残差でモデル化し符号
化・復号化することで、より自然な異音の少ない合成音
声を得ることができる。
れば、符号化装置に、高調波振幅とピッチ周波数と有声
無声判定から、スペクトル包絡と高調波スペクトルを算
出する高調波スペクトル合成手段と、音声スペクトルと
高調波スペクトルからスペクトル残差を求めるスペクト
ル残差算出手段と、スペクトル残差をスペクトル包絡に
よって平滑化して符号化するスペクトル残差符号化手段
を設け、復号化装置に、高調波振幅とピッチ周波数と有
声無声判定から、スペクトル包絡と高調波合成スペクト
ルを算出する高調波スペクトル合成手段と、スペクトル
残差符号とスペクトル包絡からスペクトル残差を出力す
るスペクトル残差復号化手段を設けることにより、有声
と判定された帯域を正弦波とその残差でモデル化し符号
化・復号化することで、より自然な異音の少ない合成音
声を得ることができる。
【0037】なお、以上の説明では、符号化装置100
に有声無声判定符号化手段107、復号化装置120に
有声無声復号化手段124を設けた構成で説明したが、
それらを省いても同様に実施可能である。その場合、無
声と判定された高調波も正弦波で表現され、本来はスペ
クトル残差の振幅が正弦波よりも大きいため、正弦波は
マスクされるが、量子化誤差によりマスクされず異音と
して知覚される場合もある。しかし、有声無声判定を符
号化・復号化しないため、伝送しなければならないビッ
ト数は減少する。
に有声無声判定符号化手段107、復号化装置120に
有声無声復号化手段124を設けた構成で説明したが、
それらを省いても同様に実施可能である。その場合、無
声と判定された高調波も正弦波で表現され、本来はスペ
クトル残差の振幅が正弦波よりも大きいため、正弦波は
マスクされるが、量子化誤差によりマスクされず異音と
して知覚される場合もある。しかし、有声無声判定を符
号化・復号化しないため、伝送しなければならないビッ
ト数は減少する。
【0038】(実施の形態2)図4は本発明の請求項2
に対応する第2の実施の形態における音声符号化・復号
化装置の構成を示す。図4において、130は符号化装
置、140は復号化装置である。図1に示した実施の形
態1における符号化・復号化装置と共通の要素には同一
の番号を付して重複した説明は省略する。符号化装置1
30において、131はスペクトル残差を入力とし、残
差信号を出力する時間波形算出手段である。132は残
差信号とスペクトル包絡を入力とし、残差符号を出力と
する残差符号化手段である。133はピッチ周波数符号
と高調波振幅符号と有声無声判定符号と残差符号を入力
とし、多重化符号を出力とするマルチプレクサである。
また復号化装置140において、141は多重化符号を
入力とし、ピッチ周波数符号と高調波振幅符号と有声無
声判定符号と残差符号を出力とするデマルチプレクサで
ある。142は残差符号とスペクトル包絡を入力とし、
残差信号を出力とする残差復号化手段である。
に対応する第2の実施の形態における音声符号化・復号
化装置の構成を示す。図4において、130は符号化装
置、140は復号化装置である。図1に示した実施の形
態1における符号化・復号化装置と共通の要素には同一
の番号を付して重複した説明は省略する。符号化装置1
30において、131はスペクトル残差を入力とし、残
差信号を出力する時間波形算出手段である。132は残
差信号とスペクトル包絡を入力とし、残差符号を出力と
する残差符号化手段である。133はピッチ周波数符号
と高調波振幅符号と有声無声判定符号と残差符号を入力
とし、多重化符号を出力とするマルチプレクサである。
また復号化装置140において、141は多重化符号を
入力とし、ピッチ周波数符号と高調波振幅符号と有声無
声判定符号と残差符号を出力とするデマルチプレクサで
ある。142は残差符号とスペクトル包絡を入力とし、
残差信号を出力とする残差復号化手段である。
【0039】以上のように構成された音声符号化・復号
化装置について、図4を用いてその動作を説明する。ま
ず符号化装置130において、時間波形算出手段131
では、入力された残差スペクトルを離散逆フーリエ変換
することにより、時間領域の残差信号を求める。残差符
号化手段132では、まず、スペクトル包絡により残差
信号のスペクトルを平滑化する。ここで、残差信号はす
でに時間領域に変換されているが、その信号のスペクト
ルを平滑化しなければならない。その方法としては、ス
ペクトル包絡を時間領域のフィルタで近似し、そのフィ
ルタに残差信号を通過させることにより、スペクトルを
平滑化させる方法がある。平滑化された残差信号は、ベ
クトル量子化などにより量子化され、符号化される。マ
ルチプレクサ133では、入力されたピッチ周波数符号
と高調波振幅符号と有声無声判定符号と残差符号をまと
め、多重化符号として復号化装置140へ出力する。
化装置について、図4を用いてその動作を説明する。ま
ず符号化装置130において、時間波形算出手段131
では、入力された残差スペクトルを離散逆フーリエ変換
することにより、時間領域の残差信号を求める。残差符
号化手段132では、まず、スペクトル包絡により残差
信号のスペクトルを平滑化する。ここで、残差信号はす
でに時間領域に変換されているが、その信号のスペクト
ルを平滑化しなければならない。その方法としては、ス
ペクトル包絡を時間領域のフィルタで近似し、そのフィ
ルタに残差信号を通過させることにより、スペクトルを
平滑化させる方法がある。平滑化された残差信号は、ベ
クトル量子化などにより量子化され、符号化される。マ
ルチプレクサ133では、入力されたピッチ周波数符号
と高調波振幅符号と有声無声判定符号と残差符号をまと
め、多重化符号として復号化装置140へ出力する。
【0040】復号化装置140において、デマルチプレ
クサ141は、符号化装置130から送信された多重化
符号を、ピッチ周波数符号と高調波振幅符号と残差符号
と有声無声符号に分解する。残差復号化手段142で
は、残差符号を復号化し、残差信号を求める。この際、
時間波形として求められている残差信号に、周波数領域
におけるスペクトル包絡を乗じる必要がある。これも符
号化装置130における残差符号化手段132と同様
に、スペクトル包絡を時間領域のフィルタで近似し、そ
のフィルタに残差信号を通すことによって、スペクトル
包絡を乗じた残差信号が求められる。求められた残差信
号は、高調波スペクトルとともに出力音声合成手段12
7に入力され、音声が合成される。
クサ141は、符号化装置130から送信された多重化
符号を、ピッチ周波数符号と高調波振幅符号と残差符号
と有声無声符号に分解する。残差復号化手段142で
は、残差符号を復号化し、残差信号を求める。この際、
時間波形として求められている残差信号に、周波数領域
におけるスペクトル包絡を乗じる必要がある。これも符
号化装置130における残差符号化手段132と同様
に、スペクトル包絡を時間領域のフィルタで近似し、そ
のフィルタに残差信号を通すことによって、スペクトル
包絡を乗じた残差信号が求められる。求められた残差信
号は、高調波スペクトルとともに出力音声合成手段12
7に入力され、音声が合成される。
【0041】以上のように、本実施の形態2によれば、
符号化装置130に、スペクトル残差を時間領域の残差
信号に変換する時間波形算出手段131と、残差信号を
平滑化して符号化する残差符号化手段132を設け、復
号化装置140に、残差符号を復号化しスペクトル包絡
を乗じて残差信号を求める残差復号化手段142を設け
ることにより、高調波によってモデル化できないスペク
トル残差を時間領域で符号化することで、周波数領域で
符号化する場合と比較して、残差信号のパワーの変化な
どをより効率よく符号化でき、音の立ち上がり部分など
の過渡部分の音質を向上させることができる。
符号化装置130に、スペクトル残差を時間領域の残差
信号に変換する時間波形算出手段131と、残差信号を
平滑化して符号化する残差符号化手段132を設け、復
号化装置140に、残差符号を復号化しスペクトル包絡
を乗じて残差信号を求める残差復号化手段142を設け
ることにより、高調波によってモデル化できないスペク
トル残差を時間領域で符号化することで、周波数領域で
符号化する場合と比較して、残差信号のパワーの変化な
どをより効率よく符号化でき、音の立ち上がり部分など
の過渡部分の音質を向上させることができる。
【0042】なお、以上の説明では、符号化装置130
に有声無声判定符号化手段107、復号化装置140に
有声無声復号化手段124を設けた構成で説明したが、
それらを省いても同様に実施可能である。
に有声無声判定符号化手段107、復号化装置140に
有声無声復号化手段124を設けた構成で説明したが、
それらを省いても同様に実施可能である。
【0043】(実施の形態3)図5は本発明の請求項3
に対応する第3の実施の形態における音声符号化・復号
化装置の構成を示す。図5において、150は符号化装
置、160は復号化装置であり、図1に示した実施の形
態1における符号化・復号化装置と共通の要素には同一
の番号を付して重複した説明は省略する。符号化装置1
50において、151は高調波スペクトルとスペクトル
残差を入力とし、ゲインを出力とするゲイン算出手段で
ある。152はゲインを入力とし、ゲイン符号を出力と
するゲイン符号化手段である。153はスペクトル残差
とゲインとスペクトル包絡を入力とし、スペクトル残差
符号を出力とする残差スペクトル符号化手段である。1
54はピッチ周波数符号と高調波振幅符号とゲイン符号
とスペクトル残差符号を入力とし、多重化符号を出力と
するマルチプレクサである。また復号化装置160にお
いて、161は多重化符号を入力とし、ピッチ周波数符
号と高調波振幅符号とスペクトル残差符号とゲイン符号
を出力とするデマルチプレクサである。162はゲイン
符号を入力とし、ゲインを出力とするゲイン復号化手段
である。163はスペクトル残差符号とゲインとスペク
トル包絡を入力とし、スペクトル残差を出力とするスペ
クトル残差復号化手段である。
に対応する第3の実施の形態における音声符号化・復号
化装置の構成を示す。図5において、150は符号化装
置、160は復号化装置であり、図1に示した実施の形
態1における符号化・復号化装置と共通の要素には同一
の番号を付して重複した説明は省略する。符号化装置1
50において、151は高調波スペクトルとスペクトル
残差を入力とし、ゲインを出力とするゲイン算出手段で
ある。152はゲインを入力とし、ゲイン符号を出力と
するゲイン符号化手段である。153はスペクトル残差
とゲインとスペクトル包絡を入力とし、スペクトル残差
符号を出力とする残差スペクトル符号化手段である。1
54はピッチ周波数符号と高調波振幅符号とゲイン符号
とスペクトル残差符号を入力とし、多重化符号を出力と
するマルチプレクサである。また復号化装置160にお
いて、161は多重化符号を入力とし、ピッチ周波数符
号と高調波振幅符号とスペクトル残差符号とゲイン符号
を出力とするデマルチプレクサである。162はゲイン
符号を入力とし、ゲインを出力とするゲイン復号化手段
である。163はスペクトル残差符号とゲインとスペク
トル包絡を入力とし、スペクトル残差を出力とするスペ
クトル残差復号化手段である。
【0044】以上のように構成された音声符号化・復号
化装置について、図5を用いてその動作を説明する。ま
ず符号化装置150において、ゲイン算出手段151
は、(4)式に示すように、入力されたスペクトル残差
の振幅と高調波スペクトルの振幅の比を各高調波ごとに
求めることにより、ゲインg(l) を求めて出力する。す
なわち、このゲインg(l) は、l番目の高調波周波数の
近傍の正弦波と残差の比を示している。
化装置について、図5を用いてその動作を説明する。ま
ず符号化装置150において、ゲイン算出手段151
は、(4)式に示すように、入力されたスペクトル残差
の振幅と高調波スペクトルの振幅の比を各高調波ごとに
求めることにより、ゲインg(l) を求めて出力する。す
なわち、このゲインg(l) は、l番目の高調波周波数の
近傍の正弦波と残差の比を示している。
【0045】
【数4】 ・・・(4)
【0046】ゲイン符号化手段152は、入力されたゲ
インをベクトル量子化などで量子化し符号化する。スペ
クトル残差符号化手段153は、まず、(3)式と同様
にスペクトル包絡によりスペクトル残差を平滑化し、次
に(5)式に示すように、ゲインで正規化して、ベクト
ル量子化などで量子化し符号化する。
インをベクトル量子化などで量子化し符号化する。スペ
クトル残差符号化手段153は、まず、(3)式と同様
にスペクトル包絡によりスペクトル残差を平滑化し、次
に(5)式に示すように、ゲインで正規化して、ベクト
ル量子化などで量子化し符号化する。
【0047】
【数5】 ・・・(5)
【0048】マルチプレクサ154では、入力されたピ
ッチ周波数符号と高調波振幅符号とゲイン符号とスペク
トル残差符号をまとめ、多重化符号として復号化装置1
60へ出力する。
ッチ周波数符号と高調波振幅符号とゲイン符号とスペク
トル残差符号をまとめ、多重化符号として復号化装置1
60へ出力する。
【0049】復号化装置160において、デマルチプレ
クサ161は、符号化装置150から送信された多重化
符号を、ピッチ周波数符号と高調波振幅符号とゲイン符
号とスペクトル残差符号に分解する。ゲイン復号化手段
162は、入力されたゲイン符号を復号化する。スペク
トル残差復号化手段163は、入力されたスペクトル残
差符号を復号化し、それにゲインおよびスペクトル包絡
を乗じてスペクトル残差を求め、出力する。求められた
スペクトル残差は、高調波スペクトルとともに出力音声
合成手段127に入力され、音声が合成される。
クサ161は、符号化装置150から送信された多重化
符号を、ピッチ周波数符号と高調波振幅符号とゲイン符
号とスペクトル残差符号に分解する。ゲイン復号化手段
162は、入力されたゲイン符号を復号化する。スペク
トル残差復号化手段163は、入力されたスペクトル残
差符号を復号化し、それにゲインおよびスペクトル包絡
を乗じてスペクトル残差を求め、出力する。求められた
スペクトル残差は、高調波スペクトルとともに出力音声
合成手段127に入力され、音声が合成される。
【0050】以上のように、本実施の形態3によれば、
符号化装置150に、高調波スペクトルと残差スペクト
ルの比からゲインを求め出力するゲイン算出手段151
と、ゲインを符号化するゲイン符号化手段152と、ス
ペクトル残差をスペクトル包絡によって平滑化し、ゲイ
ンで正規化して符号化するスペクトル残差符号化手段1
53を設け、復号化装置160に、ゲイン符号を復号化
するゲイン復号化手段162と、スペクトル残差符号を
復号化し、スペクトル包絡およびゲインを乗じてスペク
トル残差を求めるスペクトル残差復号化手段163を設
けることにより、従来各高調波の近傍における正弦波成
分と残差成分の比をしきい値により有声あるいは無声と
いう2値で表現していたものを、一般化したゲイン情報
として符号化することで、より自由度の高いモデルで符
号化でき、品質の良い合成音声が得られる。
符号化装置150に、高調波スペクトルと残差スペクト
ルの比からゲインを求め出力するゲイン算出手段151
と、ゲインを符号化するゲイン符号化手段152と、ス
ペクトル残差をスペクトル包絡によって平滑化し、ゲイ
ンで正規化して符号化するスペクトル残差符号化手段1
53を設け、復号化装置160に、ゲイン符号を復号化
するゲイン復号化手段162と、スペクトル残差符号を
復号化し、スペクトル包絡およびゲインを乗じてスペク
トル残差を求めるスペクトル残差復号化手段163を設
けることにより、従来各高調波の近傍における正弦波成
分と残差成分の比をしきい値により有声あるいは無声と
いう2値で表現していたものを、一般化したゲイン情報
として符号化することで、より自由度の高いモデルで符
号化でき、品質の良い合成音声が得られる。
【0051】(実施の形態4)図6は本発明の請求項4
に対応する第4の実施の形態における音声符号化・復号
化装置の構成を示す。図6において、170は符号化装
置、180は復号化装置であり、図4に示した実施の形
態2における符号化・復号化装置と共通の要素には同一
の番号を付して重複した説明は省略する。符号化装置1
70において、171は残差信号と高調波スペクトルを
入力とし、ゲインを出力とするゲイン算出手段である。
172はゲインを入力とし、ゲイン符号を出力とするゲ
イン符号化手段である。173は残差信号とゲインとス
ペクトル包絡を入力とし、残差符号を出力とする残差符
号化手段である。174はピッチ周波数符号と高調波振
幅符号とゲイン符号と残差符号を入力とし、多重化符号
を出力とするマルチプレクサである。また、復号化装置
180において、181は多重化符号を入力とし、ピッ
チ周波数符号と高調波振幅符号とゲイン符号と残差符号
を出力とするデマルチプレクサである。182はゲイン
符号を入力とし、ゲインを出力とするゲイン復号化手段
である。183はゲインとスペクトル包絡と残差符号を
入力とし、残差信号を出力とする残差復号化手段であ
る。
に対応する第4の実施の形態における音声符号化・復号
化装置の構成を示す。図6において、170は符号化装
置、180は復号化装置であり、図4に示した実施の形
態2における符号化・復号化装置と共通の要素には同一
の番号を付して重複した説明は省略する。符号化装置1
70において、171は残差信号と高調波スペクトルを
入力とし、ゲインを出力とするゲイン算出手段である。
172はゲインを入力とし、ゲイン符号を出力とするゲ
イン符号化手段である。173は残差信号とゲインとス
ペクトル包絡を入力とし、残差符号を出力とする残差符
号化手段である。174はピッチ周波数符号と高調波振
幅符号とゲイン符号と残差符号を入力とし、多重化符号
を出力とするマルチプレクサである。また、復号化装置
180において、181は多重化符号を入力とし、ピッ
チ周波数符号と高調波振幅符号とゲイン符号と残差符号
を出力とするデマルチプレクサである。182はゲイン
符号を入力とし、ゲインを出力とするゲイン復号化手段
である。183はゲインとスペクトル包絡と残差符号を
入力とし、残差信号を出力とする残差復号化手段であ
る。
【0052】以上のように構成された音声符号化・復号
化装置について、図6を用いてその動作を説明する。ま
ず符号化装置170において、ゲイン算出手段171で
は、フレーム内をM個のサブフレームに分割する。次
に、入力された高調波スペクトルを逆フーリエ変換など
で時間領域に変換する。次に、(6)式に示すように、
ゲインg(m) をサブフレームごとに求める。
化装置について、図6を用いてその動作を説明する。ま
ず符号化装置170において、ゲイン算出手段171で
は、フレーム内をM個のサブフレームに分割する。次
に、入力された高調波スペクトルを逆フーリエ変換など
で時間領域に変換する。次に、(6)式に示すように、
ゲインg(m) をサブフレームごとに求める。
【0053】
【数6】 ・・・(6) ゲインg(m) は、時間領域での各サブフレームにおける
正弦波成分と残差成分の比を表している。
正弦波成分と残差成分の比を表している。
【0054】求められたゲインは、ゲイン符号化手段1
72でベクトル量子化などで量子化され、符号化され
る。残差符号化手段173は、入力された残差信号をス
ペクトル包絡により平滑化し、次にゲインで正規化し、
ベクトル量子化などで量子化して符号化する。マルチプ
レクサ174では、入力されたピッチ周波数符号と高調
波振幅符号とゲイン符号と残差符号をまとめ、多重化符
号として復号化装置180へ出力する。
72でベクトル量子化などで量子化され、符号化され
る。残差符号化手段173は、入力された残差信号をス
ペクトル包絡により平滑化し、次にゲインで正規化し、
ベクトル量子化などで量子化して符号化する。マルチプ
レクサ174では、入力されたピッチ周波数符号と高調
波振幅符号とゲイン符号と残差符号をまとめ、多重化符
号として復号化装置180へ出力する。
【0055】復号化装置180において、デマルチプレ
クサ181は、符号化装置170から送信された多重化
符号を、ピッチ周波数符号と高調波振幅符号とゲイン符
号と残差符号に分解する。ゲイン符号復号化手段182
は、入力されたゲイン符号を復号化する。残差復号化手
段183では、残差符号を復号化し、まず、ゲインを乗
じ、得られた信号に対しスペクトル包絡を乗じる。求め
られた残差信号は、高調波合成スペクトルとともに出力
音声合成手段127に入力され、音声が合成される。
クサ181は、符号化装置170から送信された多重化
符号を、ピッチ周波数符号と高調波振幅符号とゲイン符
号と残差符号に分解する。ゲイン符号復号化手段182
は、入力されたゲイン符号を復号化する。残差復号化手
段183では、残差符号を復号化し、まず、ゲインを乗
じ、得られた信号に対しスペクトル包絡を乗じる。求め
られた残差信号は、高調波合成スペクトルとともに出力
音声合成手段127に入力され、音声が合成される。
【0056】以上のように、本実施の形態4によれば、
符号化装置170に、残差信号と高調波スペクトルから
ゲインを算出するゲイン算出手段171と、ゲインを符
号化するゲイン符号化手段172と、スペクトル包絡に
よって残差信号を平滑化した後、ゲインによって残差信
号を正規化して符号化する残差符号化手段173を設
け、復号化装置180に、ゲイン符号を復号化するゲイ
ン復号化手段182と、残差符号を復号化し、ゲインと
スペクトル包絡を乗ずる残差復号化手段183を設ける
ことにより、高調波によってモデル化できないスペクト
ル残差を時間領域で符号化することで、残差信号のパワ
ーの変化をより効率よく符号化できると同時に、フレー
ム内での高調波成分と残差信号成分の割合を細かく制御
でき、音の立ち上がり部分など過渡部分の音質を向上さ
せることができる。
符号化装置170に、残差信号と高調波スペクトルから
ゲインを算出するゲイン算出手段171と、ゲインを符
号化するゲイン符号化手段172と、スペクトル包絡に
よって残差信号を平滑化した後、ゲインによって残差信
号を正規化して符号化する残差符号化手段173を設
け、復号化装置180に、ゲイン符号を復号化するゲイ
ン復号化手段182と、残差符号を復号化し、ゲインと
スペクトル包絡を乗ずる残差復号化手段183を設ける
ことにより、高調波によってモデル化できないスペクト
ル残差を時間領域で符号化することで、残差信号のパワ
ーの変化をより効率よく符号化できると同時に、フレー
ム内での高調波成分と残差信号成分の割合を細かく制御
でき、音の立ち上がり部分など過渡部分の音質を向上さ
せることができる。
【0057】(実施の形態5)図7は本発明の請求項5
に対応する第5の実施の形態における音声符号化・復号
化装置の構成を示す。図7において、190は符号化装
置、200は復号化装置であり、図5に示した実施の形
態3における符号化・復号化装置と共通の要素には同一
の番号を付して重複した説明は省略する。符号化装置1
90において、191はスペクトル包絡を入力とし、ス
ペクトル包絡符号を出力とするスペクトル包絡符号化手
段である。192はスペクトル包絡とスペクトル残差を
入力とし、ゲインとビット割り当てを出力とするゲイン
算出手段である。193は高調波振幅とビット割り当て
とスペクトル包絡を入力とし、高調波補正振幅符号を出
力とする高調波補正振幅符号化手段である。194はス
ペクトル包絡とスペクトル残差とゲインとビット割り当
てを入力とし、スペクトル残差符号を出力とするスペク
トル残差符号化手段である。195はピッチ周波数符号
とスペクトル包絡符号と高調波補正振幅符号とゲイン符
号とスペクトル残差符号を入力とし、多重化符号を出力
とするマルチプレクサである。また復号化手段200に
おいて、201は多重化符号を入力とし、ピッチ周波数
符号とスペクトル包絡符号と高調波補正振幅符号とスペ
クトル残差符号とゲイン符号を出力とするデマルチプレ
クサである。202はスペクトル包絡符号を入力とし、
スペクトル包絡を出力とするスペクトル包絡復号化手段
である。203はゲイン符号とスペクトル包絡を入力と
し、ゲインとビット割り当てを出力とするゲイン復号化
手段である。204は高調波補正振幅符号とビット割り
当てとスペクトル包絡を入力とし、高調波振幅を出力と
する高調波振幅復号化手段である。205はスペクトル
残差符号とビット割り当てとゲインとスペクトル包絡を
入力とし、スペクトル残差を出力とするスペクトル残差
復号化手段である。206はピッチ周波数と高調波振幅
を入力とし、高調波スペクトルを出力とする高調波スペ
クトル合成手段である。
に対応する第5の実施の形態における音声符号化・復号
化装置の構成を示す。図7において、190は符号化装
置、200は復号化装置であり、図5に示した実施の形
態3における符号化・復号化装置と共通の要素には同一
の番号を付して重複した説明は省略する。符号化装置1
90において、191はスペクトル包絡を入力とし、ス
ペクトル包絡符号を出力とするスペクトル包絡符号化手
段である。192はスペクトル包絡とスペクトル残差を
入力とし、ゲインとビット割り当てを出力とするゲイン
算出手段である。193は高調波振幅とビット割り当て
とスペクトル包絡を入力とし、高調波補正振幅符号を出
力とする高調波補正振幅符号化手段である。194はス
ペクトル包絡とスペクトル残差とゲインとビット割り当
てを入力とし、スペクトル残差符号を出力とするスペク
トル残差符号化手段である。195はピッチ周波数符号
とスペクトル包絡符号と高調波補正振幅符号とゲイン符
号とスペクトル残差符号を入力とし、多重化符号を出力
とするマルチプレクサである。また復号化手段200に
おいて、201は多重化符号を入力とし、ピッチ周波数
符号とスペクトル包絡符号と高調波補正振幅符号とスペ
クトル残差符号とゲイン符号を出力とするデマルチプレ
クサである。202はスペクトル包絡符号を入力とし、
スペクトル包絡を出力とするスペクトル包絡復号化手段
である。203はゲイン符号とスペクトル包絡を入力と
し、ゲインとビット割り当てを出力とするゲイン復号化
手段である。204は高調波補正振幅符号とビット割り
当てとスペクトル包絡を入力とし、高調波振幅を出力と
する高調波振幅復号化手段である。205はスペクトル
残差符号とビット割り当てとゲインとスペクトル包絡を
入力とし、スペクトル残差を出力とするスペクトル残差
復号化手段である。206はピッチ周波数と高調波振幅
を入力とし、高調波スペクトルを出力とする高調波スペ
クトル合成手段である。
【0058】以上のように構成された音声符号化・復号
化装置について、図6を用いてその動作を説明する。符
号化装置190において、高調波スペクトル合成手段で
求められたスペクトル包絡は、スペクトル包絡符号化手
段191に入力され、符号化される。スペクトル包絡の
符号化は、例えばスペクトル包絡から線形予測係数を求
め、それを符号化する手法がある。ゲイン算出手段19
2は、スペクトル包絡から高調波スペクトルの振幅の推
定値H'(l)を求め、それをもとに合成されるスペクトル
H'(w)を算出し、(5)式と同様に、残差スペクトルの
振幅と高調波スペクトルの推定値H'(w)の比g'(l)を各
高調波ごとに求め、これをゲインとして出力する。
化装置について、図6を用いてその動作を説明する。符
号化装置190において、高調波スペクトル合成手段で
求められたスペクトル包絡は、スペクトル包絡符号化手
段191に入力され、符号化される。スペクトル包絡の
符号化は、例えばスペクトル包絡から線形予測係数を求
め、それを符号化する手法がある。ゲイン算出手段19
2は、スペクトル包絡から高調波スペクトルの振幅の推
定値H'(l)を求め、それをもとに合成されるスペクトル
H'(w)を算出し、(5)式と同様に、残差スペクトルの
振幅と高調波スペクトルの推定値H'(w)の比g'(l)を各
高調波ごとに求め、これをゲインとして出力する。
【0059】
【数7】 ・・・(7)
【0060】次に、ゲインg'(l)と高調波スペクトルの
推定値H'(w)をもとに、高調波補正値符号化ビット数b
d(l)およびスペクトル残差の符号化ビット数br(l)を求
める。その方法としては、(7)式に示すようにbd(l)
およびbr(l)を求める方法が考えられる。
推定値H'(w)をもとに、高調波補正値符号化ビット数b
d(l)およびスペクトル残差の符号化ビット数br(l)を求
める。その方法としては、(7)式に示すようにbd(l)
およびbr(l)を求める方法が考えられる。
【0061】
【数8】 ・・・(8) ここで、Dおよびδは、bd(l)、br(l)およびスペクト
ル包絡の符号化ビット数bh の総和がスペクトル全体を
符号化するために割り当てられているビット数に一致す
るように適当に調整する。このように設定することで、
高調波スペクトルおよびスペクトル残差の大きさによっ
て、より大きいパワーを持つ信号により大きいビットが
割り当てられる。これは、高調波スペクトルと残差スペ
クトルのパワーをそれぞれの情報源の分散とみなしたと
き、速度−歪理論における最適なビットレートをそれぞ
れの情報源に割り当てたことになる。
ル包絡の符号化ビット数bh の総和がスペクトル全体を
符号化するために割り当てられているビット数に一致す
るように適当に調整する。このように設定することで、
高調波スペクトルおよびスペクトル残差の大きさによっ
て、より大きいパワーを持つ信号により大きいビットが
割り当てられる。これは、高調波スペクトルと残差スペ
クトルのパワーをそれぞれの情報源の分散とみなしたと
き、速度−歪理論における最適なビットレートをそれぞ
れの情報源に割り当てたことになる。
【0062】高調波補正振幅符号化手段193は、高調
波振幅H(l) と、スペクトル包絡によって求められる高
調波振幅推定値H'(l)との差を符号化する。まず、各高
調波ごとに、差分値である高調波補正振幅D(l) を求め
る。 D(l) = H(l) - H'(l) ・・・(9) 次に、与えられたビット割り当てbd(l)にしたがって、
ビット数可変のベクトル量子化法などを用いて、高調波
補正振幅D(l) を量子化、符号化する。
波振幅H(l) と、スペクトル包絡によって求められる高
調波振幅推定値H'(l)との差を符号化する。まず、各高
調波ごとに、差分値である高調波補正振幅D(l) を求め
る。 D(l) = H(l) - H'(l) ・・・(9) 次に、与えられたビット割り当てbd(l)にしたがって、
ビット数可変のベクトル量子化法などを用いて、高調波
補正振幅D(l) を量子化、符号化する。
【0063】スペクトル残差符号化手段194では、入
力されたスペクトル残差R(w) に対し、まずスペクトル
包絡A(w) によってスペクトルを平坦化し、次に、ゲイ
ンg(l) を用いて正規化する。そして、入力された割り
当てビット数br(l)にしたがって、ビット数可変のベク
トル量子化法などを用いて量子化し符号化される。マル
チプレクサ195では、入力されたピッチ周波数符号と
スペクトル包絡符号と高調波補正振幅符号とゲイン符号
とスペクトル残差符号をまとめ、多重化符号として復号
化装置200へ出力する。
力されたスペクトル残差R(w) に対し、まずスペクトル
包絡A(w) によってスペクトルを平坦化し、次に、ゲイ
ンg(l) を用いて正規化する。そして、入力された割り
当てビット数br(l)にしたがって、ビット数可変のベク
トル量子化法などを用いて量子化し符号化される。マル
チプレクサ195では、入力されたピッチ周波数符号と
スペクトル包絡符号と高調波補正振幅符号とゲイン符号
とスペクトル残差符号をまとめ、多重化符号として復号
化装置200へ出力する。
【0064】復号化装置200において、デマルチプレ
クサ201は、符号化装置190から送信された多重化
符号を、ピッチ周波数符号とスペクトル包絡符号と高調
波補正振幅符号とゲイン符号とスペクトル残差符号に分
解する。スペクトル包絡復号化手段202は、スペクト
ル包絡符号を復号化して、スペクトル包絡を出力する。
ゲイン符号化手段203では、ゲイン符号を復号化する
とともに、(8)式にしたがって、割り当てビット数b
d(l)、br(l)を求める。
クサ201は、符号化装置190から送信された多重化
符号を、ピッチ周波数符号とスペクトル包絡符号と高調
波補正振幅符号とゲイン符号とスペクトル残差符号に分
解する。スペクトル包絡復号化手段202は、スペクト
ル包絡符号を復号化して、スペクトル包絡を出力する。
ゲイン符号化手段203では、ゲイン符号を復号化する
とともに、(8)式にしたがって、割り当てビット数b
d(l)、br(l)を求める。
【0065】高調波振幅復号化手段204では、まず高
調波補正振幅符号を割り当てビット数bd(l)で復号化す
る。次に、(10)式に示すように、スペクトル包絡か
ら求められる高調波スペクトル推定振幅H'(l)と復号化
された高調波補正振幅D(l)を用いて、高調波振幅を算
出する。 H(l) = H'(l) + D(l) ・・・(10)
調波補正振幅符号を割り当てビット数bd(l)で復号化す
る。次に、(10)式に示すように、スペクトル包絡か
ら求められる高調波スペクトル推定振幅H'(l)と復号化
された高調波補正振幅D(l)を用いて、高調波振幅を算
出する。 H(l) = H'(l) + D(l) ・・・(10)
【0066】スペクトル残差復号化手段205では、ま
ずスペクトル残差符号を割り当てビット数br(l)で復号
化し、ゲインを乗じた後、スペクトル包絡を乗じて、ス
ペクトル残差を出力する。高調波スペクトル合成手段2
06では、ピッチ周波数と高調波振幅から高調波スペク
トルを求め出力する。求められたスペクトル残差と高調
波合成スペクトルは出力音声合成手段127に入力さ
れ、音声が合成される。
ずスペクトル残差符号を割り当てビット数br(l)で復号
化し、ゲインを乗じた後、スペクトル包絡を乗じて、ス
ペクトル残差を出力する。高調波スペクトル合成手段2
06では、ピッチ周波数と高調波振幅から高調波スペク
トルを求め出力する。求められたスペクトル残差と高調
波合成スペクトルは出力音声合成手段127に入力さ
れ、音声が合成される。
【0067】以上のように、本実施の形態5によれば、
符号化装置190に、スペクトル包絡から推定した高調
波振幅とスペクトル残差からゲインを算出し、さらにそ
のゲインとスペクトル包絡を用いて高調波補正振幅とス
ペクトル残差を符号化する割り当てビット数を算出する
ゲイン算出手段192と、高調波振幅とスペクトル包絡
の差である高調波補正振幅を求め、割り当てられたビッ
ト数で高調波補正振幅を符号化する高調波補正振幅符号
化手段193と、スペクトル包絡でスペクトル残差を平
滑化し、さらにゲインで正規化して割り当てられたビッ
ト数で符号化するスペクトル残差符号化手段194を設
け、復号化装置200に、復号化したゲインとスペクト
ル包絡を用いて割り当てビット数を求めるゲイン復号化
手段203と、割り当てられたビット数で高調波補正振
幅を復号化し、スペクトル包絡を加えることにより高調
波振幅を求める高調波振幅復号化手段204と、割り当
てられたビット数でスペクトル残差符号を復号化し、ゲ
インとスペクトル包絡を乗じるスペクトル残差復号化手
段205を設けることにより、各高調波の近傍における
正弦波成分と残差成分の比を一般化したゲイン情報とし
て符号化することで、より自由度の高いモデルで符号化
できるとともに、そのゲイン情報をもとに高調波振幅と
スペクトル残差のビット割り当てを行うことにより、ビ
ット割り当て情報を伝送することなく、高調波振幅とス
ペクトル残差に適当なビット割り当てを行うことがで
き、より品質の良い合成音声が得られる。
符号化装置190に、スペクトル包絡から推定した高調
波振幅とスペクトル残差からゲインを算出し、さらにそ
のゲインとスペクトル包絡を用いて高調波補正振幅とス
ペクトル残差を符号化する割り当てビット数を算出する
ゲイン算出手段192と、高調波振幅とスペクトル包絡
の差である高調波補正振幅を求め、割り当てられたビッ
ト数で高調波補正振幅を符号化する高調波補正振幅符号
化手段193と、スペクトル包絡でスペクトル残差を平
滑化し、さらにゲインで正規化して割り当てられたビッ
ト数で符号化するスペクトル残差符号化手段194を設
け、復号化装置200に、復号化したゲインとスペクト
ル包絡を用いて割り当てビット数を求めるゲイン復号化
手段203と、割り当てられたビット数で高調波補正振
幅を復号化し、スペクトル包絡を加えることにより高調
波振幅を求める高調波振幅復号化手段204と、割り当
てられたビット数でスペクトル残差符号を復号化し、ゲ
インとスペクトル包絡を乗じるスペクトル残差復号化手
段205を設けることにより、各高調波の近傍における
正弦波成分と残差成分の比を一般化したゲイン情報とし
て符号化することで、より自由度の高いモデルで符号化
できるとともに、そのゲイン情報をもとに高調波振幅と
スペクトル残差のビット割り当てを行うことにより、ビ
ット割り当て情報を伝送することなく、高調波振幅とス
ペクトル残差に適当なビット割り当てを行うことがで
き、より品質の良い合成音声が得られる。
【0068】(実施の形態6)図8は本発明の請求項6
に対応する第6の実施の形態における音声符号化・復号
化装置の構成を示す。図8において、210は符号化装
置、220は復号化装置であり、図6に示した実施の形
態4における符号化・復号化装置と共通の要素には同一
の番号を付して重複した説明は省略する。符号化装置2
10において、211はスペクトル包絡を入力とし、ス
ペクトル包絡符号を出力とするスペクトル包絡符号化手
段である。212はスペクトル包絡と残差信号を入力と
し、ゲインとピット割り当てを出力とするゲイン算出手
段である。213は高調波振幅とスペクトル包絡とビッ
ト割り当てを入力とし、高調波補正振幅符号を出力とす
る高調波補正振幅符号化手段である。214はスペクト
ル包絡と残差信号とゲインとビット割り当てを入力と
し、残差符号を出力とする残差符号化手段である。21
5はピッチ周波数符号とスペクトル包絡符号と高調波補
正振幅符号とゲイン符号と残差符号を入力とし、多重化
符号を出力とするマルチプレクサである。また復号化手
段220において、221は多重化符号を入力とし、ピ
ッチ周波数符号とスペクトル包絡符号と高調波補正振幅
符号と残差符号とゲイン符号を出力とするデマルチプレ
クサである。222はスペクトル包絡符号を入力とし、
スペクトル包絡を出力とするスペクトル包絡復号化手段
である。223はゲイン符号とスペクトル包絡を入力と
し、ゲインとビット割り当てを出力とするゲイン復号化
手段である。224は高調波補正振幅符号とビット割り
当てとスペクトル包絡を入力とし、高調波振幅を出力と
する高調波振幅復号化手段である。225は残差符号と
ビット割り当てとゲインとスペクトル包絡を入力とし、
残差信号を出力とする残差復号化手段である。226は
ピッチ周波数と高調波振幅を入力とし、高調波スペクト
ルを出力とする高調波スペクトル合成手段である。
に対応する第6の実施の形態における音声符号化・復号
化装置の構成を示す。図8において、210は符号化装
置、220は復号化装置であり、図6に示した実施の形
態4における符号化・復号化装置と共通の要素には同一
の番号を付して重複した説明は省略する。符号化装置2
10において、211はスペクトル包絡を入力とし、ス
ペクトル包絡符号を出力とするスペクトル包絡符号化手
段である。212はスペクトル包絡と残差信号を入力と
し、ゲインとピット割り当てを出力とするゲイン算出手
段である。213は高調波振幅とスペクトル包絡とビッ
ト割り当てを入力とし、高調波補正振幅符号を出力とす
る高調波補正振幅符号化手段である。214はスペクト
ル包絡と残差信号とゲインとビット割り当てを入力と
し、残差符号を出力とする残差符号化手段である。21
5はピッチ周波数符号とスペクトル包絡符号と高調波補
正振幅符号とゲイン符号と残差符号を入力とし、多重化
符号を出力とするマルチプレクサである。また復号化手
段220において、221は多重化符号を入力とし、ピ
ッチ周波数符号とスペクトル包絡符号と高調波補正振幅
符号と残差符号とゲイン符号を出力とするデマルチプレ
クサである。222はスペクトル包絡符号を入力とし、
スペクトル包絡を出力とするスペクトル包絡復号化手段
である。223はゲイン符号とスペクトル包絡を入力と
し、ゲインとビット割り当てを出力とするゲイン復号化
手段である。224は高調波補正振幅符号とビット割り
当てとスペクトル包絡を入力とし、高調波振幅を出力と
する高調波振幅復号化手段である。225は残差符号と
ビット割り当てとゲインとスペクトル包絡を入力とし、
残差信号を出力とする残差復号化手段である。226は
ピッチ周波数と高調波振幅を入力とし、高調波スペクト
ルを出力とする高調波スペクトル合成手段である。
【0069】以上のように構成された音声符号化・復号
化装置について、図8を用いてその動作を説明する。ま
ず符号化装置210において、高調波スペクトル合成手
段108で求められたスペクトル包絡は、スペクトル包
絡符号化手段211に入力され、符号化される。スペク
トル包絡の符号化は、例えばスペクトル包絡から線形予
測係数を求め、それを符号化する手法がある。ゲイン算
出手段212は、まず、スペクトル包絡から高調波スペ
クトルの振幅の推定値H'(l)を求め、それによって合成
されるスペクトルH'(w)を算出し、逆フーリエ変換など
で時間領域に変換する。次に、フレーム内をM個のサブ
フレームに分割し、(11)式に示すように、ゲイン
g'(m)を求める。
化装置について、図8を用いてその動作を説明する。ま
ず符号化装置210において、高調波スペクトル合成手
段108で求められたスペクトル包絡は、スペクトル包
絡符号化手段211に入力され、符号化される。スペク
トル包絡の符号化は、例えばスペクトル包絡から線形予
測係数を求め、それを符号化する手法がある。ゲイン算
出手段212は、まず、スペクトル包絡から高調波スペ
クトルの振幅の推定値H'(l)を求め、それによって合成
されるスペクトルH'(w)を算出し、逆フーリエ変換など
で時間領域に変換する。次に、フレーム内をM個のサブ
フレームに分割し、(11)式に示すように、ゲイン
g'(m)を求める。
【0070】
【数9】 ・・・(11)
【0071】次に、ゲインg'(m)をもとに高調波補正振
幅の符号化ビット数bd と各サブフレームの残差信号の
符号化ビット数br(m)を求める。その方法としては、
(12)式に示すようにbd およびbr(m)を求める方法
が考えられる。
幅の符号化ビット数bd と各サブフレームの残差信号の
符号化ビット数br(m)を求める。その方法としては、
(12)式に示すようにbd およびbr(m)を求める方法
が考えられる。
【0072】
【数10】 ・・・(12) ここで、Dおよびδは、bh 、br(m)およびスペクトル
包絡の符号化ビット数bhの総和が、スペクトル全体を
符号化するために割り当てられているビット数に一致す
るように適当に調整する。
包絡の符号化ビット数bhの総和が、スペクトル全体を
符号化するために割り当てられているビット数に一致す
るように適当に調整する。
【0073】高調波補正振幅符号化手段213は、高調
波振幅H(l) と、スペクトル包絡によって求められる高
調波振幅推定値H'(l)との差である高調波補正振幅D
(l) を求め、与えられたビット割り当てbd にしたがっ
て、ビット数可変のベクトル量子化法などを用いて、高
調波補正振幅D(l) を量子化し符号化する。残差符号化
手段214では、入力された残差信号に対し、まずスペ
クトル包絡によってスペクトルを平坦化し、次に、ゲイ
ンを用いて正規化する。そして、入力された割り当てビ
ット数br(m)にしたがって、ビット数可変のベクトル量
子化法などを用いて量子化し符号化する。マルチプレク
サ215では、入力されたピッチ周波数符号とスペクト
ル包絡符号と高調波補正振幅符号とゲイン符号と残差符
号をまとめ、多重化符号として復号化装置220へ出力
する。
波振幅H(l) と、スペクトル包絡によって求められる高
調波振幅推定値H'(l)との差である高調波補正振幅D
(l) を求め、与えられたビット割り当てbd にしたがっ
て、ビット数可変のベクトル量子化法などを用いて、高
調波補正振幅D(l) を量子化し符号化する。残差符号化
手段214では、入力された残差信号に対し、まずスペ
クトル包絡によってスペクトルを平坦化し、次に、ゲイ
ンを用いて正規化する。そして、入力された割り当てビ
ット数br(m)にしたがって、ビット数可変のベクトル量
子化法などを用いて量子化し符号化する。マルチプレク
サ215では、入力されたピッチ周波数符号とスペクト
ル包絡符号と高調波補正振幅符号とゲイン符号と残差符
号をまとめ、多重化符号として復号化装置220へ出力
する。
【0074】復号化装置220において、デマルチプレ
クサ221は、符号化装置210から送信された多重化
符号を、ピッチ周波数符号とスペクトル包絡符号と高調
波補正振幅符号とゲイン符号と残差符号に分解する。ス
ペクトル包絡復号化手段222は、スペクトル包絡符号
を復号化して、スペクトル包絡を出力する。ゲイン符号
化手段223では、ゲイン符号を復号化するとともに、
(12)式にしたがって、割り当てビット数bd 、br
(m)を求める。高調波振幅復号化手段224では、高調
波補正振幅符号を割り当てビット数bd で復号化し、
(10)式にもとづいて、高調波振幅を求める。残差復
号化手段225では、まず残差符号を割り当てビット数
br(m)で復号化し、ゲインを乗じた後、スペクトル包絡
を乗じて、残差信号を出力する。高調波スペクトル算出
手段206では、ピッチ周波数と高調波振幅から高調波
スペクトルを求め出力する。求められた残差信号と高調
波スペクトルは出力音声合成手段127に入力され、音
声が合成される。
クサ221は、符号化装置210から送信された多重化
符号を、ピッチ周波数符号とスペクトル包絡符号と高調
波補正振幅符号とゲイン符号と残差符号に分解する。ス
ペクトル包絡復号化手段222は、スペクトル包絡符号
を復号化して、スペクトル包絡を出力する。ゲイン符号
化手段223では、ゲイン符号を復号化するとともに、
(12)式にしたがって、割り当てビット数bd 、br
(m)を求める。高調波振幅復号化手段224では、高調
波補正振幅符号を割り当てビット数bd で復号化し、
(10)式にもとづいて、高調波振幅を求める。残差復
号化手段225では、まず残差符号を割り当てビット数
br(m)で復号化し、ゲインを乗じた後、スペクトル包絡
を乗じて、残差信号を出力する。高調波スペクトル算出
手段206では、ピッチ周波数と高調波振幅から高調波
スペクトルを求め出力する。求められた残差信号と高調
波スペクトルは出力音声合成手段127に入力され、音
声が合成される。
【0075】以上のように、本実施の形態6によれば、
符号化装置210に、スペクトル包絡から推定した高調
波振幅と残差信号からゲインを算出し、さらにそのゲイ
ンとスペクトル包絡を用いて高調波振幅と残差信号を符
号化する割り当てビット数を算出するゲイン算出手段2
12と、高調波振幅とスペクトル包絡の差である高調波
補正振幅を求め、割り当てられたビット数で高調波補正
振幅を符号化する高調波補正振幅符号化手段213と、
残差信号をスペクトル包絡で平滑化し、さらにゲインで
正規化して割り当てられたビット数で符号化する残差符
号化手段214を設け、復号化装置220に、復号化し
たゲイン符号とスペクトル包絡を用いて割り当てビット
数を求めるゲイン復号化手段223と、割り当てられた
ビット数で高調波補正振幅を復号化し、スペクトル包絡
を加えることにより高調波振幅を求める高調波振幅復号
化手段224と、割り当てられたビット数で残差符号を
復号化し、ゲインとスペクトル包絡を乗じる残差復号化
手段225を設けることにより、残差信号のパワーの変
化をより効率よく符号化でき、フレーム内での高調波成
分と残差信号成分の割合やを細かく制御することによ
り、音の立ち上がり部分などの音質を向上させることが
でき、同時にそのゲイン情報をもとに高調波振幅とスペ
クトル残差のビット割り当てを行うことにより、ビット
割り当て情報を伝送することなく、高調波振幅と残差信
号に適当なビット割り当てを行うことができ、より品質
の良い合成音声が得られる。
符号化装置210に、スペクトル包絡から推定した高調
波振幅と残差信号からゲインを算出し、さらにそのゲイ
ンとスペクトル包絡を用いて高調波振幅と残差信号を符
号化する割り当てビット数を算出するゲイン算出手段2
12と、高調波振幅とスペクトル包絡の差である高調波
補正振幅を求め、割り当てられたビット数で高調波補正
振幅を符号化する高調波補正振幅符号化手段213と、
残差信号をスペクトル包絡で平滑化し、さらにゲインで
正規化して割り当てられたビット数で符号化する残差符
号化手段214を設け、復号化装置220に、復号化し
たゲイン符号とスペクトル包絡を用いて割り当てビット
数を求めるゲイン復号化手段223と、割り当てられた
ビット数で高調波補正振幅を復号化し、スペクトル包絡
を加えることにより高調波振幅を求める高調波振幅復号
化手段224と、割り当てられたビット数で残差符号を
復号化し、ゲインとスペクトル包絡を乗じる残差復号化
手段225を設けることにより、残差信号のパワーの変
化をより効率よく符号化でき、フレーム内での高調波成
分と残差信号成分の割合やを細かく制御することによ
り、音の立ち上がり部分などの音質を向上させることが
でき、同時にそのゲイン情報をもとに高調波振幅とスペ
クトル残差のビット割り当てを行うことにより、ビット
割り当て情報を伝送することなく、高調波振幅と残差信
号に適当なビット割り当てを行うことができ、より品質
の良い合成音声が得られる。
【0076】なお、上記各実施の形態における音声符号
化・復号化装置は、はプログラムによって実現し、これ
をROM、RAMフロッピーディスク、光ディスク、IC
カードなど、プログラムを記載できる記録媒体に記録
し、それを転送することにより、携帯電話機などで容易
に実施することができる。
化・復号化装置は、はプログラムによって実現し、これ
をROM、RAMフロッピーディスク、光ディスク、IC
カードなど、プログラムを記載できる記録媒体に記録
し、それを転送することにより、携帯電話機などで容易
に実施することができる。
【0077】
【発明の効果】以上のように本発明は、符号化装置に、
高調波振幅とピッチ周波数と有声無声判定からスペクト
ル包絡と高調波スペクトルを算出する高調波スペクトル
合成手段と、音声スペクトルと高調波スペクトルからス
ペクトル残差を求めるスペクトル残差算出手段と、スペ
クトル残差を平滑化し符号化するスペクトル残差符号化
手段を設け、復号化装置に、スペクトル包絡と高調波合
成スペクトルを算出する高調波スペクトル合成手段と、
スペクトル残差符号とスペクトル包絡からスペクトル残
差を求め出力するスペクトル残差復号化手段を設けるこ
とにより、有声と判定された帯域を正弦波とその残差で
モデル化し符号化・復号化することで、より自然な合成
音声を得ることができる優れた音声符号化・復号化装置
を実現できるものである。
高調波振幅とピッチ周波数と有声無声判定からスペクト
ル包絡と高調波スペクトルを算出する高調波スペクトル
合成手段と、音声スペクトルと高調波スペクトルからス
ペクトル残差を求めるスペクトル残差算出手段と、スペ
クトル残差を平滑化し符号化するスペクトル残差符号化
手段を設け、復号化装置に、スペクトル包絡と高調波合
成スペクトルを算出する高調波スペクトル合成手段と、
スペクトル残差符号とスペクトル包絡からスペクトル残
差を求め出力するスペクトル残差復号化手段を設けるこ
とにより、有声と判定された帯域を正弦波とその残差で
モデル化し符号化・復号化することで、より自然な合成
音声を得ることができる優れた音声符号化・復号化装置
を実現できるものである。
【0078】また、本発明によれば、符号化装置に、ス
ペクトル残差を時間領域の残差信号に変換する時間波形
算出手段と、残差信号を平滑化し符号化する残差符号化
手段を設け、復号化装置に、残差符号を復号化しスペク
トル包絡を乗じて残差信号を求める残差復号化手段を設
けることにより、高調波によってモデル化できないスペ
クトル残差を時間領域で符号化することで、周波数領域
で符号化する場合と比較して、残差信号のパワーの変化
などをより効率よく符号化でき、音の立ち上がり部分な
どの過渡部分の音質を向上させることができる優れた音
声符号化・復号化装置を実現できるものである。
ペクトル残差を時間領域の残差信号に変換する時間波形
算出手段と、残差信号を平滑化し符号化する残差符号化
手段を設け、復号化装置に、残差符号を復号化しスペク
トル包絡を乗じて残差信号を求める残差復号化手段を設
けることにより、高調波によってモデル化できないスペ
クトル残差を時間領域で符号化することで、周波数領域
で符号化する場合と比較して、残差信号のパワーの変化
などをより効率よく符号化でき、音の立ち上がり部分な
どの過渡部分の音質を向上させることができる優れた音
声符号化・復号化装置を実現できるものである。
【0079】また、本発明によれば、符号化装置に、高
調波スペクトルと残差スペクトルのゲインを求め出力す
るゲイン算出手段と、ゲインを符号化するゲイン符号化
手段と、スペクトル残差を平滑化し正規化して符号化す
るスペクトル残差符号化手段を設け、復号化装置に、ゲ
イン符号を復号化するゲイン復号化手段と、スペクトル
残差符号を復号化し、スペクトル包絡およびゲインを乗
じてスペクトル残差を求めるスペクトル残差復号化手段
を設けることにより、従来各高調波の近傍における正弦
波成分と残差成分の比をしきい値により有声あるいは無
声という2値で表現していたものを、一般化したゲイン
情報として符号化することで、より自由度の高いモデル
で符号化でき、品質の良い合成音声が得られる優れた音
声符号化・復号化装置を実現できるものである。
調波スペクトルと残差スペクトルのゲインを求め出力す
るゲイン算出手段と、ゲインを符号化するゲイン符号化
手段と、スペクトル残差を平滑化し正規化して符号化す
るスペクトル残差符号化手段を設け、復号化装置に、ゲ
イン符号を復号化するゲイン復号化手段と、スペクトル
残差符号を復号化し、スペクトル包絡およびゲインを乗
じてスペクトル残差を求めるスペクトル残差復号化手段
を設けることにより、従来各高調波の近傍における正弦
波成分と残差成分の比をしきい値により有声あるいは無
声という2値で表現していたものを、一般化したゲイン
情報として符号化することで、より自由度の高いモデル
で符号化でき、品質の良い合成音声が得られる優れた音
声符号化・復号化装置を実現できるものである。
【0080】また、本発明によれば、符号化装置に、残
差信号と高調波スペクトルからゲインを算出するゲイン
算出手段と、ゲインを符号化するゲイン符号化手段と、
残差信号を平滑化し正規化して符号化する残差符号化手
段を設け、復号化装置に、ゲイン符号を復号化するゲイ
ン復号化手段と、残差符号を復号化し、ゲインとスペク
トル包絡を乗ずる残差復号化手段を設けることにより、
高調波によってモデル化できないスペクトル残差を時間
領域で符号化することで、残差信号のパワーの変化をよ
り効率よく符号化できると同時に、フレーム内での高調
波成分と残差信号成分の割合を細かく制御でき、音の立
ち上がり部分など過渡部分の音質を向上させることがで
きる優れた音声符号化・復号化装置を実現できるもので
ある。
差信号と高調波スペクトルからゲインを算出するゲイン
算出手段と、ゲインを符号化するゲイン符号化手段と、
残差信号を平滑化し正規化して符号化する残差符号化手
段を設け、復号化装置に、ゲイン符号を復号化するゲイ
ン復号化手段と、残差符号を復号化し、ゲインとスペク
トル包絡を乗ずる残差復号化手段を設けることにより、
高調波によってモデル化できないスペクトル残差を時間
領域で符号化することで、残差信号のパワーの変化をよ
り効率よく符号化できると同時に、フレーム内での高調
波成分と残差信号成分の割合を細かく制御でき、音の立
ち上がり部分など過渡部分の音質を向上させることがで
きる優れた音声符号化・復号化装置を実現できるもので
ある。
【0081】また、本発明によれば、符号化装置に、ス
ペクトル包絡から推定した高調波振幅とスペクトル残差
からゲインを算出し、さらにそのゲインとスペクトル包
絡を用いて高調波補正振幅とスペクトル残差を符号化す
る割り当てビット数を算出するゲイン算出手段と、高調
波振幅とスペクトル包絡の差である高調波補正振幅を求
め割り当てられたビット数で高調波補正振幅を符号化す
る高調波補正振幅符号化手段と、スペクトル包絡でスペ
クトル残差を平滑化し、さらにゲインで正規化して割り
当てられたビット数で符号化するスペクトル残差符号化
手段を設け、復号化装置に、復号化したゲインとスペク
トル包絡を用いて割り当てビット数を求めるゲイン復号
化手段と、割り当てられたビット数で高調波補正振幅を
復号化し、スペクトル包絡を加えることにより高調波振
幅を求める高調波振幅復号化手段と、割り当てられたビ
ット数でスペクトル残差符号を復号化し、ゲインとスペ
クトル包絡を乗じるスペクトル残差復号化手段を設ける
ことにより、各高調波の近傍における正弦波成分と残差
成分の比を一般化したゲイン情報として符号化すること
で、より自由度の高いモデルで符号化できるとともに、
そのゲイン情報をもとに高調波振幅とスペクトル残差の
ビット割り当てを行うことにより、ビット割り当て情報
を伝送することなく、高調波振幅とスペクトル残差に適
当なビット割り当てを行うことができ、より品質の良い
合成音声が得られる優れた音声符号化・復号化装置を実
現できるものである。
ペクトル包絡から推定した高調波振幅とスペクトル残差
からゲインを算出し、さらにそのゲインとスペクトル包
絡を用いて高調波補正振幅とスペクトル残差を符号化す
る割り当てビット数を算出するゲイン算出手段と、高調
波振幅とスペクトル包絡の差である高調波補正振幅を求
め割り当てられたビット数で高調波補正振幅を符号化す
る高調波補正振幅符号化手段と、スペクトル包絡でスペ
クトル残差を平滑化し、さらにゲインで正規化して割り
当てられたビット数で符号化するスペクトル残差符号化
手段を設け、復号化装置に、復号化したゲインとスペク
トル包絡を用いて割り当てビット数を求めるゲイン復号
化手段と、割り当てられたビット数で高調波補正振幅を
復号化し、スペクトル包絡を加えることにより高調波振
幅を求める高調波振幅復号化手段と、割り当てられたビ
ット数でスペクトル残差符号を復号化し、ゲインとスペ
クトル包絡を乗じるスペクトル残差復号化手段を設ける
ことにより、各高調波の近傍における正弦波成分と残差
成分の比を一般化したゲイン情報として符号化すること
で、より自由度の高いモデルで符号化できるとともに、
そのゲイン情報をもとに高調波振幅とスペクトル残差の
ビット割り当てを行うことにより、ビット割り当て情報
を伝送することなく、高調波振幅とスペクトル残差に適
当なビット割り当てを行うことができ、より品質の良い
合成音声が得られる優れた音声符号化・復号化装置を実
現できるものである。
【0082】また、本発明によれば、符号化装置に、ス
ペクトル包絡から推定した高調波振幅と残差信号からゲ
インを算出し、さらにそのゲインを用いて高調波振幅と
残差信号を符号化する割り当てビット数を算出するゲイ
ン算出手段と、高調波振幅とスペクトル包絡の差である
高調波補正振幅を求め、割り当てられたビット数で高調
波補正振幅を符号化する高調波補正振幅符号化手段と、
残差信号をスペクトル包絡で平滑化し、さらにゲインで
正規化して割り当てられたビット数で符号化する残差符
号化手段を設け、復号化装置に、復号化したゲイン符号
とスペクトル包絡を用いて割り当てビット数を求めるゲ
イン復号化手段と、割り当てられたビット数で高調波補
正振幅を復号化し、スペクトル包絡を加えることにより
高調波振幅を求める高調波振幅復号化手段と、割り当て
られたビット数で残差符号を復号化し、ゲインとスペク
トル包絡を乗じる残差復号化手段を設けることにより、
残差信号のパワーの変化をより効率よく符号化でき、フ
レーム内での高調波成分と残差信号成分の割合やを細か
く制御することにより、音の立ち上がり部分などの音質
を向上させることができ、同時にそのゲイン情報をもと
に高調波振幅とスペクトル残差のビット割り当てを行う
ことにより、ビット割り当て情報を伝送することなく、
高調波振幅と残差信号に適当なビット割り当てを行うこ
とができ、より品質の良い合成音声が得られる優れた音
声符号化・復号化装置を実現できるものである。
ペクトル包絡から推定した高調波振幅と残差信号からゲ
インを算出し、さらにそのゲインを用いて高調波振幅と
残差信号を符号化する割り当てビット数を算出するゲイ
ン算出手段と、高調波振幅とスペクトル包絡の差である
高調波補正振幅を求め、割り当てられたビット数で高調
波補正振幅を符号化する高調波補正振幅符号化手段と、
残差信号をスペクトル包絡で平滑化し、さらにゲインで
正規化して割り当てられたビット数で符号化する残差符
号化手段を設け、復号化装置に、復号化したゲイン符号
とスペクトル包絡を用いて割り当てビット数を求めるゲ
イン復号化手段と、割り当てられたビット数で高調波補
正振幅を復号化し、スペクトル包絡を加えることにより
高調波振幅を求める高調波振幅復号化手段と、割り当て
られたビット数で残差符号を復号化し、ゲインとスペク
トル包絡を乗じる残差復号化手段を設けることにより、
残差信号のパワーの変化をより効率よく符号化でき、フ
レーム内での高調波成分と残差信号成分の割合やを細か
く制御することにより、音の立ち上がり部分などの音質
を向上させることができ、同時にそのゲイン情報をもと
に高調波振幅とスペクトル残差のビット割り当てを行う
ことにより、ビット割り当て情報を伝送することなく、
高調波振幅と残差信号に適当なビット割り当てを行うこ
とができ、より品質の良い合成音声が得られる優れた音
声符号化・復号化装置を実現できるものである。
【図1】本発明の実施の形態1における音声符号化復号
化装置のブロック図
化装置のブロック図
【図2】本発明の実施の形態1における高調波スペクト
ル合成手順を説明するための周波数特性図
ル合成手順を説明するための周波数特性図
【図3】本発明の実施の形態1における音声モデル説明
のための音声スペクトルS(w)、高調波スペクトルS'
(w)、スペクトル残差R(w) を示す周波数特性図
のための音声スペクトルS(w)、高調波スペクトルS'
(w)、スペクトル残差R(w) を示す周波数特性図
【図4】本発明の実施の形態2における音声符号化・復
号化装置のブロック図
号化装置のブロック図
【図5】本発明の実施の形態3における音声符号化装置
・復号化のブロック図
・復号化のブロック図
【図6】本発明の実施の形態4における音声符号化装置
・復号化のブロック図
・復号化のブロック図
【図7】本発明の実施の形態5における音声符号化装置
・復号化のブロック図
・復号化のブロック図
【図8】本発明の実施の形態6における音声符号化装置
・復号化のブロック図
・復号化のブロック図
【図9】従来の音声符号化・復号化装置のブロック周波
数特性図
数特性図
【図10】従来の音声符号化・復号化装置における音声
モデル説明のための音声スペクトルS(w) 、高調波スペ
クトルS'(w)、スペクトル残差R(w) を示す周波数特性
図
モデル説明のための音声スペクトルS(w) 、高調波スペ
クトルS'(w)、スペクトル残差R(w) を示す周波数特性
図
1 バッファ 2 ピッチ周波数推定手段 3 ピッチ周波数符号化手段 4 スペクトル算出手段 5 高調波振幅推定手段 6 高調波振幅符号化手段 7 有声無声判定符号化手段 8 マルチプレクサ 10 符号化装置 11 デマルチプレクサ 12 ピッチ周波数復号化手段 13 高調波振幅復号化手段 14 有声無声判定復号化手段 15 出力音声合成手段 20 復号化装置 100 符号化装置 101 バッファ 102 ピッチ周波数推定手段 103 ピッチ周波数符号化手段 104 スペクトル算出手段 105 高調波振幅推定手段 106 高調波振幅符号化手段 107 有声無声判定符号化手段 108 高調波スペクトル合成手段 109 スペクトル残差算出手段 110 スペクトル残差符号化手段 111 マルチプレクサ 120 復号化装置 121 デマルチプレクサ 122 ピッチ周波数復号化手段 123 高調波振幅復号化手段 124 有声無声判定復号化手段 125 高調波スペクトル合成手段 126 スペクトル残差復号化手段 127 出力音声合成手段 130 符号化装置 131 時間波形算出手段 132 残差符号化手段133 マルチプレクサ 140 復号化装置 141 デマルチプレクサ 142 残差復号化手段 150 符号化装置 151 ゲイン算出手段 152 ゲイン符号化手段 153 スペクトル残差符号化手段 154 マルチプレクサ 160 復号化装置 161 デマルチプレクサ 162 ゲイン復号化手段 163 スペクトル残差復号化手段 170 符号化装置 171 ゲイン算出手段 172 ゲイン符号化手段 173 残差符号化手段 174 マルチプレクサ 180 復号化装置 181 デマルチプレクサ 182 ゲイン復号化手段 183 残差復号化手段 190 符号化装置 191 スペクトル包絡符号化手段 192 ゲイン算出手段 193 高調波補正振幅符号化手段 194 スペクトル残差符号化手段 195 マルチプレクサ 200 復号化手段 201 デマルチプレクサ 202 スペクトル包絡復号化手段 203 ゲイン復号化手段 204 高調波振幅復号化手段 205 スペクトル残差復号化手段 206 高調波スペクトル合成手段 210 符号化装置 211 スペクトル包絡符号化手段 212 ゲイン算出手段 213 高調波補正振幅符号化手段 214 残差符号化手段 215 マルチプレクサ 220 復号化手段 221 デマルチプレクサ 222 スペクトル包絡復号化手段 223 ゲイン復号化手段 224 高調波振幅復号化手段 225 残差復号化手段 226 高調波スペクトル合成手段
Claims (6)
- 【請求項1】 符号化装置が、入力音声信号をフレーム
ごとに切り出すバッファと、ピッチ周波数を推定するピ
ッチ周波数推定手段と、推定されたピッチ周波数を符号
化するピッチ周波数符号化手段と、音声信号のスペクト
ルを求めるスペクトル算出手段と、高調波の振幅と高調
波の有声無声判定を求める高調波振幅推定手段と、高調
波振幅を符号化する高調波振幅符号化手段と、有声無声
判定を符号化する有声無声判定符号化手段と、高調波に
よる合成スペクトルとスペクトル包絡を求める高調波ス
ペクトル合成手段と、入力音声と高調波合成音声のスペ
クトルの残差を求めるスペクトル残差算出手段と、スペ
クトル残差を平滑化して符号化するスペクトル残差符号
化手段と、各符号をまとめて多重化するマルチプレクサ
とを備え、復号化装置が、多重化された符号を各符号に
分解するデマルチプレクサと、ピッチ周波数符号を復号
化するピッチ周波数復号化手段と、高調波振幅符号を復
号化する高調波振幅復号化手段と、有声無声判定符号を
復号化する有声無声復号化手段と、高調波スペクトルを
合成しスペクトル包絡を求める高調波スペクトル合成手
段と、スペクトル残差符号を復号化しスペクトル包絡を
用いてスペクトル残差を求めるスペクトル残差復号化手
段と、出力音声を合成する出力音声合成手段とを備えた
音声符号化・復号化装置。 - 【請求項2】 符号化装置が、入力音声信号をフレーム
ごとに切り出すバッファと、ピッチ周波数を推定するピ
ッチ周波数推定手段と、推定されたピッチ周波数を符号
化するピッチ周波数符号化手段と、音声信号のスペクト
ルを求めるスペクトル算出手段と、高調波の振幅と高調
波の有声無声判定を求める高調波振幅推定手段と、高調
波振幅を符号化する高調波振幅符号化手段と、有声無声
判定を符号化する有声無声判定符号化手段と、高調波に
よる合成スペクトルとスペクトル包絡を求める高調波ス
ペクトル合成手段と、入力音声と高調波合成音声のスペ
クトルの残差を求めるスペクトル残差算出手段と、スペ
クトル残差を時間信号に変換する時間波形算出手段と、
残差信号を平滑化して符号化する残差符号化手段と、各
符号をまとめて多重化するマルチプレクサとを備え、復
号化装置が、多重化された符号を各符号に分解するデマ
ルチプレクサと、ピッチ周波数符号を復号化するピッチ
周波数復号化手段と、高調波振幅符号を復号化する高調
波振幅復号化手段と、有声無声判定符号を復号化する有
声無声復号化手段と、高調波スペクトルを合成しスペク
トル包絡を求める高調波スペクトル合成手段と、残差符
号を復号化しスペクトル包絡を用いて残差信号を求める
残差復号化手段と、出力音声を合成する出力音声合成手
段とを備えた音声符号化・復号化装置。 - 【請求項3】 符号化装置が、入力音声信号をフレーム
ごとに切り出すバッファと、ピッチ周波数を推定するピ
ッチ周波数推定手段と、推定されたピッチ周波数を符号
化するピッチ周波数符号化手段と、音声信号のスペクト
ルを求めるスペクトル算出手段と、高調波の振幅と高調
波の有声無声判定を求める高調波振幅推定手段と、高調
波振幅を符号化する高調波振幅符号化手段と、高調波に
よる合成スペクトルとスペクトル包絡を求める高調波ス
ペクトル合成手段と、入力音声と高調波合成音声のスペ
クトルの残差を求めるスペクトル残差算出手段と、各高
調波ごとの高調波スペクトルとスペクトル残差のゲイン
を出力するゲイン算出手段と、ゲインを符号化するゲイ
ン符号化手段と、残差スペクトルを平滑化し正規化して
符号化するスペクトル残差符号化手段と、各符号をまと
めて多重化するマルチプレクサとを備え、復号化装置
が、多重化された符号を各符号に分解するデマルチプレ
クサと、ピッチ周波数符号を復号化するピッチ周波数復
号化手段と、高調波振幅符号を復号化する高調波振幅復
号化手段と、ゲインを復号化するゲイン復号化手段と、
高調波スペクトルを合成しスペクトル包絡を求める高調
波スペクトル合成手段と、スペクトル残差符号を復号化
しスペクトル包絡とゲインを用いてスペクトル残差を求
めるスペクトル残差復号化手段と、出力音声を合成する
出力音声合成手段とを備えた音声符号化・復号化装置。 - 【請求項4】 符号化装置が、入力音声信号をフレーム
ごとに切り出すバッファと、ピッチ周波数を推定するピ
ッチ周波数推定手段と、推定されたピッチ周波数を符号
化するピッチ周波数符号化手段と、音声信号のスペクト
ルを求めるスペクトル算出手段と、高調波の振幅と高調
波の有声無声判定を求める高調波振幅推定手段と、高調
波振幅を符号化する高調波振幅符号化手段と、高調波に
よる合成スペクトルとスペクトル包絡を求める高調波ス
ペクトル合成手段と、入力音声と高調波合成音声のスペ
クトルの残差を求めるスペクトル残差算出手段と、スペ
クトル残差を時間信号に変換する時間波形算出手段と、
フレームをM個に分割したサブフレームごとに高調波ス
ペクトルと残差信号のゲインを求めるゲイン算出手段
と、ゲインを符号化するゲイン符号化手段と、残差信号
を平滑化し正規化して符号化する残差符号化手段と、各
符号をまとめて多重化するマルチプレクサとを備え、復
号化装置が、多重化された符号を各符号に分解するデマ
ルチプレクサと、ピッチ周波数を復号化するピッチ周波
数復号化手段と、高調波振幅符号を復号化する高調波振
幅復号化手段と、ゲイン符号を復号化するゲイン復号化
手段と、高調波スペクトルを合成しスペクトル包絡を求
める高調波スペクトル合成手段と、残差符号を復号化し
スペクトル包絡とゲインを用いて残差信号を求める残差
復号化手段と、出力音声を合成する出力音声合成手段と
を備えた音声符号化・復号化装置。 - 【請求項5】 符号化装置が、入力音声信号をフレーム
ごとに切り出すバッファと、ピッチ周波数を推定するピ
ッチ周波数推定手段と、推定されたピッチ周波数を符号
化するピッチ周波数符号化手段と、音声信号のスペクト
ルを求めるスペクトル算出手段と、高調波の振幅と高調
波の有声無声判定を求める高調波振幅推定手段と、高調
波による合成スペクトルとスペクトル包絡を求める高調
波スペクトル合成手段と、入力音声と高調波合成音声の
スペクトルの残差を求めるスペクトル残差算出手段と、
スペクトル包絡を符号化するスペクトル包絡符号化手段
と、スペクトル包絡と残差スペクトルより各高調波のゲ
インを求めそれをもとに高調波補正振幅とスペクトル残
差を符号化するためのビットを割り当てるゲイン算出手
段と、ゲインを符号化するゲイン符号化手段と、高調波
振幅とスペクトル包絡から高調波補正振幅を求め、求め
られたビット数で符号化する高調波補正振幅符号化手段
と、スペクトル残差を平滑化し正規化して求められたビ
ット数で符号化する残差スペクトル符号化手段と、各符
号をまとめて多重化するマルチプレクサとを備え、復号
化装置が、多重化された符号を各符号に分解するデマル
チプレクサと、ピッチ周波数符号を復号化するピッチ周
波数復号化手段と、スペクトル包絡符号を復号化するス
ペクトル包絡復号化手段と、ゲイン符号を復号化しスペ
クトル包絡を用いて高調波補正振幅およびスペクトル残
差の割り当てビット数を求めるゲイン復号化手段と、割
り当てられたビット数で高調波補正振幅符号を復号化し
スペクトル包絡を用いて高調波振幅を求める高調波振幅
復号化手段と、高調波スペクトルを合成する高調波スペ
クトル合成手段と、割り当てられたビット数でスペクト
ル残差符号を復号化しスペクトル包絡とゲインを用いて
スペクトル残差を求めるスペクトル残差復号化手段と、
出力音声を合成する出力音声合成手段とを備えた音声符
号化・復号化装置。 - 【請求項6】 符号化装置が、入力音声信号をフレーム
ごとに切り出すバッファと、ピッチ周波数を推定するピ
ッチ周波数推定手段と、推定されたピッチ周波数を符号
化するピッチ周波数符号化手段と、音声信号のスペクト
ルを求めるスペクトル算出手段と、高調波の振幅と高調
波の有声無声判定を求める高調波振幅推定手段と、高調
波による合成スペクトルとスペクトル包絡を求める高調
波スペクトル合成手段と、入力音声と高調波合成音声の
スペクトルの残差を求めるスペクトル残差算出手段と、
スペクトル残差を時間信号に変換する時間波形算出手段
と、スペクトル包絡を符号化するスペクトル包絡符号化
手段と、スペクトル包絡とフレームをM個に分割したサ
ブフレームごとの残差信号とのゲインを求め、それをも
とに高調波補正振幅と各サブフレームの残差信号に割り
当てるビット数を求めるゲイン算出手段と、ゲインを符
号化するゲイン符号化手段と、高調波振幅とスペクトル
包絡から高調波補正振幅を求め、求められたビット数で
符号化する高調波補正振幅符号化手段と、残差信号を平
滑化し正規化して求められたビット数で符号化する残差
符号化手段と、各符号をまとめて多重化するマルチプレ
クサとを備え、復号化装置が、多重化された符号を各符
号に分解するデマルチプレクサと、ピッチ周波数符号を
復号化するピッチ周波数復号化手段と、スペクトル包絡
符号を復号化するスペクトル包絡復号化手段と、ゲイン
符号を復号化しスペクトル包絡を用いて高調波補正振幅
およびスペクトル残差の割り当てビット数を求めるゲイ
ン復号化手段と、割り当てられたビット数で高調波補正
振幅符号を復号化しスペクトル包絡を用いて高調波振幅
を求める高調波振幅復号化手段と、高調波スペクトルを
合成する高調波スペクトル合成手段と、割り当てられた
ビット数で残差符号を復号化しスペクトル包絡とゲイン
を用いて残差信号を求める残差復号化手段と、出力音声
を合成する出力音声合成手段とを備えた音声符号化・復
号化装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8172650A JPH1020888A (ja) | 1996-07-02 | 1996-07-02 | 音声符号化・復号化装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8172650A JPH1020888A (ja) | 1996-07-02 | 1996-07-02 | 音声符号化・復号化装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1020888A true JPH1020888A (ja) | 1998-01-23 |
Family
ID=15945830
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8172650A Pending JPH1020888A (ja) | 1996-07-02 | 1996-07-02 | 音声符号化・復号化装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH1020888A (ja) |
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007041593A (ja) * | 2005-08-01 | 2007-02-15 | Samsung Electronics Co Ltd | 音声信号のハーモニック成分を用いた有声音/無声音分離情報を抽出する方法及び装置 |
| JP2008502022A (ja) * | 2004-06-08 | 2008-01-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化 |
| US7366661B2 (en) | 2000-12-14 | 2008-04-29 | Sony Corporation | Information extracting device |
| JP2008519991A (ja) * | 2004-11-09 | 2008-06-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声の符号化及び復号化 |
| JP2014206769A (ja) * | 2009-10-07 | 2014-10-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
| US9208795B2 (en) | 2009-10-07 | 2015-12-08 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
| US9390717B2 (en) | 2011-08-24 | 2016-07-12 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US9406312B2 (en) | 2010-04-13 | 2016-08-02 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9583112B2 (en) | 2010-04-13 | 2017-02-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9659573B2 (en) | 2010-04-13 | 2017-05-23 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9767824B2 (en) | 2010-10-15 | 2017-09-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US10692511B2 (en) | 2013-12-27 | 2020-06-23 | Sony Corporation | Decoding apparatus and method, and program |
-
1996
- 1996-07-02 JP JP8172650A patent/JPH1020888A/ja active Pending
Cited By (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7366661B2 (en) | 2000-12-14 | 2008-04-29 | Sony Corporation | Information extracting device |
| JP2008502022A (ja) * | 2004-06-08 | 2008-01-24 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化 |
| JP2008519991A (ja) * | 2004-11-09 | 2008-06-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声の符号化及び復号化 |
| JP2007041593A (ja) * | 2005-08-01 | 2007-02-15 | Samsung Electronics Co Ltd | 音声信号のハーモニック成分を用いた有声音/無声音分離情報を抽出する方法及び装置 |
| US7778825B2 (en) | 2005-08-01 | 2010-08-17 | Samsung Electronics Co., Ltd | Method and apparatus for extracting voiced/unvoiced classification information using harmonic component of voice signal |
| JP2014206769A (ja) * | 2009-10-07 | 2014-10-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
| US9208795B2 (en) | 2009-10-07 | 2015-12-08 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
| US9691410B2 (en) | 2009-10-07 | 2017-06-27 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
| US9659573B2 (en) | 2010-04-13 | 2017-05-23 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US10381018B2 (en) | 2010-04-13 | 2019-08-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9406312B2 (en) | 2010-04-13 | 2016-08-02 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9679580B2 (en) | 2010-04-13 | 2017-06-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US10546594B2 (en) | 2010-04-13 | 2020-01-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9583112B2 (en) | 2010-04-13 | 2017-02-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US10297270B2 (en) | 2010-04-13 | 2019-05-21 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US10224054B2 (en) | 2010-04-13 | 2019-03-05 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US10236015B2 (en) | 2010-10-15 | 2019-03-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US9767824B2 (en) | 2010-10-15 | 2017-09-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US9390717B2 (en) | 2011-08-24 | 2016-07-12 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US10692511B2 (en) | 2013-12-27 | 2020-06-23 | Sony Corporation | Decoding apparatus and method, and program |
| US11705140B2 (en) | 2013-12-27 | 2023-07-18 | Sony Corporation | Decoding apparatus and method, and program |
| US12183353B2 (en) | 2013-12-27 | 2024-12-31 | Sony Group Corporation | Decoding apparatus and method, and program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3881943B2 (ja) | 音響符号化装置及び音響符号化方法 | |
| US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
| JP5753540B2 (ja) | ステレオ信号符号化装置、ステレオ信号復号装置、ステレオ信号符号化方法及びステレオ信号復号方法 | |
| CN1271597C (zh) | 对声源信号进行编码/解码的方法和装置 | |
| JP3881946B2 (ja) | 音響符号化装置及び音響符号化方法 | |
| US20090204397A1 (en) | Linear predictive coding of an audio signal | |
| US20100174532A1 (en) | Speech encoding | |
| CN1957399B (zh) | 语音/音频解码装置以及语音/音频解码方法 | |
| US20100010810A1 (en) | Post filter and filtering method | |
| KR101376099B1 (ko) | 적응적 고주파수 대역 복호화 방법 및 장치 | |
| KR20120082435A (ko) | 멀티 모드 오디오 코덱 및 이를 위해 적응된 celp 코딩 | |
| JPWO2009057327A1 (ja) | 符号化装置および復号装置 | |
| JP2003323198A (ja) | 符号化方法及び装置、復号方法及び装置、並びにプログラム及び記録媒体 | |
| CN101131820A (zh) | 编码设备、解码设备、编码方法和解码方法 | |
| JPH1020888A (ja) | 音声符号化・復号化装置 | |
| JP4603485B2 (ja) | 音声・楽音符号化装置及び音声・楽音符号化方法 | |
| Almeida et al. | Harmonic coding: A low bit-rate, good-quality speech coding technique | |
| JP4245288B2 (ja) | 音声符号化装置および音声復号化装置 | |
| US6934650B2 (en) | Noise signal analysis apparatus, noise signal synthesis apparatus, noise signal analysis method and noise signal synthesis method | |
| JPH05173599A (ja) | 音声符号復号化装置 | |
| JPH09261064A (ja) | 符号器及び復号器 | |
| JP2001500284A (ja) | 改良した調波音声符号器を備えた送信機 | |
| US8719012B2 (en) | Methods and apparatus for coding digital audio signals using a filtered quantizing noise | |
| WO2004097798A1 (ja) | 音声復号化装置、音声復号化方法、プログラム、記録媒体 | |
| JP3092653B2 (ja) | 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置 |