JP2798003B2 - 音声帯域拡大装置および音声帯域拡大方法 - Google Patents
音声帯域拡大装置および音声帯域拡大方法Info
- Publication number
- JP2798003B2 JP2798003B2 JP7110425A JP11042595A JP2798003B2 JP 2798003 B2 JP2798003 B2 JP 2798003B2 JP 7110425 A JP7110425 A JP 7110425A JP 11042595 A JP11042595 A JP 11042595A JP 2798003 B2 JP2798003 B2 JP 2798003B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- output
- buffer
- linear prediction
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
得られる環境下において、狭帯域音声信号から広帯域な
音声信号へと帯域を拡大する装置および方法に関する。
て、音声信号のディジタル化が急速に進んでおり、ディ
ジタル信号処理技術を用いた音声信号の加工には多くの
手法が提案されている。
帯域拡大方法について説明する。従来の音声帯域拡大方
法においては、例えば、信学技法SP93-61(19
93-08)にあるように、分析合成技術とベクトル量
子化の手法を用いた手法が提案されている。
な装置の構成図である。図5において、201はLPC
分析部、202はベクトル量子化部、203はディコー
ディング部、204は狭帯域コードブック、205は広
帯域コードブック、206は低域復元部、207は第一
の高域復元部、208は第二の高域復元部、209は加
算部、210はアップサンプリング部である。
について、以下その動作について説明する。
分析部201で線形予測分析され、スペクトル包絡情
報、パワー情報、およびピッチ情報に分離される。抽出
されたスペクトル包絡情報はベクトル量子化部202に
て、狭帯域コードブック204を参照してベクトル量子
化される。ベクトル量子化部202の出力をもとにディ
コーディング部203では、広帯域コードブック205
を参照し、広帯域なスペクトル包絡情報を推定する。L
PC分析部201で得られたパワー情報、ピッチ情報
と、ディコーディング部203で得られた広帯域なスペ
クトル包絡情報とから、低域復元部206では300H
z以下の低域周波数成分を生成する。また、LPC分析
部201で得られたパワー情報、ピッチ情報と、ディコ
ーディング部203で得られたスペクトル包絡情報とか
ら、第一の高域復元部207では3400Hz以上の高
域周波数成分を生成する。狭帯域音声信号をアップサン
プリングするアップサンプリング部210の出力と、低
域復元部206と高域復元部207の出力とを加算部2
09で加算し、広帯域音声信号を得る。
7の代わりに第二の高域復元部208を用いる音声帯域
拡大方法も提案されている。第二の高域復元部208で
は、LPC分析部201で得られたパワー情報、ピッチ
情報と、ベクトル量子化部202の出力とをもとに、波
形素片の方法を用いて3400Hz以上の高域成分を生
成する。それ以外の構成は第一の高域復元部207を用
いる方法と同様であり、狭帯域音声信号をアップサンプ
リングするアップサンプリング部210の出力と、低域
復元部206と高域復元部208の出力とを加算部20
9で加算し、広帯域音声信号を得るものである。
従来の構成では、スペクトル包絡情報の拡大を高精度に
行うには多数のコードブックが必要になるという問題が
ある。さらには、上記の従来の構成は、狭帯域音声信号
からピッチ情報を抽出し、それをパラメータとして直接
的に合成音源を作成する方法であるため、ピッチ推定誤
りによる音質の劣化が生じるという問題や、波形素片の
方法を用いた手法では素片データのコードブックを別途
持つ必要があるという問題を有していた。
であり、スペクトル包絡情報の拡大は、線形写像関数を
用いるなどして広帯域化し広帯域スペクトル包絡を得
て、合成音源は音源を複数のパルス列で表現し、欠落し
た帯域を補間するようなパルス列を付加すること、さら
に、パルスを強調することで生じる歪み成分を用いて広
帯域化し、前記広帯域スペクトル包絡と前記合成音源を
用いて合成することにより広帯域な音声帯域拡大を図る
ことを目的とするものである。
に、本発明の音声帯域拡大装置は、入力信号を一定量蓄
えておくバッファと、前記バッファに蓄えられた信号列
に対して線形予測係数とPARCOR係数とのうち少な
くとも線形予測係数を計算する分析部と、前記分析部に
て得られる線形予測係数からインパルス応答を計算する
インパルス応答計算部と、前記線形予測係数をパラメー
タとして前記バッファの出力と第1の音声合成部の出力
との差信号列に対し人間の聴覚特性を模擬する重みづけ
を行なう聴覚重みづけフィルタ部と、前記聴覚重みづけ
フィルタ部の出力信号からピッチ周期を推定するピッチ
周期推定部と、前記ピッチ周期推定部からの出力値を参
照して、前記聴覚重みづけフィルタからの出力信号と前
記インパルス応答計算部の出力とを入力してパルス列を
発生させるパルス発生部と、前記パルス発生部から出力
されるパルス列と、前記線形予測係数とPARCOR係
数とのいずれかとを入力して音声信号を合成する前記第
1の音声合成部と、前記パルス発生部の出力に対して周
波数重みづけをおこなう周波数重みづけフィルタと、前
記周波数重みづけフィルタの出力値と、前記線形予測係
数とPARCOR係数とのいずれかとを入力して音声を
合成する第2の音声合成部とを具備する。
信号を一定量蓄えておくバッファと、前記バッファに蓄
えられた信号列に対して線形予測係数とPARCOR係
数とのうち少なくとも線形予測係数を計算する分析部
と、前記分析部にて得られる線形予測係数からインパル
ス応答を計算するインパルス応答計算部と、前記線形予
測係数もしくはPARCOR係数をもとに帯域の拡大さ
れた線形予測係数もしくはPARCOR係数を推定する
包絡拡大部と、前記線形予測係数をパラメータとして前
記バッファと第1の音声合成部との差信号列に対し人間
の聴覚特性を模擬する重みづけを行なう聴覚重みづけフ
ィルタ部と、前記聴覚重みづけフィルタ部の出力信号か
らピッチ周期を推定するピッチ周期推定部と、前記ピッ
チ周期推定部からの出力値を参照して、前記聴覚重みづ
けフィルタ部からの出力信号と前記インパルス応答計算
部の出力とを入力してパルス列を発生させるパルス発生
部と、前記パルス発生部から出力されるパルス列と、前
記線形予測係数とPARCOR係数とのいずれかとを入
力して音声信号を合成する前記第1の音声合成部と、前
記パルス発生部の出力に対して周波数重みづけをおこな
う周波数重みづけフィルタと、前記周波数重みづけフィ
ルタの出力値と、前記包絡拡大部からの出力値とを入力
して音声を合成する第2の音声合成部とを具備する。
みづけフィルタからの出力信号に対して周波数重みづけ
を行なう周波数重みづけフィルタを有し、かつ欠落して
いる帯域を復元するパルス列を発生する機能を有するよ
うにしてもよい。
の検出値を特徴量として、ピッチ周期間隔にあるパルス
の振幅を大きくすることによりパルスを強調する機能を
有するようにしてもよい。
部の検出値を特徴量として、ある閾値を用いて、前記閾
値に設定されたパルスを出力する機能を有するようにし
てもよい。
入力して、広帯域なスペクトル包絡の特徴を有するスペ
クトル包絡に対する特徴量を、線形写像関数を用いて広
帯域化する機能を有するようにしてもよい。
信号をバッファに一定量蓄えておき、前記バッファに蓄
えられた信号列に対してスペクトル包絡に関する特徴量
を抽出し、前記抽出された特徴量と前記バッファに蓄え
られた信号列とから推定された音源パルス列に対して、
信号の持つ周波数特性についての事前情報と推定された
ピッチ情報とから広帯域な音源パルス列を発生し、前記
スペクトル包絡に関する特徴量と前記広帯域な音源パル
ス列とを用いて音声を合成するものである。
力信号をバッファに一定量蓄えておき、前記バッファに
蓄えられた信号列に対してスペクトル包絡に関する特徴
量を抽出し、前記特徴量の表現する包絡情報に欠落して
いる包絡情報を補間し、前記特徴量と前記バッファに蓄
えられた信号列とから推定された音源パルス列に対し
て、信号の持つ周波数特性についての事前情報と推定さ
れたピッチ情報とから広帯域な音源パルス列を発生し、
前記スペクトル包絡に関する特徴量と前記広帯域な音源
パルス列とを用いて音声を合成するものである。
バッファに蓄え、バッファ中の信号に対して、スペクト
ル包絡に関するPARCOR係数や線形予測係数等の特
徴量をPARCOR分析部で抽出する。また、バッファ
中の信号とスペクトル包絡に関する特徴量とから合成音
源を複数のパルス列で表現する。そのパルス列を決定し
て生成する際には、入力信号に無い帯域を、予め推定し
ておいたピッチ周期を特徴量として、周期的に強調する
ことで生成することや、ピッチ周期に対する歪みを加え
ることや、クリッピングの歪みを用いること等によって
生成する。こうして生成されたパルス列を音源として、
PARCOR分析部から出力されるPARCOR係数ま
たは線形予測係数を用いて、音声合成を行なう。また、
スペクトル包絡情報は線形写像関数やベクトル量子化の
方法を用いて広帯域化し、前記音源を用いて音声合成も
可能である。このようにして合成された音声は、スペク
トルの微細構造を保持した音声で、かつ、欠落した帯域
を補間するように広帯域化され、高品質で明瞭な合成音
を提供することとなる。
する。図1は本発明の第1の実施例における音声帯域拡
大方法を適用可能な装置の全体構成を示すブロック図で
ある。
間蓄えておくバッファである。102は、バッファ10
1に蓄えられた入力信号列に対してスペクトル包絡に関
する線形予測係数やPARCOR係数などの特徴量を抽
出する分析部、103は前記線形予測係数からインパル
ス応答を計算するインパルス応答計算部である。
105からの出力信号をバッファ101の信号列から引
いたものに、周波数軸上で人間の聴覚的重みづけを行な
う聴覚重みづけフィルタ部104と、この聴覚重みづけ
フィルタ部104の出力からピッチ周期を推定するピッ
チ周期推定部106と、分析部102にて抽出された特
徴量をもとに、パルス位置とゲインを決定しパルス列を
発生するパルス発生部107と、パルス発生部107で
発生されたパルス列と前記線形予測係数とから合成音を
合成する第一の音声合成部105とから実現される。
ィルタ部104からの入力信号に対して誤差が最小にな
るようにパルス位置とゲインを決定し、ピッチ周期推定
部106で得られたピッチ周期をもとに発生するパルス
列に、低域強調等の歪みを付加する。低域強調の歪みと
しては、例えば、半波整流、全波整流、クリッピング、
べき乗の処理等が挙げられる。
7で決定されたパルス列を入力音源として、周波数的に
欠落した部分を強調し補間することを目的とした強調フ
ィルタ部108と、分析部102にて得られた線形予測
係数を特徴量として、音声を合成する第二の音声合成部
109とからなる。
て、図1のブロック図を参照しながら詳細に説明する。
散的に一定時間取り込むが、この一定時間間隔は、例え
ばサンプリング周波数が16kHzであるとして、240
点とし、この時間単位を以下「フレーム」と呼ぶことに
する。1フレーム毎に音声のスペクトル包絡に関するパ
ラメータを算出する処理が分析部102にて実行され
る。バッファ101に取り込まれた信号は、分析部10
2にて、時刻iにおける観測信号をy(i) とし、m次の
自己相関値をr(m) とすると、(数1)によってm次の
自己相関値が計算される。
もとにして、分析部102で分析を行なう。分析部10
2では、上記自己相関値からPARCOR係数もしくは
線形予測係数を回帰的に算出する。この算出方法につい
ては、公知技術を用いて容易に実現でき、例えば、音響
・音声工学、古井著 近代科学社pp.131-136 に記載され
ている。PARCOR係数を求めれば一意的に線形予測
係数が求まるし、線形予測係数を求めれば一意的にPA
RCOR係数が求まる。この際、分析の次数としては1
0次〜25次程度の値として計算する。インパルス応答
計算部103では、分析部102で算出された線形予測
係数をもとに、その線形予測係数値の系におけるインパ
ルス応答を、インパルスを入力として印加することで算
出する。
信号から、第一の音声合成部105で合成された信号を
差し引くことから計算が始まる。差し引かれた信号は、
いわば前の分析フレームの影響を取り除くことと同じ効
果を持ち、分析フレームにおける聴覚重みづけフィルタ
部104の入力信号となる。聴覚重みづけフィルタ部1
04は、(数2)の特性を持つディジタルフィルタをも
って構成される。
で、aiはi次の線形予測係数、ckは所望のフィルタ特
性を実現する為に与えられる定数(例えば0.8程
度)、zはz変換により生じる複素変数である。聴覚重
みづけフィルタ部104は、量子化誤差の影響をパワー
の大きいフォルマント周波数辺りに付加することで、聴
覚的にザラツキ感の少ない合成音を提供する効果を持
つ。なお(数2)において、c kは例えば0.8である
とき、フィルタとしての効果が大きくなる。ピッチ周期
推定部106では、長期予測フィルタを用いてピッチ周
期を推定する。ピッチ周期推定部106としては、長期
予測に対する相関値を算出することでピッチ周期を算出
する方法と、波形を加算することでピッチ周期を推定す
る方法が挙げられる。例えば、最小2乗予測誤差法(M
SPE法)を用いた方法等があげられる。
match(m) に最大値を与えるmをピッチ周期とすること
等によりピッチ周期を算出する。
ィルタ部104からの出力系列を入力として、(数4)
によって位置mk点におけるゲインgk(mk)を算出す
る。
おけるインパルス応答である。そして、(数5)のεk
を最小とする点mkがパルス位置と成るように、予め設
定したパルスの本数まで決定していく。
えば入力系列が16kHzサンプリングで80点の観測点
に対して8点程度のパルス設定が好ましい。
ている場合は、ピッチ周期推定部106の推定値を用い
て、(数5)で決定されたパルス列に対して、推定され
たピッチ周期にあるパルスを強調することで、パルス発
生部107の出力として、基本周波数成分を復元する。
方法としては、簡単には、ピッチ周期推定部106の推
定値を用いて、フレーム長とピッチ周期推定部106か
らの出力値との比から、1フレーム長に対して何ピッチ
周期があるかを計算し、1フレームに対して、上からそ
の本数の最大振幅のパルスを定数倍(>=1)し、出力
パルス列とする。
する。同図中のaはピッチ周期推定部106によって推
定された推定ピッチ周期間隔を模式に表現したもので、
bは(数5)によって算出された現在の推定フレームに
おける推定パルス列と、一つ前の分析時刻に決定された
パルス列とを、縦軸にゲインを横軸に時刻をとって表現
したもので、cは強調処理後の推定パルス列である。b
において、過去の推定フレームにおける強調されたパル
スのうち、最後の時刻に強調されたパルスからaで示し
た推定ピッチ間隔ごとに(数5)で決定されたパルスが
あるか無いかを観測し、該当するパルスがある場合は、
cに示すようにパルスを強調し、パルス発生部107の
出力とする。
を用いて、フレーム長とピッチ周期推定部106からの
出力値との比から、1フレーム長に対して何ピッチ周期
があるかを計算し、1フレームに対して、ピッチ周期に
相当する位置にあるパルスの組を探し、振幅の大きな組
からフレーム長とピッチ周期推定部106の出力値の比
から求まる、1フレームにあるべきピッチ数だけパルス
を定数倍(>=1)し、出力パルス列とする。第一の音
声合成部105では、パルス発生部107の出力パルス
列を入力し、分析部102から出力されるPARCOR
係数を特徴量として、PARCOR合成によって合成音
を得る。
生成されたパルス列を入力として、強調フィルタ部10
8によって、欠落した帯域をFIRフィルタ等で復元す
る。第二の音声合成部109では、強調フィルタ部10
8からの出力を入力し、分析部102からのPARCO
R係数を特徴量として、PARCOR合成によって得ら
れた合成音を出力する。このようにして各フレームごと
に音声を合成する。
置によれば、入力信号を一定時間蓄えておくバッファ1
01と、前記バッファに蓄えられた信号列に対して、ス
ペクトル包絡に関する特徴量を抽出する分析部102
と、前記分析部102からの特徴量を用いて、前記バッ
ファ101の信号に対する音源パルスを推定し、推定し
たピッチ周期を用いてピッチ周期に対応するパルスを強
調するパルス発生部107と、周波数の重みづけを行う
強調フィルタ部108とを備えたことにより、比較的簡
単な構成で、ピッチ強調の効果により、帯域の欠落した
音声信号から音声帯域を拡大できる音声帯域拡大装置を
提供することができる。
5および第二の音声合成部109では、分析部102か
ら出力されるPARCOR係数を特徴量として、PAR
COR合成によって合成音を得ているが、PARCOR
係数に代えて線形予測係数を用いて音声合成を行なって
もかまわない。
について説明する。
実施例(図1)と同様であるが、図1のパルス発生部1
07におけるパルス発生の方法が異なる。以下、このパ
ルス発生方法についてのみ説明し、その他の説明は省略
する。
と、インパルス応答計算部103からの出力から第1実
施例と同様の手法で推定パルス列を得た後、ピッチ周期
推定部106の推定値を用いて、1フレーム長に対して
何ピッチ周期があるかを計算し、1フレームに対して、
上からその本数の最大振幅のパルスを、ある閾値を用い
て、その閾値以上の推定パルスはその閾値の大きさのパ
ルスとすることにより、出力パルス列とする点のみが第
一の実施例と異なる。
置によれば、入力信号を一定時間蓄えておくバッファ1
01と、前記バッファに蓄えられた信号列に対して、ス
ペクトル包絡に関する特徴量を抽出する分析部102
と、前記分析部102からの特徴量を用いて、前記バッ
ファ101の信号に対する音源パルスを推定し、推定し
たピッチ周期を用いてピッチ周期に対応するパルスを、
ある閾値を用いて、その閾値以上の振幅であるパルスを
閾値に揃えることで、音源に歪みを生じせしめ、その歪
みにより低域強調に効果のあるパルス列を生成するパル
ス発生部107と、周波数の重みづけを行う強調フィル
タ部108とを備えたことにより、比較的簡単な構成
で、ピッチ周期に対する歪みの効果を利用して、帯域の
欠落した音声信号から音声帯域を拡大できる音声帯域拡
大装置を提供することができる。
5および第二の音声合成部109では、分析部102か
ら出力されるPARCOR係数を特徴量として、PAR
COR合成によって合成音を得ているが、PARCOR
係数に代えて線形予測係数を用いて音声合成を行なって
もかまわない。
について説明する。
示す。第1の実施例との相違点は、図2に示したように
包絡拡大部110を有する点、および、分析部102
が、スペクトル包絡に関する特徴量として線形予測係数
を算出する点であり、その他の構成・動作は図1にある
構成要素と同様であるので説明を省略する。
する線形予測係数の集まりであるコードブックを予め作
成しておき、分析部102より得られる線形予測係数を
入力として、ベクトル量子化の方法を用いて、広帯域な
特性を有する線形予測係数を、上記コードブック中から
選択し、これを包絡拡大部110の出力とし、第二の音
声合成部109の入力とすることで、合成された音源な
らびに拡大されたスペクトル包絡の特徴量から、広帯域
な音声を合成する。
置によれば、入力信号を一定時間蓄えておくバッファ1
01と、前記バッファに蓄えられた信号列に対して、ス
ペクトル包絡に関する特徴量を抽出する分析部102
と、前記分析部からの出力である特徴量から広帯域な特
性を有するスペクトル包絡に関する特徴量を推定する包
絡拡大部110と、前記分析部102からの特徴量を用
いて、前記バッファ101の信号に対する音源パルス列
を推定し、推定したピッチ周期を用いて欠落した帯域を
復元するパルス発生部107と、音源のパルス列に周波
数の重みづけを行う強調フィルタ部108を備えたこと
により、比較的簡単な構成で、帯域拡大されたスペクト
ル包絡と、帯域拡大された音源とから、帯域を拡大した
高音質で広帯域な合成音を作成することができる。
5および第二の音声合成部109では、線形予測係数を
特徴量として用い、合成音を得ているが、線形予測係数
に代えてPARCOR係数を用いて音声合成を行なって
もかまわない。
について説明する。
示す。第3の実施例との相違点は、包絡拡大部の構成で
あり、第1の実施例との相違点は、図2に示したように
包絡拡大部110を有する点、および、分析部102
が、スペクトル包絡に関する特徴量として線形予測係数
を算出する点であり、その他の構成・動作は図1にある
構成要素と同様であるので説明を省略する。
いて行う。図3は包絡拡大部110の内部ブロック図で
あり、同図において、301は狭帯域コードブック、3
02は線形写像関数部、303は重みつけ加算部であ
る。分析部102で得られた入力スペクトルは、狭帯域
コードブック301の各コードと(数6)で計算される
距離diを算出される。
クトル包絡情報で、Vijはコードブック301中のi番
目のコードにおけるj次のスペクトル包絡情報である。
また、入力スペクトルは、線形写像関数部302にて複
数の線形写像関数で広帯域なスペクトルに変換される。
線形写像関数部302からの出力は重みつけ加算部30
3で重みつけ加算され、変換スペクトルとして出力され
る。その際の重みは、
番目の線形写像関数の出力に対する重みである。線形写
像関数部302の各々の線形写像関数をAkとすると、
8)において、yjはj次の変換スペクトルであり、A
ijはi番目の線形写像関数のj次の関数値である。
110の出力とし、第二の音声合成部109の入力とす
ることにより、合成された音源ならびに拡大されたスペ
クトル包絡の特徴量から、広帯域な音声を合成する。
置によれば、入力信号を一定時間蓄えておくバッファ1
01と、前記バッファに蓄えられた信号列に対して、ス
ペクトル包絡に関する特徴量を抽出する分析部102
と、前記分析部からの出力である特徴量から広帯域な特
性を有するスペクトル包絡に関する特徴量を推定する包
絡拡大部110と、前記分析部102からの特徴量を用
いて、前記バッファ101の信号に対する音源パルス列
を推定し、推定したピッチ周期を用いて、欠落した帯域
を復元するパルス発生部107と、音源のパルス列に周
波数の重みづけを行う強調フィルタ部108を備えたこ
とにより、比較的簡単な構成で、高精度に帯域拡大され
たスペクトル包絡と、帯域拡大された音源とから、帯域
を拡大した高音質で広帯域な合成音を作成できる音声帯
域拡大装置を提供することができる。
5および第二の音声合成部109では、線形予測係数を
特徴量として用い、合成音を得ているが、線形予測係数
に代えてPARCOR係数を用いて音声合成を行なって
もかまわない。
号を一定時間蓄えておくバッファを有し、バッファ中の
音声信号からスペクトル包絡成分に関する特徴量を分析
部で抽出し、前記分析部からの出力とバッファ中の信号
とから、音源を複数のパルス列で表現し、ピッチ周期推
定部で推定したピッチ周期によってパルス列に強調等の
歪みによって重みづけし、音源であるパルス列を生成
し、合成時に周波数に対する重みづけのフィルタ処理を
さらに行い、スペクトル包絡の特徴量と音源パルス列と
から音声を合成することにより、比較的簡単な構成で、
原音の音源の特徴を大きく損なうことなく、狭帯域信号
にない帯域の信号の帯域拡大を実現することができる。
また包絡拡大部を用い、PARCOR分析で得られたス
ペクトル包絡情報を高精度に広帯域化する処理を付加す
ることによって、さらに、高明瞭で広帯域な合成音声を
生成する音声帯域拡大装置および音声帯域拡大方法を提
供することができる。
置の全体構成を示すブロック図
置の全体構成を示すブロック図
念図
示すブロック図
Claims (8)
- 【請求項1】入力信号を一定量蓄えておくバッファと、
前記バッファに蓄えられた信号列に対して線形予測係数
とPARCOR係数とのうち少なくとも線形予測係数を
計算する分析部と、前記分析部にて得られる線形予測係
数からインパルス応答を計算するインパルス応答計算部
と、前記線形予測係数をパラメータとして前記バッファ
の出力と第1の音声合成部の出力との差信号列に対し人
間の聴覚特性を模擬する重みづけを行なう聴覚重みづけ
フィルタ部と、前記聴覚重みづけフィルタ部の出力信号
からピッチ周期を推定するピッチ周期推定部と、前記ピ
ッチ周期推定部からの出力値を参照して、前記聴覚重み
づけフィルタからの出力信号と前記インパルス応答計算
部の出力とを入力してパルス列を発生させるパルス発生
部と、前記パルス発生部から出力されるパルス列と、前
記線形予測係数とPARCOR係数とのいずれかとを入
力して音声信号を合成する前記第1の音声合成部と、前
記パルス発生部の出力に対して周波数重みづけをおこな
う周波数重みづけフィルタと、前記周波数重みづけフィ
ルタの出力値と、前記線形予測係数とPARCOR係数
とのいずれかとを入力して音声を合成する第2の音声合
成部とを具備する音声帯域拡大装置。 - 【請求項2】入力信号を一定量蓄えておくバッファと、
前記バッファに蓄えられた信号列に対して線形予測係数
とPARCOR係数とのうち少なくとも線形予測係数を
計算する分析部と、前記分析部にて得られる線形予測係
数からインパルス応答を計算するインパルス応答計算部
と、前記線形予測係数もしくはPARCOR係数をもと
に帯域の拡大された線形予測係数もしくはPARCOR
係数を推定する包絡拡大部と、前記線形予測係数をパラ
メータとして前記バッファと第1の音声合成部との差信
号列に対し人間の聴覚特性を模擬する重みづけを行なう
聴覚重みづけフィルタ部と、前記聴覚重みづけフィルタ
部の出力信号からピッチ周期を推定するピッチ周期推定
部と、前記ピッチ周期推定部からの出力値を参照して、
前記聴覚重みづけフィルタ部からの出力信号と前記イン
パルス応答計算部の出力とを入力してパルス列を発生さ
せるパルス発生部と、前記パルス発生部から出力される
パルス列と、前記線形予測係数とPARCOR係数との
いずれかとを入力して音声信号を合成する前記第1の音
声合成部と、前記パルス発生部の出力に対して周波数重
みづけをおこなう周波数重みづけフィルタと、前記周波
数重みづけフィルタの出力値と、前記包絡拡大部からの
出力値とを入力して音声を合成する第2の音声合成部と
を具備する音声帯域拡大装置。 - 【請求項3】パルス発生部は、聴覚重みづけフィルタか
らの出力信号に対して周波数重みづけを行なう周波数重
みづけフィルタを有し、かつ欠落している帯域を復元す
るパルス列を発生する機能を有することを特徴とする請
求項1または2記載の音声帯域拡大装置。 - 【請求項4】パルス発生部は、ピッチ周期推定部の検出
値を特徴量として、ピッチ周期間隔にあるパルスの振幅
を大きくすることによりパルスを強調する機能を有する
ことを特徴とする請求項1または2記載の音声帯域拡大
装置。 - 【請求項5】パルス発生部は、ピッチ周期推定部の検出
値を特徴量として、ある閾値を用いて、前記閾値に設定
されたパルスを出力する機能を有することを特徴とする
請求項1または2記載の音声帯域拡大装置。 - 【請求項6】包絡拡大部は、分析部で得られた特徴量を
入力して、広帯域なスペクトル包絡の特徴を有するスペ
クトル包絡に対する特徴量を、線形写像関数を用いて広
帯域化する機能を有することを特徴とする請求項2記載
の音声帯域拡大装置。 - 【請求項7】入力信号をバッファに一定量蓄えておき、
前記バッファに蓄えられた信号列に対してスペクトル包
絡に関する特徴量を抽出し、前記抽出された特徴量と前
記バッファに蓄えられた信号列とから推定された音源パ
ルス列に対して、信号の持つ周波数特性についての事前
情報と推定されたピッチ情報とから広帯域な音源パルス
列を発生し、前記スペクトル包絡に関する特徴量と前記
広帯域な音源パルス列とを用いて音声を合成することを
特徴とする音声帯域拡大方法。 - 【請求項8】入力信号をバッファに一定量蓄えておき、
前記バッファに蓄えられた信号列に対してスペクトル包
絡に関する特徴量を抽出し、前記特徴量の表現する包絡
情報に欠落している包絡情報を補間し、前記特徴量と前
記バッファに蓄えられた信号列とから推定された音源パ
ルス列に対して、信号の持つ周波数特性についての事前
情報と推定されたピッチ情報とから広帯域な音源パルス
列を発生し、前記スペクトル包絡に関する特徴量と前記
広帯域な音源パルス列とを用いて音声を合成することを
特徴とする音声帯域拡大方法。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7110425A JP2798003B2 (ja) | 1995-05-09 | 1995-05-09 | 音声帯域拡大装置および音声帯域拡大方法 |
| DE69619284T DE69619284T3 (de) | 1995-03-13 | 1996-03-12 | Vorrichtung zur Erweiterung der Sprachbandbreite |
| EP96301726A EP0732687B2 (en) | 1995-03-13 | 1996-03-12 | Apparatus for expanding speech bandwidth |
| US09/157,419 US5978759A (en) | 1995-03-13 | 1998-09-21 | Apparatus for expanding narrowband speech to wideband speech by codebook correspondence of linear mapping functions |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7110425A JP2798003B2 (ja) | 1995-05-09 | 1995-05-09 | 音声帯域拡大装置および音声帯域拡大方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH08305396A JPH08305396A (ja) | 1996-11-22 |
| JP2798003B2 true JP2798003B2 (ja) | 1998-09-17 |
Family
ID=14535437
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7110425A Expired - Lifetime JP2798003B2 (ja) | 1995-03-13 | 1995-05-09 | 音声帯域拡大装置および音声帯域拡大方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2798003B2 (ja) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE69619284T3 (de) † | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
| SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
| FI119576B (fi) * | 2000-03-07 | 2008-12-31 | Nokia Corp | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin |
| JP4008244B2 (ja) * | 2001-03-02 | 2007-11-14 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
| WO2004010415A1 (ja) * | 2002-07-19 | 2004-01-29 | Nec Corporation | オーディオ復号装置と復号方法およびプログラム |
| KR100501930B1 (ko) | 2002-11-29 | 2005-07-18 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
| SG163555A1 (en) | 2005-04-01 | 2010-08-30 | Qualcomm Inc | Systems, methods, and apparatus for highband burst suppression |
| EP3671741A1 (en) * | 2018-12-21 | 2020-06-24 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Audio processor and method for generating a frequency-enhanced audio signal using pulse processing |
| CN111863006B (zh) * | 2019-04-30 | 2024-07-16 | 华为技术有限公司 | 一种音频信号处理方法、音频信号处理装置和耳机 |
-
1995
- 1995-05-09 JP JP7110425A patent/JP2798003B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JPH08305396A (ja) | 1996-11-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2763322B2 (ja) | 音声処理方法 | |
| JP3266819B2 (ja) | 周期信号変換方法、音変換方法および信号分析方法 | |
| JP3189614B2 (ja) | 音声帯域拡大装置 | |
| JP6791258B2 (ja) | 音声合成方法、音声合成装置およびプログラム | |
| JPH10124088A (ja) | 音声帯域幅拡張装置及び方法 | |
| EP1422693B1 (en) | Pitch waveform signal generation apparatus; pitch waveform signal generation method; and program | |
| JP2009042716A (ja) | 周期信号処理方法、周期信号変換方法および周期信号処理装置ならびに周期信号の分析方法 | |
| US7792672B2 (en) | Method and system for the quick conversion of a voice signal | |
| US20090144058A1 (en) | Restoration of high-order Mel Frequency Cepstral Coefficients | |
| WO2003010752A1 (fr) | Appareil d'elargissement de la largeur de bande vocale et procede d'elargissement de la largeur de bande vocale | |
| JPH09101798A (ja) | 音声帯域拡大方法および音声帯域拡大装置 | |
| JP4382808B2 (ja) | 基本周波数情報を分析する方法、ならびに、この分析方法を実装した音声変換方法及びシステム | |
| JP2798003B2 (ja) | 音声帯域拡大装置および音声帯域拡大方法 | |
| US7305339B2 (en) | Restoration of high-order Mel Frequency Cepstral Coefficients | |
| JP2000515992A (ja) | 言語コーディング | |
| JPH10124089A (ja) | 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法 | |
| JP2018077283A (ja) | 音声合成方法 | |
| JP2009244723A (ja) | 音声分析合成装置、音声分析合成方法、コンピュータプログラム、および記録媒体 | |
| JPH05265495A (ja) | 音声符号化装置並びにその分析器及び合成器 | |
| KR100715013B1 (ko) | 대역확장장치 및 방법 | |
| Hasan et al. | An approach to voice conversion using feature statistical mapping | |
| JP3230782B2 (ja) | 広帯域音声信号復元方法 | |
| JP4313740B2 (ja) | 残響除去方法、プログラムおよび記録媒体 | |
| JP2539351B2 (ja) | 音声合成方法 | |
| JPH07261798A (ja) | 音声分析合成装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070703 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080703 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090703 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090703 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100703 Year of fee payment: 12 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110703 Year of fee payment: 13 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110703 Year of fee payment: 13 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120703 Year of fee payment: 14 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120703 Year of fee payment: 14 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130703 Year of fee payment: 15 |
|
| EXPY | Cancellation because of completion of term |