JPH08278800A

JPH08278800A - 音声通信システム

Info

Publication number: JPH08278800A
Application number: JP7080034A
Authority: JP
Inventors: Yoshiaki Tanaka; 良紀田中; Nami Hatazoe; 菜美畠添
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1995-04-05
Filing date: 1995-04-05
Publication date: 1996-10-22

Abstract

(57)【要約】【目的】電話回線等の伝送路からの狭帯域音声信号を広
帯域化処理部で広帯域化して出力する音声通信システム
に関し、広帯域化処理部での演算量を削減する。【構成】広帯域化処理部が、狭帯域受話音声信号を線形
予測分析分析して狭帯域予測係数及び狭帯域予測残差信
号を求め、該狭帯域予測係数からニューラルネットワー
ク部により広帯域予測係数を推定し、該狭帯域予測残差
信号に対して非線形演算を施して広帯域予測誤差信号を
発生させて該広帯域予測係数と合成し、低域周波数成分
と高域周波数成分とに分けた後、狭帯域受話音声信号の
中域周波数成分と合成して広帯域音声信号を求める。

Description

【発明の詳細な説明】

【産業上の利用分野】本発明は音声通信システムに関
し、特に電話回線等の伝送路を狭帯域音声信号で伝送す
る音声通信システムに関するものである。

【０００１】ビデオフォン、電話会議システム、テレビ
会議システム等のマルチメディア通信システムにおける
音声通信では、電話回線を用いて電話帯域（３００〜３
４００Hz）の音声を伝送するか、ＩＳＤＮ回線のような
広帯域の伝送路を使用する場合は、広帯域（５０〜７０
００Hz）な音声を符号化（例えばＩＴＵ−ＴＧ．７２２
の６４kb/s符号化）してディジタル伝送を行っている。

【０００２】この場合、より廉価で多くの回線を設定す
るためには、前者の電話回線を用いた狭帯域音声通信が
必要となる。

【０００３】

【従来の技術】図４には電話回線を用いた従来から周知
の狭帯域音声通信システムの構成が示されており、ハン
ドセットＴＭ（送話器）からの音声信号は狭帯域音声送
信器１で狭帯域化されて電話回線の伝送路２へ送出され
る。

【０００４】伝送路２からの狭帯域音声信号は狭帯域音
声受信器３で受信され、ハンドセットＲＶ（受話器）か
ら出力される。

【０００５】このように、ハンドセットを用いて音声の
みの通信を行う電話では、狭帯域音声でも大きな不都合
を感じないが、近年では、ビデオフォン、電話会議シス
テム、テレビ会議システム等、画像を見ながら対話や会
議を行うマルチメディア通信システムが普及して来てお
り、このようなマルチメディア通信システムにおける音
声通信、特にスピーカを用いて受聴する場合では、電話
帯域の音声での通信は臨場感や自然性に乏しく感じるよ
うになる。このため、通常の電話で用いられている帯域
より広帯域の音声を用いることが望ましい。

【０００６】一方、ＩＳＤＮ回線のような広帯域の伝送
路を用いて広帯域音声を直接伝送する場合はこのような
問題が無いが、回線料金が通常の電話回線より高くな
り、また音声のディジタル化および圧縮のための音声符
号器・復号器を備える必要があるため、通信コストが高
くなる。

【０００７】そこで、図５に示すように受信側において
狭帯域音声受信器３から出力される狭帯域音声信号を広
帯域化処理部４で広帯域化してスピーカＳＰから出力さ
せる方式が提案されるに到っている。

【０００８】この場合の広帯域化処理部４としては、線
形変換を用いた方式が提案されている。

【０００９】

【発明が解決しようとする課題】しかしながら、このよ
うな従来の広帯域化処理部は、広帯域音声信号の復元精
度があまり高くないという問題点があった。

【００１０】従って、本発明は、電話回線等の伝送路か
らの狭帯域音声信号を広帯域化処理部で広帯域化して出
力する音声通信システムにおいて、広帯域化処理音声の
復元精度を向上することを目的とする。

【００１１】

【課題を解決するための手段】上記の目的を達成するた
め、本発明に係る音声通信システムにおいては、広帯域
化処理部が、狭帯域受話音声信号をアナログ／デジタル
変換する変換器と、該変換器の出力信号に対して線形予
測分析分析を行うことにより狭帯域予測係数を求める線
形予測分析部と、該変換器の出力信号及び該狭帯域予測
係数から狭帯域予測残差信号を求める逆フィルタと、該
狭帯域予測係数から広帯域予測係数を推定するニューラ
ルネットワーク部と、該狭帯域予測残差信号に対して非
線形演算を施して広帯域予測誤差信号を発生させる非線
形処理部と、該広帯域予測係数を係数とし該広帯域予測
誤差信号を入力信号とする合成フィルタと、該変換器の
出力信号の第１の周波数帯域を通過させる第１の帯域通
過フィルタと、該合成フィルタの出力信号の第２及び第
３の周波数帯域をそれぞれ通過させる第２及び第３の帯
域通過フィルタと、該第１乃至第３の帯域通過フィルタ
の出力信号を入力して広帯域音声信号を合成する合成部
と、を備えている。

【００１２】また、上記のニューラルネットワーク部
は、該狭帯域予測係数から低域部予測係数及び高域部予
測係数をそれぞれ推定する第１及び第２のニューラルネ
ットワーク部で構成することができ、該合成フィルタ
は、該低域部予測係数及び高域部予測係数をそれぞれ係
数とし該広帯域予測誤差信号を入力信号とし、各出力を
それぞれ第２及び第３の帯域通過フィルタに与える第１
及び第２の合成フィルタで構成することができる。

【００１３】また、上記の非線形処理部は、全波整流、
半波整流、又は二乗演算を用いることができる。

【００１４】

【作用】本発明において、伝送路には狭帯域の音声信号
を伝送し、受信側において設けた広帯域化処理部が受信
音声信号の帯域拡張を行って再生を行う。

【００１５】この広帯域化処理部では、アナログ／デジ
タル変換器でアナログ信号からデジタル信号に変換され
た狭帯域受話音声に対して線形予測分析部で線形予測分
析を行い狭帯域予測係数を求め、逆フィルタにより狭帯
域予測残差信号を求める。

【００１６】狭帯域予測係数は、これを入力とするニュ
ーラルネットワーク部により広帯域の予測係数の推定を
行う。一方、狭帯域予測残差信号に対しては、これに非
線形処理部で絶対値演算（全波整流）、半波整流、又は
二乗演算等の非線形操作を行うことにより高調波成分を
発生させて広帯域の予測残差信号を生成する。

【００１７】この広帯域予測残差信号をニューラルネッ
トワーク部からの広帯域予測係数を用いて合成フィルタ
で再び線形予測合成し、その低域周波数成分および高域
周波数成分をそれぞれ帯域通過フィルタから取り出し、
元の狭帯域音声デジタル信号から帯域通過フィルタによ
り取り出された中域周波数成分に合成部で加えることに
より広帯域音声信号を生成する。

【００１８】このように本発明では、狭帯域音声の予測
残差信号に対して非線形処理を施し、このときに発生す
る高調波成分を利用することにより、少ない演算量で帯
域を増加させることなく広帯域音声信号の再生を行うこ
とができ、受話音声品質の改善が図れる。

【００１９】

【実施例】図１は本発明に係る広帯域音声通信システム
における広帯域処理部の実施例を示しており、この実施
例では、狭帯域受話音声信号をアナログ／デジタル変換
する変換器（Ａ／Ｄ変換器）４１と、このＡ／Ｄ変換器
４１からのデジタル狭帯域音声信号に対して線形予測分
析分析を行うことにより狭帯域予測係数を求める線形予
測分析部４２と、Ａ／Ｄ変換器４１からのデジタル狭帯
域音声信号及び線形予測分析部４２から得られる狭帯域
予測係数から狭帯域予測残差信号を求める逆フィルタ４
３と、線形予測分析部４２から得られる狭帯域予測係数
より広帯域予測係数を推定するニューラルネットワーク
部４４と、逆フィルタ４３で得られた狭帯域予測残差信
号に対して非線形演算を施して広帯域予測誤差信号を発
生させる非線形処理部４５と、ニューラルネットワーク
部４４で得られた広帯域予測係数を係数とし非線形処理
部４５で得られた広帯域予測誤差信号を入力とする合成
フィルタ４６と、Ａ／Ｄ変換器４１からのデジタル狭帯
域音声信号の第１の周波数帯域（３００〜３４００Hz）
を通過させる第１の帯域通過フィルタ４７と、該合成フ
ィルタの出力信号の第２及び第３の周波数帯域（５０〜
３００Hz，３４００〜７０００Hz）をそれぞれ通過させ
る第２及び第３の帯域通過フィルタ４８及び４９と、該
第１乃至第３の帯域通過フィルタ４７〜４９の出力信号
を合成して広帯域音声信号にする合成部５０と、で構成
されている。

【００２０】この実施例の動作においては、受信側にお
いて再生した狭帯域音声信号を入力としてこれをＡ／Ｄ
変換器４１でＡ／Ｄ変換し、線形予測分析部４２では、
狭帯域デジタル信号に対して短時間区間毎に線形予測分
析を行い、狭帯域予測係数を求める。

【００２１】次にこの狭帯域予測係数を入力とするニュ
ーラルネットワーク部４４では、広帯域の予測係数を推
定する。このニューラルネットワーク部としては、例え
ば階層型ネットワークにより実現することができる。

【００２２】図２には入力層と隠れ層と出力層から成る
３層ニューラルネットワーク部の構成例が示されてお
り、ネットワークの重み係数の学習には誤差逆伝搬法
（バックプロパゲーション法）等のアルゴリズムを用い
ることができる。

【００２３】このネットワークには線形予測分析部４２
からの狭帯域音声信号のＬＰＣケプストラム係数ｘ₁〜
ｘ_Nを入力し、出力には広帯域のＬＰＣケプストラム係
数ｙ ₁〜ｙ_Nが出力されるように重み係数の学習を行
う。また、推定に用いるパラメータとしてはＬＰＣケプ
ストラム係数以外にも反射係数等さまざまなものを用い
ることができる。

【００２４】このスペクトルの変換関数は一般的には非
線形と考えられるため、ニューラルネットワーク部の適
用により線形変換を用いる場合より変換精度の向上が期
待できる。また、未学習入力に対する外挿効果も有す
る。

【００２５】逆フィルタ４３は狭帯域入力音声信号に対
して線形予測分析部４２からの狭帯域予測係数を用いて
逆フィルタ処理を行い、狭帯域予測残差信号を求める。

【００２６】次にこの狭帯域予測残差信号に対してサン
プル毎に非線形処理部４５が非線形処理を施すことによ
り広帯域予測残差信号を生成する。これは絶対値演算の
ような非線形処理により高調波成分が発生することを利
用している。

【００２７】また非線形処理部４５により広帯域化した
予測残差信号をニューラルネットワーク部４４からの広
帯域予測係数を係数とする予測合成フィルタ４６に通し
て広帯域音声信号を生成する。

【００２８】この広帯域音声信号は、帯域通過フィルタ
４８及び４９を通すことにより、音声信号の低域周波数
成分（５０−３００Hz）及び高域周波数成分（３４００
−７０００Hz）をそれぞれ抽出する。

【００２９】そして、中域周波数成分（３００−３４０
０Hz）が狭帯域入力信号から帯域通過フィルタ４７によ
り取り出されて合成部５０により帯域通過フィルタ４８
及び４９の低域周波数成分及び高域周波数成分に加え合
わせることで、広帯域音声信号（５０−７０００Hz）を
生成している。

【００３０】図３は図１に示した実施例の変形例を示し
たもので、この実施例では、図１に示したニューラルネ
ットワーク部４４を、線形予測分析部４２からの狭帯域
予測係数より低域部予測係数及び高域部予測係数をそれ
ぞれ推定する第１及び第２のニューラルネットワーク部
４４ａ及び４４ｂで構成しており、合成フィルタ４６
を、ニューラルネットワーク部４４ａ及び４４ｂからの
低域部予測係数及び高域部予測係数を係数とし、それぞ
れ非線形処理部４５からの広帯域予測誤差信号を入力信
号とし、各出力をそれぞれ帯域通過フィルタ４８及び４
９に与える第１及び第２の合成フィルタ４６ａ及び４６
ｂで構成している。

【００３１】即ち、線形予測分析部４２で求めた狭帯域
予測係数を入力とするニューラルネットワーク部４４ａ
及び４４ｂを用いて低域部（５０−３００Hz）および高
域部（３４００−７０００Hz）の予測係数をそれぞれ推
定する。

【００３２】そして、逆フィルタ４３で求めた狭帯域予
測残差信号を非線形処理部４５で広帯域予測残差信号を
生成し、この広帯域予測残差信号をニューラルネットワ
ーク部４４ａ及び４４ｂからの低域部の予測係数および
高域部の予測係数をそれぞれ係数とする合成フィルタ４
６ａ及び４６ｂに通すことにより音声の低域周波数成分
および高域周波数成分をそれぞれ生成する。

【００３３】各合成フィルタ４６ａ及び４６ｂの出力信
号の低域部（５０−３００Hz）および高域部（３４００
−７０００Hz）をそれぞれ帯域通過フィルタ４８及び４
９を通した後に、これらの二つの信号を、帯域通過フィ
ルタ４７を通した中域周波数帯域（３００−３４００H
z）の入力音声信号に加え合わせることで、広帯域（５
０−７０００Hz）音声信号を生成することができる。

【００３４】第１の実施例では、電話帯域のスペクトル
から７０００Hz帯域のスペクトルを直接推定している
が、上記の低域周波数成分および高域周波数成分はオー
バーラップしているため、変換関数の学習の際に実際に
使用しない中域周波数帯域（３００−３４００Hz）も含
めて学習を行うために無駄が生じることになる。

【００３５】第２の実施例ではこのようなことがないた
め、学習の効率を上げることができる。

【００３６】

【発明の効果】以上説明したように本発明に係る音声通
信システムによれば、広帯域化処理部が、狭帯域受話音
声信号を線形予測分析分析して狭帯域予測係数及び狭帯
域予測残差信号を求め、該狭帯域予測係数からニューラ
ルネットワーク部により広帯域予測係数を推定し、該狭
帯域予測残差信号に対して非線形演算を施して広帯域予
測誤差信号を発生させて該広帯域予測係数を用いて予測
合成を行い、この合成信号から低域周波数成分と高域周
波数成分を抽出した後、狭帯域受話音声信号の中域周波
数成分と合成して広帯域音声信号を求めるように構成し
たので、狭帯域音声の予測残差信号に対して非線形処理
時に発生する高調波成分を利用することにより、少ない
演算量で帯域を増加させることなく広帯域音声信号の再
生を行うことができ、受話音声品質の改善が図れる。

【図面の簡単な説明】

【図１】本発明に係る音声通信システムに用いる広帯域
化処理部の実施例（１）を示したブロック図である。

【図２】本発明に係る音声通信システムに用いる広帯域
化処理部におけるニューラルネットワーク部の構成例を
示した図である。

【図３】本発明に係る音声通信システムに用いる広帯域
化処理部の実施例（２）を示したブロック図である。

【図４】従来から一般的な狭帯域音声通信システムの概
念構成例を示したブロック図である。

【図５】従来及び本発明に係る狭帯域音声通信システム
に共通な概念構成を示したブロック図である。

【符号の説明】

３狭帯域音声受信器４広帯域化処理部４１Ａ／Ｄ変換器４２線形予測分析部４３逆フィルタ４４，４４ａ，４４ｂニューラルネットワーク部４５非線形処理部４６，４６ａ，４６ｂ合成フィルタ４７〜４９帯域通過フィルタ５０合成部図中、同一符号は同一又は相当部分を示す。

Claims

【特許請求の範囲】

【請求項１】伝送路からの狭帯域音声信号を広帯域化処
理部で広帯域化して出力する音声通信システムにおい
て、該広帯域化処理部が、狭帯域受話音声信号をアナログ／
デジタル変換する変換器と、該変換器の出力信号に対し
て線形予測分析分析を行うことにより狭帯域予測係数を
求める線形予測分析部と、該変換器の出力信号及び該狭
帯域予測係数から狭帯域予測残差信号を求める逆フィル
タと、該狭帯域予測係数から広帯域予測係数を推定する
ニューラルネットワーク部と、該狭帯域予測残差信号に
対して非線形演算を施して広帯域予測誤差信号を発生さ
せる非線形処理部と、該広帯域予測係数を係数とし、該
広帯域予測誤差信号を入力信号とする合成フィルタと、
該変換器の出力信号の第１の周波数帯域を通過させる第
１の帯域通過フィルタと、該合成フィルタの出力信号の
第２及び第３の周波数帯域をそれぞれ通過させる第２及
び第３の帯域通過フィルタと、該第１乃至第３の帯域通
過フィルタの出力信号を入力して広帯域音声信号を合成
する合成部と、を備えていることを特徴とした音声通信
システム。
【請求項２】請求項１に記載の音声通信システムにおい
て、該ニューラルネットワーク部が、該狭帯域予測係数
から低域部予測係数及び高域部予測係数をそれぞれ推定
する第１及び第２のニューラルネットワーク部で構成さ
れており、該合成フィルタが、該低域部予測係数及び高
域部予測係数をそれぞれ係数とし、該広帯域予測誤差信
号を入力信号とする第１及び第２の合成フィルタで構成
されていることを特徴とした音声通信システム。
【請求項３】請求項１又は２に記載の音声通信システム
において、該非線形処理部が、全波整流、半波整流、又
は二乗演算を用いることを特徴とした音声通信システ
ム。