JPH08278800A - 音声通信システム - Google Patents
音声通信システムInfo
- Publication number
- JPH08278800A JPH08278800A JP7080034A JP8003495A JPH08278800A JP H08278800 A JPH08278800 A JP H08278800A JP 7080034 A JP7080034 A JP 7080034A JP 8003495 A JP8003495 A JP 8003495A JP H08278800 A JPH08278800 A JP H08278800A
- Authority
- JP
- Japan
- Prior art keywords
- band
- signal
- prediction
- narrow band
- prediction coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】
【目的】電話回線等の伝送路からの狭帯域音声信号を広
帯域化処理部で広帯域化して出力する音声通信システム
に関し、広帯域化処理部での演算量を削減する。 【構成】広帯域化処理部が、狭帯域受話音声信号を線形
予測分析分析して狭帯域予測係数及び狭帯域予測残差信
号を求め、該狭帯域予測係数からニューラルネットワー
ク部により広帯域予測係数を推定し、該狭帯域予測残差
信号に対して非線形演算を施して広帯域予測誤差信号を
発生させて該広帯域予測係数と合成し、低域周波数成分
と高域周波数成分とに分けた後、狭帯域受話音声信号の
中域周波数成分と合成して広帯域音声信号を求める。
帯域化処理部で広帯域化して出力する音声通信システム
に関し、広帯域化処理部での演算量を削減する。 【構成】広帯域化処理部が、狭帯域受話音声信号を線形
予測分析分析して狭帯域予測係数及び狭帯域予測残差信
号を求め、該狭帯域予測係数からニューラルネットワー
ク部により広帯域予測係数を推定し、該狭帯域予測残差
信号に対して非線形演算を施して広帯域予測誤差信号を
発生させて該広帯域予測係数と合成し、低域周波数成分
と高域周波数成分とに分けた後、狭帯域受話音声信号の
中域周波数成分と合成して広帯域音声信号を求める。
Description
【産業上の利用分野】本発明は音声通信システムに関
し、特に電話回線等の伝送路を狭帯域音声信号で伝送す
る音声通信システムに関するものである。
し、特に電話回線等の伝送路を狭帯域音声信号で伝送す
る音声通信システムに関するものである。
【0001】ビデオフォン、電話会議システム、テレビ
会議システム等のマルチメディア通信システムにおける
音声通信では、電話回線を用いて電話帯域(300〜3
400Hz)の音声を伝送するか、ISDN回線のような
広帯域の伝送路を使用する場合は、広帯域(50〜70
00Hz)な音声を符号化(例えばITU−TG.722
の64kb/s符号化)してディジタル伝送を行っている。
会議システム等のマルチメディア通信システムにおける
音声通信では、電話回線を用いて電話帯域(300〜3
400Hz)の音声を伝送するか、ISDN回線のような
広帯域の伝送路を使用する場合は、広帯域(50〜70
00Hz)な音声を符号化(例えばITU−TG.722
の64kb/s符号化)してディジタル伝送を行っている。
【0002】この場合、より廉価で多くの回線を設定す
るためには、前者の電話回線を用いた狭帯域音声通信が
必要となる。
るためには、前者の電話回線を用いた狭帯域音声通信が
必要となる。
【0003】
【従来の技術】図4には電話回線を用いた従来から周知
の狭帯域音声通信システムの構成が示されており、ハン
ドセットTM(送話器)からの音声信号は狭帯域音声送
信器1で狭帯域化されて電話回線の伝送路2へ送出され
る。
の狭帯域音声通信システムの構成が示されており、ハン
ドセットTM(送話器)からの音声信号は狭帯域音声送
信器1で狭帯域化されて電話回線の伝送路2へ送出され
る。
【0004】伝送路2からの狭帯域音声信号は狭帯域音
声受信器3で受信され、ハンドセットRV(受話器)か
ら出力される。
声受信器3で受信され、ハンドセットRV(受話器)か
ら出力される。
【0005】このように、ハンドセットを用いて音声の
みの通信を行う電話では、狭帯域音声でも大きな不都合
を感じないが、近年では、ビデオフォン、電話会議シス
テム、テレビ会議システム等、画像を見ながら対話や会
議を行うマルチメディア通信システムが普及して来てお
り、このようなマルチメディア通信システムにおける音
声通信、特にスピーカを用いて受聴する場合では、電話
帯域の音声での通信は臨場感や自然性に乏しく感じるよ
うになる。このため、通常の電話で用いられている帯域
より広帯域の音声を用いることが望ましい。
みの通信を行う電話では、狭帯域音声でも大きな不都合
を感じないが、近年では、ビデオフォン、電話会議シス
テム、テレビ会議システム等、画像を見ながら対話や会
議を行うマルチメディア通信システムが普及して来てお
り、このようなマルチメディア通信システムにおける音
声通信、特にスピーカを用いて受聴する場合では、電話
帯域の音声での通信は臨場感や自然性に乏しく感じるよ
うになる。このため、通常の電話で用いられている帯域
より広帯域の音声を用いることが望ましい。
【0006】一方、ISDN回線のような広帯域の伝送
路を用いて広帯域音声を直接伝送する場合はこのような
問題が無いが、回線料金が通常の電話回線より高くな
り、また音声のディジタル化および圧縮のための音声符
号器・復号器を備える必要があるため、通信コストが高
くなる。
路を用いて広帯域音声を直接伝送する場合はこのような
問題が無いが、回線料金が通常の電話回線より高くな
り、また音声のディジタル化および圧縮のための音声符
号器・復号器を備える必要があるため、通信コストが高
くなる。
【0007】そこで、図5に示すように受信側において
狭帯域音声受信器3から出力される狭帯域音声信号を広
帯域化処理部4で広帯域化してスピーカSPから出力さ
せる方式が提案されるに到っている。
狭帯域音声受信器3から出力される狭帯域音声信号を広
帯域化処理部4で広帯域化してスピーカSPから出力さ
せる方式が提案されるに到っている。
【0008】この場合の広帯域化処理部4としては、線
形変換を用いた方式が提案されている。
形変換を用いた方式が提案されている。
【0009】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の広帯域化処理部は、広帯域音声信号の復元精
度があまり高くないという問題点があった。
うな従来の広帯域化処理部は、広帯域音声信号の復元精
度があまり高くないという問題点があった。
【0010】従って、本発明は、電話回線等の伝送路か
らの狭帯域音声信号を広帯域化処理部で広帯域化して出
力する音声通信システムにおいて、広帯域化処理音声の
復元精度を向上することを目的とする。
らの狭帯域音声信号を広帯域化処理部で広帯域化して出
力する音声通信システムにおいて、広帯域化処理音声の
復元精度を向上することを目的とする。
【0011】
【課題を解決するための手段】上記の目的を達成するた
め、本発明に係る音声通信システムにおいては、広帯域
化処理部が、狭帯域受話音声信号をアナログ/デジタル
変換する変換器と、該変換器の出力信号に対して線形予
測分析分析を行うことにより狭帯域予測係数を求める線
形予測分析部と、該変換器の出力信号及び該狭帯域予測
係数から狭帯域予測残差信号を求める逆フィルタと、該
狭帯域予測係数から広帯域予測係数を推定するニューラ
ルネットワーク部と、該狭帯域予測残差信号に対して非
線形演算を施して広帯域予測誤差信号を発生させる非線
形処理部と、該広帯域予測係数を係数とし該広帯域予測
誤差信号を入力信号とする合成フィルタと、該変換器の
出力信号の第1の周波数帯域を通過させる第1の帯域通
過フィルタと、該合成フィルタの出力信号の第2及び第
3の周波数帯域をそれぞれ通過させる第2及び第3の帯
域通過フィルタと、該第1乃至第3の帯域通過フィルタ
の出力信号を入力して広帯域音声信号を合成する合成部
と、を備えている。
め、本発明に係る音声通信システムにおいては、広帯域
化処理部が、狭帯域受話音声信号をアナログ/デジタル
変換する変換器と、該変換器の出力信号に対して線形予
測分析分析を行うことにより狭帯域予測係数を求める線
形予測分析部と、該変換器の出力信号及び該狭帯域予測
係数から狭帯域予測残差信号を求める逆フィルタと、該
狭帯域予測係数から広帯域予測係数を推定するニューラ
ルネットワーク部と、該狭帯域予測残差信号に対して非
線形演算を施して広帯域予測誤差信号を発生させる非線
形処理部と、該広帯域予測係数を係数とし該広帯域予測
誤差信号を入力信号とする合成フィルタと、該変換器の
出力信号の第1の周波数帯域を通過させる第1の帯域通
過フィルタと、該合成フィルタの出力信号の第2及び第
3の周波数帯域をそれぞれ通過させる第2及び第3の帯
域通過フィルタと、該第1乃至第3の帯域通過フィルタ
の出力信号を入力して広帯域音声信号を合成する合成部
と、を備えている。
【0012】また、上記のニューラルネットワーク部
は、該狭帯域予測係数から低域部予測係数及び高域部予
測係数をそれぞれ推定する第1及び第2のニューラルネ
ットワーク部で構成することができ、該合成フィルタ
は、該低域部予測係数及び高域部予測係数をそれぞれ係
数とし該広帯域予測誤差信号を入力信号とし、各出力を
それぞれ第2及び第3の帯域通過フィルタに与える第1
及び第2の合成フィルタで構成することができる。
は、該狭帯域予測係数から低域部予測係数及び高域部予
測係数をそれぞれ推定する第1及び第2のニューラルネ
ットワーク部で構成することができ、該合成フィルタ
は、該低域部予測係数及び高域部予測係数をそれぞれ係
数とし該広帯域予測誤差信号を入力信号とし、各出力を
それぞれ第2及び第3の帯域通過フィルタに与える第1
及び第2の合成フィルタで構成することができる。
【0013】また、上記の非線形処理部は、全波整流、
半波整流、又は二乗演算を用いることができる。
半波整流、又は二乗演算を用いることができる。
【0014】
【作用】本発明において、伝送路には狭帯域の音声信号
を伝送し、受信側において設けた広帯域化処理部が受信
音声信号の帯域拡張を行って再生を行う。
を伝送し、受信側において設けた広帯域化処理部が受信
音声信号の帯域拡張を行って再生を行う。
【0015】この広帯域化処理部では、アナログ/デジ
タル変換器でアナログ信号からデジタル信号に変換され
た狭帯域受話音声に対して線形予測分析部で線形予測分
析を行い狭帯域予測係数を求め、逆フィルタにより狭帯
域予測残差信号を求める。
タル変換器でアナログ信号からデジタル信号に変換され
た狭帯域受話音声に対して線形予測分析部で線形予測分
析を行い狭帯域予測係数を求め、逆フィルタにより狭帯
域予測残差信号を求める。
【0016】狭帯域予測係数は、これを入力とするニュ
ーラルネットワーク部により広帯域の予測係数の推定を
行う。一方、狭帯域予測残差信号に対しては、これに非
線形処理部で絶対値演算(全波整流)、半波整流、又は
二乗演算等の非線形操作を行うことにより高調波成分を
発生させて広帯域の予測残差信号を生成する。
ーラルネットワーク部により広帯域の予測係数の推定を
行う。一方、狭帯域予測残差信号に対しては、これに非
線形処理部で絶対値演算(全波整流)、半波整流、又は
二乗演算等の非線形操作を行うことにより高調波成分を
発生させて広帯域の予測残差信号を生成する。
【0017】この広帯域予測残差信号をニューラルネッ
トワーク部からの広帯域予測係数を用いて合成フィルタ
で再び線形予測合成し、その低域周波数成分および高域
周波数成分をそれぞれ帯域通過フィルタから取り出し、
元の狭帯域音声デジタル信号から帯域通過フィルタによ
り取り出された中域周波数成分に合成部で加えることに
より広帯域音声信号を生成する。
トワーク部からの広帯域予測係数を用いて合成フィルタ
で再び線形予測合成し、その低域周波数成分および高域
周波数成分をそれぞれ帯域通過フィルタから取り出し、
元の狭帯域音声デジタル信号から帯域通過フィルタによ
り取り出された中域周波数成分に合成部で加えることに
より広帯域音声信号を生成する。
【0018】このように本発明では、狭帯域音声の予測
残差信号に対して非線形処理を施し、このときに発生す
る高調波成分を利用することにより、少ない演算量で帯
域を増加させることなく広帯域音声信号の再生を行うこ
とができ、受話音声品質の改善が図れる。
残差信号に対して非線形処理を施し、このときに発生す
る高調波成分を利用することにより、少ない演算量で帯
域を増加させることなく広帯域音声信号の再生を行うこ
とができ、受話音声品質の改善が図れる。
【0019】
【実施例】図1は本発明に係る広帯域音声通信システム
における広帯域処理部の実施例を示しており、この実施
例では、狭帯域受話音声信号をアナログ/デジタル変換
する変換器(A/D変換器)41と、このA/D変換器
41からのデジタル狭帯域音声信号に対して線形予測分
析分析を行うことにより狭帯域予測係数を求める線形予
測分析部42と、A/D変換器41からのデジタル狭帯
域音声信号及び線形予測分析部42から得られる狭帯域
予測係数から狭帯域予測残差信号を求める逆フィルタ4
3と、線形予測分析部42から得られる狭帯域予測係数
より広帯域予測係数を推定するニューラルネットワーク
部44と、逆フィルタ43で得られた狭帯域予測残差信
号に対して非線形演算を施して広帯域予測誤差信号を発
生させる非線形処理部45と、ニューラルネットワーク
部44で得られた広帯域予測係数を係数とし非線形処理
部45で得られた広帯域予測誤差信号を入力とする合成
フィルタ46と、A/D変換器41からのデジタル狭帯
域音声信号の第1の周波数帯域(300〜3400Hz)
を通過させる第1の帯域通過フィルタ47と、該合成フ
ィルタの出力信号の第2及び第3の周波数帯域(50〜
300Hz,3400〜7000Hz)をそれぞれ通過させ
る第2及び第3の帯域通過フィルタ48及び49と、該
第1乃至第3の帯域通過フィルタ47〜49の出力信号
を合成して広帯域音声信号にする合成部50と、で構成
されている。
における広帯域処理部の実施例を示しており、この実施
例では、狭帯域受話音声信号をアナログ/デジタル変換
する変換器(A/D変換器)41と、このA/D変換器
41からのデジタル狭帯域音声信号に対して線形予測分
析分析を行うことにより狭帯域予測係数を求める線形予
測分析部42と、A/D変換器41からのデジタル狭帯
域音声信号及び線形予測分析部42から得られる狭帯域
予測係数から狭帯域予測残差信号を求める逆フィルタ4
3と、線形予測分析部42から得られる狭帯域予測係数
より広帯域予測係数を推定するニューラルネットワーク
部44と、逆フィルタ43で得られた狭帯域予測残差信
号に対して非線形演算を施して広帯域予測誤差信号を発
生させる非線形処理部45と、ニューラルネットワーク
部44で得られた広帯域予測係数を係数とし非線形処理
部45で得られた広帯域予測誤差信号を入力とする合成
フィルタ46と、A/D変換器41からのデジタル狭帯
域音声信号の第1の周波数帯域(300〜3400Hz)
を通過させる第1の帯域通過フィルタ47と、該合成フ
ィルタの出力信号の第2及び第3の周波数帯域(50〜
300Hz,3400〜7000Hz)をそれぞれ通過させ
る第2及び第3の帯域通過フィルタ48及び49と、該
第1乃至第3の帯域通過フィルタ47〜49の出力信号
を合成して広帯域音声信号にする合成部50と、で構成
されている。
【0020】この実施例の動作においては、受信側にお
いて再生した狭帯域音声信号を入力としてこれをA/D
変換器41でA/D変換し、線形予測分析部42では、
狭帯域デジタル信号に対して短時間区間毎に線形予測分
析を行い、狭帯域予測係数を求める。
いて再生した狭帯域音声信号を入力としてこれをA/D
変換器41でA/D変換し、線形予測分析部42では、
狭帯域デジタル信号に対して短時間区間毎に線形予測分
析を行い、狭帯域予測係数を求める。
【0021】次にこの狭帯域予測係数を入力とするニュ
ーラルネットワーク部44では、広帯域の予測係数を推
定する。このニューラルネットワーク部としては、例え
ば階層型ネットワークにより実現することができる。
ーラルネットワーク部44では、広帯域の予測係数を推
定する。このニューラルネットワーク部としては、例え
ば階層型ネットワークにより実現することができる。
【0022】図2には入力層と隠れ層と出力層から成る
3層ニューラルネットワーク部の構成例が示されてお
り、ネットワークの重み係数の学習には誤差逆伝搬法
(バックプロパゲーション法)等のアルゴリズムを用い
ることができる。
3層ニューラルネットワーク部の構成例が示されてお
り、ネットワークの重み係数の学習には誤差逆伝搬法
(バックプロパゲーション法)等のアルゴリズムを用い
ることができる。
【0023】このネットワークには線形予測分析部42
からの狭帯域音声信号のLPCケプストラム係数x1 〜
xN を入力し、出力には広帯域のLPCケプストラム係
数y 1 〜yN が出力されるように重み係数の学習を行
う。また、推定に用いるパラメータとしてはLPCケプ
ストラム係数以外にも反射係数等さまざまなものを用い
ることができる。
からの狭帯域音声信号のLPCケプストラム係数x1 〜
xN を入力し、出力には広帯域のLPCケプストラム係
数y 1 〜yN が出力されるように重み係数の学習を行
う。また、推定に用いるパラメータとしてはLPCケプ
ストラム係数以外にも反射係数等さまざまなものを用い
ることができる。
【0024】このスペクトルの変換関数は一般的には非
線形と考えられるため、ニューラルネットワーク部の適
用により線形変換を用いる場合より変換精度の向上が期
待できる。また、未学習入力に対する外挿効果も有す
る。
線形と考えられるため、ニューラルネットワーク部の適
用により線形変換を用いる場合より変換精度の向上が期
待できる。また、未学習入力に対する外挿効果も有す
る。
【0025】逆フィルタ43は狭帯域入力音声信号に対
して線形予測分析部42からの狭帯域予測係数を用いて
逆フィルタ処理を行い、狭帯域予測残差信号を求める。
して線形予測分析部42からの狭帯域予測係数を用いて
逆フィルタ処理を行い、狭帯域予測残差信号を求める。
【0026】次にこの狭帯域予測残差信号に対してサン
プル毎に非線形処理部45が非線形処理を施すことによ
り広帯域予測残差信号を生成する。これは絶対値演算の
ような非線形処理により高調波成分が発生することを利
用している。
プル毎に非線形処理部45が非線形処理を施すことによ
り広帯域予測残差信号を生成する。これは絶対値演算の
ような非線形処理により高調波成分が発生することを利
用している。
【0027】また非線形処理部45により広帯域化した
予測残差信号をニューラルネットワーク部44からの広
帯域予測係数を係数とする予測合成フィルタ46に通し
て広帯域音声信号を生成する。
予測残差信号をニューラルネットワーク部44からの広
帯域予測係数を係数とする予測合成フィルタ46に通し
て広帯域音声信号を生成する。
【0028】この広帯域音声信号は、帯域通過フィルタ
48及び49を通すことにより、音声信号の低域周波数
成分(50−300Hz)及び高域周波数成分(3400
−7000Hz)をそれぞれ抽出する。
48及び49を通すことにより、音声信号の低域周波数
成分(50−300Hz)及び高域周波数成分(3400
−7000Hz)をそれぞれ抽出する。
【0029】そして、中域周波数成分(300−340
0Hz)が狭帯域入力信号から帯域通過フィルタ47によ
り取り出されて合成部50により帯域通過フィルタ48
及び49の低域周波数成分及び高域周波数成分に加え合
わせることで、広帯域音声信号(50−7000Hz)を
生成している。
0Hz)が狭帯域入力信号から帯域通過フィルタ47によ
り取り出されて合成部50により帯域通過フィルタ48
及び49の低域周波数成分及び高域周波数成分に加え合
わせることで、広帯域音声信号(50−7000Hz)を
生成している。
【0030】図3は図1に示した実施例の変形例を示し
たもので、この実施例では、図1に示したニューラルネ
ットワーク部44を、線形予測分析部42からの狭帯域
予測係数より低域部予測係数及び高域部予測係数をそれ
ぞれ推定する第1及び第2のニューラルネットワーク部
44a及び44bで構成しており、合成フィルタ46
を、ニューラルネットワーク部44a及び44bからの
低域部予測係数及び高域部予測係数を係数とし、それぞ
れ非線形処理部45からの広帯域予測誤差信号を入力信
号とし、各出力をそれぞれ帯域通過フィルタ48及び4
9に与える第1及び第2の合成フィルタ46a及び46
bで構成している。
たもので、この実施例では、図1に示したニューラルネ
ットワーク部44を、線形予測分析部42からの狭帯域
予測係数より低域部予測係数及び高域部予測係数をそれ
ぞれ推定する第1及び第2のニューラルネットワーク部
44a及び44bで構成しており、合成フィルタ46
を、ニューラルネットワーク部44a及び44bからの
低域部予測係数及び高域部予測係数を係数とし、それぞ
れ非線形処理部45からの広帯域予測誤差信号を入力信
号とし、各出力をそれぞれ帯域通過フィルタ48及び4
9に与える第1及び第2の合成フィルタ46a及び46
bで構成している。
【0031】即ち、線形予測分析部42で求めた狭帯域
予測係数を入力とするニューラルネットワーク部44a
及び44bを用いて低域部(50−300Hz)および高
域部(3400−7000Hz)の予測係数をそれぞれ推
定する。
予測係数を入力とするニューラルネットワーク部44a
及び44bを用いて低域部(50−300Hz)および高
域部(3400−7000Hz)の予測係数をそれぞれ推
定する。
【0032】そして、逆フィルタ43で求めた狭帯域予
測残差信号を非線形処理部45で広帯域予測残差信号を
生成し、この広帯域予測残差信号をニューラルネットワ
ーク部44a及び44bからの低域部の予測係数および
高域部の予測係数をそれぞれ係数とする合成フィルタ4
6a及び46bに通すことにより音声の低域周波数成分
および高域周波数成分をそれぞれ生成する。
測残差信号を非線形処理部45で広帯域予測残差信号を
生成し、この広帯域予測残差信号をニューラルネットワ
ーク部44a及び44bからの低域部の予測係数および
高域部の予測係数をそれぞれ係数とする合成フィルタ4
6a及び46bに通すことにより音声の低域周波数成分
および高域周波数成分をそれぞれ生成する。
【0033】各合成フィルタ46a及び46bの出力信
号の低域部(50−300Hz)および高域部(3400
−7000Hz)をそれぞれ帯域通過フィルタ48及び4
9を通した後に、これらの二つの信号を、帯域通過フィ
ルタ47を通した中域周波数帯域(300−3400H
z)の入力音声信号に加え合わせることで、広帯域(5
0−7000Hz)音声信号を生成することができる。
号の低域部(50−300Hz)および高域部(3400
−7000Hz)をそれぞれ帯域通過フィルタ48及び4
9を通した後に、これらの二つの信号を、帯域通過フィ
ルタ47を通した中域周波数帯域(300−3400H
z)の入力音声信号に加え合わせることで、広帯域(5
0−7000Hz)音声信号を生成することができる。
【0034】第1の実施例では、電話帯域のスペクトル
から7000Hz帯域のスペクトルを直接推定している
が、上記の低域周波数成分および高域周波数成分はオー
バーラップしているため、変換関数の学習の際に実際に
使用しない中域周波数帯域(300−3400Hz)も含
めて学習を行うために無駄が生じることになる。
から7000Hz帯域のスペクトルを直接推定している
が、上記の低域周波数成分および高域周波数成分はオー
バーラップしているため、変換関数の学習の際に実際に
使用しない中域周波数帯域(300−3400Hz)も含
めて学習を行うために無駄が生じることになる。
【0035】第2の実施例ではこのようなことがないた
め、学習の効率を上げることができる。
め、学習の効率を上げることができる。
【0036】
【発明の効果】以上説明したように本発明に係る音声通
信システムによれば、広帯域化処理部が、狭帯域受話音
声信号を線形予測分析分析して狭帯域予測係数及び狭帯
域予測残差信号を求め、該狭帯域予測係数からニューラ
ルネットワーク部により広帯域予測係数を推定し、該狭
帯域予測残差信号に対して非線形演算を施して広帯域予
測誤差信号を発生させて該広帯域予測係数を用いて予測
合成を行い、この合成信号から低域周波数成分と高域周
波数成分を抽出した後、狭帯域受話音声信号の中域周波
数成分と合成して広帯域音声信号を求めるように構成し
たので、狭帯域音声の予測残差信号に対して非線形処理
時に発生する高調波成分を利用することにより、少ない
演算量で帯域を増加させることなく広帯域音声信号の再
生を行うことができ、受話音声品質の改善が図れる。
信システムによれば、広帯域化処理部が、狭帯域受話音
声信号を線形予測分析分析して狭帯域予測係数及び狭帯
域予測残差信号を求め、該狭帯域予測係数からニューラ
ルネットワーク部により広帯域予測係数を推定し、該狭
帯域予測残差信号に対して非線形演算を施して広帯域予
測誤差信号を発生させて該広帯域予測係数を用いて予測
合成を行い、この合成信号から低域周波数成分と高域周
波数成分を抽出した後、狭帯域受話音声信号の中域周波
数成分と合成して広帯域音声信号を求めるように構成し
たので、狭帯域音声の予測残差信号に対して非線形処理
時に発生する高調波成分を利用することにより、少ない
演算量で帯域を増加させることなく広帯域音声信号の再
生を行うことができ、受話音声品質の改善が図れる。
【図1】本発明に係る音声通信システムに用いる広帯域
化処理部の実施例(1)を示したブロック図である。
化処理部の実施例(1)を示したブロック図である。
【図2】本発明に係る音声通信システムに用いる広帯域
化処理部におけるニューラルネットワーク部の構成例を
示した図である。
化処理部におけるニューラルネットワーク部の構成例を
示した図である。
【図3】本発明に係る音声通信システムに用いる広帯域
化処理部の実施例(2)を示したブロック図である。
化処理部の実施例(2)を示したブロック図である。
【図4】従来から一般的な狭帯域音声通信システムの概
念構成例を示したブロック図である。
念構成例を示したブロック図である。
【図5】従来及び本発明に係る狭帯域音声通信システム
に共通な概念構成を示したブロック図である。
に共通な概念構成を示したブロック図である。
3 狭帯域音声受信器 4 広帯域化処理部 41 A/D変換器 42 線形予測分析部 43 逆フィルタ 44,44a,44b ニューラルネットワーク部 45 非線形処理部 46,46a,46b 合成フィルタ 47〜49 帯域通過フィルタ 50 合成部 図中、同一符号は同一又は相当部分を示す。
Claims (3)
- 【請求項1】伝送路からの狭帯域音声信号を広帯域化処
理部で広帯域化して出力する音声通信システムにおい
て、 該広帯域化処理部が、狭帯域受話音声信号をアナログ/
デジタル変換する変換器と、該変換器の出力信号に対し
て線形予測分析分析を行うことにより狭帯域予測係数を
求める線形予測分析部と、該変換器の出力信号及び該狭
帯域予測係数から狭帯域予測残差信号を求める逆フィル
タと、該狭帯域予測係数から広帯域予測係数を推定する
ニューラルネットワーク部と、該狭帯域予測残差信号に
対して非線形演算を施して広帯域予測誤差信号を発生さ
せる非線形処理部と、該広帯域予測係数を係数とし、該
広帯域予測誤差信号を入力信号とする合成フィルタと、
該変換器の出力信号の第1の周波数帯域を通過させる第
1の帯域通過フィルタと、該合成フィルタの出力信号の
第2及び第3の周波数帯域をそれぞれ通過させる第2及
び第3の帯域通過フィルタと、該第1乃至第3の帯域通
過フィルタの出力信号を入力して広帯域音声信号を合成
する合成部と、を備えていることを特徴とした音声通信
システム。 - 【請求項2】請求項1に記載の音声通信システムにおい
て、該ニューラルネットワーク部が、該狭帯域予測係数
から低域部予測係数及び高域部予測係数をそれぞれ推定
する第1及び第2のニューラルネットワーク部で構成さ
れており、該合成フィルタが、該低域部予測係数及び高
域部予測係数をそれぞれ係数とし、該広帯域予測誤差信
号を入力信号とする第1及び第2の合成フィルタで構成
されていることを特徴とした音声通信システム。 - 【請求項3】請求項1又は2に記載の音声通信システム
において、該非線形処理部が、全波整流、半波整流、又
は二乗演算を用いることを特徴とした音声通信システ
ム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7080034A JPH08278800A (ja) | 1995-04-05 | 1995-04-05 | 音声通信システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7080034A JPH08278800A (ja) | 1995-04-05 | 1995-04-05 | 音声通信システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08278800A true JPH08278800A (ja) | 1996-10-22 |
Family
ID=13706986
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7080034A Withdrawn JPH08278800A (ja) | 1995-04-05 | 1995-04-05 | 音声通信システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH08278800A (ja) |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2004025625A1 (ja) * | 2002-09-12 | 2004-03-25 | Sony Corporation | 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム |
| JP2006085176A (ja) * | 2004-09-17 | 2006-03-30 | Harman Becker Automotive Systems Gmbh | 帯域制限オーディオ信号の帯域拡大 |
| KR100598614B1 (ko) * | 2004-08-23 | 2006-07-07 | 에스케이 텔레콤주식회사 | 지각적 가중필터를 이용한 음성신호의 광대역 확장시스템및 방법 |
| WO2009056027A1 (en) * | 2007-11-02 | 2009-05-07 | Huawei Technologies Co., Ltd. | An audio decoding method and device |
| US8050142B2 (en) | 2007-12-06 | 2011-11-01 | Sanyo Electric Co., Ltd. | Sound collection environment deciding device, sound processing device, electronic appliance, sound collection environment deciding method and sound processing method |
| JP4859670B2 (ja) * | 2004-10-27 | 2012-01-25 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
| CN112863477A (zh) * | 2020-12-31 | 2021-05-28 | 出门问问(苏州)信息科技有限公司 | 一种语音合成方法、装置及存储介质 |
| CN113345406A (zh) * | 2021-05-19 | 2021-09-03 | 苏州奇梦者网络科技有限公司 | 神经网络声码器语音合成的方法、装置、设备以及介质 |
| JP2022527810A (ja) * | 2019-09-18 | 2022-06-06 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 周波数帯域拡張方法、装置、電子デバイスおよびコンピュータプログラム |
-
1995
- 1995-04-05 JP JP7080034A patent/JPH08278800A/ja not_active Withdrawn
Cited By (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1302457C (zh) * | 2002-09-12 | 2007-02-28 | 索尼株式会社 | 信号处理系统、信号处理设备和方法 |
| WO2004025625A1 (ja) * | 2002-09-12 | 2004-03-25 | Sony Corporation | 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム |
| US7668319B2 (en) | 2002-09-12 | 2010-02-23 | Sony Corporation | Signal processing system, signal processing apparatus and method, recording medium, and program |
| US7986797B2 (en) | 2002-09-12 | 2011-07-26 | Sony Corporation | Signal processing system, signal processing apparatus and method, recording medium, and program |
| KR100598614B1 (ko) * | 2004-08-23 | 2006-07-07 | 에스케이 텔레콤주식회사 | 지각적 가중필터를 이용한 음성신호의 광대역 확장시스템및 방법 |
| JP2006085176A (ja) * | 2004-09-17 | 2006-03-30 | Harman Becker Automotive Systems Gmbh | 帯域制限オーディオ信号の帯域拡大 |
| JP4859670B2 (ja) * | 2004-10-27 | 2012-01-25 | パナソニック株式会社 | 音声符号化装置および音声符号化方法 |
| WO2009056027A1 (en) * | 2007-11-02 | 2009-05-07 | Huawei Technologies Co., Ltd. | An audio decoding method and device |
| US8473301B2 (en) | 2007-11-02 | 2013-06-25 | Huawei Technologies Co., Ltd. | Method and apparatus for audio decoding |
| US8050142B2 (en) | 2007-12-06 | 2011-11-01 | Sanyo Electric Co., Ltd. | Sound collection environment deciding device, sound processing device, electronic appliance, sound collection environment deciding method and sound processing method |
| JP2022527810A (ja) * | 2019-09-18 | 2022-06-06 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 周波数帯域拡張方法、装置、電子デバイスおよびコンピュータプログラム |
| US12002479B2 (en) | 2019-09-18 | 2024-06-04 | Tencent Technology (Shenzhen) Company Limited | Bandwidth extension method and apparatus, electronic device, and computer-readable storage medium |
| CN112863477A (zh) * | 2020-12-31 | 2021-05-28 | 出门问问(苏州)信息科技有限公司 | 一种语音合成方法、装置及存储介质 |
| CN112863477B (zh) * | 2020-12-31 | 2023-06-27 | 出门问问(苏州)信息科技有限公司 | 一种语音合成方法、装置及存储介质 |
| CN113345406A (zh) * | 2021-05-19 | 2021-09-03 | 苏州奇梦者网络科技有限公司 | 神经网络声码器语音合成的方法、装置、设备以及介质 |
| CN113345406B (zh) * | 2021-05-19 | 2024-01-09 | 苏州奇梦者网络科技有限公司 | 神经网络声码器语音合成的方法、装置、设备以及介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Jayant et al. | Signal compression based on models of human perception | |
| JP3283413B2 (ja) | 符号化復号方法、符号化装置および復号装置 | |
| US5317567A (en) | Multi-speaker conferencing over narrowband channels | |
| US6496795B1 (en) | Modulated complex lapped transform for integrated signal enhancement and coding | |
| US8428959B2 (en) | Audio packet loss concealment by transform interpolation | |
| JPH0955778A (ja) | 音声信号の広帯域化装置 | |
| JPH08278799A (ja) | 雑音荷重フィルタリング方法 | |
| US5457685A (en) | Multi-speaker conferencing over narrowband channels | |
| JP2010170142A (ja) | ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置 | |
| CN1254221A (zh) | 基于窄带信号产生宽带信号的方法装置及其技术设备 | |
| JP3219762B2 (ja) | 信号伝送方法 | |
| CA2399253C (en) | Speech decoder and method of decoding speech involving frequency expansion | |
| US9118805B2 (en) | Multi-point connection device, signal analysis and device, method, and program | |
| JPH09204200A (ja) | 会議システム | |
| JPH08278800A (ja) | 音声通信システム | |
| US5272698A (en) | Multi-speaker conferencing over narrowband channels | |
| JPH0946233A (ja) | 音声符号化方法とその装置、音声復号方法とその装置 | |
| JP3747072B2 (ja) | 加入者端末ユニット | |
| JPH10340097A (ja) | 快適雑音発生装置及び該装置の構成要素を含む音声エンコーダ及びデコーダ | |
| JP2570603B2 (ja) | 音声信号伝送装置およびノイズ抑圧装置 | |
| JPS62239631A (ja) | ステレオ音声伝送蓄積方式 | |
| JP3946074B2 (ja) | 音声処理装置 | |
| CN117542342A (zh) | 一种基于自适应滤波与神经网络的回声消除方法 | |
| JPH08130494A (ja) | 音声信号処理システム | |
| JP2005114814A (ja) | 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20020702 |