JP2002026964A - 音声パケット送信装置、音声パケット受信装置、及びパケット通信システム - Google Patents
音声パケット送信装置、音声パケット受信装置、及びパケット通信システムInfo
- Publication number
- JP2002026964A JP2002026964A JP2000200584A JP2000200584A JP2002026964A JP 2002026964 A JP2002026964 A JP 2002026964A JP 2000200584 A JP2000200584 A JP 2000200584A JP 2000200584 A JP2000200584 A JP 2000200584A JP 2002026964 A JP2002026964 A JP 2002026964A
- Authority
- JP
- Japan
- Prior art keywords
- packet
- voice
- receiving
- voice packet
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims description 30
- 230000005540 biological transmission Effects 0.000 claims abstract description 15
- 238000001514 detection method Methods 0.000 abstract description 5
- 230000006866 deterioration Effects 0.000 abstract description 5
- 238000000034 method Methods 0.000 description 41
- 230000006870 function Effects 0.000 description 26
- 238000004364 calculation method Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 16
- 230000006835 compression Effects 0.000 description 11
- 238000007906 compression Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000007423 decrease Effects 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 125000000205 L-threonino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])[C@](C([H])([H])[H])([H])O[H] 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
(57)【要約】
【課題】 音質低下を最小限度内に抑制する。
【解決手段】 音声パケット送信装置から送信された音
声パケットを、所定のネットワークを介して受信する音
声パケット受信装置において、前記ネットワーク上のト
ラフィックに対応して変動する音声パケットの受信状況
を検出する受信状況検出手段と、当該受信状況検出手段
が検出した受信状況に応じた受信状況情報を、前記音声
パケット送信装置に送達するため、前記ネットワークに
送信する受信状況情報送信手段とを備える。
声パケットを、所定のネットワークを介して受信する音
声パケット受信装置において、前記ネットワーク上のト
ラフィックに対応して変動する音声パケットの受信状況
を検出する受信状況検出手段と、当該受信状況検出手段
が検出した受信状況に応じた受信状況情報を、前記音声
パケット送信装置に送達するため、前記ネットワークに
送信する受信状況情報送信手段とを備える。
Description
【0001】
【発明の属する技術分野】本発明はパケット通信システ
ムに関し、例えば、インターネットなどのパケット通信
網を使って音声通信を行う場合に適用し得るものであ
る。
ムに関し、例えば、インターネットなどのパケット通信
網を使って音声通信を行う場合に適用し得るものであ
る。
【0002】また、本発明は、かかるパケット通信シス
テムの構成要素としての音声パケット受信装置に関する
ものである。
テムの構成要素としての音声パケット受信装置に関する
ものである。
【0003】さらに本発明は、かかるパケット通信シス
テムの構成要素としての音声パケット送信装置に関する
ものである。
テムの構成要素としての音声パケット送信装置に関する
ものである。
【0004】
【従来の技術】現在、インターネットなどのパケット通
信網を使って音声通信をおこなう方法(いわゆるインタ
ーネット電話等)が盛んである。
信網を使って音声通信をおこなう方法(いわゆるインタ
ーネット電話等)が盛んである。
【0005】
【発明が解決しようとする課題】ところが、このような
パケット通信において良好な音質を確保するためには、
ビットレートと音質の関係が重要な問題となっている。
パケット通信において良好な音質を確保するためには、
ビットレートと音質の関係が重要な問題となっている。
【0006】ビットレートを上げれば符号化歪みは減り
音質が向上するが、ネットワーク上のトラフィックが増
加するため、パケット到着時間が不安定になり、バッフ
ァリング遅延やパケット損失(パケットロス)を許容せ
ざるを得ず、結果的に音質は低下する。一方ビットレー
トを下げれば、トラフィック面の問題は緩和されるが符
号化歪みが増大し、やはり音質は低下する。
音質が向上するが、ネットワーク上のトラフィックが増
加するため、パケット到着時間が不安定になり、バッフ
ァリング遅延やパケット損失(パケットロス)を許容せ
ざるを得ず、結果的に音質は低下する。一方ビットレー
トを下げれば、トラフィック面の問題は緩和されるが符
号化歪みが増大し、やはり音質は低下する。
【0007】この問題に対する解決方法の一つとして、
無音圧縮方法が使われている。無音圧縮方法は音声の無
音期間中における伝送ビットを低減するために使用され
る方法で、送信側で1フレーム毎にそのフレームが有音
か無音かを判定(以下、「有音判定」)し、無音フレー
ムであれば有音フレームと比べて少ない情報量に符号化
して、ネットワークに送出する方法である。人間同士の
会話において、片方の話者につき一般に50%〜60%
は無音だといわれており、無音圧縮方法は、平均ビット
レートを下げるために、極めて効果の高い符号化方法で
ある。
無音圧縮方法が使われている。無音圧縮方法は音声の無
音期間中における伝送ビットを低減するために使用され
る方法で、送信側で1フレーム毎にそのフレームが有音
か無音かを判定(以下、「有音判定」)し、無音フレー
ムであれば有音フレームと比べて少ない情報量に符号化
して、ネットワークに送出する方法である。人間同士の
会話において、片方の話者につき一般に50%〜60%
は無音だといわれており、無音圧縮方法は、平均ビット
レートを下げるために、極めて効果の高い符号化方法で
ある。
【0008】しかし、具体的な通信装置のなかで有音判
定をどのように実行するかについては、技術的に非常に
困難な面があり、有音判定レベルを厳しく(すなわち、
高く)設定し過ぎると本来発声区間であるはずのフレー
ムを無音と判定してしまったり、逆に有音判定レベルを
甘く(すなわち、低く)設定し過ぎると何も発声してい
ない区間のフレームでも有音と判定してしまったりする
場合があり、この判定誤りが音質劣化につながってい
る。よってネットワーク上のトラフィック量の観点から
ゆるされるのであれば、無音圧縮を極力おこなわないほ
うが、音質的に好ましい。
定をどのように実行するかについては、技術的に非常に
困難な面があり、有音判定レベルを厳しく(すなわち、
高く)設定し過ぎると本来発声区間であるはずのフレー
ムを無音と判定してしまったり、逆に有音判定レベルを
甘く(すなわち、低く)設定し過ぎると何も発声してい
ない区間のフレームでも有音と判定してしまったりする
場合があり、この判定誤りが音質劣化につながってい
る。よってネットワーク上のトラフィック量の観点から
ゆるされるのであれば、無音圧縮を極力おこなわないほ
うが、音質的に好ましい。
【0009】図2に無音圧縮レベルThresh(有音
判定レベル)を変化させた場合の、平均ビットレートと
音質の関係を示す。横軸は無音圧縮無しのとき(すなわ
ち、Thresh=0のとき)の平均ビットレートを1
00%として、平均ビットレートを示しており、縦軸
は、MOSテスト(5段階評価で数値が高いほど音質が
高いことを示す)による音質評価を示している。
判定レベル)を変化させた場合の、平均ビットレートと
音質の関係を示す。横軸は無音圧縮無しのとき(すなわ
ち、Thresh=0のとき)の平均ビットレートを1
00%として、平均ビットレートを示しており、縦軸
は、MOSテスト(5段階評価で数値が高いほど音質が
高いことを示す)による音質評価を示している。
【0010】Threshをあげていくとビットレート
は下がり音質も下がるのがわかる。したがって音質を確
保するためには送信時のネットワークに問題が生じない
範囲で、低いThreshを使うことが好ましいことが
わかる。ネットワーク上のトラフィックは時間とともに
変わるので、Threshも、当該トラフィックの変動
に対して動的に適応して変更していくのが好ましい。
は下がり音質も下がるのがわかる。したがって音質を確
保するためには送信時のネットワークに問題が生じない
範囲で、低いThreshを使うことが好ましいことが
わかる。ネットワーク上のトラフィックは時間とともに
変わるので、Threshも、当該トラフィックの変動
に対して動的に適応して変更していくのが好ましい。
【0011】有音判定レベルを動的に変更する方法とし
て、ノイズレベルに逐次適応していくVAD(有声検
出)アルゴリズムが知られている。
て、ノイズレベルに逐次適応していくVAD(有声検
出)アルゴリズムが知られている。
【0012】当該VADアルゴリズムを記載した文献と
しては、次の文献1がある。
しては、次の文献1がある。
【0013】文献1:ITU−T勧告 G.723.1
AnnexAただしこの文献1の方法は、時間的に変
化する背景雑音に有音判定レベルを適応させることが目
的であって、ネットワーク上のトラフィック量とは無関
係である。
AnnexAただしこの文献1の方法は、時間的に変
化する背景雑音に有音判定レベルを適応させることが目
的であって、ネットワーク上のトラフィック量とは無関
係である。
【0014】また、ネットワーク上のトラフィック量に
あわせて送信データレートを適応させる方法を記載した
文献としては、次の文献2がある。
あわせて送信データレートを適応させる方法を記載した
文献としては、次の文献2がある。
【0015】文献2:特開平11−177623号公報
ただしこの文献2の方法は、マルチレートオーディオエ
ンコーダを使って指示した正確な値にビットレートを適
応させるものであり、有音判定レベルを指定するもので
はない。
ただしこの文献2の方法は、マルチレートオーディオエ
ンコーダを使って指示した正確な値にビットレートを適
応させるものであり、有音判定レベルを指定するもので
はない。
【0016】結局、これらの文献1、文献2に記載され
た方法よっても、なお、ネットワーク上のトラフィック
量に負担をかけない範囲で、有音検出レベルを一定時間
単位で変化させ、音質劣化を最小に押さえるパケット音
声通信を提供するという課題は、達成されていない。
た方法よっても、なお、ネットワーク上のトラフィック
量に負担をかけない範囲で、有音検出レベルを一定時間
単位で変化させ、音質劣化を最小に押さえるパケット音
声通信を提供するという課題は、達成されていない。
【0017】
【課題を解決するための手段】かかる課題を解決するた
めに、第1の発明では、音声パケット送信装置から送信
された音声パケットを、所定のネットワークを介して受
信する音声パケット受信装置において、前記ネットワー
ク上のトラフィックに対応して変動する音声パケットの
受信状況を検出する受信状況検出手段と、当該受信状況
検出手段が検出した受信状況に応じた受信状況情報を、
前記音声パケット送信装置に送達するため、前記ネット
ワークに送信する受信状況情報送信手段とを備えたこと
を特徴とする。
めに、第1の発明では、音声パケット送信装置から送信
された音声パケットを、所定のネットワークを介して受
信する音声パケット受信装置において、前記ネットワー
ク上のトラフィックに対応して変動する音声パケットの
受信状況を検出する受信状況検出手段と、当該受信状況
検出手段が検出した受信状況に応じた受信状況情報を、
前記音声パケット送信装置に送達するため、前記ネット
ワークに送信する受信状況情報送信手段とを備えたこと
を特徴とする。
【0018】また、第2の発明では、所定のネットワー
クを介して音声パケット受信装置に音声パケットを送信
する音声パケット送信装置において、(1)送信しよう
とする音声フレームが有音であるか無音であるかを、判
定レベルに応じて判定する判定手段と、(2)当該判定
手段が無音と判定した無音フレームは、有音と判定した
有音フレームよりも少ない情報量となるように符号化す
る音声符号化手段と、(3)前記ネットワーク上のトラ
フィックに対応して変動する前記音声パケットの受信状
況に応じて、前記音声パケット受信装置が送信した受信
状況情報を、前記ネットワークを介して受信する受信状
況情報受信手段と、(4)当該受信状況情報受信手段が
受信した受信状況情報に応じて、前記判定レベルを変更
する判定レベル変更手段とを備えることを特徴とする。
クを介して音声パケット受信装置に音声パケットを送信
する音声パケット送信装置において、(1)送信しよう
とする音声フレームが有音であるか無音であるかを、判
定レベルに応じて判定する判定手段と、(2)当該判定
手段が無音と判定した無音フレームは、有音と判定した
有音フレームよりも少ない情報量となるように符号化す
る音声符号化手段と、(3)前記ネットワーク上のトラ
フィックに対応して変動する前記音声パケットの受信状
況に応じて、前記音声パケット受信装置が送信した受信
状況情報を、前記ネットワークを介して受信する受信状
況情報受信手段と、(4)当該受信状況情報受信手段が
受信した受信状況情報に応じて、前記判定レベルを変更
する判定レベル変更手段とを備えることを特徴とする。
【0019】さらに、第3の発明にかかるパケット通信
システムでは、請求項1の音声パケット受信装置と、請
求項2の音声パケット送信装置とを備えることを特徴と
する。
システムでは、請求項1の音声パケット受信装置と、請
求項2の音声パケット送信装置とを備えることを特徴と
する。
【0020】
【発明の実施の形態】(A)実施形態 以下、本発明の音声パケット送信装置、音声パケット受
信装置、及びパケット通信システムの実施形態について
説明する。
信装置、及びパケット通信システムの実施形態について
説明する。
【0021】(A−1)第1の実施形態の構成 本実施形態の通信システム10の全体構成を図1に示
す。
す。
【0022】図1において、当該通信システム10は、
音声送信端末11と、IP(インターネットプロトコ
ル)ネットワーク12と、音声受信端末13とを備えて
いる。
音声送信端末11と、IP(インターネットプロトコ
ル)ネットワーク12と、音声受信端末13とを備えて
いる。
【0023】このうち音声送信端末11は、音声入力部
20と、音声符号化部21と、音声パケット送信部22
と、受信状態情報受信部23と、有音判定レベル計算部
24とを備えている。
20と、音声符号化部21と、音声パケット送信部22
と、受信状態情報受信部23と、有音判定レベル計算部
24とを備えている。
【0024】音声入力部20は、例えばマイクロホンな
どによって外部から入力される音声を取り込み、当該音
声を1フレーム長ごとに音声データADに変換して出力
する部分である。
どによって外部から入力される音声を取り込み、当該音
声を1フレーム長ごとに音声データADに変換して出力
する部分である。
【0025】音声入力部20から当該音声データADを
受け取る音声符号化部21は、当該音声データADを固
定時間長(一例として、30ms)ごとに、音声フレー
ム(すなわち音声フレーム符号化データ)CFに変換し
て出力する部分である。この音声符号化部21は、無音
圧縮を実行する部分であるため、出力される音声フレー
ムCFは、無音フレーム(無音フレーム符号化データ)
CF2(図3参照)または有音フレーム(有音フレーム
符号化データ)CF1のいずれかである。
受け取る音声符号化部21は、当該音声データADを固
定時間長(一例として、30ms)ごとに、音声フレー
ム(すなわち音声フレーム符号化データ)CFに変換し
て出力する部分である。この音声符号化部21は、無音
圧縮を実行する部分であるため、出力される音声フレー
ムCFは、無音フレーム(無音フレーム符号化データ)
CF2(図3参照)または有音フレーム(有音フレーム
符号化データ)CF1のいずれかである。
【0026】すなわち、音声符号化部21は図3に示す
ような内部構成を持ち、有音判定部21Aと、有音フレ
ーム符号化部21Bと、無音フレーム符号化部21Cと
を備えている。
ような内部構成を持ち、有音判定部21Aと、有音フレ
ーム符号化部21Bと、無音フレーム符号化部21Cと
を備えている。
【0027】有音判定部21Aは、後述する有音判定レ
ベル計算部24から供給される有音判定レベル(有音検
出レベル)LTHに応じて前記有音判定を実行し、1フ
レーム分の音声データADごとに、有音と判定した音声
データADは有音フレーム符号化部21Bに供給し、無
音と判定した音声データADは無音フレーム符号化部2
1Cに供給する部分である。
ベル計算部24から供給される有音判定レベル(有音検
出レベル)LTHに応じて前記有音判定を実行し、1フ
レーム分の音声データADごとに、有音と判定した音声
データADは有音フレーム符号化部21Bに供給し、無
音と判定した音声データADは無音フレーム符号化部2
1Cに供給する部分である。
【0028】有音判定にあたり、有音判定部21Aは、
1フレーム分の音声データADの分散を計算し、その値
が前記有音判定レベルLTH以上の場合には有音、以下
の場合は無音と判定する。
1フレーム分の音声データADの分散を計算し、その値
が前記有音判定レベルLTH以上の場合には有音、以下
の場合は無音と判定する。
【0029】有音フレーム符号化部21Bは有音フレー
ムのために符号化データサイズが比較的多くなる符号化
を実行して前記有音フレームCF1を出力し、無音フレ
ーム符号化部21Cは無音フレームのために符号化デー
タサイズが少なくなる符号化を実行して、前記無音フレ
ームCF2を出力する部分である。例えば、有音フレー
ム符号化部21Bは16ビットPCM(Pulse Code M
odulation)方式で符号化を行い、無音フレーム符号化
21Cは4ビットPCM方式で符号化を行うものであっ
てよい。
ムのために符号化データサイズが比較的多くなる符号化
を実行して前記有音フレームCF1を出力し、無音フレ
ーム符号化部21Cは無音フレームのために符号化デー
タサイズが少なくなる符号化を実行して、前記無音フレ
ームCF2を出力する部分である。例えば、有音フレー
ム符号化部21Bは16ビットPCM(Pulse Code M
odulation)方式で符号化を行い、無音フレーム符号化
21Cは4ビットPCM方式で符号化を行うものであっ
てよい。
【0030】そして、図1に示した前記音声パケット送
信部22は、当該音声フレームCFをもとに音声パケッ
トAPを形成してネットワーク12へ送出する部分であ
る。1つの音声パケットAPには、1または複数の音声
フレームCFが収容されていてよいが、通常は、複数フ
レーム(例えば5フレーム)が、1つの音声パケットA
Pに収容される。
信部22は、当該音声フレームCFをもとに音声パケッ
トAPを形成してネットワーク12へ送出する部分であ
る。1つの音声パケットAPには、1または複数の音声
フレームCFが収容されていてよいが、通常は、複数フ
レーム(例えば5フレーム)が、1つの音声パケットA
Pに収容される。
【0031】また、当該音声パケット送信部22は、時
系列に送信される各音声パケットAPのパケットヘッダ
に、音声パケット系列の連続状態を示す連続情報を付与
する連続情報付与部22Aを備えている。本実施形態で
はこの連続情報を、送信順にしたがって1つずつインク
リメントされるパケット番号(pID)であるものとす
る。
系列に送信される各音声パケットAPのパケットヘッダ
に、音声パケット系列の連続状態を示す連続情報を付与
する連続情報付与部22Aを備えている。本実施形態で
はこの連続情報を、送信順にしたがって1つずつインク
リメントされるパケット番号(pID)であるものとす
る。
【0032】また、前記受信状態情報受信部23は、ネ
ットワーク12から受信状態情報SIを受信する部分で
ある。ネットワーク12はパケット通信網なので、当該
受信状態情報SIも、パケットRPに収容されて伝送さ
れてくる。受信状態情報受信部23は、このパケットR
Pのなかから受信状態情報SIを抽出して有音判定レベ
ル計算部24に出力する。
ットワーク12から受信状態情報SIを受信する部分で
ある。ネットワーク12はパケット通信網なので、当該
受信状態情報SIも、パケットRPに収容されて伝送さ
れてくる。受信状態情報受信部23は、このパケットR
Pのなかから受信状態情報SIを抽出して有音判定レベ
ル計算部24に出力する。
【0033】有音判定レベル計算部24は、当該受信状
態情報SIに応じて、前記有音判定レベルLTHを変更
する部分である。
態情報SIに応じて、前記有音判定レベルLTHを変更
する部分である。
【0034】有音判定レベルLTHは、前記無音圧縮レ
ベルThreshに対応する閾値である。したがって上
述したように、有音判定レベルLTHを高く設定し過ぎ
ると本来発声区間であるはずのフレームの音声データA
Dを無音と判定してしまったり、逆に有音判定レベルL
THを低く設定し過ぎると何も発声していない区間のフ
レームの音声データADを有音と判定してしまったりす
る場合があり、音質劣化につながる。
ベルThreshに対応する閾値である。したがって上
述したように、有音判定レベルLTHを高く設定し過ぎ
ると本来発声区間であるはずのフレームの音声データA
Dを無音と判定してしまったり、逆に有音判定レベルL
THを低く設定し過ぎると何も発声していない区間のフ
レームの音声データADを有音と判定してしまったりす
る場合があり、音質劣化につながる。
【0035】有音判定レベル計算部24は、有音判定レ
ベルLTHを受信状態情報SIに適応させることによ
り、このような音質劣化を最小限度に抑制する。
ベルLTHを受信状態情報SIに適応させることによ
り、このような音質劣化を最小限度に抑制する。
【0036】一方、ネットワーク12を介して前記音声
パケットAPを受信するとともに、前記パケットRPの
送信元でもある音声受信端末13は、音声パケット受信
部30と、音声復号部31と、音声出力部32と、受信
状態情報作成部33と、受信状態情報送信部34とを備
えている。
パケットAPを受信するとともに、前記パケットRPの
送信元でもある音声受信端末13は、音声パケット受信
部30と、音声復号部31と、音声出力部32と、受信
状態情報作成部33と、受信状態情報送信部34とを備
えている。
【0037】このうち音声パケット受信部30は、前記
音声送信端末11内の音声パケット送信部22が送信し
た音声パケットAPを、ネットワーク12から受信する
部分である。当該音声パケット受信部30は、受信した
音声パケットAPから抽出した音声フレームCFは音声
復号部31に供給し、前記パケット番号pIDは受信状
態を示す受信状態データSDとして受信状態情報作成部
33に供給する。
音声送信端末11内の音声パケット送信部22が送信し
た音声パケットAPを、ネットワーク12から受信する
部分である。当該音声パケット受信部30は、受信した
音声パケットAPから抽出した音声フレームCFは音声
復号部31に供給し、前記パケット番号pIDは受信状
態を示す受信状態データSDとして受信状態情報作成部
33に供給する。
【0038】音声フレームCFを受け取った音声復号部
31は、当該音声フレームCFを音声データADに変換
して音声出力部32に出力する。
31は、当該音声フレームCFを音声データADに変換
して音声出力部32に出力する。
【0039】音声出力部32は、例えばスピーカなどに
よって、当該音声データADに対応した音声出力を行う
部分である。
よって、当該音声データADに対応した音声出力を行う
部分である。
【0040】また、前記受信状態情報作成部33は、前
記受信状態データSDをもとに後述する処理を行って受
信状態情報SIを作成し、受信状態情報送信部34へ出
力する部分である。
記受信状態データSDをもとに後述する処理を行って受
信状態情報SIを作成し、受信状態情報送信部34へ出
力する部分である。
【0041】受信状態情報送信部34は、当該受信状態
情報SIを収容したパケットRPを作成してネットワー
ク12へ送出する。当該パケットRPは、宛先として前
記音声送信端末11を指定するルーティング情報を付与
される。
情報SIを収容したパケットRPを作成してネットワー
ク12へ送出する。当該パケットRPは、宛先として前
記音声送信端末11を指定するルーティング情報を付与
される。
【0042】なお、前記音声送信端末11および音声受
信端末13は、一例として、IPネットワークインタフ
ェース手段とサウンド入出力手段を備えたPC(パーソ
ナルコンピュータ)等で実現することができる。
信端末13は、一例として、IPネットワークインタフ
ェース手段とサウンド入出力手段を備えたPC(パーソ
ナルコンピュータ)等で実現することができる。
【0043】以下、上記のような構成を有する本実施形
態の動作について説明する。
態の動作について説明する。
【0044】(A−2)第1の実施形態の動作外部から
入力した音声信号は、音声入力部20で1フレーム単位
の音声データADに変換され、音声符号化部21に供給
される。
入力した音声信号は、音声入力部20で1フレーム単位
の音声データADに変換され、音声符号化部21に供給
される。
【0045】音声符号化部21による符号化、音声パケ
ット送信部22によるパケット化を経て、前記音声パケ
ットAPがネットワーク12に送出される。
ット送信部22によるパケット化を経て、前記音声パケ
ットAPがネットワーク12に送出される。
【0046】当該音声パケットAPには音声受信端末1
3を指定するルーティング情報が付与されているので、
IPネットワーク12によって音声受信端末13まで転
送される。
3を指定するルーティング情報が付与されているので、
IPネットワーク12によって音声受信端末13まで転
送される。
【0047】音声送信端末11が次々と時系列に音声パ
ケットAPを送出すると、前記連続情報付与部22A
は、パケット番号pIDとして、第1番目の音声パケッ
トAP(1)には「1」(10進数表示)を付与する。
ケットAPを送出すると、前記連続情報付与部22A
は、パケット番号pIDとして、第1番目の音声パケッ
トAP(1)には「1」(10進数表示)を付与する。
【0048】同様に、第2番目の音声パケットAP
(2)にはパケット番号pIDとして「2」が、第3番
目の音声パケットAP(3)にはパケット番号pIDと
して「3」が、第4番目の音声パケットAP(4)には
パケット番号pIDとして「4」が、…、第N番目の音
声パケットAP(N)にはパケット番号pIDとして
「N」が、それぞれ付与される。
(2)にはパケット番号pIDとして「2」が、第3番
目の音声パケットAP(3)にはパケット番号pIDと
して「3」が、第4番目の音声パケットAP(4)には
パケット番号pIDとして「4」が、…、第N番目の音
声パケットAP(N)にはパケット番号pIDとして
「N」が、それぞれ付与される。
【0049】したがって、ネットワーク12のトラフィ
ックが通常範囲内にあり輻輳度が通常程度であれば、音
声受信端末13における受信状態も正常となり、前記音
声パケットAP(1)〜AP(N)が、1パケットも抜
け落ちることなくこの順番に受信される。このとき、音
声受信端末13内において音声パケット受信部30が出
力する受信状態データSDは、1ずつインクリメントさ
れた抜けのない連続した「1」〜「N」のパケット番号
pIDとなる。
ックが通常範囲内にあり輻輳度が通常程度であれば、音
声受信端末13における受信状態も正常となり、前記音
声パケットAP(1)〜AP(N)が、1パケットも抜
け落ちることなくこの順番に受信される。このとき、音
声受信端末13内において音声パケット受信部30が出
力する受信状態データSDは、1ずつインクリメントさ
れた抜けのない連続した「1」〜「N」のパケット番号
pIDとなる。
【0050】ところが、ネットワーク12のトラフィッ
クが通常範囲を超えて輻輳度が通常よりも高まると、ネ
ットワーク12中でパケット損失が発生して前記音声パ
ケットAP(1)〜AP(N)のなかに受信できないも
のが生じる。
クが通常範囲を超えて輻輳度が通常よりも高まると、ネ
ットワーク12中でパケット損失が発生して前記音声パ
ケットAP(1)〜AP(N)のなかに受信できないも
のが生じる。
【0051】このときは、前記音声パケット受信部30
が出力する受信状態データSDに抜けが発生する。
が出力する受信状態データSDに抜けが発生する。
【0052】受信状態データSDが例えば、1,2,
3,4,…,M−1、M+1,…,Nとなる場合は、M
番目の音声パケットAP(M)がパケット損失によって
失われたケースである。
3,4,…,M−1、M+1,…,Nとなる場合は、M
番目の音声パケットAP(M)がパケット損失によって
失われたケースである。
【0053】このような受信状態データSD(受信され
たパケット番号pID)を、受信状態情報SIに変換す
るのは、図4に示した通りの、受信状態情報作成部33
の処理による。
たパケット番号pID)を、受信状態情報SIに変換す
るのは、図4に示した通りの、受信状態情報作成部33
の処理による。
【0054】図4のフローチャートは、S10〜S17
の各ステップから構成されている。図4では、受信状態
情報SIとして、100パケット当たりのパケット損失
数(すなわちパケット損失率)を算出して出力する。
の各ステップから構成されている。図4では、受信状態
情報SIとして、100パケット当たりのパケット損失
数(すなわちパケット損失率)を算出して出力する。
【0055】図4において、受信状態情報作成部33の
処理がスタートすると、初期値として変数Num、変数
Loss、変数Last_pIDにはすべて、「0」が
代入される(S10)。ここで、変数(パケットカウン
タ)Numは、受信された音声パケットAPの数を示
し、変数(パケットロスカウンタ)Lossはパケット
損失によって失われた音声パケットAPの数を示し、変
数Last_pIDは、これから図4のフローチャート
を用いて処理しようとしている音声パケットAP(X)
の直前に受信された音声パケットAP(X−1)が持っ
ていたpIDを示す。
処理がスタートすると、初期値として変数Num、変数
Loss、変数Last_pIDにはすべて、「0」が
代入される(S10)。ここで、変数(パケットカウン
タ)Numは、受信された音声パケットAPの数を示
し、変数(パケットロスカウンタ)Lossはパケット
損失によって失われた音声パケットAPの数を示し、変
数Last_pIDは、これから図4のフローチャート
を用いて処理しようとしている音声パケットAP(X)
の直前に受信された音声パケットAP(X−1)が持っ
ていたpIDを示す。
【0056】なお、変数とは、ハードウエア的には、そ
の目的のためにメモリ上に確保された領域を意味する。
以下においても同じである。
の目的のためにメモリ上に確保された領域を意味する。
以下においても同じである。
【0057】次に、関数Get_pIDが受信状態デー
タSDとして音声パケット受信部30から供給された音
声パケットAP(X)のpIDの値を取得し、その値を
変数pIDに代入する(S11)。この関数Get_p
IDは、新たなパケット番号pIDが音声パケット受信
部30から供給されるたびに同じ処理を行う。
タSDとして音声パケット受信部30から供給された音
声パケットAP(X)のpIDの値を取得し、その値を
変数pIDに代入する(S11)。この関数Get_p
IDは、新たなパケット番号pIDが音声パケット受信
部30から供給されるたびに同じ処理を行う。
【0058】そしてステップS12では、変数Numの
値が「100」(10進数表示)に等しいかどうかが検
査され、等しい場合にはYes側に分岐し、等しくない
場合にはNo側に分岐する。
値が「100」(10進数表示)に等しいかどうかが検
査され、等しい場合にはYes側に分岐し、等しくない
場合にはNo側に分岐する。
【0059】最初、変数Numには前記「0」が代入さ
れているので、この分岐はNo側が選択される。もっと
も早い場合でも、ステップS12がYes側に分岐する
のは、101番目の音声パケットAP(101)が受信
されたときである。パケット損失があるとこの101
が、当該パケット損失数だけ大きくなり、ステップS1
2のYes側の分岐が選択されるタイミングが遅くな
る。
れているので、この分岐はNo側が選択される。もっと
も早い場合でも、ステップS12がYes側に分岐する
のは、101番目の音声パケットAP(101)が受信
されたときである。パケット損失があるとこの101
が、当該パケット損失数だけ大きくなり、ステップS1
2のYes側の分岐が選択されるタイミングが遅くな
る。
【0060】X(1≦X≦101。ただしXは自然数)
番目のパケットである音声パケットAP(X)を処理す
るときには、それまでにパケット損失がなければ、当該
変数Numの値は、X−1である。
番目のパケットである音声パケットAP(X)を処理す
るときには、それまでにパケット損失がなければ、当該
変数Numの値は、X−1である。
【0061】ステップS12がNo側に分岐するとステ
ップS13の処理が行われる。
ップS13の処理が行われる。
【0062】ステップS13では、当該音声パケットA
P(X)の変数pIDの値が、前記Last_pIDに
「1」を加えた値に等しいかどうかが検査される。すな
わち、前記受信状態データSDとして音声パケット受信
部30から供給されるpIDが1つずつインクリメント
されていて抜けがないかどうかが調べられる。抜けがな
ければ、ステップS13はYes側に分岐して、処理は
ステップS17に進み、抜けがあればNo側に分岐して
ステップS16に進む。
P(X)の変数pIDの値が、前記Last_pIDに
「1」を加えた値に等しいかどうかが検査される。すな
わち、前記受信状態データSDとして音声パケット受信
部30から供給されるpIDが1つずつインクリメント
されていて抜けがないかどうかが調べられる。抜けがな
ければ、ステップS13はYes側に分岐して、処理は
ステップS17に進み、抜けがあればNo側に分岐して
ステップS16に進む。
【0063】例えば、Last_pIDの初期値は前記
「0」なので、最初に音声送信端末11から送信された
音声パケットAP(1)がネットワーク12で失われる
ことなく、最初に音声受信端末13に受信されたなら
ば、音声パケットAP(1)のpIDの「1」と、La
st_pID+1の値は等しくなる。
「0」なので、最初に音声送信端末11から送信された
音声パケットAP(1)がネットワーク12で失われる
ことなく、最初に音声受信端末13に受信されたなら
ば、音声パケットAP(1)のpIDの「1」と、La
st_pID+1の値は等しくなる。
【0064】X番目の音声パケットAP(X)を処理す
るときには、音声パケットAP(X)またはAP(X−
1)の双方ともがパケット損失によって失われていない
場合にだけ、ステップS13のYes側が選択される。
るときには、音声パケットAP(X)またはAP(X−
1)の双方ともがパケット損失によって失われていない
場合にだけ、ステップS13のYes側が選択される。
【0065】当該ステップS13につづいて行われるス
テップS17では、Last_pID++およびNum
++が行われる。すなわち、変数Last_pIDと変
数Numがインクリメントされる。当該ステップS17
の次には前記ステップS11が実行される。
テップS17では、Last_pID++およびNum
++が行われる。すなわち、変数Last_pIDと変
数Numがインクリメントされる。当該ステップS17
の次には前記ステップS11が実行される。
【0066】一方、ステップS13につづいて行われる
ステップS16では、変数Last_pIDおよびNu
mに加えて、変数Lossもインクリメントされて、処
理は、前記ステップS12へ戻る。
ステップS16では、変数Last_pIDおよびNu
mに加えて、変数Lossもインクリメントされて、処
理は、前記ステップS12へ戻る。
【0067】また、前記ステップS12がYes側に分
岐すると、ステップS14において、Send(Los
s)の処理が行われる。すなわち送信関数Send()
により、変数Lossの値が、前記受信状態情報SIと
して、受信状態情報送信部34に出力される。
岐すると、ステップS14において、Send(Los
s)の処理が行われる。すなわち送信関数Send()
により、変数Lossの値が、前記受信状態情報SIと
して、受信状態情報送信部34に出力される。
【0068】ステップS14の次にはステップS15に
おいて、変数Lossと変数Numに初期値「0」が代
入されて、処理はステップS13に進む。なお、このと
き変数Last_pIDは初期化されないので、ステッ
プS13における変数pIDとLast_pIDの関係
はその前の関係が維持される。すなわち、パケット番号
pIDとしては、101以上の連続番号を使用すること
ができる。
おいて、変数Lossと変数Numに初期値「0」が代
入されて、処理はステップS13に進む。なお、このと
き変数Last_pIDは初期化されないので、ステッ
プS13における変数pIDとLast_pIDの関係
はその前の関係が維持される。すなわち、パケット番号
pIDとしては、101以上の連続番号を使用すること
ができる。
【0069】音声送信端末11と音声受信端末13のあ
いだで、パケット損失のない正常な通信が維持されるか
ぎり、ステップS11、S12、S13、S17によっ
て構成されるループが繰り返され、当該ループの101
回目の繰り返しごと(100パケット期間ごと)にステ
ップS14とS15の処理が行われる。この場合、パケ
ット損失数は「0」なので、関数Send(Loss)
によって出力される受信状態情報SIは「0」である。
いだで、パケット損失のない正常な通信が維持されるか
ぎり、ステップS11、S12、S13、S17によっ
て構成されるループが繰り返され、当該ループの101
回目の繰り返しごと(100パケット期間ごと)にステ
ップS14とS15の処理が行われる。この場合、パケ
ット損失数は「0」なので、関数Send(Loss)
によって出力される受信状態情報SIは「0」である。
【0070】ただし、パケット損失があると、その損失
数だけ、前記ステップS12、S13、S16によって
構成されるループが繰り返されることになる。
数だけ、前記ステップS12、S13、S16によって
構成されるループが繰り返されることになる。
【0071】前記ステップS14によって、受信状態情
報SIとして前記変数Lossの値を受け取った受信状
態情報送信部34は、その値をパケットRPのなかに収
容し、音声送信端末11に宛ててネットワーク12へ送
出する。
報SIとして前記変数Lossの値を受け取った受信状
態情報送信部34は、その値をパケットRPのなかに収
容し、音声送信端末11に宛ててネットワーク12へ送
出する。
【0072】ネットワーク12から当該パケットRPを
受信した音声送信端末11の内部では、受信状態情報受
信部23が当該パケットRPから受信状態情報SIとし
て前記変数Lossの値を抽出し、有音判定レベル計算
部24に出力する。
受信した音声送信端末11の内部では、受信状態情報受
信部23が当該パケットRPから受信状態情報SIとし
て前記変数Lossの値を抽出し、有音判定レベル計算
部24に出力する。
【0073】この有音判定レベル計算部24が、当該変
数Lossの値をもとに有音判定レベルLTHとして、
音声符号化部21にThreshを設定する処理を、図
5のフローチャートに示す。
数Lossの値をもとに有音判定レベルLTHとして、
音声符号化部21にThreshを設定する処理を、図
5のフローチャートに示す。
【0074】図5のフローチャートは、S20〜S27
の各ステップから構成されている。
の各ステップから構成されている。
【0075】図5において、有音判定レベル計算部24
の処理がスタートする(S20)と、関数Get_Lo
ssが、受信状態情報SIとして受信状態情報受信部2
3から供給された前記変数Lossの値を取得して、有
音判定レベル計算部24側の変数Lossに代入する
(S21)。関数Get_Lossは、新たな受信状態
情報SIが供給されるたびに同じ動作を繰り返す。
の処理がスタートする(S20)と、関数Get_Lo
ssが、受信状態情報SIとして受信状態情報受信部2
3から供給された前記変数Lossの値を取得して、有
音判定レベル計算部24側の変数Lossに代入する
(S21)。関数Get_Lossは、新たな受信状態
情報SIが供給されるたびに同じ動作を繰り返す。
【0076】なお、図5のフローチャートにおいて、変
数Lossは、この有音判定レベル計算部24側の変数
Lossを意味するものとする。この変数Lossも、
前記受信状態情報作成部33側の変数Lossも、パケ
ット損失数を格納している点では同じであるが、前記受
信状態情報作成部33側の変数Lossが1つの100
パケット期間中にインクリメントされてその値が変化し
得るパケットロスカウンタであったのに対し、この変数
Lossの値は、1つの100パケット期間中は一定不
変である。
数Lossは、この有音判定レベル計算部24側の変数
Lossを意味するものとする。この変数Lossも、
前記受信状態情報作成部33側の変数Lossも、パケ
ット損失数を格納している点では同じであるが、前記受
信状態情報作成部33側の変数Lossが1つの100
パケット期間中にインクリメントされてその値が変化し
得るパケットロスカウンタであったのに対し、この変数
Lossの値は、1つの100パケット期間中は一定不
変である。
【0077】次にステップS22では、関数Get_T
hreshが直前の100パケット期間に音声符号化部
21で使用した有音判定レベルLTH(現在、音声符号
化部21で使用している有音判定レベルLTH等であっ
てもよい)の値としてThreshの値を取得し、変数
Thresh0に代入する。関数Get_Thresh
も、新たな受信状態情報SIが供給されるたびに同じ動
作を繰り返す。
hreshが直前の100パケット期間に音声符号化部
21で使用した有音判定レベルLTH(現在、音声符号
化部21で使用している有音判定レベルLTH等であっ
てもよい)の値としてThreshの値を取得し、変数
Thresh0に代入する。関数Get_Thresh
も、新たな受信状態情報SIが供給されるたびに同じ動
作を繰り返す。
【0078】ここで、変数Thresh0は、直前の1
00パケット期間に音声符号化部21で使用した有音判
定レベルTLHの値を格納するための変数である。
00パケット期間に音声符号化部21で使用した有音判
定レベルTLHの値を格納するための変数である。
【0079】また、Threshの値とは、有音判定部
21Aによって1フレーム分の音声データADの分散と
比較される値である。その値が大きいほど有音判定レベ
ルLTHが高くなって、前記有音判定部21Aにより、
音声データADが無音フレームであるとの判定結果が出
される傾向が高まり、反対にその値が小さいほど有音判
定レベルLTHが低くなって、音声データADが有音フ
レームであるとの判定結果が出される傾向が高まる。
21Aによって1フレーム分の音声データADの分散と
比較される値である。その値が大きいほど有音判定レベ
ルLTHが高くなって、前記有音判定部21Aにより、
音声データADが無音フレームであるとの判定結果が出
される傾向が高まり、反対にその値が小さいほど有音判
定レベルLTHが低くなって、音声データADが有音フ
レームであるとの判定結果が出される傾向が高まる。
【0080】ステップS22につづくステップS23で
は、変数Lossの値が「0」であるかどうかが検査さ
れ、「0」の場合にはYes側に分岐して処理はステッ
プS24に進み、「0」でない場合にはNo側に分岐し
てステップS27へ進む。
は、変数Lossの値が「0」であるかどうかが検査さ
れ、「0」の場合にはYes側に分岐して処理はステッ
プS24に進み、「0」でない場合にはNo側に分岐し
てステップS27へ進む。
【0081】ステップS24では、前記変数Thres
h0の値から予め定めた変化幅α(α>0)を減算して
得られる値を、変数Threshに代入する。ここで、
変数Threshは、基本的に、次の100パケット期
間に音声符号化部21で使用する有音判定レベルLTH
を格納するための変数である。
h0の値から予め定めた変化幅α(α>0)を減算して
得られる値を、変数Threshに代入する。ここで、
変数Threshは、基本的に、次の100パケット期
間に音声符号化部21で使用する有音判定レベルLTH
を格納するための変数である。
【0082】この処理は、直前の100パケット期間中
におけるパケット損失数が「0」であれば、現状でもビ
ットレートは十分に低くトラフィック面の問題はないと
して、ビットレートを上げて符号化歪みを減少させる方
向に制御していることになる。
におけるパケット損失数が「0」であれば、現状でもビ
ットレートは十分に低くトラフィック面の問題はないと
して、ビットレートを上げて符号化歪みを減少させる方
向に制御していることになる。
【0083】ステップS24の次に実行されるステップ
S25では、関数Limitationによって、当該
関数Threshの値が予め定められた最大値以下ない
し最小値以上の有効範囲内に限定される。すなわち、変
数Threshの値が当該有効範囲内にある場合にはそ
の値がそのまま使用され、(有効範囲よりも大きい場合
には関数Limitationによって規定される最大
値が変数Threshの値とされ、)有効範囲よりも小
さい場合には関数Limitationによって規定さ
れる最小値が変数Threshの値とされる。
S25では、関数Limitationによって、当該
関数Threshの値が予め定められた最大値以下ない
し最小値以上の有効範囲内に限定される。すなわち、変
数Threshの値が当該有効範囲内にある場合にはそ
の値がそのまま使用され、(有効範囲よりも大きい場合
には関数Limitationによって規定される最大
値が変数Threshの値とされ、)有効範囲よりも小
さい場合には関数Limitationによって規定さ
れる最小値が変数Threshの値とされる。
【0084】次にステップS26では、当該変数Thr
eshの値が、関数SetEncによって音声符号化部
21の有音判定レベルLTHとして設定され、処理は、
前記ステップS21に戻る。
eshの値が、関数SetEncによって音声符号化部
21の有音判定レベルLTHとして設定され、処理は、
前記ステップS21に戻る。
【0085】一方、前記ステップS23においてNo側
の分岐が選択された場合に実行されるステップS27で
は、変数Thresh0の値にLoss*βを加算して
得られる値を、前記変数Threshに代入する。ここ
で、「*」は乗算を意味する演算子で、Loss*β
は、変数Lossの値にβ(>0)を乗算して得られる
値を意味する。
の分岐が選択された場合に実行されるステップS27で
は、変数Thresh0の値にLoss*βを加算して
得られる値を、前記変数Threshに代入する。ここ
で、「*」は乗算を意味する演算子で、Loss*β
は、変数Lossの値にβ(>0)を乗算して得られる
値を意味する。
【0086】この処理は、直前の100パケット期間中
におけるパケット損失数が「0」でなければ、現状でも
ビットレートは高すぎてトラフィック面の問題が大きい
として、たとえ符号化歪みが増大するとしてもビットレ
ートを下げる方向に制御することを意味する。
におけるパケット損失数が「0」でなければ、現状でも
ビットレートは高すぎてトラフィック面の問題が大きい
として、たとえ符号化歪みが増大するとしてもビットレ
ートを下げる方向に制御することを意味する。
【0087】なお、βの値は、前記αと等しくてもよく
異なってもよい。
異なってもよい。
【0088】このステップS27の次にも前記ステップ
S25とS26が実行される。
S25とS26が実行される。
【0089】そして、音声符号化部21は、ステップS
26で有音判定レベルLTHとして設定された変数Th
reshの値に基いて、次の100パケット期間の有音
判定を行う。
26で有音判定レベルLTHとして設定された変数Th
reshの値に基いて、次の100パケット期間の有音
判定を行う。
【0090】以上の手順を繰り返すことで、直前100
パケットの受信状態を反映した有音判定レベルLTHで
音声通信を行うことができる。
パケットの受信状態を反映した有音判定レベルLTHで
音声通信を行うことができる。
【0091】図5において、ネットワーク12のトラフ
ィックが安定している場合、ステップS23のYes側
とNo側がほぼ均等な頻度で選択されて、有音判定レベ
ルLTHは一定値(最適値)をはさんで小さな振幅で変
動する状態を維持することになる。
ィックが安定している場合、ステップS23のYes側
とNo側がほぼ均等な頻度で選択されて、有音判定レベ
ルLTHは一定値(最適値)をはさんで小さな振幅で変
動する状態を維持することになる。
【0092】そして、ネットワーク12のトラフィック
が変動すればそれに応じて、ステップS23のYes側
とNo側の選択頻度が不均等となり、前記最適値の変動
に追従する。
が変動すればそれに応じて、ステップS23のYes側
とNo側の選択頻度が不均等となり、前記最適値の変動
に追従する。
【0093】要するに、本実施形態では、音声パケット
APの受信状態を計算し、音声パケットAPの受信状態
が悪いときには有音判定レベルLTHを上げ、受信状態
にゆとりがあるときには有音判定レベルLTHを下げる
ことができる。
APの受信状態を計算し、音声パケットAPの受信状態
が悪いときには有音判定レベルLTHを上げ、受信状態
にゆとりがあるときには有音判定レベルLTHを下げる
ことができる。
【0094】これにより、ネットワーク12上のトラフ
ィックが混雑しているときは音声パケットAPの平均ビ
ットレートを下げパケット損失やジッタ増加による音質
劣化を抑制し、前記トラフィックにゆとりがある場合に
は、無音圧縮による音質劣化を抑制することができ、平
均ビットレートをネットワークの混雑状況に自動適応さ
せることができる。
ィックが混雑しているときは音声パケットAPの平均ビ
ットレートを下げパケット損失やジッタ増加による音質
劣化を抑制し、前記トラフィックにゆとりがある場合に
は、無音圧縮による音質劣化を抑制することができ、平
均ビットレートをネットワークの混雑状況に自動適応さ
せることができる。
【0095】なお、図4のフローチャート(特にステッ
プS11、S12、S13、S17によって構成される
ループ、またはステップS11、S12、S13、S1
6によって構成されるループ)は、通常、100パケッ
ト期間に100回繰り返されるが、図5のフローチャー
トは、100パケット期間、または100パケット期間
と100パケット期間のあいだの期間などにステップS
21、S22、S23、S24、S25、S26によっ
て構成されるループまたはステップS21、S22、S
23、S27、S25、S26によって構成されるルー
プが1回だけ実行されればよい。
プS11、S12、S13、S17によって構成される
ループ、またはステップS11、S12、S13、S1
6によって構成されるループ)は、通常、100パケッ
ト期間に100回繰り返されるが、図5のフローチャー
トは、100パケット期間、または100パケット期間
と100パケット期間のあいだの期間などにステップS
21、S22、S23、S24、S25、S26によっ
て構成されるループまたはステップS21、S22、S
23、S27、S25、S26によって構成されるルー
プが1回だけ実行されればよい。
【0096】(A−3)第1の実施形態の効果 以上説明したように、本実施形態によれば、ネットワー
ク(12)の混雑状態に対応した適切な平均ビットレー
トを設定することで、高すぎるビットレートによっても
たらされるパケット損失を防止するとともに、低すぎる
ビットレートによってもたらされる符号化歪みに起因す
る音質低下も可及的に低減して、音質低下を最小限度内
に抑制し、高品質で信頼性の高い音声通信を実現するこ
とができる。
ク(12)の混雑状態に対応した適切な平均ビットレー
トを設定することで、高すぎるビットレートによっても
たらされるパケット損失を防止するとともに、低すぎる
ビットレートによってもたらされる符号化歪みに起因す
る音質低下も可及的に低減して、音質低下を最小限度内
に抑制し、高品質で信頼性の高い音声通信を実現するこ
とができる。
【0097】また、パケット損失が発生するような通信
状態ではパケット損失にともなってジッタも増加する可
能性が高いが、本実施形態でパケット損失を防止すれ
ば、当該ジッタによる音質低下も低減することが可能で
ある。
状態ではパケット損失にともなってジッタも増加する可
能性が高いが、本実施形態でパケット損失を防止すれ
ば、当該ジッタによる音質低下も低減することが可能で
ある。
【0098】(B)第2の実施形態 以下では、本実施形態が第1の実施形態と相違する点に
ついてのみ説明する。
ついてのみ説明する。
【0099】本実施形態では、音声符号化部の内部で有
音判定レベルLTHが音声データADの内容に応じて動
的に変化する無音圧縮方式を適用する。
音判定レベルLTHが音声データADの内容に応じて動
的に変化する無音圧縮方式を適用する。
【0100】本実施形態は、有音判定レベル計算部によ
って算出される変数Scaleに関連する部分に特徴が
ある。
って算出される変数Scaleに関連する部分に特徴が
ある。
【0101】また、本実施形態は、前記文献1に記載さ
れた音声符号化方式を実現することができる。
れた音声符号化方式を実現することができる。
【0102】(B−1)第2の実施形態の構成および動
作 本実施形態の通信システム40の全体構成は、図1に示
した第1の実施形態の通信システム10と同じである。
したがって、第1の実施形態と同じ符号20、22、2
3、30〜34を付した各部の機能は、第1の実施形態
と同じである。
作 本実施形態の通信システム40の全体構成は、図1に示
した第1の実施形態の通信システム10と同じである。
したがって、第1の実施形態と同じ符号20、22、2
3、30〜34を付した各部の機能は、第1の実施形態
と同じである。
【0103】ただし本実施形態の有音判定レベル計算部
44は、前記有音判定レベル計算部24と異なり、受信
状態情報SI(Loss)を受け取って、有音判定レベ
ルLTH(Thresh)ではなく有音判定スケールS
caleを計算する部分である。有音判定レベル計算部
44が、受信状態情報SIをもとに有音判定スケールS
caleを求める処理は、後述する図7に示した通りで
ある。
44は、前記有音判定レベル計算部24と異なり、受信
状態情報SI(Loss)を受け取って、有音判定レベ
ルLTH(Thresh)ではなく有音判定スケールS
caleを計算する部分である。有音判定レベル計算部
44が、受信状態情報SIをもとに有音判定スケールS
caleを求める処理は、後述する図7に示した通りで
ある。
【0104】また、音声符号化部41の内部構成も、図
6に示すように、第1の実施形態の音声符号化部21と
相違する。本実施形態の音声符号化部41は、VAD方
式による有音判定方法を組み込んだACELP(Algebr
aic Code Exited LinerPrediction)方式による符号
化を実行する。
6に示すように、第1の実施形態の音声符号化部21と
相違する。本実施形態の音声符号化部41は、VAD方
式による有音判定方法を組み込んだACELP(Algebr
aic Code Exited LinerPrediction)方式による符号
化を実行する。
【0105】VAD方式を組み込んだACELP方式の
原理は、前記文献1に詳細に述べられている通りのもの
であるが、文献1に記載されたような通常のVAD方式
では、LPC(Linear Predictive Coding)分析によ
る平均残差パワーErrとノイズレベルNlevに基く
有音判定レベルThresh(Nlev)を閾値として
決定するのに対し、本実施形態では、当該Thresh
の値に有音判定Scale蓄積部45から読み出したS
caleの値(初期値は1.00)を乗じたScale
*Thresh(Nlev)を閾値SCとする。
原理は、前記文献1に詳細に述べられている通りのもの
であるが、文献1に記載されたような通常のVAD方式
では、LPC(Linear Predictive Coding)分析によ
る平均残差パワーErrとノイズレベルNlevに基く
有音判定レベルThresh(Nlev)を閾値として
決定するのに対し、本実施形態では、当該Thresh
の値に有音判定Scale蓄積部45から読み出したS
caleの値(初期値は1.00)を乗じたScale
*Thresh(Nlev)を閾値SCとする。
【0106】したがって、文献1の方式では、パケット
損失率(前記受信状態SI)を閾値に反映させることが
不可能であるが、本実施形態ではそれが可能となる。
損失率(前記受信状態SI)を閾値に反映させることが
不可能であるが、本実施形態ではそれが可能となる。
【0107】また、第1の実施形態と比べた場合、第1
の実施形態のThresh(有音判定レベルLTH)が
図5のフローチャートによって生成されたものであるの
に対し、本実施形態の当該Threshは、前記平均残
差パワーErrとノイズレベルNlevに基いて生成さ
れたThresh(Nlev)である点で相違する。
の実施形態のThresh(有音判定レベルLTH)が
図5のフローチャートによって生成されたものであるの
に対し、本実施形態の当該Threshは、前記平均残
差パワーErrとノイズレベルNlevに基いて生成さ
れたThresh(Nlev)である点で相違する。
【0108】図6において、当該音声符号化部41は、
有音フレーム符号化部41Bと、無音フレーム符号化部
41Cと、音声分析部42と、有音判定部43と、有音
判定Scale蓄積部45とを備えている。
有音フレーム符号化部41Bと、無音フレーム符号化部
41Cと、音声分析部42と、有音判定部43と、有音
判定Scale蓄積部45とを備えている。
【0109】このうち有音フレーム符号化部41Bは前
記有音フレーム符号化部21Bに対応し、無音フレーム
符号化部41Cは前記無音フレーム符号化部21Cに対
応し、有音判定部43は前記有音判定部21Aに対応す
る。
記有音フレーム符号化部21Bに対応し、無音フレーム
符号化部41Cは前記無音フレーム符号化部21Cに対
応し、有音判定部43は前記有音判定部21Aに対応す
る。
【0110】ただし有音判定部43は、有音判定を行う
点では、前記有音判定部21Aと同じであるが、有音フ
レーム符号化部41Bまたは無音フレーム符号化部41
Cに音声データADを供給する機能は音声分析部42が
装備している等、その他の点でも、後述する種々の相違
を有する。
点では、前記有音判定部21Aと同じであるが、有音フ
レーム符号化部41Bまたは無音フレーム符号化部41
Cに音声データADを供給する機能は音声分析部42が
装備している等、その他の点でも、後述する種々の相違
を有する。
【0111】音声入力部20から1フレーム分の音声デ
ータADを受け取る音声分析部42は、当該音声データ
ADに対して音声分析を実行して、その分析結果を有音
判定部43に供給する。
ータADを受け取る音声分析部42は、当該音声データ
ADに対して音声分析を実行して、その分析結果を有音
判定部43に供給する。
【0112】本実施形態では、当該音声分析として、L
PC分析を行い、その分析結果や、音声データADから
抽出することのできる付帯情報(例えば、パワー計算結
果やゼロクロス回数など)を、前記Thresh(Nl
ev)を生成するために用いる基礎情報BIとして有音
判定部43に供給する。
PC分析を行い、その分析結果や、音声データADから
抽出することのできる付帯情報(例えば、パワー計算結
果やゼロクロス回数など)を、前記Thresh(Nl
ev)を生成するために用いる基礎情報BIとして有音
判定部43に供給する。
【0113】有音判定部43は、当該基礎情報BIに基
づいて、Thresh(Nlev)を生成する機能を装
備している。
づいて、Thresh(Nlev)を生成する機能を装
備している。
【0114】なお、基礎情報BIは、Thresh(N
lev)を生成するために用いられるほか、有音判定の
対象とするためにも使用される。
lev)を生成するために用いられるほか、有音判定の
対象とするためにも使用される。
【0115】一方、有音判定Scale蓄積部45は、
有音判定レベル計算部44から有音判定スケールSca
leを受け取って蓄積し、有音判定部43に供給する。
有音判定レベル計算部44から有音判定スケールSca
leを受け取って蓄積し、有音判定部43に供給する。
【0116】前記有音判定部43は、前記Thresh
(Nlev)とこの有音判定スケールScaleを乗算
して、判定用閾値SC(=Scale*Thresh
(Nlev))を得る。この判定用閾値SCが、有音判
定部43における有音判定に使用される有音判定レベル
となる。
(Nlev)とこの有音判定スケールScaleを乗算
して、判定用閾値SC(=Scale*Thresh
(Nlev))を得る。この判定用閾値SCが、有音判
定部43における有音判定に使用される有音判定レベル
となる。
【0117】当該有音判定部43による有音判定の判定
結果JAが音声分析部42に供給されると、音声分析部
42は、当該判定結果JAに応じて1フレーム分の音声
データADを、有音フレーム符号化部41Bまたは無音
フレーム符号化部41Cのいずれかに供給する。
結果JAが音声分析部42に供給されると、音声分析部
42は、当該判定結果JAに応じて1フレーム分の音声
データADを、有音フレーム符号化部41Bまたは無音
フレーム符号化部41Cのいずれかに供給する。
【0118】次に、前記有音判定スケール蓄積部44に
有音判定スケールScaleを供給する有音判定レベル
計算部44の処理について説明する。この処理は、図7
のフローチャートに示すように、受信状態情報SI(L
oss)を有音判定スケールScaleに変換する処理
である。
有音判定スケールScaleを供給する有音判定レベル
計算部44の処理について説明する。この処理は、図7
のフローチャートに示すように、受信状態情報SI(L
oss)を有音判定スケールScaleに変換する処理
である。
【0119】図7のフローチャートは、S30〜S35
の各ステップから構成されている。
の各ステップから構成されている。
【0120】図7において、処理がスタートすると(S
30)、実数型変数Scaleには初期値として実数
1.00が格納される。
30)、実数型変数Scaleには初期値として実数
1.00が格納される。
【0121】次に、関数Get_Lossが、受信状態
情報SIとして受信状態情報受信部23から供給された
前記変数Lossの値を取得して、有音判定レベル計算
部24側の変数Lossに代入する(S31)。
情報SIとして受信状態情報受信部23から供給された
前記変数Lossの値を取得して、有音判定レベル計算
部24側の変数Lossに代入する(S31)。
【0122】このステップS31は、前記ステップS2
1とまったく同じ処理である。したがってステップS3
1でも、関数Get_Lossは、新たな受信状態情報
SIが供給されるたびに同じ動作を繰り返すことにな
る。
1とまったく同じ処理である。したがってステップS3
1でも、関数Get_Lossは、新たな受信状態情報
SIが供給されるたびに同じ動作を繰り返すことにな
る。
【0123】そして、当該変数Lossに格納された値
が「0」であれば、処理はステップS33に進み、
「0」でなければステップS35に進む。
が「0」であれば、処理はステップS33に進み、
「0」でなければステップS35に進む。
【0124】ステップS33では、直前の変数Scal
eの値(初回は前記初期値1.00)にαを乗じて得ら
れる値(Scale*α)が、変数Scaleに代入さ
れる。ここで、αは、0<α<1の実数定数である。
eの値(初回は前記初期値1.00)にαを乗じて得ら
れる値(Scale*α)が、変数Scaleに代入さ
れる。ここで、αは、0<α<1の実数定数である。
【0125】ステップS33につづくステップS34で
は、当該変数Scaleの値が、関数SetEncによ
って有音判定部43の判定用閾値SCとして設定され、
処理は、前記ステップS31に戻る。
は、当該変数Scaleの値が、関数SetEncによ
って有音判定部43の判定用閾値SCとして設定され、
処理は、前記ステップS31に戻る。
【0126】一方、前記ステップS35では、直前の変
数Scaleの値に変数Lossの値と定数βの値を乗
算した結果を、変数Scaleに代入する。ここで、定
数βは、1<βの実数(または整数)である。
数Scaleの値に変数Lossの値と定数βの値を乗
算した結果を、変数Scaleに代入する。ここで、定
数βは、1<βの実数(または整数)である。
【0127】当該ステップS35の次には、前記ステッ
プS34が行われ、変数Scaleの値が、関数Set
Encによって有音判定部43に供給され、処理は、前
記ステップS31に戻る。
プS34が行われ、変数Scaleの値が、関数Set
Encによって有音判定部43に供給され、処理は、前
記ステップS31に戻る。
【0128】このような図7のフローチャートによれ
ば、パケット損失のない状態がつづくと定数αが累乗さ
れて変数Scaleの値が低下するので判定用閾値SC
も低下して行き、反対に、パケット損失のある状態がつ
づくと定数βが累乗されて判定用閾値SCが上昇して行
く。
ば、パケット損失のない状態がつづくと定数αが累乗さ
れて変数Scaleの値が低下するので判定用閾値SC
も低下して行き、反対に、パケット損失のある状態がつ
づくと定数βが累乗されて判定用閾値SCが上昇して行
く。
【0129】ネットワーク12のトラフィックが安定
し、音声データADの内容も安定している場合、ステッ
プS32のYes側とNo側がほぼ均等な頻度で選択さ
れて、判定用閾値SCは一定値(最適値)をはさんで小
さな振幅で変動する状態を維持することになる。
し、音声データADの内容も安定している場合、ステッ
プS32のYes側とNo側がほぼ均等な頻度で選択さ
れて、判定用閾値SCは一定値(最適値)をはさんで小
さな振幅で変動する状態を維持することになる。
【0130】そして、ネットワーク12のトラフィック
または音声データADの内容が変動すればそれに応じ
て、ステップS32のYes側とNo側の選択頻度が不
均等となり、前記最適値の変動に追従する。
または音声データADの内容が変動すればそれに応じ
て、ステップS32のYes側とNo側の選択頻度が不
均等となり、前記最適値の変動に追従する。
【0131】第1の実施形態では、ネットワーク12の
トラフィックが変動し、受信状態情報SIが変化した場
合にだけ有音判定レベルLTHが変化したが、本実施形
態では、ネットワーク12のトラフィックがほぼ一定で
あっても、音声データADの内容が変化すると、その変
化に応じて判定用閾値SCが変化し得る。
トラフィックが変動し、受信状態情報SIが変化した場
合にだけ有音判定レベルLTHが変化したが、本実施形
態では、ネットワーク12のトラフィックがほぼ一定で
あっても、音声データADの内容が変化すると、その変
化に応じて判定用閾値SCが変化し得る。
【0132】(B−2)第2の実施形態の効果 本実施形態によれば、第1の実施形態の効果と同等な効
果を得ることができる。
果を得ることができる。
【0133】加えて、本実施形態では、判定用閾値(S
C)が、音声入力部(20)から供給される音声データ
(AD)の内容に応じても動的に変動するため、より適
切で精密なビットレートの制御が可能である。
C)が、音声入力部(20)から供給される音声データ
(AD)の内容に応じても動的に変動するため、より適
切で精密なビットレートの制御が可能である。
【0134】(C)他の実施形態 なお、上記第1および第2の実施形態では、2台の端末
12、13間で音声パケットAPを送受する場合につい
て説明したが、図8に示すように、同一のネットワーク
12に多数の端末51〜56を接続して複数組の端末間
で音声パケット送受を行うシステム構成としてもよい。
図8の場合、前記端末11と13のように相互に通信す
る端末は、本発明に対応したものでなければならない
が、システム中に、本発明に対応していない端末が混在
してもかまわない。
12、13間で音声パケットAPを送受する場合につい
て説明したが、図8に示すように、同一のネットワーク
12に多数の端末51〜56を接続して複数組の端末間
で音声パケット送受を行うシステム構成としてもよい。
図8の場合、前記端末11と13のように相互に通信す
る端末は、本発明に対応したものでなければならない
が、システム中に、本発明に対応していない端末が混在
してもかまわない。
【0135】また、第1および第2の実施形態では、前
記音声送信端末11および音声受信端末13の実現例と
して、IPネットワークインタフェース手段とサウンド
入出力手段を備えたPC(パーソナルコンピュータ)を
示したが、この各PCを、図9に示すように複数の装置
を組合せたもので置換することもできる。
記音声送信端末11および音声受信端末13の実現例と
して、IPネットワークインタフェース手段とサウンド
入出力手段を備えたPC(パーソナルコンピュータ)を
示したが、この各PCを、図9に示すように複数の装置
を組合せたもので置換することもできる。
【0136】たとえば、電話機64とPBX(構内交換
機)63と電話−パケット変換装置62とを組み合わせ
たものや、IPプロトコルに対応した電話−パケット変
換装置60と電話機61を組み合わせたもの等で、前記
各PCを置換してもよい。変換装置としては、例えばV
oIP(voice over IP)ゲートウェイ装置である沖
電気製BS−1200などを用いることができる。
機)63と電話−パケット変換装置62とを組み合わせ
たものや、IPプロトコルに対応した電話−パケット変
換装置60と電話機61を組み合わせたもの等で、前記
各PCを置換してもよい。変換装置としては、例えばV
oIP(voice over IP)ゲートウェイ装置である沖
電気製BS−1200などを用いることができる。
【0137】また、上記第1および第2の実施形態で
は、前記連続情報として、パケット番号pIDを使用し
たが、当該パケット番号pIDの替わりとして、例えば
タイムスタンプ情報などを使用することもできる。タイ
ムスタンプ情報とは、音声パケットAPが送信された時
刻や音声パケットAPが生成された時刻を示す情報であ
る。
は、前記連続情報として、パケット番号pIDを使用し
たが、当該パケット番号pIDの替わりとして、例えば
タイムスタンプ情報などを使用することもできる。タイ
ムスタンプ情報とは、音声パケットAPが送信された時
刻や音声パケットAPが生成された時刻を示す情報であ
る。
【0138】連続情報としてタイムスタンプを使う場合
の処理の概略を、図1を参照しながら説明すると、次の
ようになる。
の処理の概略を、図1を参照しながら説明すると、次の
ようになる。
【0139】まず、音声パケット送信部22内の連続情
報付与部22Aは、各音声パケットAPを送出する際に
タイムスタンプを当該音声パケットAPに付加する。
報付与部22Aは、各音声パケットAPを送出する際に
タイムスタンプを当該音声パケットAPに付加する。
【0140】次に、音声パケット受信部30は、受取っ
た各音声パケットAPのタイムスタンプと、現在の時刻
を比較し、この音声パケットAPの転送に要した時間
(パケット転送時間)を算出する。
た各音声パケットAPのタイムスタンプと、現在の時刻
を比較し、この音声パケットAPの転送に要した時間
(パケット転送時間)を算出する。
【0141】そして、受信状態情報作成部33は、あら
かじめ定めた平均パケット転送時間と、各音声パケット
APのパケット転送時間を比較することでパケット揺ら
ぎ時間(ジッタ)を得、100パケット毎にジッタ分散
を計算し、これを受信状態情報SIとする。
かじめ定めた平均パケット転送時間と、各音声パケット
APのパケット転送時間を比較することでパケット揺ら
ぎ時間(ジッタ)を得、100パケット毎にジッタ分散
を計算し、これを受信状態情報SIとする。
【0142】なお、前記パケット番号pIDやこのタイ
ムスタンプ情報等の連続情報を音声パケットAPに付加
する方法は、任意の方法で良く、RTP(RealTi
meTransport Protcol)などの既存
のプロトコルを使っても良い。
ムスタンプ情報等の連続情報を音声パケットAPに付加
する方法は、任意の方法で良く、RTP(RealTi
meTransport Protcol)などの既存
のプロトコルを使っても良い。
【0143】また、前記受信状態情報の送付間隔、すな
わちパケットRPの送信間隔は任意であるが、あまり頻
繁に行うと、パケットRPの伝送自体がネットワーク
(12)のトラフィックに対する負荷となるので、注意
が必要である。
わちパケットRPの送信間隔は任意であるが、あまり頻
繁に行うと、パケットRPの伝送自体がネットワーク
(12)のトラフィックに対する負荷となるので、注意
が必要である。
【0144】さらに、前記符号化方法としては、PCM
の16ビットと、4ビットを使って説明したが、1フレ
ームあたりの音声符号化データ量が有音フレームより無
音フレームのほうが少なくなる組み合わせであれば、ど
のような方法を使用してもよい。例えばITU−T勧告
G.729 AnnexBに示されるG.729のた
めの無音圧縮スキームを使っても良い。
の16ビットと、4ビットを使って説明したが、1フレ
ームあたりの音声符号化データ量が有音フレームより無
音フレームのほうが少なくなる組み合わせであれば、ど
のような方法を使用してもよい。例えばITU−T勧告
G.729 AnnexBに示されるG.729のた
めの無音圧縮スキームを使っても良い。
【0145】なお、上記第1および第2の実施形態で
は、有音判定レベルLTHを動的に制御する方法をしめ
したが、無音圧縮機能をON・OFFする2値制御で行
っても良い。この場合は、このようなON・OFFスイ
ッチを持っている音声符号化部に全く変更を加えること
なく、本発明を実現することが可能である。
は、有音判定レベルLTHを動的に制御する方法をしめ
したが、無音圧縮機能をON・OFFする2値制御で行
っても良い。この場合は、このようなON・OFFスイ
ッチを持っている音声符号化部に全く変更を加えること
なく、本発明を実現することが可能である。
【0146】また、上記第1および第2の実施形態で
は、音声パケットAPに関しては、音声送信端末11は
送信機能のみを備え、前記音声受信端末13は受信機能
のみを備えていたが、端末11,13ともに、音声パケ
ットの送信機能と受信機能の両機能を装備して双方向に
音声パケット通信ができる構成としてもよい。
は、音声パケットAPに関しては、音声送信端末11は
送信機能のみを備え、前記音声受信端末13は受信機能
のみを備えていたが、端末11,13ともに、音声パケ
ットの送信機能と受信機能の両機能を装備して双方向に
音声パケット通信ができる構成としてもよい。
【0147】その場合、前記受信状態情報SIは、独立
したパケットRPに収容するのではなく、端末13から
端末11に宛てて送信する音声パケットの一部に収容す
るようにすることも可能である。
したパケットRPに収容するのではなく、端末13から
端末11に宛てて送信する音声パケットの一部に収容す
るようにすることも可能である。
【0148】また、この場合には、図10に示すよう
に、有音判定レベル計算部81を、受信端末(送受信端
末)71内に設けても良い。
に、有音判定レベル計算部81を、受信端末(送受信端
末)71内に設けても良い。
【0149】さらに、図4のステップS12では、音声
パケットAPの100パケット当たりのパケット損失数
を検査するために、変数Numの値が「100」と等し
いかどうかを調べたが、当該「100」は100以外の
任意の定数に変更し、任意のパケット数ごとのパケット
損失数を検査することができる。
パケットAPの100パケット当たりのパケット損失数
を検査するために、変数Numの値が「100」と等し
いかどうかを調べたが、当該「100」は100以外の
任意の定数に変更し、任意のパケット数ごとのパケット
損失数を検査することができる。
【0150】なお、受信状況情報としては、前記受信状
態情報SIの替わりに、損失率の他の特徴量(例えばジ
ッタの程度や遅延時間の程度)を検査するようにしても
よい。すなわち受信状態情報としては、ネットワーク
(12)上のトラフィック量に関わる音声パケットAP
の受信状態を表す変数であれば何を使っても良い。
態情報SIの替わりに、損失率の他の特徴量(例えばジ
ッタの程度や遅延時間の程度)を検査するようにしても
よい。すなわち受信状態情報としては、ネットワーク
(12)上のトラフィック量に関わる音声パケットAP
の受信状態を表す変数であれば何を使っても良い。
【0151】また、図5のフローチャートでは、有音判
定レベルLTHを変更するために定数α、βを使った
が、パケット受信状態が悪いと判断した場合に有音判定
レベルLTHを上げ、パケット受信状態にゆとりがある
と判断した場合には、有音判定レベルLTHを下げるこ
とができる方法であれば、その他の方法でも使用可能で
ある。
定レベルLTHを変更するために定数α、βを使った
が、パケット受信状態が悪いと判断した場合に有音判定
レベルLTHを上げ、パケット受信状態にゆとりがある
と判断した場合には、有音判定レベルLTHを下げるこ
とができる方法であれば、その他の方法でも使用可能で
ある。
【0152】例えば、過去数期間の受信状態を記憶して
おきそれを反映させた形で有音判定レベルのレベル変更
を行っても良い。一例として、10期間連続でLoss
=0の場合にはじめて有音判定レベルLTHをαだけ上
げる方法などを使っても良い。
おきそれを反映させた形で有音判定レベルのレベル変更
を行っても良い。一例として、10期間連続でLoss
=0の場合にはじめて有音判定レベルLTHをαだけ上
げる方法などを使っても良い。
【0153】また、図5のフローチャートでは、変数L
ossの値が「0」であるか否かに応じて2通りのルー
プを実行するようにしたが、「0」でないケースでも変
数Lossの数値範囲には1〜100の幅があり得るの
で、例えば「1」の場合と「10」の場合とで異なるル
ープを実行するようにしてもよい。
ossの値が「0」であるか否かに応じて2通りのルー
プを実行するようにしたが、「0」でないケースでも変
数Lossの数値範囲には1〜100の幅があり得るの
で、例えば「1」の場合と「10」の場合とで異なるル
ープを実行するようにしてもよい。
【0154】さらに、図4のフローチャートは上述した
ように非常に繰り返し回数が多いので、このフローチャ
ートの処理が、システム全体の動作速度向上のボトルネ
ックとなる可能性がある。したがって、図4のフローチ
ャートをもっと効率的に構成すると、システム全体を高
速化できるなど、利点が大きい。
ように非常に繰り返し回数が多いので、このフローチャ
ートの処理が、システム全体の動作速度向上のボトルネ
ックとなる可能性がある。したがって、図4のフローチ
ャートをもっと効率的に構成すると、システム全体を高
速化できるなど、利点が大きい。
【0155】例えば、ネットワーク(12)の輻輳度な
どの条件によっては、図4のフローチャートのように前
記パケットカウンタNumの値に応じて分岐するのでは
なく、パケットロスカウンタLossの値に応じて分岐
するフローチャートを構成したほうが効率的となる可能
性もある。一例としては、パケットロスカウンタLos
sの値が5になったらそのときのパケット損失率を計算
し、当該パケット損失率を前記受信状態情報SIとして
用いるようにしてもよい。
どの条件によっては、図4のフローチャートのように前
記パケットカウンタNumの値に応じて分岐するのでは
なく、パケットロスカウンタLossの値に応じて分岐
するフローチャートを構成したほうが効率的となる可能
性もある。一例としては、パケットロスカウンタLos
sの値が5になったらそのときのパケット損失率を計算
し、当該パケット損失率を前記受信状態情報SIとして
用いるようにしてもよい。
【0156】また、上記第1および第2の実施形態で
は、IPプロトコルに対応したIPネットワーク12を
使用したが、本発明で用いるネットワークは、IPネッ
トワークに限らない。
は、IPプロトコルに対応したIPネットワーク12を
使用したが、本発明で用いるネットワークは、IPネッ
トワークに限らない。
【0157】なお、図4、図5、図7のフローチャート
の機能は、どのようなプログラミング言語を用いて記述
してもよく、論理回路を利用してハードウエア的に実現
することも可能である。
の機能は、どのようなプログラミング言語を用いて記述
してもよく、論理回路を利用してハードウエア的に実現
することも可能である。
【0158】
【発明の効果】以上に説明したように、本発明によれ
ば、音質低下を、ネットワークのトラフィックに対応し
た最小限度内に抑制し、高品質で信頼性の高い音声通信
を実現することができる。
ば、音質低下を、ネットワークのトラフィックに対応し
た最小限度内に抑制し、高品質で信頼性の高い音声通信
を実現することができる。
【図1】第1の実施形態に係る通信システムの全体構成
を示す概略図である。
を示す概略図である。
【図2】平均ビットレートと音質の関係を示す概略図で
ある。
ある。
【図3】第1の実施形態の主要部の概略構成を示すブロ
ック図である。
ック図である。
【図4】第1の実施形態の動作説明図である。
【図5】第1の実施形態の動作説明図である。
【図6】第2の実施形態の主要部の概略構成を示すブロ
ック図である。
ック図である。
【図7】第2の実施形態の動作説明図である。
【図8】他の実施形態にかかる通信システムの全体構成
を示す概略図である。
を示す概略図である。
【図9】他の実施形態にかかる通信システムの全体構成
を示す概略図である。
を示す概略図である。
【図10】他の実施形態にかかる通信システムの全体構
成を示す概略図である。
成を示す概略図である。
10,40…通信システム、11…音声送信端末、12
…ネットワーク、13…音声受信端末、20…音声入力
部、21、41…音声符号化部、21A、43…有音判
定部、21B、41B…有音フレーム符号化部、21
C、41C…無音フレーム符号化部、22…音声パケッ
ト送信部、23…受信状態情報受信部、24、44…有
音判定レベル計算部、30…音声パケット受信部、31
…音声復号部、32…音声出力部、33…受信状態情報
作成部、34…受信状態情報送信部、42…音声分析
部、45…音声判定Scale蓄積部。
…ネットワーク、13…音声受信端末、20…音声入力
部、21、41…音声符号化部、21A、43…有音判
定部、21B、41B…有音フレーム符号化部、21
C、41C…無音フレーム符号化部、22…音声パケッ
ト送信部、23…受信状態情報受信部、24、44…有
音判定レベル計算部、30…音声パケット受信部、31
…音声復号部、32…音声出力部、33…受信状態情報
作成部、34…受信状態情報送信部、42…音声分析
部、45…音声判定Scale蓄積部。
Claims (3)
- 【請求項1】 音声パケット送信装置から送信された音
声パケットを、所定のネットワークを介して受信する音
声パケット受信装置において、 前記ネットワーク上のトラフィックに対応して変動する
音声パケットの受信状況を検出する受信状況検出手段
と、 当該受信状況検出手段が検出した受信状況に応じた受信
状況情報を、前記音声パケット送信装置に送達するた
め、前記ネットワークに送信する受信状況情報送信手段
とを備えたことを特徴とする音声パケット受信装置。 - 【請求項2】 所定のネットワークを介して音声パケッ
ト受信装置に音声パケットを送信する音声パケット送信
装置において、 送信しようとする音声フレームが有音であるか無音であ
るかを、判定レベルに応じて判定する判定手段と、 当該判定手段が無音と判定した無音フレームは、有音と
判定した有音フレームよりも少ない情報量となるように
符号化する音声符号化手段と、 前記ネットワーク上のトラフィックに対応して変動する
前記音声パケットの受信状況に応じて、前記音声パケッ
ト受信装置が送信した受信状況情報を、前記ネットワー
クを介して受信する受信状況情報受信手段と、 当該受信状況情報受信手段が受信した受信状況情報に応
じて、前記判定レベルを変更する判定レベル変更手段と
を備えることを特徴とする音声パケット送信装置。 - 【請求項3】 請求項1の音声パケット受信装置と、 請求項2の音声パケット送信装置とを備えることを特徴
とするパケット通信システム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000200584A JP2002026964A (ja) | 2000-07-03 | 2000-07-03 | 音声パケット送信装置、音声パケット受信装置、及びパケット通信システム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2000200584A JP2002026964A (ja) | 2000-07-03 | 2000-07-03 | 音声パケット送信装置、音声パケット受信装置、及びパケット通信システム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2002026964A true JP2002026964A (ja) | 2002-01-25 |
Family
ID=18698434
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000200584A Pending JP2002026964A (ja) | 2000-07-03 | 2000-07-03 | 音声パケット送信装置、音声パケット受信装置、及びパケット通信システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2002026964A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006303702A (ja) * | 2005-04-18 | 2006-11-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声符号化選択制御方法、音声パケット送信装置、音声パケット受信装置、音声パケット送信プログラム、音声パケット受信プログラム、記録媒体 |
| JP2008160320A (ja) * | 2006-12-21 | 2008-07-10 | Fujitsu Ltd | 通信装置 |
-
2000
- 2000-07-03 JP JP2000200584A patent/JP2002026964A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006303702A (ja) * | 2005-04-18 | 2006-11-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声符号化選択制御方法、音声パケット送信装置、音声パケット受信装置、音声パケット送信プログラム、音声パケット受信プログラム、記録媒体 |
| JP2008160320A (ja) * | 2006-12-21 | 2008-07-10 | Fujitsu Ltd | 通信装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7246057B1 (en) | System for handling variations in the reception of a speech signal consisting of packets | |
| EP2055055B1 (en) | Adjustment of a jitter memory | |
| EP2382726B1 (en) | Method of transmitting data in a communication system | |
| Janssen et al. | Assessing voice quality in packet-based telephony | |
| EP2140637B1 (en) | Method of transmitting data in a communication system | |
| US20040032860A1 (en) | Quality of voice calls through voice over IP gateways | |
| US20020141392A1 (en) | Gateway apparatus and voice data transmission method | |
| KR20100003729A (ko) | 통신 시스템에서 데이터 전송 방법 | |
| US8320391B2 (en) | Acoustic signal packet communication method, transmission method, reception method, and device and program thereof | |
| US7301902B2 (en) | Generic on-chip homing and resident, real-time bit exact tests | |
| EP2109950B1 (en) | Method of transmitting data in a communication system | |
| US5406560A (en) | Speech packet communication system | |
| US6947887B2 (en) | Low speed speech encoding method based on Internet protocol | |
| JP2002026964A (ja) | 音声パケット送信装置、音声パケット受信装置、及びパケット通信システム | |
| CN1984203A (zh) | 对丢失的语音业务数据帧进行补偿的方法 | |
| CN1929355B (zh) | 语音包丢失恢复系统以及方法 | |
| JP3487158B2 (ja) | 音声符号化伝送システム | |
| JP2002252644A (ja) | 音声パケット通信装置及び音声パケット通信方法 | |
| JP3813046B2 (ja) | パケット受信装置 | |
| KR100423957B1 (ko) | 디지털 음성 통신 시스템에서 음성 전송의 지연 감소 방법및 장치 | |
| WO2004053837A1 (en) | A user terminal and method for distributed speech recognition | |
| JPH07212320A (ja) | 音声帯域信号パケット化装置 | |
| JP2009204815A (ja) | 無線通信装置、無線通信方法および無線通信システム |