JP2008033230A - 音声データ復号装置及び音声データ変換装置 - Google Patents
音声データ復号装置及び音声データ変換装置 Download PDFInfo
- Publication number
- JP2008033230A JP2008033230A JP2007035662A JP2007035662A JP2008033230A JP 2008033230 A JP2008033230 A JP 2008033230A JP 2007035662 A JP2007035662 A JP 2007035662A JP 2007035662 A JP2007035662 A JP 2007035662A JP 2008033230 A JP2008033230 A JP 2008033230A
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- audio
- loss
- signal
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 128
- 238000000034 method Methods 0.000 claims description 46
- 230000003044 adaptive effect Effects 0.000 claims description 22
- 230000003595 spectral effect Effects 0.000 claims description 16
- 238000001514 detection method Methods 0.000 abstract description 30
- 239000000284 extract Substances 0.000 abstract description 8
- 230000015572 biosynthetic process Effects 0.000 description 17
- 238000003786 synthesis reaction Methods 0.000 description 17
- 230000015654 memory Effects 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000005055 memory storage Effects 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 5
- 239000000872 buffer Substances 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Detection And Prevention Of Errors In Transmission (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
解決する、音声データ復号装置及び音声データ変換装置を提供する。
【解決手段】本発明の音声データ復号装置は、波形符号化方式による音声データ復号装置
であって、音声データ中にロスがあるかを検出するロスディテクタと、音声データを復号
して第一復号音声信号を生成する音声データデコーダと、第一復号音声信号から第一パラ
メータを抽出する音声データアナライザと、ロス検出結果に基づいて、第一パラメータを
修正するパラメータ修正部と、修正された第一パラメータを用いて第一合成音声信号を生
成する音声合成部を備えている。また、他の解決の手段についても述べる。
【選択図】 図1
Description
関する。
号を行うことで音声信号の授受を行っている。この音声圧縮の方式としては、例えば、I
TU−T(International Telecommunication Union Telecommunication Standardizatio
n sector)勧告G.711方式、またはCELP(Code-Excited Linear Prediction)方式が
知られている。
の輻輳等により、音声データの一部が欠落することがある。この欠落した音声データに対
する誤り補償として、欠落する前に受信した音声データの情報に基づいて、欠落した音声
データに対する音声信号の生成を行う。
技術として、特許文献1は、遅れて受信したパケットに含まれる音声フレームデータを用
いて、フィルタメモリ値を更新する技術を開示している。すなわち、ロスしたパケットを
遅れて受信した場合、このパケットに含まれる音声フレームデータを用いて、ピッチフィ
ルタ、またはスペクトル概形を表すフィルタで使用するフィルタメモリ値を更新する技術
である。
において、符号化データの欠落後に正しい符号化データを受け取っても、符号化側と復号
化側の予測器の状態不一致により不快な異常音を出力するという課題を解決する技術を開
示している。すなわち、パケット損失が「検出」から「非検出」へ遷移してから所定時間
、検出状態制御部が過去の音声データを基に生成した補間信号を徐々に減少させ、時間が
経つにつれて符号化側と復号化側との予測器の状態が次第に一致して音声信号が正常にな
っていくので、音声信号を徐々に増大させる。その結果、この技術は、符号化データの欠
落状態から復旧した直後においても異常音を出力しないという効果を奏する。
音声信号を生成する技術が開示されている。
るため、上記のような技術が開示されているものの、音質に依然、改善の余地が残されて
いた。
課題を解決することが求められる。
音声データ中にロスがあるかを検出するロスディテクタと、音声データを復号して第一復
号音声信号を生成する音声データデコーダと、第一復号音声信号から第一パラメータを抽
出する音声データアナライザと、ロス検出結果に基づいて、第一パラメータを修正するパ
ラメータ修正部と、修正された第一パラメータを用いて第一合成音声信号を生成する音声
合成部を備えている。
、第一復号音声信号及び第一合成音声信号との出力比率を変化させながら音声信号を出力
する音声信号出力部を備える構成とすることもできる。
する前にロス後の音声フレームを受信したかを検出し、音声データデコーダは、ロス後に
受信した音声フレームを復号して第二復号音声信号を生成し、音声データアナライザは、
第二復号音声信号の時間を反転させて第二パラメータを抽出し、パラメータ修正部は、第
二パラメータに所定の修正を行い、音声合成部は、修正された第二パラメータを用いて第
二合成音声信号を生成し、さらに、ロス検出結果に基づいて、第一復号音声信号、第一合
成音声信号、及び第二合成音声信号の出力比率を変化させながら音声信号を出力する音声
信号出力部を備える構成としてもよい。
音声データ中にロスを検出し、音声データデコーダがロス部分を補間する音声信号を出力
する前にロス後の音声フレームを受信したかを検出するロスディテクタと、ロス後に受信
した音声フレームを復号して復号音声信号を生成する音声データデコーダと、復号音声信
号の時間を反転させてパラメータを抽出する音声データアナライザと、パラメータに所定
の修正を行うパラメータ修正部と、修正されたパラメータを用いて合成音声信号を生成す
る音声合成部を備えている。
音声データ復号装置であって、音声データ中にロスがあるかを検出し、かつ第一音声デー
タデコーダが第一音声信号を出力する前にロス後の音声フレームを受信したか検出するロ
スディテクタと、ロス検出結果に基づいて、音声データを復号して音声信号を生成する第
一音声データデコーダと、ロス検出結果に基づいて、ロス後の音声フレームの音声信号を
生成する第二音声データデコーダと、第一及び第二パラメータを用いてロスした音声デー
タに対する第三パラメータを生成して第一音声データデコーダに出力するパラメータ補間
部と、第一音声データデコーダから入力された音声信号を出力する音声信号出力部と、を
備え、ロスを検出しなかった場合、第一音声データデコーダは、音声データを復号して音
声信号を生成し、復号時に抽出した第一パラメータをパラメータ補間部に出力し、ロスを
検出した場合、第一音声データデコーダは、ロス前に受信した音声データを用いてロスに
対応する第一音声信号を生成し、ロスを検出し、かつ第一音声データデコーダが第一音声
信号を出力する前にロス後の音声フレームを検出した場合、第二音声データデコーダは、
ロス前に受信した音声データを用いてロスに対応する第二音声信号を生成し、第二音声信
号を用いてロス後の第一音声フレームの音声データを復号し、復号時に抽出した第二パラ
メータをパラメータ補間部に出力し、第一音声データデコーダは、パラメータ補間部から
入力された第三パラメータを用いてロスに対応する第三音声信号を生成する。
間信号を出力する音声データ復号装置であって、ロスを検出し、かつロスに対応する音声
データを遅れて受信したことを検出するロス検出部と、メモリ蓄積部に蓄積されているロ
ス前の音声データを使って、ロスに対応する音声データを復号して復号音声信号を生成す
る音声データデコーダと、出力している全音声信号に対する復号音声信号の比率を変化さ
せながら出力する音声信号出力部を備えている。
ータの符号を変換する音声データ変換装置であって、音声データ中のロスを検出するロス
ディテクタと、音声データを復号して復号音声信号を生成する音声データデコーダと、パ
ラメータを抽出するフィルタを有し、復号音声信号を第二音声符号化方式で符号化する音
声データエンコーダと、音声データエンコーダからパラメータを受け取って保持し、パラ
メータをそのままか、又は所定の修正を行い、ロス検出結果に基づいて、音声データエン
コーダに出力するパラメータ修正部と、を備え、音声データエンコーダは、ロスを検出し
なかった場合、復号音声信号を第二音声符号化方式で符号化し、その際に抽出したパラメ
ータをパラメータ修正部へ出力し、ロスを検出した場合、パラメータ修正部から入力され
るパラメータに基づいて音声信号を生成し、フィルタが持つメモリを更新する。
第二音声符号化方式がCELP方式とする構成としてもよい。
ン、正規化残差信号、または正規化残差信号ゲインである構成とすることもできる。
が期待される。
本発明の技術的範囲を限定するものではない。
号装置の構成を示す。実施例1の音声データ復号装置は、ロスディテクタ101、音声デ
ータデコーダ102、音声データアナライザ103、パラメータ修正部104、音声合成
部105及び音声信号出力部106により構成されている。ここで、音声データとは、あ
る一連の音声を符号化したデータをいい、また、少なくとも1つの音声フレームから構成
される音声のデータのことをいう。
とともに、受信した音声データがロスしたかを検出し、ロス検出結果を音声データデコー
ダ102とパラメータ修正部104と音声信号出力部106に出力する。
データ出力部106と音声データアナライザ103に出力する。
、分割した信号に対して線形予測分析を用いて、音声信号のスペクトル特性を表すスペク
トルパラメータを抽出する。次に、音声データアナライザ103は、フレーム分割した音
声信号をサブフレーム(例えば5ms)に分割し、サブフレーム毎に過去の音源信号を基に
適応コードブックにおけるパラメータとして、ピッチ周期に対応する遅延パラメータと適
応コードブックゲインを抽出する。また、音声データアナライザ103は、適応コードブ
ックにより該当するサブフレームの音声信号をピッチ予測する。さらに、音声データアナ
ライザ103は、ピッチ予測して求めた残差信号を正規化して、正規化残差信号と正規化
残差信号ゲインを抽出する。そして、抽出したスペクトルパラメータ、遅延パラメータ、
適応コードブックゲイン、正規化残差信号または正規化残差信号ゲイン(以下、これらを
総称してパラメータとも呼ぶ)をパラメータ修正部104に出力する。ここで、スペクト
ルパラメータ、遅延パラメータ、適応コードブックゲイン、正規化残差信号及び正規化残
差信号ゲインのうちから2つ以上を抽出する構成としてもよい。
いて、音声データアナライザ103から入力されたスペクトルパラメータ、遅延パラメー
タ、適応コードブックゲイン、正規化残差信号または正規化残差信号ゲインをそのまま用
いるか、又は±1%の乱数を加える、或いはゲインを小さくしていくなどの修正をする。
さらに、パラメータ修正部104は、この値を音声合成部105に出力する。これらの値
を修正する理由は、繰り返しにより不自然な音声信号が生成されることを避けるためであ
る。
遅延パラメータ、適応コードブックゲイン、正規化残差信号または正規化残差信号ゲイン
を使って合成音声信号を生成し、音声信号出力部106に出力する。
て、音声データデコーダ102から入力された復号音声信号、音声合成部105から入力
された合成音声信号、又は復号音声信号と合成音声信号とをある比率で混合した信号のい
ずれかを出力する。
601)。ここで、ロスを検出する方法としては、無線網におけるビット誤りをCRC (Cyc
lic Redundancy Check)符号を用いて検出した場合に音声データがロスしたとして検出す
る方法、又はIP (Internet Protocol)網におけるロスをRFC3550RTP (A Transport Protoc
ol for Real-Time Applications)ヘッダのシーケンス番号の抜けにより検出した場合に音
声データがロスしたとして検出する方法がある。
イザ102が受信した音声データを復号し、音声信号出力部へ出力する(S602)。
03が、ロス直前の復号音声信号を基に、スペクトルパラメータ、遅延パラメータ、適応
コードブックゲイン、正規化残差信号または正規化残差信号ゲインを抽出する(S603
)。ここで、復号音声信号の分析は、ロスを検出した直前の復号音声信号に対して行なっ
てもよいし、全ての復号音声信号に対して行ってもよい。次に、パラメータ修正部104
はロス検出結果に基づいて、スペクトルパラメータ、遅延パラメータ、適応コードブック
ゲイン、正規化残差信号または正規化残差信号ゲインをそのまま用いるか、或いは±1%
の乱数を加える等して修正する(S604)。音声合成部105は、これらの値を使って
、合成音声信号を生成する(S605)。
2から入力された復号音声信号、音声合成部105から入力された合成音声信号又は復号
音声信号と合成音声信号とをある比率で混合した信号のいずれかを出力する(S606)
。具体的には、前フレームと現フレームでロスが検出されていない場合は、復号音声信号
を出力し、ロスが検出された場合は、合成音声信号を出力し、ロスが検出された次のフレ
ームでは、最初は、合成音声信号の比が大きく、時間が経過するにつれて復号音声信号の
比が大きくなるように音声信号を加算することにより、音声信号出力部106から出力され
る音声信号が不連続になることを避ける。
1方式において、パラメータを抽出し、これらの値を、音声データのロスを補間する信号
に利用することで、ロスを補間する音声の音質を向上させることができる。
なる点は、音声データのロスを検出した際、ロス部分を補間する音声信号を出力する前に
、ロス後の次の音声データを受信しているかを検出する。そして、次の音声データを検出
した場合、ロスした音声データに対する音声信号を生成するのに、実施例1の動作に加え
、次の音声データの情報をも用いる点である。
データに対する復号装置の構成を示す。実施例2の音声データ復号装置は、ロスディテク
タ201、音声データデコーダ202、音声データアナライザ203、パラメータ修正部
204、音声合成部205及び音声信号出力部206より構成されている。ここで、音声
データデコーダ202、パラメータ修正部204及び音声合成部205は、実施例1の音
声データデコーダ102、パラメータ修正部104及び音声合成部105と同じ動作をす
るので、説明は割愛する。
ータのロスを検出した場合、音声データデコーダ202がロス部分を補間する音声信号を
出力する前に、ロス後の次の音声データを受信しているかを検出する。さらに、ロスディ
テクタ201は、この検出結果を音声データデコーダ202と音声データアナライザ20
3とパラメータ修正部204と音声信号出力部206に出力する。
加え、ロスディテクタ201からの検出結果に基づいて、ロスを検出した次の音声データ
に対する音声信号の時間を反転させた信号を生成する。そして、この信号について実施例
1と同様の手順で分析を行い、抽出したスペクトルパラメータ、遅延パラメータ、適応コ
ードブックゲイン、正規化残差信号または正規化残差信号ゲインをパラメータ修正部20
4に出力する。
て、音声データデコーダ202から入力された復号音声信号、或いは最初はロスが検出さ
れた前の音声データのパラメータにより生成された合成音声信号の比率が高く、最後はロ
スが検出された次の音声データのパラメータにより生成された合成音声信号の時間を反転
させた信号の比率が高くなるように加算した信号のいずれかを出力する。
701)。ロスディテクタ201が音声データのロスを検出しなかったならば、実施例1
のS602と同様の動作を行う(S702)。
、音声データデコーダ202がロス部分を補間する音声信号を出力する前にロス後の次の
音声データを受信しているか、検出する(S703)。次の音声データを受信していない
ならば、実施例1のS603乃至S605と同様の動作を行う(S704乃至S706)
。次の音声データを受信したならば、音声データデコーダ202が次の音声データを復号
する(S707)。この復号した次の音声データを基に、音声データアナライザ203が
スペクトルパラメータ、遅延パラメータ、適応コードブックゲイン、正規化残差信号また
は正規化残差信号ゲインを抽出する(S708)。次に、パラメータ修正部204はロス
検出結果に基づいて、スペクトルパラメータ、遅延パラメータ、適応コードブックゲイン
、正規化残差信号または正規化残差信号ゲインをそのまま用いるか、或いは±1%の乱数
を加える等して修正する(S709)。音声合成部205は、これらの値を使って、合成
音声信号を生成する(S710)。
に基づいて、音声データデコーダ202から入力された復号音声信号、または最初はロス
が検出された前の音声データのパラメータにより生成された合成音声信号の比率が高く、
最後はロスが検出された次の音声データのパラメータにより生成された合成音声信号の時
間を反転させた信号の比率が高くなるように加算した信号を出力する(S711)。
の到着時間の揺らぎを吸収するために、受信した音声データのバッファリングを行ってい
るので、ロスした部分の音声信号を補間する際に、バッファに存在しているロスした次の
音声データを用いることで、補間信号の音質を向上させることができる。
符号化された音声データの復号に関して、音声データのロスを検出した場合に、実施例2
と同様に、第一音声データデコーダ302がロス部分を補間する音声信号を出力する前に
ロス後の音声データを受信していれば、ロスした音声データに対する音声信号を生成する
際に次の音声データの情報を用いる構成を示している。
の音声データ復号装置は、ロスディテクタ301、第一音声データデコーダ302、パラ
メータ補間部303、第二音声データデコーダ304及び音声信号出力部305から構成
されている。
音声データデコーダ304に出力するとともに、受信した音声データがロスしているかを
検出する。ロスを検出した場合に、第一音声データデコーダ302がロス部分を補間する
音声信号を出力する前に次の音声データを受信しているかを検出し、検出結果を第一音声
データデコーダ302と第二音声データデコーダ304に出力する。
タを復号して、復号音声信号を音声データ出力部に出力し、復号時のスペクトルパラメー
タ、遅延パラメータ、適応コードブックゲイン、正規化残差信号または正規化残差信号ゲ
インをパラメータ補間部303に出力する。また、第一音声データデコーダ302は、ロ
スを検出し、次の音声データを受信していない場合、過去の音声データの情報を用いてロ
ス部分を保管する音声信号を生成する。生成する方法については、上記特許文献1に記載
されている方法を用いることができる。さらに、第一音声データデコーダ302は、パラ
メータ補間部303から入力されたパラメータを用いてロスした音声データに対する音声
信号を生成し、音声信号出力部305に出力する。
ス部分を補間する音声信号を出力する前に次の音声データを受信している場合、ロスした
音声データに対する音声信号を過去の音声データの情報を用いて生成する。そして、第二
音声データデコーダ304は、生成した音声データを使って次の音声データを復号した際
に用いる、スペクトルパラメータ、遅延パラメータ、適応コードブックゲイン、正規化残
差信号または正規化残差信号ゲインを抽出し、パラメータ補間部303に出力する。
と第二音声データデコーダ304から入力されたパラメータを用いて、ロスした音声デー
タに対するパラメータを生成し、第一音声データデコーダ302に出力する。
力する。
01)。ロスしていないならば、第一音声データデコーダ302が、入力された音声デー
タを復号し、復号時のスペクトルパラメータ、遅延パラメータ、適応コードブックゲイン
、正規化残差信号または正規化残差信号ゲインをパラメータ補間部303に出力する(S
802及びS803)。
分を補間する音声信号を出力する前にロス後の次の音声データを受信しているか、検出す
る(S804)。次の音声データを受信していないならば、第一音声データデコーダ30
2が、過去の音声データの情報を用いてロス部分を保管する音声信号を生成する(S80
5)。
声データに対する音声信号を過去の音声データの情報を用いて生成する(S806)。第
二音声データデコーダ304は、生成した音声データを使って次の音声データを復号し、
復号時のスペクトルパラメータ、遅延パラメータ、適応コードブックゲイン、正規化残差
信号または正規化残差信号ゲインを生成し、パラメータ補間部303に出力する(S80
7)。次に、パラメータ補間部304が、第一音声データデコーダ302から入力された
パラメータと第二音声データデコーダ304から入力されたパラメータを用いて、ロスし
た音声データに対するパラメータを生成する(S808)。そして、第一音声データデコ
ーダ302は、パラメータ補間部304が生成したパラメータを用いて、ロスした音声デ
ータに対する音声信号を生成し、第一音声データデコーダ302に出力する(S809)
。
305へ出力し、音声信号出力部305が復号音声信号を出力する(S810)。
を吸収するために、受信した音声データのバッファリングを行っているので、CELP方式に
おいてロスした部分の音声信号を補間する際に、バッファに存在しているロスした次の音
声データを用いることで、補間信号の音質を向上させることができる。
ータのロスが生じたときに補間信号を用いると、ロスした部分は補うことができるものの
、補間信号は正しい音声データから生成したわけではないので、その後に受信した音声デ
ータの音質を低下させてしまう。そこで、実施例4は、実施例3に加えて、音声データの
ロスの部分に対する補間音声信号を出力した後に、ロスした部分の音声データが遅れて届
いた場合、この音声データを用いることにより、ロスした次の音声データの音声信号の品
質を向上させる技術を開示する。
成を示す。実施例4の音声データ復号装置は、ロスディテクタ401、第一音声データデ
コーダ402、第二音声データデコーダ403、メモリ蓄積部404及び音声信号出力部
405から構成されている。
音声データデコーダ403に出力する。また、ロスディテクタ401は、受信した音声デ
ータがロスしたかを検出する。ロスを検出した場合には、次の音声データを受信している
かを検出し、検出結果を第一音声データデコーダ402、第二音声データデコーダ403
または音声信号出力部405に出力する。さらに、ロスディテクタ401は、ロスした音
声データが遅れて受信したかどうかを検出する。
タを復号する。また、第一音声データデコーダ402は、ロスが検出された場合、過去の
音声データの情報を用いて音声信号を生成して、音声データ出力部405に出力する。生
成する方法については、特許文献1に記載されている方法を用いることができる。さらに
、第一音声データデコーダ402は、合成フィルタ等のメモリをメモリ蓄積部404に出
力する。
て到着した音声データを、メモリ蓄積部404に蓄積されているロス検出直前パケットの
合成フィルタ等のメモリを使って復号し、復号信号を音声信号出力部405に出力する。
て、第一音声データデコーダ402から入力された復号音声信号、第二音声データデコー
ダ403から入力された復号音声信号または前記二つの信号をある比率で加算した音声信
号を出力する。
した音声データを保管する音声信号を出力する。ここで、S805及びS806のときに
、過去の音声データより音声信号を生成したときに、合成フィルタ等のメモリをメモリ蓄
積部404に出力する(S903及びS904)。そして、ロスディテクタ401が、ロ
スしていた音声データを遅れて受信したのを検出する(S905)。ロスディテクタ40
1が検出していないならば、実施例3で生成した音声信号を出力する。ロスディテクタ4
01が検出したならば、第二音声データデコーダ403が、遅れて到着した音声データを
、メモリ蓄積部404に蓄積されているロス検出直前パケットの合成フィルタ等のメモリ
を使って復号する(S906)。
基づいて、第一音声データデコーダ402から入力された復号音声信号、第二音声データ
デコーダ403から入力された復号音声信号または前記二つの信号をある比率で加算した
音声信号を出力する(S907)。具体的には、ロスを検出し、音声データが遅れて到着
した場合、音声信号出力部405は、ロスした音声データの次の音声データに対する音声
信号として、最初は、第一音声データデコーダ402から入力された復号音声信号の比を
大きくする。そして、時間が経過するにつれて、音声信号出力部405は、第二音声デー
タデコーダ403から入力された復号音声信号の比を大きくするように加算した音声信号
を出力する。
リを書き換えることで、正しい復号音声信号を生成することができる。また、この正しい
復号音声信号を、あえてすぐに出力せず、ある比率で加算した音声信号を出力することで
、音声が不連続になることを防止することがきる。さらに、ロスした部分に補間信号を用
いたとしても、遅れて届いたロス部分の音声データで合成フィルタ等のメモリを書きかえ
て復号音声信号を生成することで、補間信号後の音質を向上させることができる。
間信号の生成をした形態に付け加えてもよい。
る装置の構成を示している。ここでは、例えば、G.711で代表される波形符号化方式で符
号化された音声データを、CELP方式で符号化された音声データに変換する装置の形態を示
す。実施例5の音声データ変換装置は、ロスディテクタ501、音声データデコーダ50
2、音声データエンコーダ503、パラメータ修正部504及び音声データ出力部505
から構成されている。
。また、ロスディテクタ501は、受信した音声データがロスしているかを検出し、検出
結果を音声データデコーダ502と音声データエンコーダ503とパラメータ修正部50
4と音声信号出力部505に出力する。
復号し、復号音声信号を音声データエンコーダ503に出力する。
02から入力された復号音声信号を符号化し、符号化した音声データを音声データ出力部
505に出力する。また、音声データエンコーダ503は、符号化時のパラメータである
スペクトルパラメータ、遅延パラメータ、適応コードブックゲイン、残差信号または残差
信号ゲインをパラメータ修正部504に出力する。さらに、音声データエンコーダ503
は、ロスが検出された場合、パラメータ修正部504から入力されパラメータを受け取る
。そして、音声データエンコーダ503は、パラメータ抽出に用いるフィルタ(図示せず
)を保持しており、パラメータ修正部504から受け取ったパラメータを符号化して、音
声データを生成する。その際に、音声データエンコーダ503はフィルタ等のメモリを更
新する。ここで、音声データエンコーダ503は、符号化時に生じる量子化誤差により、
符号化後のパラメータ値がパラメータ修正部504から入力された値と同じ値にならない
場合、符号化後のパラメータ値がパラメータ修正部504から入力された値に最も近い値
となるように選択する。また、通信相手の無線通信装置が保持するフィルタのメモリとの
齟齬が生じることを避けるために、音声データエンコーダ503は、音声データを生成す
る際に、パラメータ抽出などに用いるフィルタが持つメモリ(図示せず)を更新する必要
がある。さらに、音声データエンコーダ503は、生成した音声データを音声データ出力
部505に出力する。
あるスペクトルパラメータ、遅延パラメータ、適応コードブックゲイン、残差信号または
残差信号ゲインを受け取り、保存する。また、パラメータ修正部504は、保持していた
ロス検出前のパラメータをそのまま用いるか、又は所定の修正をし、ロスディテクタ50
1から入力されるロス検出結果に基づいて、音声データエンコーダ503へ出力する。
いて、音声データエンコーダ503から受け取った音声信号を出力する。
1001)。ロスディテクタ501がロスを検出しなかったなら、音声データデコーダ5
02が受信した音声データを基に復号音声信号を生成する(S1002)。そして、音声
データエンコーダ503が、復号音声信号を符号化し、符号化時のパラメータであるスペ
クトルパラメータ、遅延パラメータ、適応コードブックゲイン、残差信号または残差信号
ゲインを出力する(S1003)。
るロス前のパラメータをそのままか、または所定の修正をして、音声データエンコーダ5
03へ出力する。このパラメータを受信した音声データエンコーダ503は、パラメータ
を抽出するためのフィルタが持つメモリを更新する(S1004)。さらに、音声データ
エンコーダ503が、ロスする直前のパラメータを基に音声信号を生成する(S1005
)。
503から受け取った音声信号を出力する(S1006)。
声データのロスに対する補間信号を波形符号化方式で生成せず、パラメータなどを用いて
ロス部分を補間することで、補間信号の音質を向上させることができる。また、音声デー
タのロスに対する補間信号を波形符号化方式で生成せず、パラメータなどを用いてロス部
分を補間することで、演算量を少なくすることができる。
ELP方式で符号化された音声データに変換する形態を示したが、CELP方式で符号化された
音声データを別のCELP方式で符号化された音声データに変換する形態でもよい。
は上記実施例に限定されることはなく、請求項やその均等物によって参酌される最も広い
範囲で解釈される。
102 音声データデコーダ
103 音声データアナライザ
104 パラメータ修正部
105 音声合成部
106 音声信号出力部
201 ロスディテクタ
202 音声データデコーダ
203 音声データアナライザ
204 パラメータ修正部
205 音声合成部
206 音声信号出力部
301 ロスディテクタ
302 第一音声データデコーダ
303 第二音声データデコーダ
304 パラメータ補間部
305 音声信号出力部
401 ロスディテクタ
402 第一音声データデコーダ
403 第二音声データデコーダ
404 メモリ蓄積部
405 音声信号出力部
501 ロスディテクタ
502 音声データデコーダ
503 音声データエンコーダ
504 パラメータ修正部
505 音声データ出力部
Claims (2)
- 波形符号化方式による音声データ復号装置であって、
音声データ中にロスを検出し、音声データデコーダがロス部分を補間する音声信号を出力
する前に前記ロス後の音声フレームを受信したかを検出するロスディテクタと、
前記ロス後に受信した前記音声フレームを復号して復号音声信号を生成する前記音声デー
タデコーダと、
前記復号音声信号の時間を反転させてパラメータを抽出する音声データアナライザと、
前記パラメータに所定の修正を行うパラメータ修正部と、
修正された前記パラメータを用いて合成音声信号を生成する音声合成部と、を備える音声
データ復号装置。
- 前記パラメータが、スペクトルパラメータ、遅延パラメータ、適応コードブックゲイン、
正規化残差信号、または正規化残差信号ゲインである前記請求項1に記載の音声データ復
号装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007035662A JP5056048B2 (ja) | 2007-02-16 | 2007-02-16 | 音声データ復号装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007035662A JP5056048B2 (ja) | 2007-02-16 | 2007-02-16 | 音声データ復号装置 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006204781 Division | 2006-07-27 | 2006-07-27 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2008033230A true JP2008033230A (ja) | 2008-02-14 |
| JP2008033230A5 JP2008033230A5 (ja) | 2009-07-09 |
| JP5056048B2 JP5056048B2 (ja) | 2012-10-24 |
Family
ID=39122680
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007035662A Expired - Fee Related JP5056048B2 (ja) | 2007-02-16 | 2007-02-16 | 音声データ復号装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5056048B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116229942A (zh) * | 2023-03-15 | 2023-06-06 | 北京有竹居网络技术有限公司 | 模型生成方法、声音事件检测方法、装置、介质及设备 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005157045A (ja) * | 2003-11-27 | 2005-06-16 | Matsushita Electric Ind Co Ltd | 音声伝送方法 |
-
2007
- 2007-02-16 JP JP2007035662A patent/JP5056048B2/ja not_active Expired - Fee Related
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005157045A (ja) * | 2003-11-27 | 2005-06-16 | Matsushita Electric Ind Co Ltd | 音声伝送方法 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116229942A (zh) * | 2023-03-15 | 2023-06-06 | 北京有竹居网络技术有限公司 | 模型生成方法、声音事件检测方法、装置、介质及设备 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5056048B2 (ja) | 2012-10-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11227612B2 (en) | Audio frame loss and recovery with redundant frames | |
| KR100919868B1 (ko) | 패킷 손실 보상 | |
| US7519535B2 (en) | Frame erasure concealment in voice communications | |
| CN104781876B (zh) | 音频编码装置、音频编码方法以及音频解码装置、音频解码方法 | |
| JP2008261904A (ja) | 符号化装置、復号化装置、符号化方法および復号化方法 | |
| EP3301672A1 (en) | Audio encoding device and audio decoding device | |
| JP4678440B2 (ja) | 音声データ復号装置 | |
| JP2002221994A (ja) | 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体 | |
| JP5056048B2 (ja) | 音声データ復号装置 | |
| JP5056049B2 (ja) | 音声データ復号装置 | |
| JP2008033231A (ja) | 音声データ復号装置及び音声データ変換装置 | |
| JP2008033233A (ja) | 音声データ復号装置及び音声データ変換装置 | |
| JP5011913B2 (ja) | 差分符号化信号復号装置 | |
| JP2005151235A (ja) | 復号装置 | |
| JP2008026700A (ja) | デジタル通信システム | |
| Napoleon et al. | Enhanced recovery technique for improving voice quality degraded by packet loss in data networks |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080613 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20090513 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090521 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090618 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110705 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110801 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110927 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111128 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120703 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120716 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150810 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5056048 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |