JP2853824B2 - Speech parameter information coding method - Google Patents
Speech parameter information coding methodInfo
- Publication number
- JP2853824B2 JP2853824B2 JP4265194A JP26519492A JP2853824B2 JP 2853824 B2 JP2853824 B2 JP 2853824B2 JP 4265194 A JP4265194 A JP 4265194A JP 26519492 A JP26519492 A JP 26519492A JP 2853824 B2 JP2853824 B2 JP 2853824B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- ratio
- frame
- past
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【0001】[0001]
【産業上の利用分野】本発明は音声の信号系列を少ない
情報量でディジタル符号化する高能率音声符号化法であ
って、特にスペクトル包絡やパワーのパラメータの音声
のパラメータ情報符号化法に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a high-efficiency speech encoding method for digitally encoding a speech signal sequence with a small amount of information, and more particularly to a speech parameter information encoding method for spectral envelope and power parameters.
【0002】[0002]
【従来の技術】ディジタル移動無線通信や音声蓄積サー
ビスでは電波や記憶媒体の効率的利用を図るために、種
々の高能率音声符号化法が用いられている。8kHzサ
ンプルの音声を8kbit/s以下で符号化する方法と
してはCELP、VSELP、マルチパルス符号化、重
み付きベクトル量子化による変換符号化等が知られてい
る。いずれの方法においても、スペクトル包絡情報やパ
ワーの情報をフレーム毎に符号化して伝送している。2. Description of the Related Art In digital mobile radio communications and voice storage services, various high-efficiency voice coding methods are used in order to use radio waves and storage media efficiently. As a method of encoding the sound of 8 kHz samples at 8 kbit / s or less, CELP, VSELP, multi-pulse encoding, transform encoding by weighted vector quantization, and the like are known. In either method, spectrum envelope information and power information are encoded and transmitted for each frame.
【0003】[0003]
【発明の課題を解決するための課題】ところで、上述し
た従来の符号化においては、情報圧縮効率を高めるため
に、フレーム更新周期を長くする方法や、過去のフレー
ムからの差分や、予測値との差分を量子化する方法が知
られている。しかしながら、フレーム更新周期を40m
s以上にすると、音声波形のスペクトル特性の変化やパ
ワーの変化に追随できず符号化歪が増大するという問題
が生じる。また、符号誤りによってパラメータが破壊さ
れると、長い区間で符号化音声に歪が生ずる。一方、過
去のフレームのパラメータとの差や予測値との差を符号
化すると、短い更新周期でもパラメータの時間的連続性
を生かして情報圧縮が図れるが、過去の符号誤りの影響
が長い時間にわたって伝播するという欠点がある。By the way, in the above-mentioned conventional coding, in order to increase the information compression efficiency, a method of extending a frame update period, a difference from a past frame, a prediction value, and the like. Is known. However, if the frame update cycle is 40 m
Above s, a problem arises in that it is not possible to follow changes in the spectral characteristics and power of the speech waveform, and the coding distortion increases. Further, if the parameters are destroyed due to a code error, distortion occurs in the coded speech in a long section. On the other hand, when the difference between the parameter of the past frame and the difference between the predicted value and the predicted value are encoded, the information can be compressed by utilizing the temporal continuity of the parameter even in a short update cycle, but the influence of the past code error is over a long time. It has the disadvantage of propagating.
【0004】この発明は上述した事情に鑑みてなされた
もので、少ない情報量でスペクトル情報やパワーを符号
化する際、符号誤りの伝播を避け、比較的短い更新周期
を保ち、かつ、パラメータの時間的連続性を利用して量
子化歪を小さくできる音声のパラメータ情報符号化法を
提供することにある。The present invention has been made in view of the above-mentioned circumstances, and when encoding spectral information and power with a small amount of information, avoids the propagation of code errors, maintains a relatively short update cycle, and maintains the parameter update. An object of the present invention is to provide a speech parameter information coding method capable of reducing quantization distortion by using temporal continuity.
【0005】[0005]
【課題を解決するための手段】上述した問題点を解決す
るために、請求項1記載の発明では、音声を一定のサン
プル数毎のフレームに区切り、フレーム単位でスペクト
ル包絡の形状やパワーのパラメータを抽出し、パラメー
タのセットを量子化するパラメータ情報符号化法におい
て、符号器では、過去のベクトルすなわち過去のフレー
ムの量子化の際に用いられた一部の出力ベクトルと、現
在のベクトルすなわち符号帳の中の再生ベクトルの2つ
のベクトルの加重平均操作を行い、平均したベクトルと
分析で求められた理想的なパラメータベクトルとの歪が
最小となるような基準を用いて、符号帳の中の出力ベク
トルを選択し、その番号を伝送するとともに、復号器で
は過去のベクトルと伝送された符号に対応する現在の再
生ベクトルとを加重平均して出力することを特徴とす
る。In order to solve the above-mentioned problems, according to the first aspect of the present invention, a speech is divided into frames of a predetermined number of samples, and the shape of a spectral envelope and a parameter of a power are divided in frame units. In the parameter information encoding method of extracting a parameter set and quantizing a set of parameters, the encoder uses a past vector, that is, a part of output vectors used when quantizing a past frame, and a current vector, that is, a code. The weighted averaging operation of the two reproduced vectors in the book is performed, and the criterion that minimizes the distortion between the averaged vector and the ideal parameter vector obtained by the analysis is used. The output vector is selected, its number is transmitted, and the decoder adds the past vector and the current reproduction vector corresponding to the transmitted code. And outputs an average.
【0006】また、請求項2記載の発明では、請求項1
記載の音声のパラメータ情報符号化法において、伝送路
に符号誤りが予想される場合には、1つ前のフレームの
符号帳の出力ベクトルを変形して過去のベクトルとする
ことを特徴とする。また、請求項3記載の発明では、請
求項1記載の音声のパラメータ情報符号化法において、
加重平均の比率を現在のフレームの符号帳のベクトルの
グループ毎、または個々のベクトル毎、またはベクトル
の要素毎に固有の値を設定しておくことを特徴とする。Further, according to the invention described in claim 2, according to claim 1,
In the described speech parameter information encoding method, when a code error is expected in the transmission path, the output vector of the codebook of the immediately preceding frame is transformed into a past vector. According to a third aspect of the present invention, in the speech parameter information encoding method according to the first aspect,
The ratio of the weighted average is set to a unique value for each group of the codebook vectors of the current frame, for each individual vector, or for each element of the vector.
【0007】また、請求項4記載の発明では、請求項1
記載の音声のパラメータ情報符号化法において、複数種
類の加重平均の比率を予め設定しておき、符号器では、
量子化歪が小さくなるように、比率と符号帳ベクトルを
組み合わせて選択し、比率を指定する符号とベクトルを
指定する符号とを組み合わせて伝送するとともに、復号
器では、指定された比率で、過去のベクトルと現在のベ
クトルとの加重平均を行なうことを特徴とする。Further, according to the invention described in claim 4, according to claim 1,
In the described speech parameter information encoding method, the ratio of a plurality of types of weighted average is set in advance, and in the encoder,
In order to reduce the quantization distortion, a ratio and a codebook vector are selected in combination, and a code specifying the ratio and a code specifying the vector are transmitted in combination. And a weighted average of the current vector and the current vector.
【0008】また、請求項5記載の発明では、請求項1
記載の音声のパラメータ情報符号化法において、復号器
では、過去のフレームの伝送情報に誤りがあることを検
出した場合には、過去のベクトルの比率を下げて加重平
均をとり、現在のフレームの伝送情報に誤りがあること
を検出した場合には、現在のベクトルの比率を下げて加
重平均をとることを特徴とする。[0008] According to the fifth aspect of the present invention, in the first aspect,
In the described speech parameter information coding method, when the decoder detects that there is an error in the transmission information of the past frame, the decoder reduces the ratio of the past vector, takes a weighted average, and takes the weight of the current frame. When it is detected that there is an error in the transmission information, a weighted average is obtained by reducing the ratio of the current vector.
【0009】[0009]
【作用】請求項1記載の発明によれば、符号器では、過
去のベクトルすなわち過去のフレームの量子化の際に用
いられた一部の出力ベクトルと、現在のベクトルすなわ
ち符号帳の中の再生ベクトルの2つのベクトルの加重平
均操作を行い、平均したベクトルと分析で求められた理
想的なパラメータベクトルとの歪が最小となるような基
準を用いて、符号帳の中の出力ベクトルを選択し、その
番号を伝送するとともに、復号器では過去のベクトルと
伝送された符号に対応する現在の再生ベクトルとを加重
平均して出力する。According to the first aspect of the present invention, in the encoder, the past vector, that is, a part of the output vector used in the quantization of the past frame, and the current vector, that is, the reproduction in the codebook. Perform a weighted average operation of the two vectors of the vector and select an output vector in the codebook using a criterion that minimizes the distortion between the averaged vector and the ideal parameter vector obtained by the analysis. , And the decoder outputs a weighted average of the past vector and the current reproduction vector corresponding to the transmitted code.
【0010】また、請求項2記載の発明によれば、請求
項1記載の音声のパラメータ情報符号化法において、伝
送路に符号誤りが予想される場合には、1つ前のフレー
ムの符号帳の出力ベクトルを変形して過去のベクトルと
する。According to the second aspect of the present invention, in the speech parameter information encoding method according to the first aspect, if a code error is expected in a transmission path, the codebook of the immediately preceding frame is used. Is transformed into a past vector.
【0011】また、請求項3記載の発明によれば、請求
項1記載の音声のパラメータ情報符号化法において、加
重平均の比率を現在のフレームの符号帳のベクトルのグ
ループ毎、または個々のベクトル毎、またはベクトルの
要素毎に固有の値を設定しておく。According to a third aspect of the present invention, in the speech parameter information encoding method according to the first aspect, the ratio of the weighted average is determined for each group of the codebook vectors of the current frame or for each vector. A unique value is set for each element or for each element of the vector.
【0012】また、請求項4記載の発明によれば、請求
項1記載の音声のパラメータ情報符号化法において、複
数種類の加重平均の比率を予め設定しておき、符号器で
は、量子化歪が小さくなるように、比率と符号帳ベクト
ルを組み合わせて選択し、比率を指定する符号とベクト
ルを指定する符号とを組み合わせて伝送するとともに、
復号器では、指定された比率で、過去のベクトルと現在
のベクトルとの加重平均を行なう。According to a fourth aspect of the present invention, in the speech parameter information encoding method according to the first aspect, a ratio of a plurality of types of weighted averages is set in advance, and the encoder performs quantization distortion. In order to reduce the ratio, select a combination of the ratio and the codebook vector, and transmit by combining the code specifying the ratio and the code specifying the vector,
The decoder performs a weighted average of the past vector and the current vector at a specified ratio.
【0013】また、請求項5記載の発明によれば、請求
項1記載の音声のパラメータ情報符号化法において、復
号器では、過去のフレームの伝送情報に誤りがあること
を検出した場合には、過去のベクトルの比率を下げて加
重平均をとり、現在のフレームの伝送情報に誤りがある
ことを検出した場合には、現在のベクトルの比率を下げ
て加重平均をとる。According to a fifth aspect of the present invention, in the speech parameter information encoding method according to the first aspect, when the decoder detects that there is an error in the transmission information of the past frame, The weighted average is calculated by reducing the ratio of the past vectors, and when it is detected that there is an error in the transmission information of the current frame, the weighted average is calculated by reducing the ratio of the current vector.
【0014】[0014]
【実施例】次に図面を参照してこの発明の実施例につい
て説明する。本発明では、スペクトルパラメータの値ま
たはベクトル(以下、単にベクトルと表わす)を、過去
と現在のフレームの複数のベクトルの加重平均ベクトル
で表わす。通常の差分符号化や予測符号化では過去のフ
レームの出力ベクトルをそのまま用いるが、本発明にお
いてはその一部のみ、例えば加重平均して作られたベク
トルのうち、1つ前のフレームで更新されたベクトルの
みを用いたり、符号誤りの影響のないベクトルのみを用
いたり、符号誤りを想定して変形したベクトルを用いる
ことが特徴である。また加重平均の比率を選択したり制
御したりすることも特徴である。Next, an embodiment of the present invention will be described with reference to the drawings. In the present invention, a value or a vector of a spectral parameter (hereinafter, simply referred to as a vector) is represented by a weighted average vector of a plurality of vectors in the past and present frames. In normal differential coding or predictive coding, the output vector of a past frame is used as it is, but in the present invention, only a part of the output vector is updated in the previous frame among vectors created by weighted averaging, for example. It is characterized in that only a vector that has been affected by a code error is used, or a vector that is deformed assuming a code error is used. Another feature is that the ratio of the weighted average is selected and controlled.
【0015】図1は本発明をスペクトルパラメータのベ
クトル量子化に適用した第1の実施例の構成を示すブロ
ック図である。図において、乗算器1は、1フレーム前
の過去の符号ベクトルVjに、(1−g)なる係数を乗
算し、これを加算器2の一方の入力端へ供給する。な
お、符号gは加重平均の比率の定数である。また、乗算
器3は、切換えスイッチSW1を介して供給された現在
の再生ベクトルWkに加重平均の比率の定数gを乗算
し、これを加算器2の他方の入力端へ供給するようにな
っている。加算器2は、それぞれの入力端へ供給された
ベクトルを加算し、量子化値Ynとして歪計算器4へ供
給する。該歪計算器4には、入力パラメータとして、n
個のフレームで分析されたスペクトルパラメータベクト
ルXnが供給されており、先の量子化値Ynとスペクトル
パラメータベクトルXnとの歪が最小となる再生ベクト
ルWkを上記切換えスイッチSW1により選択し、上述
した乗算器へ供給するとともに、その番号を符号S1と
して伝送するようになっている。FIG. 1 is a block diagram showing the configuration of a first embodiment in which the present invention is applied to vector quantization of spectral parameters. In the figure, a multiplier 1 multiplies a past code vector V j one frame before by a coefficient (1-g), and supplies this to one input terminal of an adder 2. Note that the symbol g is a constant of the ratio of the weighted average. Further, the multiplier 3 multiplies the current reproduction vector W k supplied via the changeover switch SW 1 by a constant g of the ratio of the weighted average, and supplies this to the other input terminal of the adder 2. ing. The adder 2 adds the respective supplied vector to the input, and supplies to the distortion calculator 4 as the quantization value Y n. The distortion calculator 4 has n as an input parameter.
The spectral parameter vector X n analyzed in the number of frames is supplied, and a reproduction vector W k that minimizes the distortion between the previous quantized value Y n and the spectral parameter vector X n is selected by the changeover switch SW1. , And the number is transmitted as a symbol S1.
【0016】したがって、本実施例では、あるn番目の
フレームで分析されたスペクトルパラメータベクトルX
nの量子化値Ynは、 Yn=(1−g)Vj+gWk と表される。なお、現在の再生ベクトルWkは、次のフ
レームにおいては、過去の符号ベクトルVjとして用い
られる。Therefore, in this embodiment, the spectrum parameter vector X analyzed in a certain n-th frame
quantized value Y n of n is represented as Y n = (1-g) V j + gW k. Note that the current reproduction vector W k is used as a past code vector V j in the next frame.
【0017】次に、図2は2フレーム過去のベクトルU
も用いる第2の実施例の場合で、さらに3フレームの周
期で繰り返すものの、フレームに依存して3種の符号帳
U,V,Wを用いる例である。 Yn=(Ui+Vj+Wk)/3 ここで、Uiは2つ過去のフレームで決まった出力ベク
トルであり、Vjは1つ過去のフレームで決まった符号
ベクトルである。n番目のフレームにおける再生ベクト
ルWkとしては、符号帳Wの中から、量子化値Ynとスペ
クトルパラメータベクトルXnとの歪が最も小さくなる
ベクトルが選択され、伝送される。出力ベクトルVjは
次のフレーム、再生ベクトルWkは次のフレームおよび
次の次のフレームでも用いられる。また、再生ベクトル
Wkは、n番目のフレームで決めることができるが、遅
延が許されるならば、次のフレームあるいは2フレーム
先のパラメータXを考慮して決めると量子化歪を小さく
することができる。Next, FIG. 2 shows a vector U two frames past.
This is an example in which three types of codebooks U, V, and W are used depending on the frame, although they are repeated in a cycle of three frames. Y n = (U i + V j + W k ) / 3 where U i is an output vector determined in two previous frames, and V j is a code vector determined in one previous frame. As the reproduction vector W k in the n-th frame, a vector that minimizes the distortion between the quantized value Y n and the spectrum parameter vector X n is selected from the codebook W and transmitted. The output vector V j is used in the next frame, and the reproduction vector W k is used in the next frame and the next next frame. The reproduction vector W k can be determined in the n-th frame. However, if delay is allowed, the quantization distortion can be reduced by considering the next frame or the parameter X two frames ahead. it can.
【0018】次に、図3は第3の実施例の符号化の様子
を示すもので、量子化値Ynは Yn=(Ui+Vj+Wk+Zn)/4 で表わされる。この場合、n番目のフレームではWnと
Znが決められて符号が伝送される。なお、上記の例で
は、符号帳U,V,Wは、各々、別の符号帳としたが、
共用することも可能である。Next, FIG. 3 shows a state of encoding in the third embodiment. The quantized value Y n is represented by Y n = (Ui + Vj + W k + Z n ) / 4. In this case, in the n-th frame, W n and Z n are determined and the code is transmitted. In the above example, the codebooks U, V, and W are respectively different codebooks.
It is also possible to share.
【0019】上述した第1、第2、第3の実施例では、
まず、理想的なXnを求め、パラメータの次元での平均
によって量子化値Ynを決める方法を用いたが、線形予
測パラメータの場合、過去のフレームで決まったパラメ
ータを用いた逆フィルタで求めた残差信号を分析するこ
とで、現在のフレームのパラメータを決める方法もあ
る。また、パラメータ次元での平均法では、個々の合成
フィルタの多項式の係数が平均されたものが最終的な合
成フィルタの係数となる。一方、分析を複数回行なう後
者の方法の場合、個々の多項式の積が最終的な合成フィ
ルタの多項式となる。In the first, second, and third embodiments described above,
First, a method of determining an ideal X n and determining the quantization value Y n by averaging in the parameter dimension was used. In the case of a linear prediction parameter, an inverse filter using a parameter determined in a past frame was used. There is also a method of determining the parameters of the current frame by analyzing the residual signal. In the averaging method in the parameter dimension, the average of the coefficients of the polynomials of the individual synthesis filters is the final coefficient of the synthesis filter. On the other hand, in the latter method of performing the analysis a plurality of times, the product of the individual polynomials becomes the final polynomial of the synthesis filter.
【0020】請求項2記載の発明では、特に伝送路符号
誤りによる歪の増加を抑える方法である。この場合、図
1において、出力ベクトルである量子化値Ynの代わり
に、符号誤り率を考慮した復号器での期待値Yn *と入力
パラメータであるスペクトルパラメータベクトルXnの
歪が最小となる符号を選択するよう構成する(図示
略)。この期待値は伝送路での符号誤り率(ビット誤り
率)をε、ベクトル1個に対する伝送ビット数をmとす
ると、 Yn * = (1−mε)Yn+ΣεYe と近似できる。ただし、右辺の第2項はベクトルに対応
する伝送路符号m個のうち1ビットだけが誤った場合に
出力されるm種類のベクトルYeの総和を示す。The invention according to claim 2 is a method for suppressing an increase in distortion particularly due to a transmission line code error. In this case, in FIG. 1, instead of the quantized value Y n as the output vector, the distortion between the expected value Y n * and the spectrum parameter vector X n as the input parameter in the decoder considering the bit error rate is minimized. (Not shown). The expected value is the bit error rate in the transmission path (bit error rate) epsilon, it can be approximated when the number of transmission bits for one vector and m, and Y n * = (1-mε ) Y n + ΣεY e. However, the second term on the right side indicates the sum of m types of vectors Y e output when only one bit out of m transmission path codes corresponding to the vector is incorrect.
【0021】図4は請求項3記載の発明に対応する第4
の実施例の構成を示すブロック図であり、該実施例で
は、加重平均の比率gを一定でなく、符号帳の中の再生
ベクトルWKに応じて設定された比率gkを用いるように
なっている。図において、再生ベクトルWKは個別の比
率gk(k=0〜nの整数)が設定された乗算器M1,
M2,……,Mn-1,Mnを通して切換えスイッチSW2
へ供給される。また、歪計算器4は、量子化値Ynとス
ペクトルパラメータベクトルXnとの歪が最小となるよ
うに、切換えスイッチSW2により再生ベクトルWkを
選択するとともに、それに応じた比率gkを選択するよ
うになっている。また、該切換えスイッチSW2の切換
えによって、乗算器1に供給される比率も連動して変る
ようになっている。量子化値Ynは、 Yn=(1−gk)Vj+gkWk で表される。この式では比率gkは再生ベクトルに対応
するスカラ値であるが、複数の再生ベクトルをひとまと
めにして、各集団毎にスカラ値を対応させてもよい。そ
の逆に再生ベクトルの各要素毎に比率の値を設定しても
よい。いずれの場合も過去の符号ベクトルVjを前提と
し、量子化値YnとスペクトルパラメータベクトルXnと
の歪を最小化する意味で、過去のベクトルとの比率と再
生ベクトルの最適な組合せを選択する。FIG. 4 shows a fourth embodiment corresponding to the third aspect of the present invention.
FIG. 3 is a block diagram showing a configuration of an embodiment of the present invention. In this embodiment, the ratio g of the weighted average is not constant, and the ratio g k set according to the reproduction vector W K in the codebook is used. ing. In the figure, a reproduction vector W K is a multiplier M 1 , in which individual ratios g k (k = 0 to an integer of n) are set.
The changeover switch SW2 through M 2 ,..., M n−1 , M n
Supplied to Further, the distortion calculator 4 selects the reproduction vector W k by the changeover switch SW2 and selects the ratio g k according to it so that the distortion between the quantization value Y n and the spectrum parameter vector X n is minimized. It is supposed to. Further, the ratio supplied to the multiplier 1 changes in conjunction with the switching of the switch SW2. Quantized value Y n is expressed by Y n = (1-g k ) V j + g k W k. In this equation, the ratio g k is a scalar value corresponding to the reproduction vector. However, a plurality of reproduction vectors may be grouped and the scalar value may correspond to each group. Conversely, a ratio value may be set for each element of the reproduction vector. In each case, the past code vector V j is assumed, and an optimal combination of the ratio with the past vector and the reproduction vector is selected in the sense of minimizing the distortion between the quantized value Y n and the spectrum parameter vector X n. I do.
【0022】図5は請求項4記載の発明に対応する第5
の実施例の構成を示すブロック図であり、該実施例で
は、複数種類の加重平均の比率の値を再生ベクトルとは
独立に設定することを特徴としている。この図におい
て、1フレーム前の符号ベクトルVjは乗算器MA1,M
A2の入力端へ供給される。乗算器MA1,MA2には、
それぞれ係数として(1−g1)および(1−g2)が設
定されており、その出力は切換えスイッチSW3,SW
4へ供給されている。切換えスイッチSW3は、歪計算
器4による歪計算結果に応じて切換えられるようになっ
ており、乗算器M1,M2のいずれかの出力を選択し、加
算器2の一方の入力端へ供給する。また、再生ベクトル
WKは、切換えスイッチSW4へ供給されている。該切
換えスイッチSW4は、上記スイッチSW3と同様に、
歪計算器4による歪計算結果に応じて切換えられるよう
になっており、選択した再生ベクトルWKを乗算器M
A3,MA4の入力端へ供給する。該乗算器MA3,MA4
には、それぞれ係数としてg1,g2が設定されており、
その出力は切換えスイッチSW5へ供給されている。該
切換えスイッチSW5は、上記スイッチSW3およびS
W4と同様に、歪計算器4による歪計算結果に応じて切
換えられるようになっており、選択した乗算器MA3,
MA4の出力を加算器2の他方の入力端へ供給するよう
になっている。このような構成において、量子化値Yn
は、 Yn=(1−gi)Vi+giWk で表される。この場合も、再生ベクトルと比率の組合せ
で歪の最小化を図るが、どの比率を用いるかを示す選択
情報S2を別に伝送する必要がある。FIG. 5 shows a fifth embodiment corresponding to the fourth aspect of the present invention.
FIG. 3 is a block diagram showing a configuration of an embodiment of the present invention, which is characterized in that values of ratios of a plurality of types of weighted averages are set independently of a reproduction vector. In this figure, the code vector V j one frame before is determined by the multipliers MA 1 , M
It is supplied to the input of A 2. The multipliers MA 1 and MA 2 include:
(1-g 1 ) and (1-g 2 ) are set as coefficients, respectively, and the outputs thereof are changeover switches SW3, SW
4. Changeover switch SW3 is adapted to be switched in response to the distortion calculation result by the distortion calculator 4, selects one of the output of the multiplier M 1, M 2, fed to one input terminal of the adder 2 I do. Further, the reproduction vector W K is supplied to the changeover switch SW4. The changeover switch SW4 is, like the switch SW3,
Switching is performed in accordance with the result of the distortion calculation by the distortion calculator 4, and the selected reproduction vector W K is multiplied by the multiplier M
A 3 and supply to the input terminal of MA4. The multipliers MA 3 and MA 4
Have g 1 and g 2 set as coefficients, respectively.
The output is supplied to a changeover switch SW5. The changeover switch SW5 is connected to the switches SW3 and S
As in the case of W4, switching is performed according to the result of distortion calculation by the distortion calculator 4, and the selected multipliers MA3, MA3,
The output of MA 4 is supplied to the other input terminal of the adder 2. In such a configuration, the quantization value Y n
Is expressed by Y n = (1-g i ) V i + g i W k. Also in this case, the distortion is minimized by a combination of the reproduction vector and the ratio, but it is necessary to separately transmit selection information S2 indicating which ratio is to be used.
【0023】請求項5の発明では、符号誤りが復号器で
検出された場合にその影響を小さくする方法であり、量
子化値Ynは、 Yn=(1−gv)Vi+gvWk で表される。符号器では図1の場合と同様に歪が最小と
なるWkを求めるが、復号器での過去のフレームのベク
トルVj、または現在のフレームのベクトルWkに符号誤
りが検出された、あるいは符号誤りの確立が高いと推定
された場合、復号器側のみで、誤りを含むベクトルの加
重平均比率を小さくして出力ベクトルとする構成として
いる(図示略)。この変形例では、例えば、1つ前のフ
レームに伝送路誤りが検出された場合には前のフレーム
の情報を全く用いずに、量子化値を、 Yn=Wk とする。あるいは、その中間で、量子化値を、 Yn=(1−√gv)Vi+√gvWk として前のフレームの影響を軽減するようにしている。[0023] In the present invention of claim 5 is a method to reduce the influence when a code error is detected in the decoder, the quantized value Y n, Y n = (1 -g v) V i + g v It is represented by W k . The encoder obtains W k that minimizes the distortion as in the case of FIG. 1, but a code error is detected in the vector V j of the past frame or the vector W k of the current frame in the decoder, or When it is estimated that the probability of a code error is high, only the decoder side reduces the weighted average ratio of the vector containing the error to obtain an output vector (not shown). In this modification, for example, when a transmission path error is detected in the immediately preceding frame, the quantization value is set to Y n = W k without using information of the previous frame at all. Alternatively, in the middle, the quantized values, so that to reduce the effect of the previous frame as Y n = (1-√g v ) V i + √g v W k.
【0024】[0024]
【発明の効果】以上、説明したように、この発明によれ
ば、フレーム毎に1つの符号帳に対応するインデックス
のみを伝送するので、フレーム長を短くしても伝送情報
量は小さくて済む。また過去のフレームと連続性が高い
ときには量子化歪を小さくできる。一方、符号誤りが生
じても、過去のフレームと平均化されるので影響は小さ
い。また現在のフレームの符号誤りは2つ先のフレーム
までしか影響は及ばない。また冗長符号を用いて符号誤
りが検出できるなら、誤りのあるパラメータを除外して
平均すれば誤りの影響を小さくできるという利点が得ら
れる。As described above, according to the present invention, since only the index corresponding to one codebook is transmitted for each frame, the amount of transmission information can be reduced even if the frame length is shortened. When the continuity with the past frame is high, the quantization distortion can be reduced. On the other hand, even if a code error occurs, the influence is small because it is averaged with past frames. A code error in the current frame affects only the next two frames. Further, if a code error can be detected using a redundant code, an advantage can be obtained that the influence of the error can be reduced by averaging while excluding erroneous parameters.
【図1】本発明の第1の実施例の構成を示すブロック図
である。FIG. 1 is a block diagram showing a configuration of a first exemplary embodiment of the present invention.
【図2】本発明の第2の実施例の構成を示すブロック図
である。FIG. 2 is a block diagram showing a configuration of a second exemplary embodiment of the present invention.
【図3】本発明の第3の実施例の構成を示すブロック図
である。FIG. 3 is a block diagram illustrating a configuration of a third exemplary embodiment of the present invention.
【図4】本発明の第4の実施例(請求項3)の構成を示
すブロック図である。FIG. 4 is a block diagram showing a configuration of a fourth embodiment (Claim 3) of the present invention.
【図5】本発明の第5の実施例(請求項4)の構成を示
すブロック図である。FIG. 5 is a block diagram showing a configuration of a fifth embodiment (Claim 4) of the present invention.
1,3 乗算器 2 加算器 4 歪計算器 Vj 符号ベクトル(出力ベクトル) g 加重平均の比率 SW1 切換えスイッチ Wk 再生ベクトル Yn 量子化値 Xn スペクトルパラメータベクトル U,V,W 符号帳 Yn * 期待値 ε 符号誤り率(ビット誤り率) M1,M2,……,Mn-1,Mn 乗算器 MA1,MA2,MA3,MA4 乗算器1,3 multiplier 2 adder 4 distortion calculator V j code vector (output vector) g ratio of weighted average SW1 switch W k reproduction vector Y n quantized value X n spectrum parameter vector U, V, W codebook Y n * expected value ε bit error rate (bit error rate) M 1 , M 2 ,..., M n−1 , M n multipliers MA 1 , MA 2 , MA 3 , MA 4 multipliers
───────────────────────────────────────────────────── フロントページの続き (72)発明者 三樹 聡 東京都千代田区内幸町一丁目1番6号 日本電信電話株式会社内 (72)発明者 大室 仲 東京都千代田区内幸町一丁目1番6号 日本電信電話株式会社内 (56)参考文献 特開 平1−68024(JP,A) 特開 平5−165499(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/18 H03M 7/30 JICSTファイル(JOIS)──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Satoshi Miki 1-6-1, Uchisaiwaicho, Chiyoda-ku, Tokyo Nippon Telegraph and Telephone Corporation (72) Inventor Naka Naka, 1-16-1 Uchisaiwaicho, Chiyoda-ku, Tokyo Nippon Telegraph and Telephone Corporation (56) References JP-A-1-68024 (JP, A) JP-A-5-165499 (JP, A) (58) Fields investigated (Int. Cl. 6 , DB name) G10L 3/00-9/18 H03M 7/30 JICST file (JOIS)
Claims (5)
区切り、フレーム単位でスペクトル包絡の形状やパワー
のパラメータを抽出し、パラメータのセットを量子化す
るパラメータ情報符号化法において、 符号器では、過去のベクトルすなわち過去のフレームの
量子化の際に用いられた一部の出力ベクトルと、現在の
ベクトルすなわち符号帳の中の再生ベクトルの2つのベ
クトルの加重平均操作を行い、平均したベクトルと分析
で求められた理想的なパラメータベクトルとの歪が最小
となるような基準を用いて、符号帳の中の出力ベクトル
を選択し、その番号を伝送するとともに、 復号器では過去のベクトルと伝送された符号に対応する
現在の再生ベクトルとを加重平均して出力することを特
徴とする音声のパラメータ情報符号化法。In a parameter information encoding method for dividing a speech into frames of a fixed number of samples, extracting a parameter of a shape and a power of a spectral envelope in frame units, and quantizing a set of parameters, an encoder includes: A weighted averaging operation is performed on the past vector, that is, a part of the output vectors used in the quantization of the past frame and the current vector, that is, the reproduced vector in the codebook. The output vector in the codebook is selected using the criterion that minimizes the distortion from the ideal parameter vector obtained in step 2, and its number is transmitted. And outputting a weighted average of a current reproduction vector corresponding to the encoded code and output.
は、1つ前のフレームの符号帳の出力ベクトルを変形し
て過去のベクトルとすることを特徴とする請求項1記載
の音声のパラメータ情報符号化法。2. A speech signal according to claim 1, wherein when a code error is expected in the transmission path, the output vector of the codebook of the immediately preceding frame is transformed into a past vector. Parameter information encoding method.
帳のベクトルのグループ毎、または個々のベクトル毎、
またはベクトルの要素毎に固有の値を設定しておくこと
を特徴とする請求項1記載の音声のパラメータ情報符号
化法。3. The ratio of the weighted average is determined for each group of codebook vectors in the current frame, or for each individual vector,
2. A method according to claim 1, wherein a unique value is set for each vector element.
ておき、符号器では、量子化歪が小さくなるように、比
率と符号帳ベクトルを組み合わせて選択し、比率を指定
する符号とベクトルを指定する符号とを組み合わせて伝
送するとともに、復号器では、指定された比率で、過去
のベクトルと現在のベクトルとの加重平均を行なうこと
を特徴とする請求項1記載の音声のパラメータ情報符号
化法。4. A ratio of a plurality of types of weighted averages is set in advance, and an encoder selects a combination of a ratio and a codebook vector so as to reduce quantization distortion, and selects a code and a vector for specifying the ratio. 2. A speech parameter information code according to claim 1, wherein the code is transmitted in combination with a code designating the parameter, and the decoder performs a weighted average of the past vector and the current vector at a specified ratio. Chemical method.
に誤りがあることを検出した場合には、過去のベクトル
の比率を下げて加重平均をとり、現在のフレームの伝送
情報に誤りがあることを検出した場合には、現在のベク
トルの比率を下げて加重平均をとることを特徴とする請
求項1記載の音声のパラメータ情報符号化法。5. When the decoder detects that there is an error in the transmission information of the past frame, the decoder lowers the ratio of the past vector and takes a weighted average, and there is an error in the transmission information of the current frame. 2. A speech parameter information encoding method according to claim 1, wherein when the fact is detected, the ratio of the current vector is reduced and a weighted average is calculated.
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4265194A JP2853824B2 (en) | 1992-10-02 | 1992-10-02 | Speech parameter information coding method |
EP93401656A EP0577488B9 (en) | 1992-06-29 | 1993-06-28 | Speech coding method and apparatus for the same |
DE69309557T DE69309557T2 (en) | 1992-06-29 | 1993-06-28 | Method and device for speech coding |
DE69328450T DE69328450T2 (en) | 1992-06-29 | 1993-06-28 | Method and device for speech coding |
EP96202584A EP0751496B1 (en) | 1992-06-29 | 1993-06-28 | Speech coding method and apparatus for the same |
US08/658,303 US5787391A (en) | 1992-06-29 | 1996-06-05 | Speech coding by code-edited linear prediction |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4265194A JP2853824B2 (en) | 1992-10-02 | 1992-10-02 | Speech parameter information coding method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06118999A JPH06118999A (en) | 1994-04-28 |
JP2853824B2 true JP2853824B2 (en) | 1999-02-03 |
Family
ID=17413855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4265194A Expired - Lifetime JP2853824B2 (en) | 1992-06-29 | 1992-10-02 | Speech parameter information coding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2853824B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3255189B2 (en) * | 1992-12-01 | 2002-02-12 | 日本電信電話株式会社 | Encoding method and decoding method for voice parameter |
KR100566713B1 (en) * | 2000-11-27 | 2006-04-03 | 니뽄 덴신 덴와 가부시키가이샤 | Acoustic parameter encoding, decoding method, apparatus and program, speech encoding, decoding method, apparatus and program |
-
1992
- 1992-10-02 JP JP4265194A patent/JP2853824B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH06118999A (en) | 1994-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2964344B2 (en) | Encoding / decoding device | |
US7337112B2 (en) | Digital signal coding and decoding methods and apparatuses and programs therefor | |
KR100469002B1 (en) | Audio coding method and apparatus | |
US6202045B1 (en) | Speech coding with variable model order linear prediction | |
EP2200023B1 (en) | Multichannel signal coding method and apparatus and program for the methods, and recording medium having program stored thereon. | |
JP2007504503A (en) | Low bit rate audio encoding | |
EP2290824B1 (en) | Long term prediction coding and decoding method, devices thereof, program thereof, and recording medium | |
JP3811110B2 (en) | Digital signal encoding method, decoding method, apparatus, program and recording medium | |
JP2853824B2 (en) | Speech parameter information coding method | |
JP3472279B2 (en) | Speech coding parameter coding method and apparatus | |
US7072830B2 (en) | Audio coder | |
JP4351684B2 (en) | Digital signal decoding method, apparatus, program, and recording medium | |
JP3219467B2 (en) | Audio decoding method | |
JP3193515B2 (en) | Voice coded communication system and apparatus therefor | |
JP3071388B2 (en) | Variable rate speech coding | |
JP3283152B2 (en) | Speech parameter quantization device and vector quantization device | |
JP3296363B2 (en) | Speech linear prediction parameter coding method | |
JP3496618B2 (en) | Apparatus and method for speech encoding / decoding including speechless encoding operating at multiple rates | |
JP2968109B2 (en) | Code-excited linear prediction encoder and decoder | |
JP3453116B2 (en) | Audio encoding method and apparatus | |
JPH06130998A (en) | Compressed voice decoding device | |
JP3107620B2 (en) | Audio coding method | |
JP3099876B2 (en) | Multi-channel audio signal encoding method and decoding method thereof, and encoding apparatus and decoding apparatus using the same | |
JPH10260699A (en) | Voice coding method and apparatus | |
JP3192051B2 (en) | Audio coding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071120 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081120 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091120 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101120 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101120 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111120 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111120 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121120 Year of fee payment: 14 |
|
EXPY | Cancellation because of completion of term |