[go: up one dir, main page]

WO1994010682A1 - Method of encoding speech - Google Patents

Method of encoding speech Download PDF

Info

Publication number
WO1994010682A1
WO1994010682A1 PCT/DE1993/000999 DE9300999W WO9410682A1 WO 1994010682 A1 WO1994010682 A1 WO 1994010682A1 DE 9300999 W DE9300999 W DE 9300999W WO 9410682 A1 WO9410682 A1 WO 9410682A1
Authority
WO
WIPO (PCT)
Prior art keywords
speech
quantized
lsp
frame
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/DE1993/000999
Other languages
German (de)
French (fr)
Inventor
Bertram Wächter
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bosch Telecom GmbH
Original Assignee
ANT Nachrichtentechnik GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ANT Nachrichtentechnik GmbH filed Critical ANT Nachrichtentechnik GmbH
Priority to AU51742/93A priority Critical patent/AU5174293A/en
Publication of WO1994010682A1 publication Critical patent/WO1994010682A1/en
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders

Definitions

  • the invention is based on a method for speech coding using the analysis-by-synthesis method according to the preamble of claims 1 and 2, respectively
  • Speech coding methods are known, for example from German Patent 38 34 871.
  • the speech coding procedure has one thing in common
  • Encoders within a certain period of e.g. 20-30 ms divided. Each speech frame is subjected to a linear prediction analysis in the encoder, which removes linear dependencies in the speech signal.
  • the linear prediction is carried out with the help of FIR filters (Finite Impulse Response).
  • FIR filters Finite Impulse Response
  • Frame redetermined i.e. these are adaptive filters.
  • Today's speech coders which operate at bit rates between 4 and 16 kbit / sec. work, generally use the analysis-by-synthesis method, in which the filter coefficients listed above and an associated excitation are determined in the transmitter so that the energy of the weighted error e (n) between the original language and the synthesized language is as small as possible.
  • the filter coefficients a i have a large dynamic range and are therefore poorly suited for quantization and transmission. Besides, there is no easy one
  • the zeros z Oi of F 1 and F 2 have the following properties, all zeros are on the unit circle, so they are adequately described by specifying a phase i - all zeros are simple
  • the polynomials F 1 and F 2 are i by specifying P values
  • a common method is the scalar quantization of each individual LSP, for example, in 4.8 kbit / sec.
  • CELP speech codec according to the Federal Standard 1016 of the US Department of Defense the Line Spectrum Parameters scalar quantized with a total of 34 bits.
  • Quantizer no longer permissible for ⁇ i . This means that some of the bits that are available for the quantization of the parameters LSP are not fully used. According to FIG. 3 there are 8 possible steps for ⁇ i + l
  • Another disadvantage of this method is that adaptation to different input spectra of the speech signal is not possible. If the quantizer can be used for this, the range of values for individual line spectrum parameters increases. This leads to an increase in the bit rate.
  • References [5] and [6] suggest reducing the bit rate for the transmission of the line spectrum parameters by quantizing their differences.
  • the first LSP is scalarized as above.
  • the present invention was based on the object
  • Speech codecs can be achieved compared to speech signals with different input characteristics. The one needed
  • Circuitry should not be too high.
  • the method according to the invention has a reduced sensitivity of the speech codec to speech signals with very different input spectra. Another advantage is that a Transmission error with an LSP only affects a maximum of two further LSP values.
  • the invention is based on the idea of neither quantizing all LSP parameters scalarly nor quantifying only a single one of the total P parameters scalarly, but rather only quantizing every nth of the P parameters scalarly and the in between
  • every second LSP becomes scalar
  • every third LSP is quantized scalarly.
  • mapping function for the parameters in between are, for example

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

The invention concerns a speech-encoding method using analysis-by-synthesis techniques. The speech signal is scanned, a frame formed from a predetermined number of scanning samples, and the coefficients of a grade P speech-synthesis filter determined from the samples in each frame. Using these coefficients, a number P of so-called line-spectrum parameters (LSPs) are determined and quantized, for transmission over a channel with limited transmission capacity. The method is characterized in that every other line-spectrum parameter (LSP) is quantized in scalar (absolute) fashion and that the line spectrum parameters (LSPs) lying between them are transformed (normalized) before quantization. The invention is intended particularly for use in speech-encoding equipment in portable radio equipment.

Description

Beschreibung description

Verfahren zur Sprachcodierung Die Erfindung geht aus von einem Verfahren zur Sprachcodierung unter Verwendung der Analyse-durch-Synthese-Methode gemäß Oberbegriff des Anspruches 1 bzw. 2. Solche Method for speech coding The invention is based on a method for speech coding using the analysis-by-synthesis method according to the preamble of claims 1 and 2, respectively

Sprachcodierverfahren sind bekannt, beispielsweise durch die deutsche Patentschrift 38 34 871.  Speech coding methods are known, for example from German Patent 38 34 871.

Den Sprachcodierungsverfahren gemein ist eine The speech coding procedure has one thing in common

Prädiktionsanalyse des Eingangssignales (Linear Prediction-Coder, LPC) . Dabei wird das Sprachsignal am Eingang des Prediction analysis of the input signal (linear prediction coder, LPC). The speech signal at the input of the

Encoders in Rahmen einer bestimmten Dauer von z.B. 20-30 ms unterteilt. Jeder Sprachrahmen wird im Encoder einer linearen Prädiktionsanalyse unterworfen, welche lineare Abhängigkeiten im Sprachsignal entfernt. Die lineare Prädiktion wird mit Hilfe von FIR-Filtern (Finite Impulse Response) durchgeführt. Die Koeffizienten dieser linearen Filter werden in jedem Encoders within a certain period of e.g. 20-30 ms divided. Each speech frame is subjected to a linear prediction analysis in the encoder, which removes linear dependencies in the speech signal. The linear prediction is carried out with the help of FIR filters (Finite Impulse Response). The coefficients of these linear filters are in each

Rahmen neu ermittelt, d.h. es handelt sich hier um adaptive Filter. Frame redetermined, i.e. these are adaptive filters.

Die heutigen Sprachcodierer welche bei Bitraten zwischen 4 und 16 kBit/sec. arbeiten, benutzen in der Regel die Analysedurch-Synthese-Methode wobei im Sender die oben angeführten Filterkoeffizienten und eine dazu gehörige Anregung so bestimmt werden, daß die Energie des gewichteten Fehlers e(n) zwischen Originalsprache und der synthetisierten Sprache möglichst klein wird.  Today's speech coders which operate at bit rates between 4 and 16 kbit / sec. work, generally use the analysis-by-synthesis method, in which the filter coefficients listed above and an associated excitation are determined in the transmitter so that the energy of the weighted error e (n) between the original language and the synthesized language is as small as possible.

Zum Empfänger übertragen werden müssen Parameter, welche die Anregung beschreiben, und die schon weiter oben erwähnten Koeffizienten des linearen Filters. Auf die Ermittlung der Koeffizienten des linearen Filters soll hier nicht näher eingegangen werden. Als Ergebnis erhält man ein nichtrekursives Filter von Grade P mit der Parameters describing the excitation and the coefficients of the linear filter already mentioned above must be transmitted to the receiver. The determination of the coefficients of the linear filter will not be discussed in more detail here. As a result you get a Grade P non-recursive filter with the

Übertragungsfunktion

Figure imgf000004_0002
Transfer function
Figure imgf000004_0002

Die inverse Übertragungsfunktion H(z) = 1/A(z) wandelt das Federsignal (die Anregung) in das (synthetisierte) The inverse transfer function H (z) = 1 / A (z) converts the spring signal (the excitation) into the (synthesized)

Sprachsignal um:

Figure imgf000004_0001
Speech signal at:
Figure imgf000004_0001

Das nach dieser Methode berechnete Filter H(z) ist ohne The filter H (z) calculated according to this method is without

Quantisierung der Filterkoeffizienten ai in jedem Fall stabil Quantization of the filter coefficients a i stable in any case

Die Filterkoeffizienten ai weisen jedoch eine große Dynamik auf und sind deshalb für die Quantisierung und Übertragung schlecht geeignet. Außerdem besteht nicht eine einfache However, the filter coefficients a i have a large dynamic range and are therefore poorly suited for quantization and transmission. Besides, there is no easy one

Möglichkeit, im Empfänger die Stabilität des rekursiven Possibility of the stability of the recursive in the receiver

Filters zu prüfen. Check filters.

Bekannt ist es, daß die sogenannten Line Spectrum Parameter LSP für die Quantisierung und Übertragung, also zur  It is known that the so-called line spectrum parameters LSP for quantization and transmission

Beschreibung des Prädiktorfilters H(z) geeignet sind. Man erhält diese Parameter als Nullstellen eines symmetrischen Polynoms Description of the predictor filter H (z) are suitable. These parameters are obtained as zeros of a symmetric polynomial

F1(z) = A(z) + Z-(P+1) A(z-1) und eines antisymmetrischen Polynorms F 1 (z) = A (z) + Z - (P + 1) A (z -1 ) and an antisymmetric polynorm

F2(z) = A(z) - Z-(P+1) A(z-1) F 2 (z) = A (z) - Z - (P + 1) A (z -1 )

Die Nullstellen zOi von F1 und F2 haben folgende Eigenschaften alle Nullstellen liegen auf dem Einheitskreis, sind also durch die Angabe einer Phase i ausreichend beschrieben - alle Nullstellen sind einfach The zeros z Oi of F 1 and F 2 have the following properties, all zeros are on the unit circle, so they are adequately described by specifying a phase i - all zeros are simple

- auf dem Einheitskreis liegt abwechselnd eine Nullstelle von F1 und F2. - On the unit circle there is an alternating zero of F 1 and F 2 .

In Figur 2 sind die Nullstellen von F1(z) und F2(z) für die Fälle P = 6 und P = 5 dargestellt. Alle Nullstellen zi können durch die Argumente ωi oder durch den daraus abgeleiteten Frequenzwert

Figure imgf000005_0001
dargestellt werden. FIG. 2 shows the zeros of F 1 (z) and F 2 (z) for the cases P = 6 and P = 5. All zeros z i can by the arguments ω i or by the derived frequency value
Figure imgf000005_0001
being represented.

Da die Nullstellen in konjugiert komplexen Paaren auftreten und Nullstellen bei ± 1 in jedem Fall vorliegen, sind die Polynome F1 und F2 durch die Angabe von P Werten i Since the zeros occur in conjugate complex pairs and there are zeros at ± 1 in any case, the polynomials F 1 and F 2 are i by specifying P values

vollständig bestimmt.  completely determined.

Nach den oben beschriebenen Eigenschaften muß gelten  According to the properties described above must apply

ω1 < ω 2 < ... <ωP ω 12 <... <ω P

Diese Monotonie-Eigenschaft ist zwingend notwendig, damit das rekursive Filter H(z) stabil ist. Man hat damit ein Kriterium, um die Stabilität des Filters zu überprüfen.  This monotony property is imperative for the recursive filter H (z) to be stable. This gives you a criterion for checking the stability of the filter.

Bei Änderung der Charakteristik des Spektrums des When changing the characteristic of the spectrum of the

Eingangssignals ändert sich die Verteilung einzelner LSPs stark. Als Beispiel ist in Fig. 1 die Verteilung der LSP für Filtergrad P = 10 dargestellt. Im oberen Bild, Fig. la, ist die Eingangssprache nur tiefpaßgefiltert, im unteren Bild, Fig. lb, IRS gefiltert (bandbegrentz) nach CCITT P.48.  Input signal, the distribution of individual LSPs changes significantly. 1 shows the distribution of the LSP for filter grade P = 10 as an example. In the upper picture, Fig. La, the input language is only low pass filtered, in the lower picture, Fig. Lb, IRS filtered (band limited) according to CCITT P.48.

Ein übliches Verfahren ist die skalare Quantisierung jedes einzelnen LSP, beispielsweise werden in 4,8 kBit/sec. CELP- Sprachcodec nach dem Federal Standard 1016 des US- Verteidigungsministeriums US die Line Spectrum Parameter skalar mit insgesamt 34 Bit quantisiert. A common method is the scalar quantization of each individual LSP, for example, in 4.8 kbit / sec. CELP speech codec according to the Federal Standard 1016 of the US Department of Defense the Line Spectrum Parameters scalar quantized with a total of 34 bits.

Zu beachten ist bei der Quantisierung, daß auch nach der  It should be noted in the quantization that even after the

Quantisierung die Monotonie-Eigenschaft erhalten werden muß, damit das rekursive Filter stabil ist; d.h. es muß gelten :

Figure imgf000006_0001
. Quantization the monotonicity property must be obtained for the recursive filter to be stable; ie the following must apply:
Figure imgf000006_0001
,

Da sich die Werte-Bereiche der Quantisierer für ωi und ωi+1 überlappen, sind nach der Quantisierung von ωχ alle Since the value ranges of the quantizers for ω i and ω i +1 overlap, all are after the quantization of ω χ

Quantisierungsstufen von ωi+1 ausgeschlossen, welche diese strenge Monotonie verletzen (siehe Figur 3). Umgekehrt sind auch nach der Quantisierung von ωi+l auch Werte aus dem Quantization levels of ω i + 1 excluded, which violate this strict monotony (see Figure 3). Conversely, even after the quantization of ω i + l , values from the

Quantisierer für ωi nicht mehr zulässig. Dies bedeutet, daß ein Teil der Bits, welche für die Quantisierung der Parameter LSP zur Verfügung stehen, nicht vollständig genutzt werden. Nach Figur 3 werden von 8 möglichen Stufen für ωi+l Quantizer no longer permissible for ω i . This means that some of the bits that are available for the quantization of the parameters LSP are not fully used. According to FIG. 3 there are 8 possible steps for ω i + l

tatsächlich nur 5 benutzt.  actually only 5 used.

Ein weiterer Nachteil dieses Verfahrens ist, daß eine Adaption an unterschiedliche Eingangsspektren des Sprachsignals nicht möglich ist. Soll der Quantisierer hierfür eingesetzt werden können, so vergrößert sich der Wertebereich einzelner Line Spectrum Parameter. Dies führt zu einer Erhöhung der Bitrate. Another disadvantage of this method is that adaptation to different input spectra of the speech signal is not possible. If the quantizer can be used for this, the range of values for individual line spectrum parameters increases. This leads to an increase in the bit rate.

In den Literaturstellen [5] und [6] wird eine Reduzierung der Bitrate für die Übertragung der Line Spectrum Parameter durch Quantisierung deren Differenzen vorgeschlagen. Dabei wird der erste LSP wie oben skalar quantisiert .References [5] and [6] suggest reducing the bit rate for the transmission of the line spectrum parameters by quantizing their differences. The first LSP is scalarized as above.

Figure imgf000006_0002
Für alle weiteren LSP wird die Differenz zum vorangegangenen Wert berechnet und diese dann quantisiert.
Figure imgf000006_0002
For all other LSPs, the difference to the previous value is calculated and then quantized.

Figure imgf000007_0001
Figure imgf000007_0001

Dieses Verfahren adaptiert sich gut an unterschiedlichen  This method adapts well to different ones

Eingangsspektren des Sprachsignals, da nur der Wertebereich des ersten LSP ausreichend groß gewählt werden muß. Input spectra of the speech signal, since only the value range of the first LSP has to be chosen sufficiently large.

Ein Nachteil dieses Verfahrens besteht in der Fortpflanzung von Fehlern. Tritt bei der Übertragung von ωx ein Fehler auf, so werden alle ωi, für i=x bis P falsch dekodiert. A disadvantage of this method is the propagation of errors. If an error occurs during the transmission of ω x , all ω i , for i = x to P, are decoded incorrectly.

Der vorliegenden Erfindung lag die Aufgabe zugrunde, ein The present invention was based on the object

Verfahren der eingangs genannten Art anzugeben, welches in der Lage ist bei gleichbleibender Bitrate eine Verbesserung der Sprachqualität zu erreichen oder aber bei gleichbleibender Sprachqualität eine Verringerung der Bitrate zu erzielen. Method of the type mentioned at the beginning, which is able to achieve an improvement in the speech quality with a constant bit rate or a reduction in the bit rate with a constant speech quality.

Außerdem soll eine Verringerung der Empfindlichkeit des In addition, a reduction in the sensitivity of the

Sprachcodecs gegenüber Sprachsignalen mit unterschiedlichen Eingangscharakteristika erreicht werden. Der benötigte Speech codecs can be achieved compared to speech signals with different input characteristics. The one needed

Schaltungsaufwand soll dabei nicht allzu hoch sein. Circuitry should not be too high.

Diese Aufgabe wurde gelöst durch die Ansprüche 1 und 2. This object was achieved by claims 1 and 2.

Vorteilhafte Ausgestaltungen ergeben sich durch die Advantageous configurations result from the

Unteransprüche. Dependent claims.

Das erfindungsgemäße Verfahren erzielt die Vorteile eine Verbesserung der Sprachqualität bei gleichbleibender Bitrate bzw. eine Verringerung der Bitrate bei gleichbleibender The method according to the invention achieves the advantages of an improvement in the speech quality with a constant bit rate or a reduction in the bit rate with a constant bit rate

Sprachqualität. Außerdem weist das erfindungsgemäße Verfahren eine verringerte Empfindlichkeit des Sprachcodecs gegenüber Sprachsignalen mit sehr unterschiedlichen Eingangsspektren auf. Ein weiterer Vorteil besteht darin, daß sich ein Übertragunsfehler bei einem LSP nur auf maximal zwei weitere LSP-Werte auswirkt. Voice quality. In addition, the method according to the invention has a reduced sensitivity of the speech codec to speech signals with very different input spectra. Another advantage is that a Transmission error with an LSP only affects a maximum of two further LSP values.

Die Erfindung geht aus von der Idee, weder alle LSP-Parameter skalar zu quantisieren noch nur einen einzigen der insgesamt P Parameter skalar zu quantisieren, sondern nur jeden n ten der P Parameter skalar zu quantisieren und die dazwischen The invention is based on the idea of neither quantizing all LSP parameters scalarly nor quantifying only a single one of the total P parameters scalarly, but rather only quantizing every nth of the P parameters scalarly and the in between

liegenden Parameter zu transformieren bzw. abzubilden und danach zu quantisieren. transform or map lying parameters and then quantize them.

Das Verfahren wird im folgenden anhand eines  The process is described below using a

Ausführungsbeispieles näher beschrieben, wobei angenommen wird, daß P eine gerade Zahl ist. Embodiment described in more detail, wherein it is assumed that P is an even number.

In einem ersten Schritt wird jeder zweite LSP skalar In a first step, every second LSP becomes scalar

quantisiert.

Figure imgf000008_0006
quantized.
Figure imgf000008_0006

Nun muß auf Grund der strengen Monotonie gelten

Figure imgf000008_0007
Now must apply due to the strict monotony
Figure imgf000008_0007

wobei der fiktive Wert P+1 auf den maximal möglichen Wert fürwhere the fictitious value P + 1 to the maximum possible value for

P gesetzt wird. Dieser Wertebereich für ωi ändert sich von Rahmen zu Rahmen mit

Figure imgf000008_0002
und
Figure imgf000008_0003
. Ideal wäre es.nun, für jede Kombination von
Figure imgf000008_0005
und
Figure imgf000008_0004
einen eigenen P is set. This range of values for ω i changes from frame to frame
Figure imgf000008_0002
and
Figure imgf000008_0003
, It would be ideal for any combination of
Figure imgf000008_0005
and
Figure imgf000008_0004
an own

Quantisierer für ωi zu verwenden, was aus Gründen des To use quantizers for ω i , which is for the sake of

Realisierungsaufwandes nicht möglich ist. Stattdessen wird der Wertebereich durch folgende Transformation auf das Intervall ]0,1[ abgebildet. )

Figure imgf000008_0001
Jeder Wert Xi kann nun mit einem Quantisierer quantisiert und übertragen werden. Die Rücktransformation erfolgt gemäß
Figure imgf000009_0005
Realization effort is not possible. Instead, the value range is mapped to the interval] 0.1 [by the following transformation. )
Figure imgf000008_0001
Each value X i can now be quantized and transmitted using a quantizer. The back transformation takes place according to
Figure imgf000009_0005

Das Verfahren funktioniert entsprechend, wenn man die  The procedure works accordingly if you have the

Parameter, die absolut quantisiert werden, mit denen  Parameters that are absolutely quantized with those

vertauscht, die nach Normierung quantisiert werden, d.h. quantisiere absolut: ωi i = 2,(2), P quantisere nach Transformation: ωi i = 1,(2), P - 1 swapped, which are quantized according to normalization, ie quantize absolutely: ω i i = 2, (2), P quantize after transformation: ω i i = 1, (2), P - 1

Statt der Transformation der LSP in den Bildbereich ist es auch möglich, den Quantisierer aus dem Bildbereich nach (13) in den ω-Bereich abzubilden. Instead of transforming the LSP into the image area, it is also possible to map the quantizer from the image area according to (13) into the ω area.

In ähnlicher Weise wird bei dem zweiten Ausführungsbeispiel jeder dritte LSP skalar quantisiert.Similarly, in the second embodiment, every third LSP is quantized scalarly.

Figure imgf000009_0001
für i = 1, (3),
Figure imgf000009_0001
for i = 1, (3),

Die Abbildungsfunktion für die dazwischen liegenden Parameter sind beispielsweise

Figure imgf000009_0002
Figure imgf000009_0003
The mapping function for the parameters in between are, for example
Figure imgf000009_0002
Figure imgf000009_0003

oder

Figure imgf000009_0004
or
Figure imgf000009_0004

da ωi ja nun bekannt ist. Diese Lösung erbringt noch eine weitere Reduzierung der since ω i is now known. This solution further reduces the

Bitrate bei gleichbleibender Qualität oder eine höhere  Bit rate with the same quality or a higher one

Qualität bei gleichbleibender Bitrate; allerdings wirkt sich ein Übertragungsfehler hier auf max. drei weitere LSP-Werte aus.  Quality at constant bit rate; however, a transmission error affects max. three more LSP values.

In entsprechender Weise kann auch verfahren werden, indem nur jeder vierte LSP skalar quantisiert und die dazwischen  A corresponding procedure can also be followed in which only every fourth LSP is scalarly quantified and those in between

liegenden LSP entsprechend transformiert und dann quantisiert übertragen werden. lying LSP are transformed accordingly and then transmitted quantized.

Literatur literature

[1] Markel, J.D.; Gray, A.H.: Linear Prediction of Speech. [1] Markel, J.D .; Gray, A.H .: Linear Prediction of Speech.

Berlin, Heidelberg, New York: Springer Verlag, 1976  Berlin, Heidelberg, New York: Springer Verlag, 1976

[2] Müller, J.M.; Scheuermann, H.; Wächter, B.: Ein Beitrag zur Sprachcodierung für Bitraten unter 8 kbit/s Frequenz, Band [2] Müller, J.M .; Scheuermann, H .; Wächter, B .: A contribution to speech coding for bit rates below 8 kbit / s frequency, band

43, 9/89, S.242-252 43, 9/89, pp.242-252

[3] N. Sugamura, F. Itakura: "Speech Analysis and Synthesis [3] N. Sugamura, F. Itakura: "Speech Analysis and Synthesis

Methods Deveoped at ECL in NTT-Form LPC to LSP-. Speech Methods Deveoped at ECL in NTT form LPC to LSP-. Speech

Communication, Band 5, 1986, S.199-215  Communication, Volume 5, 1986, pp. 199-215

[4] J.P. Campbell, V.C. Welch, T.E. Tremain: "The DOD 4.8 kbps [4] J.P. Campbell, V.C. Welch, T.E. Tremain: "The DOD 4.8 kbps

Standard", aus "Advances in Speech Coding", Kluwer, 1991 Standard ", from" Advances in Speech Coding ", Kluwer, 1991

[5] F.K. Soong, B.H. Juang: "LSP and Speech Data Compression"; [5] F.K. Soong, B.H. Juang: "LSP and Speech Data Compression";

Proc. ICASSP-84, März' 84 Proc. ICASSP-84, March '84

[6] F.K. Soong, B.H. Juang: "Optimal Quantisation of LSP  [6] F.K. Soong, B.H. Juang: "Optimal Quantization of LSP

Parameters" Proc. ICASSP-88, April'88  Parameters "Proc. ICASSP-88, April'88

Claims

Patentansprüche Claims 1. Verfahren zur Sprachcodierung unter Verwendung der Analyse-durch-Synthese-Methode, wobei das Sprachsignal abgetastet, aus einer festgelegten Anzahl Abtastproben ein Rahmen gebildet und aus den Abtastproben rahmenweise die Koeffizienten eines 1. A method for speech coding using the analysis-by-synthesis method, wherein the speech signal is sampled, a frame is formed from a fixed number of samples and the coefficients of the samples are frame-by-frame Sprach-Synthese-Filters mit dem Grad P bestimmt werden, wobei mittels dieser Koeffizienten eine Anzahl P sogenannter Line Spectrum Parameter LSP ermittelt und quantisiert werden, zur Übertragung über einen Kanal mit begrenzter Speech synthesis filters with the degree P are determined, a number P of so-called line spectrum parameters LSP being determined and quantized by means of these coefficients, for transmission over a channel with limited Übertragungskapazität, dadurch gekennzeichnet, daß jeder zweite Line Spectrum Parameter LSP skalar (absolut) Transmission capacity, characterized in that every second line spectrum parameter LSP scalar (absolute) quantisiert wird
Figure imgf000011_0002
für i = 1, (2), P-1 oder i = 2, (2), P und daß die dazwischen liegenden Line Spectrum Parameter LSP ωi für i = 2, (2), P bzw. i = 1, (2), P-1 vor einer Quantisierung transformiert (normiert) werden.
is quantized
Figure imgf000011_0002
for i = 1, (2), P-1 or i = 2, (2), P and that the line spectrum parameters LSP ω i in between for i = 2, (2), P or i = 1, ( 2), P-1 are transformed (normalized) before quantization.
Figure imgf000011_0001
Figure imgf000011_0001
2. Verfahren zur Sprachcodierung unter Verwendung der Analyse-durch-Synthese-Methode, wobei das Sprachsignal abgetastet, aus einer festgelegten Anzahl Abtastproben ein Rahmen gebildet und aus den Abtastproben rahmenweise die Koeffizienten eines  2. A method for speech coding using the analysis-by-synthesis method, wherein the speech signal is sampled, a frame is formed from a fixed number of samples and the coefficients of the samples are frame-by-frame Sprach-Synthese-Filters mit dem Grad P bestimmt werden, wobei mittels dieser Koeffizienten eine Anzahl P sogenannter Line Spectrum Parameter LSP ermittelt und quantisiert werden, zur Übertragung über einen Kanal mit begrenzter Speech synthesis filters with the degree P are determined, a number P of so-called line spectrum parameters LSP being determined and quantized by means of these coefficients, for transmission over a channel with limited Übertragungskapazität, dadurch gekennzeichnet, daß jeder dritte Line Spektrum Parameter LSP skalar (absolut) Transmission capacity, characterized in that everyone third line spectrum parameter LSP scalar (absolute) quantisiert wird is quantized für i=1,(3),... oder i=2, (3), ... oder i=3,(3),...
Figure imgf000012_0001
for i = 1, (3), ... or i = 2, (3), ... or i = 3, (3), ...
Figure imgf000012_0001
und daß die dazwischen liegenden Line Spektrum Parameter LSP ωi für i = 2, 3, 5, 6 ... oder i = 1, 3, 4, 6, 7 ... and that the intermediate line spectrum parameters LSP ω i for i = 2, 3, 5, 6 ... or i = 1, 3, 4, 6, 7 ... oder i = 1, 2, 4, 5, 7, 8 ... mit or i = 1, 2, 4, 5, 7, 8 ... with
Figure imgf000012_0002
Figure imgf000012_0002
transformiert und dann quantisiert werden. transformed and then quantized.
3. Verfahren zur Sprachcodierung unter Verwendung der Analyse-durch-Synthese-Methode, wobei das Sprachsignal abgetastet, aus einer festgelegten Anzahl Abtastproben ein Rahmen gebildet und aus den Abtastproben rahmenweise die Koeffizienten eines 3. A method for speech coding using the analysis-by-synthesis method, wherein the speech signal is sampled, a frame is formed from a fixed number of samples and the coefficients of the samples are frame-by-frame Sprach-Synthese-Filters mit dem Grad P bestimmt werden, wobei mittels dieser Koeffizienten eine Anzahl P sogenannter Line Spectrum Parameter LSP ermittelt und quantisiert werden, zur Übertragung über einen Kanal mit begrenzter Speech synthesis filters with the degree P are determined, a number P of so-called line spectrum parameters LSP being determined and quantized by means of these coefficients, for transmission over a channel with limited Übertragungskapazität, dadurch gekennzeichnet, daß jeder n-te Line Spectrum Parameter LSP skalar (absolut) quantisiert wird
Figure imgf000012_0003
für i = m, (n), P; l<m<n und daß die dazwischenliegenden Linien Spectrum Parameter LSP ωi für i = 1, P und i ≠ m, (n),P transformiert (normiert)
Figure imgf000012_0004
Transmission capacity, characterized in that every nth line spectrum parameter LSP is scalar (absolute) quantized
Figure imgf000012_0003
for i = m, (n), P; l <m <n and that the lines between them transform spectrum parameters LSP ω i for i = 1, P and i ≠ m, (n), P (normalized)
Figure imgf000012_0004
und anschließend quantisiert werden. and then quantized.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Transformation nach der Funktion
Figure imgf000013_0001
4. The method according to claim 1, characterized in that the transformation according to the function
Figure imgf000013_0001
erfolgt. he follows.
5. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß die Transformation nach den Abbildungsfunktionen
Figure imgf000013_0002
Figure imgf000013_0003
oder
5. The method according to claim 2, characterized in that the transformation according to the mapping functions
Figure imgf000013_0002
Figure imgf000013_0003
or
Figure imgf000013_0004
Figure imgf000013_0004
erfolgt. he follows.
PCT/DE1993/000999 1992-10-28 1993-10-20 Method of encoding speech Ceased WO1994010682A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AU51742/93A AU5174293A (en) 1992-10-28 1993-10-20 Method of encoding speech

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19924236315 DE4236315C1 (en) 1992-10-28 1992-10-28 Method of speech coding
DEP4236315.2 1992-10-28

Publications (1)

Publication Number Publication Date
WO1994010682A1 true WO1994010682A1 (en) 1994-05-11

Family

ID=6471507

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE1993/000999 Ceased WO1994010682A1 (en) 1992-10-28 1993-10-20 Method of encoding speech

Country Status (3)

Country Link
AU (1) AU5174293A (en)
DE (1) DE4236315C1 (en)
WO (1) WO1994010682A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
US5012518A (en) * 1989-07-26 1991-04-30 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
GB2240013A (en) * 1989-12-22 1991-07-17 Ericsson Ge Mobile Communicat Error protection for multi-pulse speech coders

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3834871C1 (en) * 1988-10-13 1989-12-14 Ant Nachrichtentechnik Gmbh, 7150 Backnang, De Method for encoding speech
CA2054849C (en) * 1990-11-02 1996-03-12 Kazunori Ozawa Speech parameter encoding method capable of transmitting a spectrum parameter at a reduced number of bits

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4975956A (en) * 1989-07-26 1990-12-04 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
US5012518A (en) * 1989-07-26 1991-04-30 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
GB2240013A (en) * 1989-12-22 1991-07-17 Ericsson Ge Mobile Communicat Error protection for multi-pulse speech coders

Also Published As

Publication number Publication date
DE4236315C1 (en) 1994-02-10
AU5174293A (en) 1994-05-24

Similar Documents

Publication Publication Date Title
DE69401512T2 (en) HYBRID ADAPTIVE BIT ALLOCATION FOR AUDIO CODERS AND DECODERS
EP0290581B1 (en) Process for transmitting digital audio-signals
DE69401514T2 (en) EFFICIENT ADAPTIVE BIT ALLOCATION FOR CODING METHODS AND CODING DEVICE IN COMPUTER EFFICIENCY
DE69915400T2 (en) Device for coding and decoding audio signals
EP0193143B1 (en) Audio signal transmission method
DE60012198T2 (en) ENCODING THE CORD OF THE SPECTRUM BY VARIABLE TIME / FREQUENCY RESOLUTION
DE69900786T2 (en) VOICE CODING
DE69029232T2 (en) System and method for speech coding
DE102006022346B4 (en) Information signal coding
DE60117471T2 (en) BROADBAND SIGNAL TRANSMISSION SYSTEM
DE60319590T2 (en) METHOD FOR CODING AND DECODING AUDIO AT A VARIABLE RATE
DE60012760T2 (en) MULTIMODAL LANGUAGE CODIER
EP0978172B1 (en) Method for masking defects in a stream of audio data
EP0954909A1 (en) Method for coding an audio signal
DE19811039A1 (en) Methods and devices for encoding and decoding audio signals
WO2007087824A1 (en) Method and arrangements for audio signal encoding
DE69808936T2 (en) INCREASING THE DENSITY OF CODED LANGUAGE SIGNALS
DE69420683T2 (en) Encoder for speech parameters
DE60124079T2 (en) language processing
EP0962015A1 (en) Method and devices for coding discrete signals or for decoding coded discrete signals
EP1023777B1 (en) Method and device for limiting a stream of audio data with a scaleable bit rate
EP0464534B1 (en) Transform coder with adaptive window function
DE4430864A1 (en) Transmission and storage method for embedding additional information in data stream
DE69801536T2 (en) Device and method for signal coding
DE69820515T2 (en) Speech coding apparatus using a multi-pulse excitation signal

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AU CA FI JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK ES FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1993922885

Country of ref document: EP

ENP Entry into the national phase

Ref country code: US

Ref document number: 1995 424446

Date of ref document: 19950428

Kind code of ref document: A

Format of ref document f/p: F

WWW Wipo information: withdrawn in national office

Ref document number: 1993922885

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: CA

122 Ep: pct application non-entry in european phase