[go: up one dir, main page]

EP1388147A1 - Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals - Google Patents

Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals

Info

Publication number
EP1388147A1
EP1388147A1 EP01943072A EP01943072A EP1388147A1 EP 1388147 A1 EP1388147 A1 EP 1388147A1 EP 01943072 A EP01943072 A EP 01943072A EP 01943072 A EP01943072 A EP 01943072A EP 1388147 A1 EP1388147 A1 EP 1388147A1
Authority
EP
European Patent Office
Prior art keywords
speech signal
narrowband
signal
broadband
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP01943072A
Other languages
English (en)
French (fr)
Other versions
EP1388147B1 (de
Inventor
Roland Aubauer
Stefano Ambrosius Klinke
Frannk Lorenz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Siemens Corp
Original Assignee
Siemens AG
Siemens Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG, Siemens Corp filed Critical Siemens AG
Publication of EP1388147A1 publication Critical patent/EP1388147A1/de
Application granted granted Critical
Publication of EP1388147B1 publication Critical patent/EP1388147B1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Definitions

  • the present invention relates to a method for expanding the bandwidth of a narrowband filtered speech signal, in particular a speech signal sent by a telecommunication device according to the preamble of claim 1, the preamble of claim 4, the preamble of claim 7, the preamble of claim 17 and the preamble of Claim 23.
  • Speech coding methods are characterized by their different bandwidths.
  • narrowband encoders English: narrow-band coder
  • broadband encoders English: wide-band coder
  • voice signals that are fed to the narrowband coder are usually sampled at a lower sampling rate than the speech signals that are fed to the broadband coder. For that, the net bit rate is the
  • Narrowband encoders usually lower than the net bit rate of the broadband encoder.
  • the coded voice signals of different bandwidth are transmitted within the same channel mode, this enables the use of different rates in the channel coding, which leads to different error protection. If the same channel mode is used, it is possible to add more redundant error protection bits to the narrow-band coded speech signals in the course of the channel coding in the event of poor transmission conditions over the transmission channel than to the broadband coded speech signals. Therefore offers at Varying transmission conditions the transmission of voice signals over a transmission channel, in which, depending on the transmission conditions, the speech coding is switched between broadband and narrowband speech coding ["wide-band” to narrow-band “switching (" WB / NB “switching)] and the channel coding, in particular the rate of the channel coding, is adapted to this. At the receiving end, the coded speech signals are decoded in accordance with the coding.
  • a disadvantage of such an approach is that a receiving subscriber finds the sudden switching from broadband coding to narrowband coding and the associated loss of quality particularly extremely disruptive.
  • This so-called "WB / NB switching" problem can also arise in the handover situation in telecommunication systems for wireless telecommunication with several base stations and mobile parts, the base stations being assigned to different telecommunication subsystems and the mobile parts within the system for roaming as a dual across subsystems -Mode handsets are designed to occur:
  • the starting point of the considerations is an existing broadband call connection between a base station and a handset. If a handover to another base station is now carried out for the handset or the call participant, it can happen that the receiving base station belongs to a subsystem that does not support the broadband voice service. For this reason, switching back to narrow-band coding and decoding. In this scenario, too, the receiving subscriber will find the sudden switching from broadband coding to narrowband coding and the associated loss of quality to be extremely disruptive.
  • the previously known telecommunication systems use various digital and analog coding methods to transmit the voice signals.
  • the restoration is carried out by generating frequencies of the lower frequency range by means of non-linear signal processing, by means of which subharmonic frequencies of the signal are generated and added to the high-pass signal.
  • EP 0 994 464 also discloses a further development in which the nonlinear signal processing is carried out by multiplying the signal by a function of the signal.
  • a disadvantage of the methods mentioned is that the filter characteristic (transmission characteristic of the telephone) with which the signal was filtered on the remote subscriber terminal is generally unknown and can be very different for different device types. This is shown in FIGURE 8. A restoration of the voice signal is therefore only possible if the filter characteristics of the participating devices involved are known or if these devices are matched to one another.
  • the digital speech signal for further processing and transmission is split up into coefficients that describe the spectral rough structure of a signal section and into an excitation or prediction error signal, the so-called residual signal, which forms the spectral fine structure.
  • This residual signal no longer contains the spectral envelope of the speech signal, which is represented by the coefficients that describe the rough spectral structure.
  • a typical representation for the spectral rough structure are the LPC coefficients (linear predictive coding) determined in linear prediction analysis, which describe a recursive filter, the so-called synthesis filter, whose transfer function corresponds to the spectral rough structure. These coefficients are used in their actual or a transformed form in many speech coders.
  • the received residual signal is used as an input signal for the synthesis filter on the receiver side, so that the reconstructed speech signal is available at the output of the filter.
  • the LPC coefficients are consequently a representation of the rough spectral structure of a speech signal section and can be used for the synthesis of speech signals using an appropriate excitation signal.
  • codebooks For expanding the bandwidth in the upper frequency range, methods are known which are based on special speech data books, so-called codebooks (codebooks), which form a relation between the LPC coefficients of a narrowband speech signal section and those of a broadband speech signal section. The consequence of this is that the code books have to be trained with narrowband and broadband speech at the same time and must be stored in the communication terminal.
  • a broadband excitation signal is generated from the narrowband residual signal, which was generated by the linear prediction analysis of the narrowband speech signal, which contains frequency components above the bandwidth of the narrowband speech signal.
  • the object on which the invention is based is to expand the bandwidth of a narrow-band filtered speech signal in a simple and cost-effective manner without sacrificing quality.
  • This task is based on the method defined in the preamble of claim 1 by the features specified in the characterizing part of claim 1, starting from the method defined in the preamble of claim 4 by the features given in the characterizing part of claim 4, starting from that in the preamble of the method defined in claim 7 by the features specified in the characterizing part of claim 7, starting from the method defined in the preamble of claim 17 by the features specified in the characterizing part of claim 17 and starting from the method defined in the preamble of claim 23 by the characteristics of claim 23 specified features solved.
  • the narrowband filtered speech signal is above a first cut-off frequency and below one with respect to frequency components ) ro r h- 1 - 1
  • a broadband expanded speech signal is generated from the individual broadband expanded speech signal time segments.
  • Speech signal with respect to frequency components above the first cut-off frequency in the time domain can be estimated in claims 17 and 18, according to which the narrowband speech signal is first divided into speech signal time sections and each narrowband speech signal time section is classified as a voiced sound or as an unvoiced sound and then the narrowband speech signal time segments are processed in such a non-linear manner that a modified speech signal time segment is generated in each case, which contains on the one hand the respective essentially unchanged narrowband speech signal time segment and on the other hand signal components generated by the nonlinear signal processing above the first cutoff frequency and the modified voice signal time segments with respect to the type-related classification undertaken is filtered so differently that broadbandi from the modified speech signal time segments extended voice signal periods and thus a broadband expanded voice signal is created.
  • the modified speech signal time segments are filtered in such a way that in the case of a voiced speech signal time segment, little energy above the first cutoff frequency, for example kHz, and in the case of an unvoiced speech signal time segment, more energy above the first cutoff frequency, for example 4 kHz, is let through.
  • the supplement generated for the narrow-band speech signal sections classified as unvoiced sounds is generated in such a way that the energy of this supplement is not negligible in relation to the total energy of the narrow-band speech signal section. In this way, an expansion of the narrowband filtered speech signal can be carried out easily without precise knowledge of the unvoiced sound.
  • the addition generated for the narrow-band speech signal time segments classified as unvoiced sounds is generated in such a way that second filter coefficients of a broadband voice signal time segment are determined on the basis of at least one broadband code book from first filter coefficients of the narrow-band voice signal time segment. This can improve the quality of the synthesized speech signal compared to the speech signal where no codebook is used.
  • the development according to claim 12 allows the restoration of a broadband speech signal expanded in the upper frequency range on the basis of determined broadband filter coefficients.
  • the development according to claim 13 allows the restoration of a broadband speech signal expanded in the upper frequency range on the basis of determined broadband filter coefficients and a broadband prediction error signal time period.
  • PNP P- P d cn P ⁇ rt C ⁇ JT rt PPP tr>£> ⁇ ⁇ P ⁇ P- ⁇ iQ Hl P ⁇ tr d ⁇ ⁇ P- CL P er TJ TJ P- ⁇ ⁇ TJ ⁇ PP cn P cn Hl ⁇ P- ⁇ PP 1 P 1 P- P '3
  • the signal components generated by the nonlinear signal processing for the narrow-band speech signal segments classified as unvoiced sounds are generated in such a way that the energy of the respective signal component is not negligible in relation to the total energy of the narrow-band voice signal time segment.
  • the method for expanding the narrowband filtered speech signal can advantageously be further developed according to claim 22 - in the sense of a simplified calculation and implementation of the method - by selecting the narrowband speech signal time segments to be of equal length.
  • a method of how the narrowband filtered speech signal can be estimated with respect to frequency components below the second cutoff frequency is given in claims 23 and 24, according to which a prediction error signal of the narrowband speech signal is first calculated and then the filter characteristic of the narrowband filtered speech signal is calculated of the prediction error signal is estimated and a process for processing the narrowband speech signal is controlled on the basis of the filter characteristic in such a way that a broadband expanded speech signal is generated.
  • An essential advantage of the method according to claim 23 is the simple to implement extension of a narrowband filtered speech signal in the lower frequency range without Knowledge of the original broadband excitation signal and without knowledge of the transmission filter characteristics of the telecommunication terminals, which improves the quality of the speech signal.
  • the filter characteristic of the narrow-band filtered speech signal is estimated by comparing the partial energies of the prediction error signal measured in at least two frequency ranges and conclusions about the filter characteristic of the narrow-band filtered speech signal can be obtained from the resulting energy differences.
  • the development according to claim 26 achieves an adaptation by simple evaluation of the inverse filter characteristic.
  • the alternative according to claim 27 approach also allows an adjusted equalization by restoring the fundamental frequency and / or at least one harmonic and prevents intermodulation.
  • the development according to claim 28 prevents unwanted harmonics from being added to the original signal by removing unwanted components of the expanded speech signal and is advantageously used when the expanded signal has DC components.
  • FIG. 3 shows, as a third exemplary embodiment, a sequence diagram for expanding the bandwidth of a speech signal sent by a telecommunications device in the direction of the upper frequencies above a first cut-off frequency of the narrowband filtered speech signal in the time domain,
  • FIG. 4 shows, as a fourth exemplary embodiment, a flow chart for expanding the bandwidth of a speech signal sent by a telecommunications device in the direction of the lower frequencies below a second cut-off frequency of the narrow-band filtered speech signal
  • FIGURE 5 as a fifth embodiment shows a flow chart for expanding the bandwidth of a voice signal sent by a telecommunications device in the direction of the lower frequencies below a second cut-off frequency of the narrowband filtered speech signal
  • FIGURE 6a the spectrum of a voiced sound (vowels)
  • FIGURE 6b the spectrum of an unvoiced sound (fricative)
  • FIGURE 7a shows a possible expansion of the spectrum of a vowel
  • FIGURE 7b shows a possible expansion of the spectrum of a fricative
  • FIGURE 8 filter characteristics of different device types
  • FIGURE 9 a course of a first speech signal
  • FIGURE 9b course of a first residual signal resulting from the speech signal
  • FIGURE 9c short-term spectral analysis of the speech signal
  • FIGURE 9d Short-term spectral analysis of the residual signal.
  • FIG. 1 shows, using a flow chart, a first process (a first method) for expanding the bandwidth of a voice signal sent by a telecommunications device in the direction of the upper frequencies above a first cut-off frequency - for example 4 kHz - of the narrowband filtered voice signal in the frequency range.
  • a first process for expanding the bandwidth of a voice signal sent by a telecommunications device in the direction of the upper frequencies above a first cut-off frequency - for example 4 kHz - of the narrowband filtered voice signal in the frequency range.
  • the voice signal is sent by the telecommunication device.
  • P ⁇ P ⁇ P 1 p ⁇ P- ⁇ $ NNP rt rt ⁇ ⁇ PPPP ⁇ P rt ⁇ rt ⁇ ⁇ rt cn cn P rt tr ZN P- P P- NPP P- P- tn • P- P- ⁇ ⁇ z p- tr ⁇ rt P ⁇ P- PP cn
  • a broadband excitation signal is determined according to the invention on the basis of the narrowband excitation signal calculated from the speech signal using linear prediction.
  • the calculation can also be carried out by adding the narrow-band signal with Gaussian (white) or limited (colored) noise.
  • FIGURE 2 uses a flow chart to show the second process (the first method) for expanding the bandwidth of a voice signal sent by a telecommunications device in the direction of the upper frequencies above a first cut-off frequency - e.g. 4 kHz - the narrowband filtered speech signal in the frequency domain.
  • a first cut-off frequency e.g. 4 kHz - the narrowband filtered speech signal in the frequency domain.
  • the voice signal is sent again by the telecommunication device. There is thus again a narrowband filtered speech signal.
  • this voice signal is subdivided into narrow-band voice signal time segments of preferably the same size. Then, in a known manner, in a prediction analysis, LPC coefficients and a narrowband prediction error signal are generated for each speech signal period in a second process step P1.2 calculated, in a third process step P2.2 on the basis of the LPC coefficients and the narrowband prediction error signal, the spectral structure of the narrowband speech signal time segments is calculated and in a fourth process step P3.2 a classification is carried out in such a way that the respective speech signal time segment as a voiced one Loud - such as "a", "e” or "i”, whose pronunciation has a spectrum shown in FIGURE 6a - or as an unvoiced sound - such as "s", "seh” or "f”, whose pronunciation is an in FIGURE 6b has the spectrum shown - classified or defined.
  • a short-term signal energy of a first narrow-band filtered speech signal time segment and a long-term signal energy are determined on the basis of further successive narrow-band filtered speech signal time segments correlating to the first signal, and then the detection is carried out by comparing a ratio of short-term signal energy to long-term signal energy with a threshold value.
  • the distinction can be made by comparing the short-term signal energy - ie the signal energy in a short time segment of the narrowband speech signal - and the long-term signal energy - ie the signal energy viewed over a longer time segment - and then comparing equal to the ratio of short-term to long-term energy with a fixed threshold value.
  • the spectral structure calculated in the third process step P2.2 is expanded in relation to the sound-related classification carried out in the third process step P2.1.
  • This is done in such a way that supplements for expanding the speech signal, each of which has a spectral structure, are generated periodically with respect to the phonetic-related classification carried out in the fourth process step P3.2, the supplement being independent of the respective one in the case of the voiced sound It is loud (with determination of the type of speech - voiced / unvoiced - the addition necessary to expand the bandwidth is also determined), the spectral structure of the narrowband speech signal time period and the spectral structure of the generated addition are linked periodically to an expanded spectral structure.
  • the narrowband spectral structure is expanded by an addition such that the expanded broadband spectral structure above 4 kHz is essential has less energy than below 4 kHz. It is e.g. a drop, an exponential drop, an increase, a constant zero level or a constant level of the spectral structure to higher frequencies is conceivable.
  • an extension can also be completely dispensed with, because the signal energy of a voiced sound above the upper limit frequency of the narrowband speech signal (for example 4 kHz) is generally negligible (see FIG. 6a).
  • the broadband frequency response generated corresponds to this case the narrowband frequency response of the underlying narrowband speech signal.
  • the narrowband frequency response is expanded in such a way that - in contrast to the expansion for voiced sounds - it is in the range above the first cut-off frequency of the narrowband speech signal (eg 4 kHz) has a non-negligible part of its total energy.
  • the expansion can always be carried out by a similar spectral expansion, regardless of the precise knowledge of the sounds (only adapted to the energy of the narrowband speech signal), so that this expansion is also achieved simply, inexpensively and quickly ,
  • associated broadband filter coefficients are determined from the narrowband filter coefficients calculated in the second process step P1.2. These filter coefficients are then used to synthesize frequency components above the upper cut-off frequency of the narrow-band speech signal (e.g. 4 kHz).
  • the code books are only required in the event that the examination of the narrowband spectral envelope determined in the fourth process step P3.2 detects an unvoiced sound. Therefore, they can also be restricted to filter coefficients for unvoiced sounds and can therefore be very small, as a result of which they do not represent a large memory requirement for a telecommunications terminal.
  • the narrowband prediction error signal calculated in the second process step P1.2 is expanded to a broadband prediction error signal, so that with regard to the time segment duration, the prediction error signal sections of the broadband prediction error signal corresponding to the narrowband speech signal time segments are generated.
  • broadband filter coefficients are then available for speech synthesis, with which the broadband speech signal time segments and thus the broadband expanded, using the broadband excitation signal or prediction signal generated as already described
  • Speech signal is generated, the quality of which is significantly better than that of the narrowband filtered speech signal.
  • the broadband filter coefficients calculated on the basis of the code books and fed to the synthesis filter are used for the synthesis of the upper frequency band of the speech signal, which leads to an improvement in the quality of the speech signal due to the bandwidth expansion.
  • broadband filter coefficients can therefore be determined without the help of code books or with very small code books, with one possible application of the method according to the invention for expanding the voice signal bandwidth in the upper frequency range in telecommunications systems in which voice coders with variable bit rate are used, both of which can encode broadband as well as narrowband, since there may be a situation where the speech encoder changes between narrowband (narrowband) and broadband (wide band) during communication.
  • tectieren realized by comparing a ratio of short-term signal energy to long-term signal energy with a threshold value.
  • the distinction can be made by comparing the short-term signal energy - i.e. the signal energy in a short time segment of the narrowband speech signal - and the long-term signal energy - i.e. of the signal energy over a longer period of time - and then comparing the ratio of short-term to long-term energy with a fixed threshold value.
  • the narrow-band speech signal time sections are processed in a non-linear manner, preferably by spectral mirroring, in such a way that a modified speech signal time section is generated in each case, which on the one hand the respective essentially unchanged narrow-band speech signal time section and on the other hand above the first cut-off frequency by the non-linear ones Signal processing generated signal components contains.
  • the modified speech signal time sections are filtered differently with respect to the classification based on the type of speech so that broadband extended speech signal time sections and thus a broadband expanded speech signal result from the modified speech signal time sections, with little energy in the case of a voiced speech signal time section above the first cut-off frequency - e.g. 4 kHz - and in the case of an unvoiced speech signal period more energy above the first cut-off frequency - e.g. 4 kHz is allowed through.
  • FIG. 9a to 9d will first be used to expand a band-limited speech signal according to the invention in the direction of the lower frequencies or The redistribution of the lower frequency components will be explained.
  • EP 0 994 464 already discloses spectral restoration of signal components in the lower frequency range of a speech signal limited by a high-pass function to low frequencies, the restoration being carried out by generating frequencies in the lower frequency range using non-linear signal processing, with subharmonic ones for this purpose Frequencies of the signal are generated and added to the high-pass signal.
  • the method according to the invention permits the expansion of band-limited speech signals in the lower frequency range in heterogeneous systems, since according to the invention filter characteristics are determined by an estimate, whereby for the estimate a speech signal, as shown in FIG. 9a, is first a first, as shown in FIG. 9b shown, first residual signal, also prediction
  • a fourth process step P3.4 the inverse filter characteristic is then used to calculate an inverse filter, with which the underlying narrowband speech signal is equalized and the low frequencies are raised, it being necessary for this that the required amplification of the low frequencies is not chosen too large is, since otherwise the ratio of signal to interference power, generally referred to as signal-to-noise ratio, deteriorates significantly.
  • the broadband speech signal expanded in the direction of the lower frequencies is present after equalization, so that an improvement in the quality of speech in a telecommunications terminal is achieved when using this method.
  • the equalization here means filtering the narrowband speech signal with the estimated inverse filter characteristic, i.e. low frequencies are amplified and the amplification is determined on the basis of the inverse filter characteristic.
  • the method described in EP 0 994 464 can be improved in that the nonlinear signal processing, in which subharmonic frequencies of the speech signal are generated, by forming the absolute value of the signal (double rectification) or by one-way rectification of the signal, which is simpler than the already known multiplication of the narrowband speech signal can be realized with a function of this signal, which avoids the relatively high signal processing outlay which the nonlinear signal processing described in EP 0 994 464 entails.
  • FIG. 5 uses a flow chart to show a fifth process (a fifth method) for expanding the bandwidth of a voice signal sent by a telecommunications device in the direction of the lower frequencies below a two- co co>N> P 1 P 1 c ⁇ o c ⁇ 0 cn 0 c ⁇
  • a fifth process step P4.5 the result of the nonlinear signal processing is subjected to a bandpass filtering in order to reduce unwanted signal components that lie outside the frequency range to be synthesized.
  • lowpass filtering can also be carried out.
  • Low-pass filtering is generally used when the DC component that is always present in the signal to be filtered is low.
  • the signal filtered in this way is combined with the underlying speech signal, preferably by addition, so that the result is the broadband speech signal expanded in the direction of the lower frequencies.
  • a combination, not shown, of the methods shown in FIGURE 4 and FIGURE 5, i.e. a combination of nonlinear signal processing and equalization of the narrowband speech signal is also conceivable, as long as the condition discussed in the exemplary embodiment according to FIG. 4 that the necessary amplification is not too great is fulfilled.
  • the two methods are combined in such a way that the narrow-band signal is first equalized with the calculated inverse filter and then the non-linear signal processing is used.
  • a combination (likewise not shown) of the method according to the invention for expanding narrowband speech signals in the upper frequency range with the method for expanding narrowband voice signals in the lower frequency range, which can be referred to as a "wideband speech extender”, is particularly advantageous since it guarantees the synthesis of a broadband speech signal that comes closest to the underlying speech signal, so that a user of a telecommunication terminal that uses the “Wideband Speech Extender * uses a high quality voice signal comparable to the quality of voice signals in radio and television sets.
  • the “wideband speech extender *” can thus be used in telecommunications devices where there is a band-limited transmission of voice signals in order to give the user the impression of a broadband transmission.
  • the “wideband speech extender *” can also be used in telecommunication systems where the “WB / NB switching ⁇ problem occurs, ⁇ so that a broadband speech signal and thus a largely constant signal is always present Quality is guaranteed.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)

Abstract

Um die Bandbreite eines schmalbandig gefilterten Sprachsignals auf einfache und kostengünstige Weise ohne Qualitätseinbussen zu erweitern, wird das schmalbandig gefilterte Sprachsignal in bezug auf Frequenzanteile oberhalb einer ersten Grenzfrequenz und unterhalb einer zweiten Grenzfrequenz getrennt voneinander im Sinne von: durch unabhängige unterschiedliche Methoden geschätzt und auf der Basis dieser jeweiligen Schätzung erweitert. Die Schätzung kann dabei vorzugsweise entweder im Zeitbereich oder im Frequenzbereich erfolgen.

Description

Beschreibung
Verfahren zur Erweiterung der Bandbreite eines schmalbandig gefilterten Sprachsignals, insbesondere eines von einem Tele- ommuni ationsgerät gesendeten Sprachsignals
Die vorliegende Erfindung betrifft ein Verfahren zur Erweiterung der Brandbreite eines schmalbandig gefilterten Sprachsignals, insbesondere eines von einem Telekommunikationsgerät gesendeten Sprachsignals gemäß dem Oberbegriff des Patentanspruches 1, dem Oberbegriff des Patentanspruches 4, dem Oberbegriff des Patentanspruches 7, dem Oberbegriff des Patentanspruches 17 und dem Oberbegriff des Patentanspruches 23.
Sprachcodierverfahren sind durch ihre unterschiedlichen Bandbreiten charakterisiert. So gibt es beispielsweise Schmalband-Codierer (engl.: narrow-band coder), welche Sprachsignale, die im Frequenzbereich bis 4000 Hz liegen, in codierte Sprachsignale umsetzen und Breitband-Codierer (engl.: wide- band coder) , welche Sprachsignale, die typischerweise zwischen 50 und 7000 Hz liegen, in codierte Sprachsignale umsetzen. Die Sprachsignale, die dem Schmalband-Codierer zugeführt werden, werden dabei in der Regel mit einer geringeren Abtastrate abgetastet als die Sprachsignale, die dem Breitband- Codierer zugeführt werden. Dafür ist die Nettobitrate des
Schmalband-Codierers in der Regel niedriger als die Nettobitrate des Breitband-Codierers.
Werden die codierten Sprachsignale verschiedener Bandbreite innerhalb des gleichen Kanalmodus übertragen, so ermöglicht dies die Anwendung verschiedener Raten bei der Kanalcodierung, was zu unterschiedlichem Fehlerschutz führt. So ist es bei Anwendung des gleichen Kanalmodus möglich, bei schlechten Übertragungsbedingungen über den Übertragungskanal den schmalbandigen codierten Sprachsignalen im Zuge der Kanalcodierung mehr redundante Fehlerschutzbits hinzuzufügen als den breitbandigen codierten Sprachsignalen. Daher bietet sich bei variierenden Übertragungsbedingungen die Übertragung von Sprachsignalen über einen Übertragungskanal an, bei der abhängig von den Übertragungsbedingungen die Sprachcodierung zwischen einer breitbandigen und einer schmalbandigen Sprachcodierung umgeschaltet ["Wide-Band" to Narrow-Band"-Switching ("WB/NB"-Switching) ] und die Kanalcodierung, insbesondere die Rate der Kanalcodierung, daran angepaßt wird. Empfangsseitig erfolgt eine an die Codierung angepaßte Decodierung der codierten Sprachsignale.
Bei dem neuen Telekommunikationssystem zur drahtlosen Telekommunikation UMTS (Universal Mobile Telecommunications System") ist beispielsweise eine Breitband-Codierung standardisiert worden, um mit den zukünftigen UMTS-Endgeräten eine sehr gute Sprachqualität zu gewährleisten.
Nachteilig bei einem derartigen Ansatz ist, dass ein empfangender Teilnehmer insbesondere das plötzliche Umschalten von Breitband-Codierung auf Schmalband-Codierung und den damit verbundenen Qualitätsverlust als äußerst störend empfindet.
Dieses sogenannte "WB/NB-Switching"-Problem kann auch bei der Handover-Situation in Telekommunikationssystemen zur drahtlosen Telekommunikation mit mehreren Basisstationen und Mobil- teilen, wobei die Basisstationen unterschiedlichen Telekommunikationsteilsystemen zugeordnet sind und die Mobilteilen innerhalb des Systems für ein teilsystemübergreifendes Roaming als Dual-Mode-Mobilteilen ausgebildet sind, auftreten: Ausgangspunkt der Betrachtungen ist eine bestehende breitban- dige Gesprächsverbindung zwischen einer Basisstation und einem Mobilteil. Wenn nun für das Mobilteil bzw. den Gesprächsteilnehmer eine Übergabe (Handover) an eine andere Ba- sisstation durchgeführt wird, kann der Fall eintreten, dass die übernehmende Basisstation zu einem Teilsystem gehört, welches den breitbandigen Sprachservice nicht unterstützt. Aus diesem Grunde wird dann auf die schmalbandige Codierung und Decodierung zurückgeschaltet. Auch in diesem Szenario wird der empfangende Teilnehmer insbesondere das plötzliche Umschalten von Breitband-Codierung auf Schmalband-Codierung und den damit verbundenen Qualitäts- verlust als äußerst störend empfinden.
Basisstationen, die wie oben beschrieben keine breitbandige Gesprächsverbindung unterstützen, sowie andere Telekommunikationsendgeräte, welche lediglich Schmalband-Codierung oder analoge Sprachsignalübertragung im Bereich von typisch 300 bis 3400 Hz ermöglichen, sind noch weit verbreitet, da die bisher bekannten Telekommunikationssysteme Sprachsignale bisher im Allgemeinen mit einer Bandbreite von etwa 3,1 kHz zwischen 3400 Hz (erste Grenzfrequenz) und 300 Hz (zweite Grenz- frequenz) übertragen, da die Verständlichkeit der Kommunikation trotz der damit gegebenen Bandbegrenzung der Sprache ausreichend ist. Zur Übertragung der Sprachsignale verwenden die bisher bekannten Telekommunikationssysteme dabei verschiedene digitale und analoge Codierverfahren.
Um eine Qualitätsverbesserung derart zu erzielen, dass eine Sprachqualität in Telekommunikationssystemen mit der Sprachqualität bei Radio- und Fernsehsignalen vergleichbar ist, wird es erforderlich, Frequenzanteile der Sprache, die über die Bandbreite von 300 Hz bis 3400 Hz hinausgehen, e pfänger- seitig abzuschätzen und zu synthetisieren.
Im Stand der Technik sind verschiedene Verfahren bekannt, die eine Erweiterung der Bandbreite eines schmalbandigen Sprach- signals ermöglichen.
Beispielsweise ist für eine Erweiterung der Bandbreite im unteren Frequenzbereich (<300Hz) aus der EP 0 994 464 eine Wiederherstellung von Signalanteilen des unteren Frequenzbe- reichs eines durch eine Hochpassfunktion zu tiefen Frequenzen hin begrenzten Sprachsignals bekannt, wobei die beschriebene Hochpass-Filterung z.B. bei der Sprachübertragung über ein Telefon beim fernen Teilnehmer durchgeführt wird (Sende- Charakteristik des Fernsprechers) .
Die Wiederherstellung erfolgt dabei durch Generieren von Fre- quenzen des unteren Frequenzbereichs durch eine nichtlineare Signalverarbeitung, mittels der subharmonische Frequenzen des Signals erzeugt und zum Hochpasssignal hinzuaddiert werden.
Des Weiteren ist in der EP 0 994 464 dazu auch eine Weiter- bildung bekannt, bei der die nichtlineare Signalverarbeitung durch die Multiplikation des Signals mit einer Funktion des Signals durchgeführt wird.
Nachteilig an den genannten Verfahren ist es, dass in der Re- gel die Filtercharakteristik (Sende-Charakteristik des Fernsprechers) , mit der das Signal am fernen Teilnehmerendgerät gefiltert wurde, unbekannt ist und für verschiedene Gerätetypen sehr unterschiedlich sein kann. Dies ist in FIGUR 8 gezeigt dargestellt. Eine Wiederherstellung des Sprachsignals ist deshalb nur dann möglich, wenn die Filtercharakteristiken der beteiligten Teilnehmergeräte jeweils bekannt oder diese Geräte aufeinander abgestimmt sind.
In vielen Verfahren der digitalen Sprachcodierung werden das digitale Sprachsignal zur Weiterverarbeitung und Übertragung in Koeffizienten, welche die spektrale Grobstruktur eines Signalabschnitts beschreiben, und in ein Anregungs- bzw. Prä- diktionsfehlersignal, das sogenannte Restsignal, welches die spektrale Feinstruktur bildet, aufgespalten. Dieses Restsig- nal enthält nicht mehr die spektrale Einhüllende des Sprachsignals, die durch die Koeffizienten, die die spektrale Grob- struktur beschreiben, repräsentiert wird.
Auf der Decodiererseite werden diese beiden - meist quanti- siert übertragenen - Teile, welche die spektrale Grob- und Feinstruktur beschreiben, wieder zusammengefügt und bilden das decodierte Sprachsignal. Eine typische Repräsentation für die spektrale Grobstruktur bilden die bei der linearen Pradiktionsanalyse ermittelten LPC-Koeff zienten (Linear Predictive Coding) , welche ein re- kursives Filter, das sogenannte Synthesefilter, beschreiben, dessen Ubertragungsfunktion der spektralen Grobstruktur entspricht. Diese Koeffizienten werden in ihrer eigentlichen o- der einer transformierten Form in vielen Sprachcodierern verwendet. Hierbei wird auf Empfangerseite das empfangene Rest- signal als Eingangssignal für das Synthesefilter verwendet, so dass am Ausgang des Filters das rekonstruierte Sprachsignal verfugbar ist. Die LPC-Koeffizienten sind folglich eine Repräsentation der spektralen Grobstruktur eines Sprachsignalabschnitts und können unter Verwendung eines passenden An- regungssignals zur Synthese von Sprachsignalen verwendet werden.
Für eine Erweiterung der Bandbreite im oberen Frequenzbereich sind Verfahren bekannt, die auf besonderen Sprachdatenbu- ehern, sogenannten Codebuchern (Codebooks) basieren, die eine Relation zwischen den LPC-Koeffizienten eines schmalbandigen Sprachsignalabschnitts und denen eines breitbandigen Sprachsignalabschnitts bilden. Das hat zur Folge, dass die Codebu- cher gleichzeitig mit schmalbandiger und breitbandiger Spra- ehe trainiert und im Kommunikationsendgerat abgespeichert werden müssen.
Außerdem wird aus dem schmalbandigen Restsignal, das durch die lineare Pradiktionsanalyse des schmalbandigen Sprachsig- nals erzeugt wurde, ein breitbandiges Anregungssignal erzeugt, welches Frequenzkomponenten oberhalb der Bandbreite des schmalbandigen Sprachsignals enthalt.
Da die Codebucher im Telekommunikationsgerat gespeichert wer- den müssen, ist neben dem aufwendigen Training der Codebucher sowohl mit schmalbandiger als auch mit breitbandiger Sprache, auch der hohe Bedarf an Speicher und die Schwierigkeit einer Sprecher- und sprachunabhängigen eindeutigen Zuordnung zwischen beiden Codebüchern nachteilig.
Um den Speicherplatzbedarf bei der Verwendung von Codebüchern zu verringern, ist es gemäß einem von der Technischen Hochschule Aachen entwickelten Verfahren bekannt, nur noch ein Codebuch in Verbindung mit einem Hidden-Markov-Modell, mit dem die statistischen Spracheigenschaften beschrieben werden können, zu benutzen.
In der Praxis haben diese Verfahren zur Erweiterung der Bandbreite im oberen Frequenzbereich keine Anwendung gefunden, da zudem die Qualität der erzeugten breitbandigen Sprachsignale unzureichend und von dem jeweiligen Sprachsignal abhängig ist.
Die der Erfindung zugrundeliegende Aufgabe besteht darin, die Bandbreite eines schmalbandig gefilterten Sprachsignals auf einfache und kostengünstige Weise ohne Qualitätseinbußen zu erweitern.
Diese Aufgabe wird ausgehend von dem im Oberbegriff des Anspruchs 1 definierten Verfahren durch die im Kennzeichen des Anspruchs 1 angegebenen Merkmale, ausgehend von dem im Ober- begriff des Anspruchs 4 definierten Verfahren durch die im Kennzeichen des Anspruchs 4 angegebenen Merkmale, ausgehend von dem im Oberbegriff des Anspruchs 7 definierten Verfahren durch die im Kennzeichen des Anspruchs 7 angegebenen Merkmale, ausgehend von dem im Oberbegriff des Anspruchs 17 defi- nierten Verfahren durch die im Kennzeichen des Anspruchs 17 angegebenen Merkmale sowie ausgehend von dem im Oberbegriff des Anspruches 23 definierten Verfahren durch die Kennzeichen des Anspruches 23 angegebenen Merkmale gelöst.
Bei dem erfindungsgemäßen Verfahren gemäß Anspruch 1 wird das schmalbandig gefilterte Sprachsignal in bezug auf Frequenzanteile oberhalb einer ersten Grenzfrequenz und unterhalb einer ) r-o r h-1 -1
Cn o (_π o Cn o Üi s: rt cn o o er ι φ ι-3 H- ^ ι-i i-i t? CL CL N Hi PJ r+ cn iQ P- rsi CΛ P CL N
Φ P- TJ P P P Φ i-i I-i P Φ P> φ J •fl H- J ι-i Φ H- d H- Φ T d o p d P s: g O d d ≤
P- O Φ cn cn P 3 Ξ P) cn 3 l-i PJ Φ ι P Φ ι-f N cn Φ P P cn Φ Φ tr Hl P Φ rr P ? Hi Hi CL P): Φ 3 ty pj: Φ P> Φ cn Φ PJ: H- r-r P pi: pj T P tf P- cn p: o P-
Φ cn r+ Φ Φ P- £P H- cn Φ P l-i ri- ι P" M Φ Φ Φ r+ n O t-i N φ TJ r+ CL pr rt
P Hi H PJ t iQ r+ l-h ω CΛ r+ CΛ Φ CΛ N s; o ι-i l-i H- H- ι-i PJ J d: N g ι-i N Φ Φ r Φ P P" - Φ s Φ O O g* r+ rt- *1 3 rr o l-i s: <ϊ- P J cn n H- d φ d d l-i d P
Φ J (- Φ Φ P H t-i α ι-i <5 ^ o cυ: ι-i p er IQ r+ D- PJ 3 iQ r+ O P P
P P1 Φ P ι-i cn r+ 3 α cn Φ C c &o iQ Φ φ H- s; cn Φ Φ !-f PJ iQ ω P Q φ 0 cn cn CΛ Ό Φ P) Φ Ό ? l-i l-i ? H- P r+ H- r+ s l_J- P ^ P O P tr P
CΛ p P- P- TJ i-i t-i r+ H h rf ^ rf H- [ϊJ rt- d o Φ f-i H- H- CΛ φ l-i d CL M ^ cn f Φ
TJ cn CΛ v ^Q i-i d H- P C φ c P N 3 i-i CL M H rt s: .&. φ Hl Φ — P p- p: P ι-i P- rf P P P o CΛ O o ι-i £: ι-( l-i cn l-i P> d 3 d » y f-i Φ μ P P cn P N
P ιQ P PJ tu n tr Ό P α t-T Ό T er 3 Φ P P" ^ d H- er d ^ " o P vQ Hi
O P d P1 tr t -~^ Φ HI H3 ι-i i=r H- P i Φ P) ^ h-1 N φ t-i CL CL P- P
P* J ? cn N cn ~j PJ ι-i P r+ φ t-i C Φ P>: P Φ H- Hi L_l. r+ cn ≤ P φ s: Φ CL p- ιQ Φ ui rr Φ P- O i o r+ i-i P> O ω P P rr Φ d N Λ P- i-i P Φ Φ iQ
P- N d Φ P- ι er f Φ t PJ cn ≤ P t ιQ Φ -1 Φ Φ Φ CL t-i α er d φ tr cn d
^Q Φ P P rr P Φ cn 3 ri- Φ φ cn cn H- cn P) cn ι-( Φ ) cn Φ φ P- φ φ d φ
P P- N P P N H- pj: Φ cn Φ l-i l-i Hl CTl O ιQ rr d cn l-i P) cn l-i P CL 3 P- P P P
P rr d φ tf - v <P H- tr N O tr rl- cn O t→ d cn Φ N P rt N
(-< P P d cn N iQ 3 P & ri- φ ι-i < 3 Hi P» O Φ ) cn Hi cn O H- P cn ^ l_l. Φ
N er ^ O Φ J Φ φ p c 3 O PJ O d: l-i t? W d O s: O s: o P t-i o φ p. tQ
Φ in rt tT P- H- I-1 & ι-i C ^ i J Hi P l-i ri¬ 3 rt rr PJ φ - H- PJ rr cn φ l-i ≤. cn Φ
P- O CL P rt O N cn M P rr r+ N er ef P> ι-i 3 H- 3 Φ Φ O & N φ o rt r+ tr s: P- P t Φ Ό ^ φ Φ H- £ P) CL Φ P> O P> tn J i P- B" d d P- tr P
P P 3 Φ rr er H- ι-( ^ f-i P> P O i P" Φ Φ N tr f-1 (- Φ (- CL Φ 3 Φ iQ -- P- Φ er P- P rf cn r+ m Z P) cn P" cn 3 P o Φ Φ er P er Φ Cn Φ P P cn P- φ P
CΛ rr l_l. CL Φ O Φ P) o 1 Φ 3 cn M ^-^ s: H- iQ P l-i P> CL P) P O H" N Ξ iQ α P
O rr φ Φ tr ι-i er t S H- cn ^ Φ i l_l- *". Φ L CΛ P Φ P ir O er er Φ Φ P" rt p- s; 0 Φ P cn r+ n ι_ι. ιQ er H- Φ φ P) P H- rr P> : er P Φ P- P P-
P _l. P- P- rsi O cn P) Φ !-r Φ pj: Φ cn P s: t-1 Φ ^Q ι-i H- CΛ H- r+ Φ P H cn Ω <
P- Φ P- £ P rt Φ t * S. P l-i Φ Φ Φ d cn i Ό ι cn N p. CL Φ φ ω p O rr s: P Φ rf H- P ^ rt- H- Φ N Φ CΛ H- « P Φ t-i Φ TJ rt tr P- P- o Φ P rt Φ P- α cn Φ r+ H- l_l. cn Φ φ H- C o Ό h-" CL h-1 r Φ P) ι-i P ιQ o φ PJ φ
P- iQ 0 J rf φ Φ P &α (- P ^ d H H- Φ J CΛ d H- CΛ O CΛ s: P-1 PJ P p: S P-
Φ Φ P er er rt s: Φ cn ιQ P l-i P) t cn cn Ό l-i P TJ tf Ό O Φ tr vQ r+ rt Φ P
P cn P d p Φ cn - — . cn P Φ o o Φ cn l-i l-i cn t-i P' l-i Φ ,-^ s: N rt P
N cn Φ P o Φ H- H Ό α Φ N r+ J tr P cn H- P) J cn PJ H- P> φ CL α Hi Φ d p P
Φ φ er P- rr t-T ι-i P Φ H- Φ cn r+ Hi o d rr o i o P Φ Φ P- & CL P O CL d P- P CL π- cn P N cn <! ?T !-J H- s: ω H- tr1 H- H- ET Hl H- tr P p- P f-i cn Φ vq α φ iQ P Φ Φ tr TJ H- Φ φ rr Φ r+ H- H- ^ P) 9 N cn Z 9 cn J cn ^! r+ TJ H Φ P r H- P P P rl- £ Φ ι-i ι-i pι l-i P P d 3 H- H- Φ 3 H- l-1 H- ^ Φ Φ p; Φ P e rt P Φ rt- ιQ H- cn P> Φ er C Φ P) r+ - Φ <Q H- iQ N ^Q tr P 11 t-i d P- P 1 s: P r Φ CL O C rf t* Φ ι-i CΛ P> l-i P cn O P φ P N P cn rT n 3 s: 1
P- φ P P P- tr P) Φ ≤ o ^ N H- Hl d P> Φ cn H- P) s. P rt- Φ P" Φ P- p, P- p s: ιQ Φ C s: er . Φ t 0 ^d Φ cn r+ P t-1 P Φ r+ Φ CSI P- iQ rr 3
Φ Φ P Φ H- ι-i P> H- P P H3 H- r Φ t cn CL l-i N P> P ω φ rt φ
"• er P- P- P H l-i Φ cn CΛ r+ H- CL 1 rr ^ P φ φ er H- co cn TJ - — - P- Φ cn CΛ
P iQ rr Φ H- r+ rf Φ rt PJ Φ H- fr1 H- cn P H- Ώ l-i r-r f-i O P-
P Φ Φ tτj α rt- f-i l-i π- er tr1 l-i P M P) ri- O P) P P. P φ cr rt tr P
P P ι-i d Φ o er »1 C r+ cn H- P> cn H- P) N l-i d p) tr φ P Φ O t-s φ . p: P
P- r+ pj: i-i 3 P o Φ s: Φ O Φ d Φ er i rt- O' P H- iQ P tr Hi l-i rt φ iQ TJ Φ pj: Φ P £ r+ Φ •< t ri- d Φ pj: cn H- P Φ P- N cn o φ α N
Φ P P P- α cn t-i α H α cn H- cn cn P cn Φ i N P W O rr φ vQ P Hi P- P- P- rt <
P p: ?r H- n H- H- H Ό ω TJ Φ H- Ό ω rr d N P' rt- Φ H ιQ iQ o Φ o
CL rr W ET i Φ Φ φ φ r+ Φ i d P) P Φ tr CL Φ P Φ tr d P
Φ P- P- r+ 3 Φ H ? ^ rr K P ω H- Φ φ 1 P P P • •
P 1 H- J i-i rr H- ω P> iQ cn rt d P P α 1 1 1 1 1 ω 1 Φ ι-ι d φ rt P 1 1 Hi P 1 1
bevor abschließend aus den einzelnen breitbandigen erweiterten Sprachsignalzeitabschnitten ein breitbandiges erweitertes Sprachsignal erzeugt wird.
Eine alternative Methode, wie das schmalbandig gefilterte
Sprachsignal in bezug auf Frequenzanteile oberhalb der ersten Grenzfrequenz im Zeitbereich geschätzt werden kann, ist in den Ansprüchen 17 bzw. 18 angegeben, wonach zunächst das schmalbandige Sprachsignal in Sprachsignalzeit- abschnitte unterteilt wird und jeder schmalbandige Sprachsignalzeitabschnitt als ein stimmhafter Laut oder als ein stimmloser Laut klassifiziert wird und anschließend die schmalbandigen Sprachsignalzeitabschnitte derart nichtlinear verarbeitet werden, dass jeweils ein modifizierter Sprachsignalzeitabschnitt erzeugt wird, der einerseits den jeweiligen im wesentlichen unveränderten schmalbandige Sprachsignalzeitabschnitt und andererseits oberhalb der ersten Grenzfrequenz durch die nichtlineare Signalverarbeitung erzeugte Signalanteile enthält und die modifizierten Sprach- signalzeitabschnitte in bezug auf die vorgenommene lautartbe- zogene Klassifizierung derart unterschiedlich gefiltert werden, dass aus den modifizierten Sprachsignalzeitabschnitten breitbandige erweiterte Sprachsignalzeitabschnitte und damit ein breitbandiges erweitertes Sprachsignal entsteht.
Das Schätzen der Frequenzanteile oberhalb der ersten Grenzfrequenz des schmalbandig gefilterten Sprachsignals im Zeitbereich ist von Vorteil, weil keine Begutachtung des Spektrums und daher keine rechenintensive Transformation in den Spektralbereich notwendig ist. Im Übrigen werden die modifizierten Sprachsignalzeitabschnitte derart gefiltert, dass im Fall eines stimmhaften Sprachsignalzeitabschnittes wenig E- nergie oberhalb von der ersten Grenzfrequenz - z.B. kHz - und im Fall eines stimmlosen Sprachsignalzeitabschnittes mehr Energie oberhalb von der ersten Grenzfrequenz - z.B. 4 kHz - durchgelassen wird. cn iQ cn Z P rt z <! ö Φ < ö
P- -> Φ P- φ P- p: Φ d & cn O P-
Φ Φ cn P P- i tr P P s: P φ
P P- CL o rt P tr Ω Φ cn » ω rt Ω ^ p- Φ tr P P- Φ
Φ tr Φ Z Φ cn CL Ω d
Φ P- cn φ p- P- cn d tr 3 t?
CΛ o P- P cn Φ P- P P
TJ M cn P CL rt P Φ iQ tr Z i
P P CL "< Φ d P Φ p:
P ^Q <! P s: rt P s; φ P P1 P o p: Φ cn φ CL i Φ P- Ω N - P P cn cn P P- P Φ P' d cn N tr φ 03 CL CL rt φ (ϋ P
P- d P- Φ P cn P Φ Φ cn rt P iQ
^Q P P P- rt cn P ->
P iQ CL P PJ r tr O cn -
P φ φ P- Φ d er P- O cn rt P * <! P Ω P- P P p- CL O p- P cn O rt < tr o Φ CL Φ ^ P
P φ Φ cn P' P- d tr CL y
<! <Q Z P P rt rt P d P PJ cn
Φ Φ P- P P- CL tr iQ Ω cn P rt
P P P P f-3 3 P- P p- cn Hi Φ
Hi o o Φ 3 Φ P <Q cn rt rt p: 3 tr P- P- cn CL Φ Φ Φ cn
3 o Φ P- 3 Hi P- P ω Φ CL p: cn iQ p: d= P CL
Ω P P- n CL Φ Φ 03 P Φ f P- tr Φ cn Φ P P P P Φ rr z P- P rt cn tu d
P- CL iQ tr> φ & rt Φ rt iQ z P P d CΛ P CL P cn P- cn P1 : CL CL P P- d Φ z TJ g rt 1 φ
P d iQ i rt P φ P P- P-
CL d P P Φ P- d PJ 3 N Ω
Φ P Ω CL P P -3 rt Ω P 3 • tr
• tr Φ Φ Φ J Hl d tö Φ cn Φ P- P- P rt P . cn Φ P 3 rt rt VD Φ iQ • • Cn
O P <Q Φ Φ Φ Φ
3 Hi Φ P o P P P- tr1 CL P-
P- o P iQ tr tr cn P φ P P rt P P- Φ P- CΛ rt d cn - iQ d φ P 1 TJ rt ->
CL rt Φ Φ CL P Φ Φ tr1 d
P P Hl P d P P- P P ω o P Ω P Φ d φ P
<! P ^i iQ tr Φ P rt =: tr cn P φ rt P cn rt Φ tr
>< Ö3 P ιQ Φ er P- tO Hi cn O p:
P Φ Λ Φ ιQ d p: P rt cn P cn d P P P cn Φ iQ
P" rt d φ Φ d: P O P P-
Φ Φ Hi rt P Ω P1 P- rt s: i rt rt cn N N *- Cn rt • P-
P- cn rt tr cn p: φ P- α
1 CL Φ P- iQ rt _; P
CL P- 1 Ω Φ cn CL 1
P- φ tr i 1 P- 1
Φ 1 1 φ
Bei der Weiterbildung gemäß Anspruch 10 wird die für die als stimmlose Laute klassifizierten schmalbandigen Sprachsignalabschnitte jeweils erzeugte Ergänzung derart erzeugt, daß die Energie dieser Ergänzung in bezug auf die Gesamtenergie des schmalbandigen Sprachsignalabschnittes nicht vernachlässigbar ist. Auf diese Weise kann einfach ohne genaue Kenntnis des stimmlosen Lautes ein Erweiterung des schmalbandig gefilterten Sprachsignals durchgeführt werden.
Bei der Weiterbildung gemäß Anspruch 11 wird die für die als stimmlose Laute klassifizierten schmalbandigen Sprachsignalzeitabschnitte jeweils erzeugte Ergänzung derart erzeugt, dass auf Basis von zumindest einem Breitband-Codebuch aus ersten Filterkoeffizienten des schmalbandigen Sprachsignalzeitabschnittes zweite Filterkoeffizienten eines breitbandigen Sprachsignalzeitabschnittes ermittelt werden. Dadurch kann die Qualität des synthetisierten Sprachsignals gegenüber dem Sprachsignal, wo kein Codebuch verwendet wird, verbessert werden.
Die Weiterbildung gemäß Anspruch 12 erlaubt die Wiederherstellung eines im oberen Frequenzbereich erweiterten breitbandigen Sprachsignals anhand von ermittelten breitbandigen Filterkoeffizienten.
Die Weiterbildung gemäß Anspruch 13 erlaubt die Wiederherstellung eines im oberen Frequenzbereich erweiterten breitbandigen Sprachsignals anhand von ermittelten breitbandigen Filterkoeffizienten und eines breitbandigen Prädiktionsfeh- lersignalzeitabschnittes .
Bei den Verfahren gemäß der Ansprüche 7 und 8 werden für die Schätzung der Filterkoeffizienten für das Synthesefilter kei- ne Codebücher benötigt, wodurch der Speicherplatzbedarf in vorteilhafter Weise verringert werden konnte. Allerdings ist die Schätzung der Frequenzeinhüllenden oberhalb der ersten ω co > > P» P> cn o Cπ o Cπ o Cπ
K cn P Cd tr P cn Hl cn 1 rt <Q g S P tr o P- Φ CL o z Φ cn P- P N tr M ^ Φ cn Q
P Φ p- φ P d Ω P- P- φ Φ Φ 3 P P- Φ o cn P Φ er o Hi p- P P P- P P- φ Φ P φ P
Φ P ιQ cn P- Φ cn tr P" ιQ P P- 3 P - P P- rt cn d Φ tr Hi cn P- Φ Φ P P 3 rt P Φ
P P P P- 3 ft P P1 p: L O: φ rt rt P P1 P- cn P P- rt p: cn P t P P cn CL rt CL P Φ P CΛ P P- o . rt tr Φ Φ Φ tr N rt rt P M EP rt cn N
P- tr P1 rt φ tr φ P< P PJ rt φ < φ P- d cn P rt P d P- Φ P N tr P P- Φ rt Pi
Φ Φ N P- P P P tr rt N P Z 1 P ^Q Ω *>« P1 P Φ cn cn d P- P iQ P tr P- P
P- Φ 3 P P Φ φ d Φ φ rt P" <5 Ci tr rt P cn <Q Φ P rt Φ 3 Φ α rt P- 3 S CL Φ P P- ;*r P P d o s rt
Z O P CL Φ rt P P CL P- P B cn P 3 μQ
Φ d rt p- φ P- P- α CΛ rt rt P P α P- Z d P Φ P α P Φ O α d P- P ςu: TJ • P" d cn P P P P- ιQ P P- TJ P d g P1 Φ Ω P- P rt P cn Φ tr P P d P tΛ ^Q i P o Φ iQ tr Pi rt Φ N iQ P tr P iQ P- Λ* P CL Φ N cn P P cn P CL ^ Φ CL Φ d C cn P l_J. cn rt Φ Φ Φ P cn Φ cn rt P- Φ CL P- Hi P1 Φ rt Ω φ P P Φ P Ω 3 Φ N
Φ Φ Ω Φ P Φ P" P Ω Ω LJ- 3 J p: P1 P P CL Φ tr P- Φ tr <Q rt 3 1 P
Z P p- tr P P tr tr Φ p: P rt 3 r+ d P- tr Φ P- P P PJ Φ tr ^ P
Φ N P f P- z φ CΛ cn P £ t d: φ Φ P Ω P vQ Φ cn α Φ Φ CL Φ P- Cd d P1 P- tr* N
P- φ P- P P1 φ P TJ P- P- Φ Ω α tr cn CL tr Hl d rt Φ P P- Φ cn P cn >e> φ P •
P- d rt d CL P- P ιQ rt P- ΪJJ tr Φ P rt rt Φ CΛ Φ P LQ P- φ vQ φ rt φ cn d Cd
P- iQ rt rt d rt P P rt P> p φ cn <! P ** P Ω P d Φ rt Φ P- φ rt • iQ rt Φ Φ P Φ Φ Ω P cn cn P ω P 3 N tr Φ rt P Cd . CL P rt P- P- N Φ φ Φ iQ P P tr tr TJ J^. tr o P CL Φ CL p: cn P Φ φ Φ tr P φ d P »t-.
P P l_J- ^ rt ? ω N o ro P P rt Hi φ PJ P P rt P cn n P ö cn O P Φ
Φ iQ Φ P P- Φ Ω P d tr φ Z P P P cn P- N Φ rt o d Φ Φ P 3 tr α Ϊ
CΛ ΓΛ Z P φ £: ^ P- tr N Ω P- P- Φ tr φ cn Ω d P Φ & P- rt P tr Hl CL P Φ P W
P- P- φ cn 3 Λ TJ P rt J Φ tr cn rt P P P N tr P N P P Φ N P Pi 1 Cd Φ P N N iQ <Q P- cn p: TJ Hi P P P d tf CL Φ cn d Φ rt iQ Hl p: tr d φ P- n P P- 3 d
P P P" P- £ P rt 1 r cn tQ * co P P- P Φ ω P- P Q tr d P o P- N o φ rt Φ
P P cn Hi P φ N cn cn rt n P i P- p: P 3 Φ P Φ Ω <Q P rt P- α P- tr P- Pi cn b~- P1 P- g Ω P Φ Ω U2 Φ tsi CL P rt rt Φ Φ Φ & Φ P tr rt tr φ Φ rt P P^ d= Φ
P P N tr P- PJ Φ C d P- P- P cn N P PJ P d P d < Φ Φ P P tr tr P φ P- tr
P P d P- cn cn CΛ rt P Hi tr Φ ι cn P1 cn P Φ N P Φ P- P- P rt d P L P P P rt rt P Φ TJ P- TJ P P- P- P P Φ rt CL P P- Φ t P Hi iQ P P P- CL Φ Ω P P- rt
Φ Φ Ω P P iQ P tr rt P1 Φ Φ P . φ d Ω P- cn o N P iQ Φ P- P tr CL iQ -> LQ
P- P- tr rt d P P cn rt rt P- P P P Ω tr rt o Φ Φ CL P1 cn CL iQ 1 Φ z P
P* Φ Ω P Ω Ω Φ rt d o- Φ tr cn Hl ^^ Λ Φ φ P- φ TJ o P φ CL o cn Φ CL P PJ -' tr tr 3 P tr ω Φ P P^ CL iQ Hi N d P P- O Φ P P α o P P tf
P- cn P P- rr P cn z Hl Z P P P P- • Φ Ω O cn cn Φ P. ^ cn
P- α φ cn P> Φ p- P- rt P CL n φ 1 P- cn d O N Cd P Φ PJ α φ φ cn P φ P- φ
P Φ Ω <£> P ιQ rt Z CL Φ Φ P- > Φ P tr P- . N Ω φ Φ cn P rt tr P d
P P tr N z
P rt CL P- P- P P rt P cn Φ tr cn tr z •» P d rt P P tr P P- 3 s: Φ P Φ P tQ P Φ Ω tr Ω P P- P .£> , , rt d < φ 3 Ω Φ tr Φ cn
Φ P Ω P Φ d P" 3 Φ Φ P tr Φ p- o ω rt N Φ v Ω φ P- P tr P Φ P
N rt P* P vQ N Φ P rt Φ P- 3 Ω rt Φ ?r • P Φ tr P rt tr ? P- £ 3 d rt tr CL rt Φ P φ Φ z P- Φ P 3 P tr . P d Hi Φ Hi Φ
CL P φ cn P — P1 N m C cn Φ < O d: P iQ Φ P" P φ P- K P • t d cn P P cn Φ Φ α P P
P P- P P Z rt P rt Φ P- rt CΛ tr σ O - — - O P p- rt ™i rt P Hi Φ cn Ω
P N P P- P d: cn P Φ rt CΛ JT rt P P P tr >£> Φ α P Φ P- Φ iQ Hl P Ω tr d Φ φ P- CL P er TJ TJ P- Φ φ TJ Φ P P cn P cn Hl Φ P- φ P P1 P 1 P- P' 3
Pi d P <Q P- CL cn Hi P tr rt P cn P p- P CL d-- P P- ?T Hl P Φ P rt P- N S rt P
^Q P Φ Φ • Ω rt Φ o Φ rt P P CL P- tr tr tr P ffi P- Φ cn CΛ Φ N Ω P- φ Φ P"
CL
** r»t φ P tr Ω Ω P Φ 0 Ω LQ P Φ P α N N P P TJ P d tr Φ P-
P- Hi P z tr tr rt P O p- ffi Φ Φ P — - P- d P- P K Φ P rt σ φ CΛ CΛ d= P- P- Φ TJ Φ P cn p- Φ P- tr Φ ^ Pi P- P O P rt Φ P Φ
CL P- TJ P rt P P P cn P- P- P O rt tr Ö P P p- Φ Ω Φ Φ Φ P rt P-
Ώ P v P rt CL cn CΛ TJ <l i α. o tr P- CL P P- rt P1 P. iQ tr Hi P d P tr Φ φ cn P P Φ Φ cn TJ Φ O P Φ H-3 CL P P Φ cn cn Φ rt φ rt cn Hl P P- Pi >Q cn cn P Ω P- P d P iQ P P P P Φ φ P P P P Φ P P- P- 3 P" P Φ
P tr φ P Φ P rt 1 1 Ω tr CL d tr P P CL Q 1 P- α ? s:
3 1 ! CL α 1 Ω P cn tr d P- cn φ d cn ? ω P 1 CL rt d rt P- rr P- P p- P 1 Ω iQ 1 Ω O O P P Φ P Φ cn 1 φ cn 1 1 P* Φ tr 1 1 1 1 P iQ 1
energie des schmalbandigen Sprachsignalzeitabschnittes vernachlässigbar ist.
Bei der Weiterbildung gemäß Anspruch 20 werden die für die als stimmlose Laute klassifizierten schmalbandigen Sprachsignalabschnitte jeweils durch die nichtlineare Signalverarbeitung erzeugten Signalanteile derart erzeugt, dass die Energie des jeweiligen Signalanteils in bezug auf die Gesamtenergie des schmalbandigen Sprachsignalzeitabschnittes nicht vernach- lässigbar ist.
Gemäß Anspruch 21 ist es von Vorteil - weil einfach zu realisieren, wenn die Signalanteile durch spektrale Spiegelung erzeugt werden.
Das Verfahren zur Erweiterung des schmalbandig gefilterten Sprachsignals kann gemäß Anspruch 22 vorteilhaft - im Sinne einer vereinfachten Berechnung und Durchführung des Verfahrens - weitergebildet werden, indem die schmalbandigen Sprachsignalzeitabschnitte gleich lang gewählt werden.
Eine Methode, wie das schmalbandig gefilterte Sprachsignal in bezug auf Frequenzanteile unterhalb der zweiten Grenzfrequenz geschätzt werden kann, ist in den Ansprüchen 23 bzw. 24 ange- geben, wonach zunächst ein Prädiktionsfehlersignal des schmalbandigen Sprachsignals berechnet wird und anschließend die Filtercharakteristik des schmalbandig gefilterten Sprachsignals anhand des Prädiktionsfehlersignals geschätzt wird und auf Basis der Filtercharakteristik ein Prozess zur Bearbeitung des schmalbandigen Sprachsignals derart gesteuert wird, dass ein breitbandiges erweitertes Sprachsignal erzeugt wird.
Ein wesentlicher Vorteil des Verfahrens gemäß Anspruch 23 ist die einfache zu realisierende Erweiterung eines schmalbandig gefilterten Sprachsignals im unteren Frequenzbereich ohne Kenntnis des ursprünglichen breitbandigen Anregungssignals und ohne Kenntnis der Sendefiltercharakteristik der Telekommunikationsendgeräte, die eine Qualitätsverbesserung des Sprachsignals erzielt.
Gemäß Anspruch 25 wird die Filtercharakteristik des schmalbandig gefilterten Sprachsignals geschätzt, indem die in mindestens zwei Frequenzbereichen gemessenen Teilenergien des Prädiktionsfehlersignals verglichen und aus den daraus resul- tierenden Energiedifferenzen Rückschlüsse auf die Filtercharakteristik des schmalbandig gefilterten Sprachsignals gewonnen werden.
Die Weiterbildung gemäß der Ansprüche 26 und 27 erlaubt durch angepasste Entzerrung des schmalbandig gefilterten Sprachsignals eine Qualitätsverbesserung des Sprachsignals, das vorteilhaft insbesondere dann eingesetzt werden kann, wenn die Verstärkung von tiefen Frequenzen nicht hoch ist.
Die Weiterbildung gemäß Anspruch 26 erzielt eine Anpassung durch einfache Auswertung der inversen Filtercharakteristik.
Die Alternative gemäß Anspruch 27 Ansatz erlaubt ebenso eine angepasste Entzerrung durch Wiederherstellen von Grundfre- quenz und/oder mindestens einer Oberwelle und verhindert eine Intermodulation.
Die Weiterbildung gemäß Anspruch 28 verhindert, dass unerwünschte Oberwellen zu dem Originalsignal addiert werden, in- dem sie unerwünschte Anteile des erweiterten Sprachsignals entfernt und kommt vorteilhaft dann zum Einsatz, wenn das erweiterte Signal Gleichanteile aufweist.
Weitere vorteilhafte Ausgestaltungen sind in den übrigen Un- teransprüchen angegeben. Weitere Einzelheiten, Merkmale und Vorteile der Erfindung werden nachfolgend anhand der in den Figuren dargestellten Ausführungsbeispiele näher erläutert. Dabei zeigen:
FIGUR 1 als ein erstes Ausführungsbeispiel ein Ablaufdiagramm zur Erweiterung der Brandbreite eines von einem Telekommunikationsgerät gesendeten Sprachsignals in Richtung der oberen Frequenzen oberhalb einer ersten Grenzfrequenz des schmalbandig gefilterten Sprachsignals im Frequenzbereich,
FIGUR 2 als ein zweites Ausführungsbeispiel ein Ablaufdiagramm zur Erweiterung der Brandbreite eines von einem Telekommunikationsgerät gesendeten Sprachsignals in Richtung der oberen Frequenzen oberhalb einer ersten Grenzfrequenz des schmalbandig gefilterten Sprachsignals im Frequenzbereich,
FIGUR 3 als ein drittes Ausführungsbeispiel ein Ablaufdia- gra m zur Erweiterung der Brandbreite eines von einem Telekommunikationsgerät gesendeten Sprachsignals in Richtung der oberen Frequenzen oberhalb einer ersten Grenzfrequenz des schmalbandig gefilterten Sprachsignals im Zeitbereich,
FIGUR 4 als ein viertes Ausführungsbeispiel ein Ablaufdiagramm zur Erweiterung der Brandbreite eines von einem Telekommunikationsgerät gesendeten Sprachsignals in Richtung der unteren Frequenzen unterhalb einer zweiten Grenzfrequenz des schmalbandig gefilterten Sprachsignals,
FIGUR 5 als ein fünftes Ausführungsbeispiel ein Ablaufdiagramm zur Erweiterung der Brandbreite eines von einem Telekommunikationsgerät gesendeten Sprachsignals in Richtung der unteren Frequenzen unterhalb einer zweiten Grenzfrequenz des schmalbandig gefilterten Sprachsignals,
FIGUR 6a das Spektrum eines stimmhaften Lautes (Vokals) ,
FIGUR 6b das Spektrum eines stimmlosen Lautes (Frikativs) ,
FIGUR 7a eine mögliche Erweiterung des Spektrums eines Vokals,
FIGUR 7b eine mögliche Erweiterung des Spektrums eines Frikativs,
FIGUR 8 Filtercharakteristika unterschiedlicher Gerätety- pen,
FIGUR 9a Verlauf eines ersten Sprachsignals,
FIGUR 9b Verlauf eines ersten sich aus dem Sprachsignal er- gebenden Restsignals (first residual signal),
FIGUR 9c : Kurzzeitspektralanalyse des Sprachsignals,
FIGUR 9d: Kurzzeitspektralanalyse des Restsignals.
FIGUR 1 zeigt anhand eines Ablaufdiagramms einen ersten Pro- zess (eine erste Methode) zur Erweiterung der Brandbreite eines von einem Telekommunikationsgerät gesendeten Sprachsig- nals in Richtung der oberen Frequenzen oberhalb einer ersten Grenzfrequenz - z.B. 4 kHz - des schmalbandig gefilterten Sprachsignals im Frequenzbereich. Gemäß einem Ausgangszustand AZ des dargestellten Prozesses wird von dem Telekommunikationsgerät das Sprachsignal gesendet. Es liegt somit ein schmalbandig gefiltertes Sprachsignal vor. co co ) r-υ
Cπ o cπ o cπ o Cπ tr1 W > P p rt CΛ Φ cn > P1 CΛ Φ CL tr 1 P CL
P" P α cn Ω tr1 cn cn CΛ P CΛ cn P P-
P Φ d Φ TJ Φ P- Ω \-- O TJ P- P P P φ rt tr P P J TJ Φ <^i TJ p- tr P P
P P P rt P- P1 fr P P P P; rt cn Φ P P tr P φ d Φ d P- P ^ Φ uq tn iQ Φ cn φ rt P Φ 3 Φ φ φ Z CL Φ P ω rt α Φ P « PI ^ P Ω < Φ
N tsi P P- P O P P rt cn P- P- P φ φ rt Φ P P1 Ω P" - — rt P tr o P-
Φ Φ φ P φ Φ φ tr d tr1 P1 P tr1 P Φ L cn rt P p- 1 P cn tr P « P P P P
P- P- P- P P P P cn 3 P tr P P d cn φ TJ Φ cn tr P Z Cn cn P P- φ rt rt rt rt rt iQ φ P- P P rt d 3 rt φ cn P- P- rt P Z Φ φ P- cn tr 1 φ rt d 3 cn P cn P- P- P iQ φ iQ P P- rt P- p- Φ P1 Φ rt z P- p- cn p- iQ P- Φ cn P- rt iQ
P- d P- < φ P P N α < Φ Φ g P cn P1 Φ P Φ P φ rt cn P P rt rt Φ cn Φ ι cn ι CL P cn Φ P- P- p Ω cn P P Φ Φ P P- Φ P P s; P
P ω P d rt P- ιQ P- P - < tr s: ^ cn CL t^l er P1 Ω d tr d Φ cn
P' Ω P P d P Φ rt P P Φ P φ 3 Φ o O Ω Φ H Φ P" N P- tr fr cn P P- rt
P" tr Ω Φ P cn iQ cn P P P- tr P tr Q P- rt P Φ φ P rt Ω rt cn Φ φ P Φ d tr1 tr P- P- Φ d CL rt cn Φ 3 Φ P- cn Φ P- P Φ d tr Φ φ P
P p- P P rt <Q Φ cn Φ tr φ P P P- P to TJ cn ^ rt d rt P P P
Φ rt Φ ? P < P P P- s: P rt P Φ P r P P- p- P P p- rt v
P rt P P LQ Φ tr ιQ P P" P- P- P- P M P rt d Φ cn Φ CΛ -: tr iQ d CL rt Φ P- P
P P cn P rt P a g t1 Ω CL P1 Φ P P tr P1 J Φ cn P d rt P- φ O
P- α P- P Φ iQ Ω P φ Φ CL φ p P PJ P- tr P i rt cn Φ Ω CL P- P P' P-
Φ φ Φ P- tr P P *Q P1 d i K Z fr tr Φ Ω P- rt Ω Φ cn CL rt Φ P Φ rt Φ Φ o rt CL Φ d O s: Z P Φ rt O P P P- tr P . tr tn
1 1 P- tn P- P- t P Φ P- 1 cn Φ φ P P CL P- p- P p- P CL P- P P cn
CΛ Φ P- Ω rt O <Q P P Φ cn cn 1 CL Φ P P cn d φ π- P Φ Φ iQ cn
CL Ω CL ιQ tr rt P P- φ cn P CΛ P CL Φ Φ 3 P rt rt φ P- p-
• t • Bf P Ω
P Φ P Φ CΛ Φ 3 P- TJ d cn p- P P cn o tf pr 3 tr P P Φ Φ TJ p- tr1 P- P φ Φ P P tr rt P P α P Φ φ Ω P
• P • rt h-> P- Φ P- P P d P P rt w cn rt P Φ Φ cn d P- d Φ 3 tr φ P-
P1 Φ Φ P P P- P P P d ^ rt Ω Φ tr P- 1 n cn P 3 ; PJ rt
CL tr CL P P Φ 3 φ PJ Ω d rt CL P tr P P cn P1 » z Ω ^1 p- cn rt
Φ P Φ cn Φ tn P- P P tr P Φ Φ cn d φ tr P TJ rt φ Φ tr α P z Φ Ω
P P P Ω P rt φ P cn Φ rt cn 3 α 3 tr P L P- Φ _; P- CL P- tQ P cn φ Sa tr
CL tr < rt P CL P- P- Φ ^ cn Φ P" Φ cn cn cn Φ P Φ P- rt P- Φ 3 o
CΛ 1 CΛ Φ P- Φ Φ CL ιQ rt P P- P tr CL 1 Ω rt P rt rt P P •
P- CΛ P- P- Φ P P1 φ z P cn tn Φ P P- . Φ cn CΛ tr φ cn d: rt ^ Φ α P" Q J ιQ α tr rt P φ P P- Ω P- P cn Φ cn z TJ s 1 P rt tr Φ O P tr
P P P d 3 p: P- P> ιQ tr <Q ^ rt M P- φ Φ P- P P d s: P Z
P P P P P- * d cn rt N P P- rt H 0- P- P < P- fT O o > 3 rt P •τl Φ P p-
Ω 1 rt rt P Ω Φ φ P φ CD P Φ P φ Φ cn rt p. P. d P "* d P- P P CL P φ tr Φ P CL tr P P- CL P P- φ P P Φ P Φ φ cn tr P Φ O CL P- CL
P cn P CL Φ P- 3 Φ rt φ i-> cn 5d P tr d P P cn P α O P φ ^Q
Φ P- φ d P- cn P P P P P P- rt Φ Po tr P 3 TJ P Φ P Φ CL
P ^Q ι-i P P cn P P1 σ Φ Ω P- n P P Φ P- P _; P P rf ω Φ Pl tn P-
P iQ Ω Φ φ cn tr P cn P p- M tr rt Ω rt cn rt - P P1 P Φ cn cn P cn CΛ φ
P- P P- tr 3 cn Ω P d Ω vQ Φ Φ tr Φ rt P P d =; cn Ω P cn P cn d: TJ ω
Φ -> Φ tr P tr P- tr P p- P- P * tf P. cn P Ω P P φ cn < CΛ <J P1 L φ P φ CΛ P P P1 cn g cn CL s: Φ Φ tr1 Φ Ω cn tr P ω d: P- Φ Ω O P- P- P- P- TJ P rt d Ω p cn φ P- P- P P tr H) P Ω er 1 P P tr P Φ vQ P rt φ φ rt (Q Φ P tr rt φ CL P- φ P Φ d P O P- φ tr CΛ
Φ Z tP P rt φ Φ P Ω Φ φ cn φ cn P rt P rt CL cn J
P d Φ P* φ ^ φ iQ P Φ P rt cn P" P- P P rt φ ω P φ rt 3 rt Φ P- P
P P- Φ P1 d P Φ α cn φ P d rt CΛ < P rt 1 - z rt P P ιQ P
Φ α P P P CL Φ ω Φ P Φ TJ d d ^ O tτj 1 P- P- φ rt d P Ω
P- Φ Ω z P- P cn P CL 1 Φ P P P O S P s: P- πd P- CΛ P tr
P CL 3 tr φ Φ CL P- O φ ; d: ^Q φ cn Φ p P- P1 M o • J 1 cn
Φ Φ P P- P rt o Z P - ω rt rt PJ Λ CΛ P- P- cn ^ φ P- . P P1 P N p-
P P fr α rt rt cn Φ 1 P- cn P rt Φ P P P d TJ rt P cn o iQ P Φ ιQ d φ cn P <Q Φ rt rj- p- P d Φ P φ φ P- iQ TJ cn O tr Φ Ω P- P
P P P P- ü rt Φ Φ Φ 9 3 P 1 P f o Φ P Φ Φ Φ P- tr rt P t Φ ιQ φ Φ P P P rt P 1 P P ?d P- P- Φ 1 1 1 1 1 P 1 1 1 1 1 1
co co ) > P1 P1 cπ o cπ o Cπ o Cn cn tr rt CL d
Ω P Φ P P Φ pj: tr P P P O P P
P α P N iQ
P- P- CΛ Ω Φ Φ Φ rt iQ TJ tf tn P P rt Φ P cn z Φ
P P P- cn φ P
Ω P Ω P- o CΛ tr tr rt t i
. TJ tn Φ P Φ φ
P1 P P- P- p- P P-
P ιQ P rt rt rt
N Ω P φ rr Φ P d tf P 3 P d cn P1 πd tn
< P- N cn CΛ cn φ iQ Φ Φ . TJ Ω
P P P- Ω P tr fr P rt tr P P
P P1 P cn 3 Ω P- d= N tr rt P- pr rt
TJ Φ cn Φ rt cn rt
Hi P- Ω P rt P-
Φ rt tr Φ ( t
P P P PJ P Φ tr P- P cn P rt cn rt O P tr Ω rt N Φ N P
Φ tr Φ P- Φ Ω
< P 3 cn P P- tr o P- P- cn Φ rt rt
P rt rt cn tn P Φ rt Ω tr rr
P CL tf K cn tr P Φ P O Ω 1 cn d 3 P- Ω tr
Ω cn rt tr P d tr φ rt J P- P
P" CL P P rt CL
P- Φ rt PJ cn rt
Φ 3 cn Cn cn P
EP TJ • Pi P- P
Φ φ P P1 P- P cn
P P Φ P" Ω cn Ω rt Φ tr rt tr P- Φ P- P1
P- φ Φ φ P P P-
P P P cn cn Φ Φ
P. φ 3 t φ TJ Φ P N φ
P- P P d Hl P
P o iQ : φ N cn Φ Pi P Φ
3 φ Ω H) P- Hi 3 cn tr P- P< rt cn tn 3 P" rt Φ <
P- 1 P rt Φ P φ
Φ P1 φ P P tr 1 P P 1
1 1
co co rv> t\) P1 P1
Cπ o cn o cπ o Cn
TJ 3 ^ P rt α P CL ^ tr1 ö z rt O CΛ P P H to rt Q rsi P- N N cn iQ φ cn ω rt
P P- O d Φ P- P φ P- TJ d P- Φ P TJ tr P 3 Φ P- Φ & d Φ P Φ Φ rt Φ P P Ω p- Φ p: rt Φ Ω 3 Hi P Pi P1 O P φ P cn P rt P P- Ω P tr Φ P- d tn P P P Z tr ιQ P - Hl tr Hl P P- rt 1 Ω ^ ? P P PJ P tr d P P rt CL i cn rt P φ P P
P- P- i CΛ Φ rt P Φ *t tf φ O O Ω cn ^< φ rt P P N P φ rt cn rt Φ P- P- P J
^ φ P- iQ P- P Φ P- P o P- Φ Φ tr rt cn P" P d iQ CL Φ tr 3 Φ Ω CL P P rt rt P" P rt 3 N t-> i Φ φ d φ P Hi Hl P Z P- iQ P P cn P tr Φ z d Φ rt N O
P- P- Φ P P tτj P P Hi Hi Hl tr φ Φ φ N i Φ CL Ω tn P cn φ Hi P Φ φ N o CL φ P- P INI P rt Q Hl z P- P- rt P P 3 z P- φ φ tr P- tr P- tn p- rt p- Φ
P φ P Ω P1 p: Φ P- φ $ N N P rt rt Φ φ P P P P Φ P rt Φ rt φ Φ rt cn cn P rt tr Z N P- P P- N P P P- P- tn • P- P- Φ Φ z p- tr Φ rt P Φ P- P P cn
H) φ N Φ z P- Φ P- φ φ Φ rt P rt P cn •^ φ rt rt p- P P CΛ tn tr cn φ O P Φ P p- fr P cn Φ iQ P P s: d σ Φ Φ H P- rt Φ rt TJ P rt φ TJ cn Ω tr P P- rt tn rt P- P P d rt rt Φ P P P P o cn Q rt Φ P tr co d Φ P tr Ω tr
P1 P- CL rt Ω P- Ω S rt P Φ Φ P Ω tr tr Ω Φ P . Ω P CL P P tr P
Φ iQ φ P- d tr o tr Φ α iQ P P rt tr Φ z S Φ tr v P CL TJ P t-1 tr φ Ω Φ P P-
P P- Hi iQ P φ P rt cn P Φ tn ** Φ P- P- Φ P 3 rt P P CΛ P tr P- P- rt
1 P P- α P cn P Ω P cn Φ P CL P rt Φ P > Φ cn o P- P 3 TJ P cn rt rt rt
P P CL Pi φ tr P P- P- tn P- z α tf P 1 N iQ d O: P P P- tr rt tr P- P CL φ X P d N i P O P Φ ω O tr cn CΛ tr φ φ ω iQ P rt iQ P Φ TJ
N 1 φ tn Φ φ tr d P- Pi d P φ iQ P P Φ CL ^ P O TJ P cn P P- Ω P- P P P cn z CΛ P 3 3 P- P rt P cn Φ iQ P" CL P- Φ P P P1 P Φ cn α P- tf P •
• TJ rt φ cn rt Φ P Φ P- Φ P — φ CL P P- cn φ φ Ω cn Φ P1 P- CL
P Φ rt CL P P- cn P- P- CΛ P P P P A P- Ω rt Ω P P tr P- iQ d t? P P P d ω < Φ P Hi TJ P p: φ CΛ Φ d iQ N tr tr tr z Q O φ Φ P P p Ω P φ rr P P- Φ 3 cn φ p: P P tr P d J P Φ d tn P P φ P- P d P Ω d
P tr Φ i cn Ω iQ P P- φ 3 P P rt φ P P P 1 P iQ P P- P P- P- P d P P N P- tr cn
Φ cn P- d p: tr P rt P Ω Φ P Φ rt P p: N Φ p: ιQ P- rt rt P P1 P1 φ P Q P- P P Ω P Cd CΛ pr rt Φ Ω d Φ Pi Ω P p- rt Φ P- 3 cn P- d N CL d iQ iQ tr L P1 P- Φ CΛ TJ P- cn tr1 P tr rt P P- tr P iQ P P- P- rt iQ V d Φ
P P P cn P- P- . iQ P- TJ P φ ^ TJ Z o cn Φ P1 cn P" Φ TJ rt φ rt <l p: rt P- cn P iQ P Φ cn P- φ P- P P P cn P O φ 3 CL P- P iQ rt rt cn Φ cn rt φ rt Ω P tn P1 fr P- Ω α rt Φ P Ω Φ rt 1 P er φ Q rt Φ Φ N P- • P φ Φ P cn Z tr Φ cn P d <Q tr P- P 3 Ω tr tn tr ^ CL P- P P 3 P α d P P> 3 N <! p- rt 3 p- p- tr P P Φ P- φ tr cn Φ o Φ P P Z p: rt P- CΛ tr P- Φ P d φ P iQ cn cn P 3 P cn Hl cn P- CΛ tn φ P P Φ Go Φ φ φ d CL TJ TJ P Ω P CL P P N
P Ω P- P1 Φ φ P- d P- iQ > φ Hi rt $ P P P P- d P P P tr r • iQ Hl Φ
P tr <! CΛ P cn P1 P iQ P P Pi Hi fr P- P Φ φ N Ω P P o rt φ d: P1
P Φ Hl P- P rt Ω P P rt P- P- P O P d Φ P- CΛ P φ tr Ω Ω N P Φ cn iQ P cn P- d= i φ CΛ Φ tr P tf 1 N P P tr P P P TJ Pi d rt tr tr Φ P rt cn Φ Φ φ rt CΛ P P P- P P Φ rt P- P 3 Ω • Φ P P- iQ d cn cn Ω φ P P P s: rt •< P tτj <Q CL P tr tn Φ Φ ^ <i Φ tr cn P P φ P CS3 P- cn tf Z P
P- P α 1 P P Φ P- tr tn Φ P P o *«» Ω CL P iQ d ιQ cn Φ d o C < φ CL rt P * p: P P φ cn Ω Hi cn rt P p- N P' d • cn P Ω CL P P tr P- φ d tr tn Φ P1 rt cn Ω tr p- Φ P- CL P- z cn P P P tr Φ CL vQ Φ Φ P
Φ P φ P P- cn φ tr P P1 CL P P P P φ P- iQ Φ 3 P1 P 3 φ P cn fr
P Ω cn rt ^ tr rt P P- rt P φ o tn Φ P- i tn P 3 N P- P CL Φ φ P tr Φ d . rr Φ Φ t P- rt Φ P P P tn P rt P Q Φ φ rt <! Φ P P d:
Φ i- P P- tn tr O rt rt P tn CL P tr P Φ P Φ o P P- rt P- cn TJ z 1 P- Ω H o Ω rt Φ rt rt P- Φ Φ Φ Φ P 3 tr Pi rt φ cn ^ tsi Pi o P- P- tr Cn P tr Hl ιQ tr φ φ P P- cn p: Φ d= P i_l. P O tr P Φ rt
P rt P CL Hl 3 Φ Φ P- PJ P- P TJ J EP P iQ tr Φ rt P Φ P- Φ
P rt Φ CL cn iQ Φ P P- P- tr P α P iQ P P P- Φ Φ Φ cn z Φ P- Φ Λ rt P φ Φ P P- rt Φ P- tn N rt O: Φ φ P- p: Φ CΛ p: O P P P Ω φ P cn P- d P
P P φ Φ cn tr P- rt P Ω P φ CL P TJ CL N H tr P- rt rt Φ tr CΛ
P CL 1 Ω rt cn Φ Φ Φ tr P- P P- Φ CL P ^ CL P P1 TJ tr P 1 TJ z P tr1 t-> tr O P P1 P P *1 ^ P ^1 tn P- Ξ P P- P- cn P Φ P N P p- CL P TJ rt p: a iQ rt cn CL Φ tn P- rr Ω rt tn φ Φ Φ φ rt O cn P Φ P
P Φ O rt P- Φ Φ φ rt O 1 P- tr P- Φ p- 1 cn rt Φ 1 CL P Ω
CL ω 1 N φ 1 P P . 1 1 1 1 O tn 1 φ Φ P P- tr
• 1 P P P l 1 1
Um ein Sprachsignal in die Richtung der oberen Frequenzen zu erweitern, ist die Kenntnis eines breitbandigen Anregungssig- nals und der Filterkoeffizienten, die das (breitbandige) Sprachsignal im Sinne der linearen Prädiktion beschreiben er- forderlich.
Da beispielsweise in Telekommunikationssystemen in denen schmalbandig übertragen wird, das Sprachsignal schmalbandig vorliegt, wird erfindungsgemäß anhand des mittels linearer Prädiktion aus dem Sprachsignal berechneten schmalbandigen Anregungssignal ein breitbandiges Anregungssignal ermittelt.
Dies erfolgt beispielweise durch Frequenzspiegelung des schmalbandigen Anregungssignals, bei dem die Frequenzanteile zwischen 0 kHz und 4 kHz an der 4 kHz - Spektrallinie in einen Bereich von 4 kHz bis 8 kHz gespiegelt werden.
Alternativ kann die Berechnung auch durch Addition des schmalbandigen Signals mit Gauß schem (weißen) oder begrenz- ten (gefärbtem) Rauschen realisiert werden.
FIGUR 2 zeigt anhand eines Ablaufdiagramms den zweiten Pro- zess (die erste Methode) zur Erweiterung der Brandbreite eines von einem Telekommunikationsgerät gesendeten Sprachsig- nals in Richtung der oberen Frequenzen oberhalb einer ersten Grenzfrequenz - z.B. 4 kHz - des schmalbandig gefilterten Sprachsignals im Frequenzbereich. Gemäß dem Ausgangszustand AZ des dargestellten Prozesses wird wieder von dem Telekommunikationsgerät das Sprachsignal gesendet. Es liegt somit wi- der ein schmalbandig gefiltertes Sprachsignal vor.
In einem ersten Prozessschritt PO.2 wird dieses Sprachsignal in vorzugsweise gleich große schmalbandige Sprachsignalzeitabschnitte unterteilt. Anschließend werden für jeden Sprach- signalzeitabschnitt in einem zweiten Prozessschritt P1.2 in bekannter Weise im Rahmen einer Pradiktionsanalyse LPC- Koeffizienten und ein sch albandiges Prädiktionsfehlersignal berechnet, in einem dritten Prozessschritt P2.2 auf der Basis der LPC-Koeffizienten und des schmalbandigen Prädiktionsfeh- lersignals die Spektralstruktur der schmalbandigen Sprachsignalzeitabschnitte berechnet und in einem vierten Prozess- schritt P3.2 eine Klassifizierung derart durchgeführt, dass der jeweilige Sprachsignalzeitabschnitt als ein stimmhafter Laut - wie beispielsweise "a", "e" oder "i", deren Aussprache ein in FIGUR 6a dargestelltes Spektrum aufweist - oder als ein stimmloser Laut - wie beispielsweise "s", "seh" oder "f", deren Aussprache ein in FIGUR 6b dargestelltes Spektrum aufweist - eingestuft bzw. definiert wird.
Diese Unterscheidung wird beispielsweise anhand der Position der ersten Formanten oder anhand des Verhältnisses von Spekt- ralanteilen oberhalb und unterhalb einer bestimmten Frequenz - beispielsweise 2 kHz - geschehen. Eine Unterscheidung anhand des schmalbandigen Spektrums ist einfach durchzuführen, da wie ein Vergleich des in FIGUR 6a dargestellten Spektrum eines stimmhaften Lautes mit dem in FIGUR 6b dargestellten Spektrum eines stimmlosen Lautes zeigt, stimmhafte und stimmlose Laute in der Regel sehr unterschiedliche Spektren haben.
Alternativ dazu wird eine Kurzzeitsignalenergie eines ersten schmalbandig gefilterten Sprachsignalzeitabschnittes sowie eine Langzeitsignalenergie anhand weiterer aufeinanderfolgender zum ersten Signal korrelierender schmalbandig gefilterter Sprachsignalzeitabschnitte ermittelt und anschließend das De- tektieren durch Vergleich eines Verhältnisses von Kurzeitsignalenergie zu Langzeitsignalenergie mit einem Schwellwert re- alisiert.
Alternativ dazu kann die Unterscheidung durch Vergleich der Kurzzeitsignalenergie - d.h. der Signalenergie in einem kurzen Zeitausschnitt des Schmalband-Sprachsignals - und der Langzeitsignalenergie - d.h. der Signalenergie über einen längeren Zeitausschnitt betrachtet - und anschließendem Ver- gleich des Verhältnis Kurzzeit- zu Langzeitenergie mit einem festen Schwellwert durchgeführt werden.
Im Anschluss daran wird in einem fünften Prozessschritt P4.2 in bezug auf die im dritten Prozessschritt P2.1 vorgenommene lautartbezogene Klassifizierung die im dritten Prozessschritt P2.2 berechnete Spektralstruktur erweitert. Dies geschieht derart, dass zeitabschnittsweise in bezug auf die im vierten Prozessschritt P3.2 vorgenommene lautartbezogene Klassifizie- rung Ergänzungen zur Erweiterung des Sprachsignals, die jeweils eine spektrale Struktur aufweisen, erzeugt werden, wobei für den Fall des stimmhaften Lautes die Ergänzung unabhängig von dem jeweiligen Laut ist (mit Feststellung der Art des Sprachlautes - stimmhaft/stimmlos - wird auch die zur Er- Weiterung der Bandbreite notwendige Ergänzung bestimmt) , die spektrale Struktur des schmalbandigen Sprachsignalzeitabschnittes und die spektrale Struktur der erzeugten Ergänzung zeitabschnittsweise zu einer erweiterten spektralen Struktur verknüpft werden.
Handelt es sich in dem fünften Prozessschritt P4.2 bei dem untersuchten schmalbandigen Sprachsignal um einen stimmhaften Laut, so wird die schmalbandige spektrale Struktur, wie in FIGUR 7a dargestellt, derart durch eine Ergänzung erweitert, dass die erweiterte breitbandige spektrale Struktur oberhalb von 4 kHz wesentlich weniger Energie als unterhalb von 4 kHz besitzt. Es ist z.B. ein Abfall, ein exponentieller Abfall, ein Anstieg, ein gleichbleibendes Nullniveau oder ein gleichbleibendes Niveau der spektralen Struktur zu höheren Frequen- zen hin denkbar.
Alternativ kann auch ganz von einer Erweiterung abgesehen werden, weil in der Regel die Signalenergie eines stimmhaften Lautes oberhalb der oberen Grenzfrequenz des Schmalband- Sprachsignals (z.B. 4 kHz) vernachlässigbar ist (vgl. FIGUR 6a) . Der erzeugte breitbandige Frequenzgang entspricht für diesen Fall dem schmalbandigen Frequenzgang des zugrundeliegenden schmalbandigen Sprachsignals.
Es ist auch möglich, dass die Erweiterung, die nach Detektion eines stimmhaften Lautes vorgenommen wird, unabhängig von der genauen Kenntnis der Laute stets die gleiche ist (angepasst lediglich an die Energie des Schmalband-Sprachsignals), so dass eine einfache, kostengünstige und schnelle Umsetzung dieser Erweiterung erzielt wird.
Handelt es sich in dem fünften Prozessschritt P4.2 bei dem untersuchten schmalbandigen Sprachsignal um einen stimmlosen Laut, so wird der schmalbandige Frequenzgang, wie in FIGUR 7b dargestellt, derart erweitert, dass er - im Gegensatz zur Er- Weiterung bei stimmhaften Lauten - im Bereich oberhalb der ersten Grenzfrequenz des Schmalband-Sprachsignals (z.B. 4 kHz) einen nicht vernachlässigbaren Teil seiner Gesamtenergie besitzt .
Auch hierbei kann die Erweiterung stets, unabhängig von der genauen Kenntnis der Laute, durch eine gleichartige spektrale Erweiterung erfolgen (angepasst lediglich an die Energie des Schmalband-Sprachsignals), so dass hierdurch ebenso eine einfache, kostengünstige und schnelle Umsetzung dieser Erweite- rung erzielt wird.
Als Ergebnis der ersten bis fünften Prozessschritte P0.2...P4.2 in FIGUR 2 wird also eine neue erweiterte breitbandige spektrale Struktur in Abhängigkeit von dem Laut, der der vorhandenen schmalbandigen spektralen Struktur zugrundeliegt, generiert.
Als alternativen Ansatz zur Durchführung der Erweiterung im fünften Prozessschritt P4.2 kann man auch auf Codebücher zu- rückgreifen. Voraussetzung hierfür ist, dass mindestens ein Codebuch vorhanden ist, das den Zusammenhang, beispielsweise unter Zuhilfenahme der statistischen Eigenschaften der Spra- ehe, die z.B. in einem Hidden Markov Model (HMM) abgespeichert werden können, zwischen schmalbandigen und breitbandigen Filterkoeffizienten darstellt und aufgrund der statistischen Beziehung zu den im zweiten Prozessschritt P1.2 berech- neten schmalbandigen Filterkoeffizienten, breitbandige Filterkoeffizienten liefert.
Bei einer alternativen Zuordnung von schmalbandigen zu breitbandigen Filterkoeffizienten, die durch ein oder mehrere Co- debücher wiedergegeben wird, werden aus den im zweiten Prozessschritt P1.2 berechneten schmalbandigen Filterkoeffizienten zugehörige breitbandige Filterkoeffizienten ermittelt. Diese Filterkoeffizienten werden dann zur Synthese von Frequenzanteilen oberhalb der oberen Grenzfrequenz des schmal- bandigen Sprachsignals (z.B. 4 kHz) verwendet.
Die Codebücher werden jedoch nur für den Fall benötigt, dass die Untersuchung der im vierten Prozessschritt P3.2 ermittelten schmalbandigen Spektraleinhüllende einen stimmlosen Laut detektiert. Daher können sie auch auf Filterkoeffizienten für stimmlose Laute eingeschränkt und damit sehr klein sein, wodurch sie keine große Speicheranforderung an ein Telekommunikationsendgerät darstellen.
Außerdem wird in einem sechsten Prozessschritt P5.2 das in dem zweiten Prozessschritt P1.2 berechnete schmalbandige Prä- diktionsfehlersignal zum einem breitbandigen Prädiktionsfeh- lersignal erweitert, so dass bezüglich der Zeitabschnittdauer den schmalbandigen Sprachsignalzeitabschnitten entsprechende Pürädiktionsfehlersignalabschnitte des breitbandigen Prädik- tionsfehlersignales erzeugt werden.
Daran anschließend wird aus der im fünften Prozessschritt P4.2 erzeugten erweiterten spektralen Struktur durch die Be- rechnung von breitbandigen Filterkoeffizienten in einem siebten Prozessschritt P6.2 und dem im sechsten Prozessschritt P5.2 jeweils erzeugten breitbandigen Prädiktionsfehlersigna- co co t t P1 P>
Cn σ cπ o Cπ o cπ er P CL α Λ tsl P- N N
P P Φ P- d φ P Φ Φ
Φ P-" tn Φ Φ P- d tn
P- φ cn P rt CL iQ cn rt P Φ tr N P φ rt tn tr P P Φ tr 3 Φ Ω
P CΛ Φ P tn P tr
P rt P- Ω φ P
CL P CL rt φ tr tr P-
P- d P tr P P Hi P rt iQ fr cn P z P- rt Φ rt
Φ rt cn P φ rt Φ P-
P d α P- rt P rt J
P cn P- rt Φ tr -j
CΛ p- i Φ TJ P •
TJ er φ Φ P α P P >
P Φ P rt P O
P P P Φ ω N P- P
Ω Φ d 1 Φ Q d tr Ω cn P- CΛ tr cn Φ cn cn tr 1 TJ P cn P
P- P rt P Φ cn ιQ Φ Φ Φ P P- Ω Φ φ
P rt P P Ω rt tr P P
P fr tr er P z
Z O cn P P- φ P- cn d t? φ P- P rt P- P
• P cn Hl iQ CL rt rt
CL Ω Hl P P- Φ CL
Φ tr P- P i TJ P P-
P• p: N * φ P> rt Φ rt P- o Φ cn
N φ N P- • P Φ
CL d P d P N 3
P- P rt CΛ
Φ iQ ro Φ to CL TJ TJ
P P P- d P P cn CL N Ω P P o
TJ Φ tr Φ tr Ω Ω N φ P Φ d rt tr tr φ
7r cn iQ d ω cn r tr Ω φ P rsi P- cn
P P pr P iQ d iQ cn
P Φ P • cn P Ω h-> P- Φ CL P P tr
Φ rt P- Φ 3 P tr tr P 3 N P-
CΛ P Φ φ φ rt rt P P O P P- rt
P er Hl rt d P- P Φ d: P ^ iQ d P iQ tr Φ rt Φ Pi Φ Φ cn z d P P P Ω φ
P Q tf P- tn P . CL P P1
Φ TJ d P P- P- cn
P- Φ P Φ Φ rt
P i CL 1 tn rt φ φ rr Φ Φ P cn 1 P P 1
Diese breitbandigen Filterkoeffizienten stehen dann für die Sprachsynthese zur Verfügung, mit der unter Verwendung des - wie bereits beschrieben - erzeugten breitbandigen Anregungssignals oder Prädiktionssignals die breitbandigen Sprachsig- nalzeitabschnitte und damit das breitbandige erweiterte
Sprachsignal erzeugt wird, dessen Qualität deutlich besser ist als die des schmalbandig gefilterten Sprachsignals.
Die auf Basis der Codebücher berechneten und dem Synthesefil- ter zugeführten breitbandigen Filterkoeffizienten werden zur Synthese des oberen Frequenzbands des Sprachsignals verwendet, was zu einer Qualitätsverbesserung des Sprachsignals durch die Bandbreitenerweiterung führt.
Erfindungsgemäß können daher breitbandige Filterkoeffizienten ohne die Hilfe von Codebüchern bzw. mit sehr kleinen Codebüchern bestimmt werden, wobei eine mögliche Anwendung des erfindungsgemäßen Verfahrens zur Erweiterung der Sprachsignalbandbreite im oberen Frequenzbereich in Telekommunikations- Systemen besteht, in denen Sprachcoder mit variabler Bitrate eingesetzt werden, die sowohl breitbandig als auch schmalbandig codieren können, da dort der Fall eintreten kann, dass der Sprachcoder während der Kommunikation zwischen Schmalband (narrow band) und Breitband (wide band) wechselt.
Die dadurch verursachte deutliche Verschlechterung in der Kommunikationsqualität wird dabei durch die Anwendung des in dieser Erfindung beschriebenen Verfahrens in Kommunikationsendgeräten verhindert.
In Telekommunikationssystemen, die beispielsweise gemäß dem UMTS-Standard funktionieren, und bei denen die oben beschriebene Problematik auftaucht, ist daher ein erfindungsgemäßes Schätzen der breitbandigen Sprachsignalanteile während der schmalbandigen Übertragung, um eine konstante Qualität zu gewährleisten, vorteilhaft einsetzbar. co co r > P> P1
Cπ o cn o cπ o Cπ
CΛ CL Φ cn > CΛ Φ CL tr 1 P CL α cn Ω tr cn cn CΛ ^ cn P P- Pt Φ fr CL CΛ Q P Φ N ^ J Φ P- O -> O TJ P- P P P Φ P- rt tr P P TJ TJ P1 P- tr P P P- P Φ TJ P P P- φ H
P P P tr rt tn φ P P tr P Φ d Φ d P- P P iQ tn P rt cn P Φ -> P tn cn
P Φ 3 Φ Φ TT φ Z CL Φ P tn Hl rr CL Φ P cn P Ω < φ P- P P cn φ tn
Ω N P P rt cn P- P- P φ Φ rt Φ P Ω tn P tr o P- cn o CL Ω N cn to tr d tr P1 P tr P φ CL cn rt P P- 1 P cn tr p- P" P P P Ω P P tr Pi p- — . cn 3 P tr P P d cn φ TJ Φ tn tr P iQ Z cn Hi N P- N Φ tf cn P cn P P < φ co p- P P rt d 3 rt Φ tn p- P- rt P N Z Φ Φ P- P- φ rr d 3 3 iQ iQ P- Φ o P- Q Φ iQ P P- rt P- P- φ Φ rt z P- p- cn P- iQ N P- rt iQ P Φ φ iQ Λ t P P N
P P N α <! Φ Φ 3 P cn P" Φ P Φ • P Φ rt cn P P- rt Φ cn Φ P1 P cn P d P- Φ Φ
P cn φ P- P- p Ω cn P P Φ Φ P φ P Z P tr p: rt P Φ Ω φ P-
P" rt P- iQ CL P- P tf < tr Z ^i tn CL t^j tr P1 P- P tr d φ cn P rt Φ P tr P- CL iQ
N Φ rt P P Φ P Φ 3 φ O O Ω φ Φ N d tn P P- rt P P1 cn N rt P P rt
Φ P cn iQ N tn Hl P P p- tr P tr Hl Q P- rt P φ P Ω rt cn Φ CL P. P1 d φ P-
P- P- Φ d CL rt iQ 1 ω Φ 3 φ P- cn Φ _; P- iQ tr Φ Φ P P- P rt P- 1 P 3 rt P rt CΛ Q Hi Φ cn Φ tr φ P P P- P t TJ cn rt P P iQ cn Φ 3 iQ rt P
P P- P P- Z P rt P Φ P tr P CL P- P- P α P- rt iQ TJ P N H Φ tr tr iQ P P- P- P- P- P IV) P rt d Φ cn φ CΛ tr Φ rt Φ P- P iQ CΛ 03 . CL Φ P cn P P1 rt P to 3 tr Ω CL Φ P P tr TJ Φ cn P rt P- Φ O Φ TJ TJ Φ Cd Φ P1 S P
Ω P Φ Φ CL Φ P P pr P- Tr tr P iQ rt cn Φ Ω P P1 P- N Hl P P P- • P φ Φ P- tr P1 P P iQ P1 d tu CL Z fr tf P P- rt Ω Φ P- P O rt fr rt
P Φ rt φ Φ O rt CL Φ N d O z Z P φ rt O P rt P . pr tn P1 Ω N tr J-» o o tr φ p- fr P Φ P- P" cn Φ φ P P P- p- P p- P a p- tn rt tr φ Φ tr o P- rt O i P P Φ cn cn 1 L Φ P P iQ cn d Φ rt CL Φ iQ cn Φ cn cn P fr Φ B α P rt P P- φ cn P CΛ P CL CL φ Φ 3 P rt d P- P Ω P P- tn Φ tc P d Φ Φ
Φ P Φ CΛ Φ 3 P- TJ iQ d • cn P P cn o tr rt iQ Φ P- N Φ P — - cn
Φ TJ ^ tr tr P- P φ Φ P P tr rt ^ P P Ω Φ Ω EP P Φ P cn Ω P p-
Φ P1 P P d P P rt fr cn rt P Φ Φ cn d P- tr 3 tr Φ P- tn P tr 1 Tr N
P P- P P P d ^ rt Ω Φ tr P- s Hl - cn iQ » rt 1 3 •
Φ Ω N d rt M P tr P P t "^ *ι P d
3 tr n ^ Z φ N P- cn rt CΛ P- CL P rt P s P" p- P P tr N P Φ Φ Q d φ tr P TJ rt φ Φ Hi z Φ Ω TJ iQ P cn Φ φ P- P rt Φ P cn Φ rt tn 3 3 tr P CL P- Φ _; p- P- d: ω E tr TJ P Φ α Φ cn & O M d rt P CL P- P- Φ to cn Φ PJ φ cn cn CQ Φ P tr P- Φ 3 o P cn 3 d P P Hi
Φ CL ιQ rt P N P- P tr CL Ω rt P P rt P P • Ω Φ s: p: tn Φ cn z CL
P1 Φ z P cn cn Φ P cn P- • φ tn Λ tr Φ cn rt Φ α P1 co tr P P- EP Ω P iQ φ P- rt P φ P P- Ω P- P cn Φ tn z TJ - l P rt P tr tn CL φ tr N Φ P- P
P- P" iQ tr iQ ^ rt H P- Φ Φ P- s: P Z P- Φ CL CL 3 φ P rt iQ d tn rt N P P- rt PI CL P- P < P- fr o O 3 CL TJ Φ P P- iQ rt Φ Φ P P p: Φ P
P Ω Φ φ P Φ Q P Φ P Φ Φ cn rt CL CL d p P P P L P P . P 3 rt P P tr P P- 1 CL P P- Φ P P Φ P φ Φ cn tf tn o CL P- P tr o d
3 Φ rt φ cn to iQ P tf d P P cn P cn N φ i P1 Cd > P tr Q P
P P P P P P- rt Φ Hl tr pj: P 3 TJ Hl φ P Φ P. cn o d P Φ Φ iQ cn
P P" tr Φ Ω P- cn cn P P Φ * P = P P rt ω P- < P tn CL P tn tn tr P ω P tr 3 tr rr Ω rt cn rt tr P Pi P1 P Φ Φ ω Hl ω φ o P1 iQ P- tr Φ α Φ
Ω P d Ω iQ Φ p Φ tr Φ rt P P d cn Ω P P cn TJ tn P P- CL P iQ P P P- tr P Hl tr P- tr CL P-1 P P- P- P Hl ** tr Ω P P Φ • φ φ P P" CL P P
P1 α Φ P Φ CΛ P P P" α Cn 3 cn CL s: φ Φ tr tr P tn Q 3 iQ iQ tr Φ φ
P- P- P- P- TJ Hl P rt d Ω p cn Φ CL P- P Φ P Ω rt cn Φ rt öd P
Φ iQ P rt Φ φ rt iQ Φ P tr rt Φ P- Φ P Φ d z P- Φ tr CΛ N Hi Φ Φ P
EP P rt P- fr Φ φ P Ω Φ Φ cn Φ tn P P- rt φ rt CL tn TJ tn φ d P- P- P P CL φ iQ P Φ P rt cn tr P- P P rt Φ cn P p- rt φ P- P O P^ cn P" P P P
P Φ CL tn φ P d rt CΛ N CL < P rt 1 P1 P iQ P 3 φ rt rt Φ CΛ CL P-
CL Pi φ tn φ P Φ TJ d d ^ O TJ 1 P- P- P- TJ P Ω P- Tr P Φ P TJ tr rt
P- P cn P CL φ Hi P P P o > 3 P z iQ P1 CΛ P tr rt o P P P P rt
CL P- Hi O Φ Tr d: iQ Φ cn Φ d p P- φ • TJ P1 cn 3 CL rt Φ P Φ Φ
P rt O z P tf tn rt rt tr Λ CΛ P- P- cn P" ^ φ co P N P- Z Φ P Ω P- P cn Φ P- cn P rt Φ P P P d TJ rt P cn O H P Φ ιQ P- d > P cn tr rt
P iQ φ r tr P- P d Φ P Φ φ P- iQ TJ cn cn tr φ Ω P- P φ P tsi rt cn φ ö rt Φ Φ φ 3 3 P 1 P fr O Φ P φ ci Φ P- tr rt P P- Φ P- φ Φ P P P N rt P 1 P P to P- P 1 1 P1 Φ 1 P iQ
1 P 1 1 1 l 1 φ P 1
tektieren durch Vergleich eines Verhältnisses von Kurzeitsignalenergie zu Langzeitsignalenergie mit einem Schwellwert realisiert.
Alternativ dazu kann die Unterscheidung durch Vergleich der Kurzzeitsignalenergie - d.h. der Signalenergie in einem kurzen Zeitausschnitt des Schmalband-Sprachsignals - und der Langzeitsignalenergie - d.h. der Signalenergie über einen längeren Zeitausschnitt betrachtet - und anschließendem Ver- gleich des Verhältnis Kurzzeit- zu Langzeitenergie mit einem festen Schwellwert durchgeführt werden.
Außerdem werden in einem dritten Prozessschritt P2.3 die schmalbandigen Sprachsignalzeitabschnitte derart nichtlinear, vorzugsweise durch spektrale Spiegelung, verarbeitet, dass jeweils ein modifizierter Sprachsignalzeitabschnitt erzeugt wird, der einerseits den jeweiligen im wesentlichen unveränderten schmalbandige Sprachsignalzeitabschnitt und andererseits oberhalb der ersten Grenzfrequenz durch die nichtlinea- re Signalverarbeitung erzeugte Signalanteile enthält.
Im Anschluss daran werden in einem vierten Prozessschritt P3.3 die modifizierten Sprachsignalzeitabschnitte in bezug auf die vorgenommene lautartbezogene Klassifizierung derart unterschiedlich gefiltert werden, dass aus den modifizierten Sprachsignalzeitabschnitten breitbandige erweiterte Sprachsignalzeitabschnitte und damit ein breitbandiges erweitertes Sprachsignal entsteht, wobei im Fall eines stimmhaften Sprachsignalzeitabschnittes wenig Energie oberhalb von der ersten Grenzfrequenz - z.B.4 kHz - und im Fall eines stimmlosen Sprachsignalzeitabschnittes mehr Energie oberhalb von der ersten Grenzfrequenz - z.B. 4 kHz -durchgelassen wird.
Ausgehend von der FIGUR 8 soll anhand FIGUREN 9a bis 9d zu- nächst die erfindungsgemäße Erweiterung eines bandbegrenzten Sprachsignals in die Richtung der unteren Frequenzen bzw. die Widerhersteilung der unteren Frequenzanteile erläutert werden.
Wie eingangs diskutiert ist aus der EP 0 994 464 bereits eine spektrale Wiederherstellung von Signalanteilen des unteren Frequenzbereichs eines durch eine Hochpassfunktion zu tiefen Frequenzen hin begrenzten Sprachsignals bekannt, wobei die Wiederherstellung durch Generieren von Frequenzen des unteren Frequenzbereichs durch eine nichtlineare Signalverarbeitung erfolgt, wobei dazu subharmonische Frequenzen des Signals erzeugt und zum Hochpasssignal hinzu addiert werden.
Bei bestehenden, insbesondere dem aus der EP 0 994 464 bekannten, Verfahren zur Erweiterung der unteren Frequenzen ist es erforderlich, die Filtercharakteristik, mit der ein Signal an einem fernen Telekommunikationsendgerät gefiltert wurde, zu kennen. Im Allgemeinen sind derartige Verfahren nur unter Verwendung von Telekommunikationseinrichtungen mit gleicher Charakteristik, d.h. Telekommunikationsendgeräte gleichen Typs, optimal einsetzbar, da deren Filtercharakteristik gleich bzw. angepasst ist.
In heterogenen Systemen, wo eine Vielzahl unterschiedlicher Telekommunikationsgeräte sowie unterschiedliche Typen von Te- lekommunikationsgeräten Verwendung finden, sind diese Verfahren nicht einsetzbar, da unterschiedliche Typen von Telekommunikationsgeräten, z.B. Siemens-Telekommunikationsgeräten wie in FIGUR 8 gezeigt, unterschiedliche Filtercharakteristiken aufweisen.
Das erfindungsgemäße Verfahren erlaubt in heterogenen Systemen die Erweiterung bandbegrenzter Sprachsignale im unteren Frequenzbereich, da gemäß der Erfindung Filtercharakteristiken durch eine Schätzung ermittelt werden, wobei für die Schätzung zunächst von einem, wie in der FIGUR 9a dargestellten, Sprachsignal ein erstes, wie in der FIGUR 9b dargestelltes, Restsignal (first residual signal) , auch Prädiktionsfeh-
P CL iQ Φ CL Ξ > tn P cn rt rt P φ N t-*] H CL Ω P O CL t^l CΛ P- P- CΛ ö P CL P
P Φ φ P- P- P- d Ω p: rt Φ Φ P P- Φ H P Φ tr P- P Φ P TJ 3 cn TJ P P Φ P Φ fr P cn P fr P cn tf rt Φ P P P1 P cn cn Pi P P tn cn cn φ P rt P - CL tn Φ P rt Ω φ rt Q 3 P1 cn φ cn o P Φ ,Q P <: P Φ cn
Φ iQ tr 3 P- φ P * CΛ O cn to P to P d P ^ d Ω Φ Ω Z P Φ TJ P-
P Φ P= o P- tr P1 P rt TJ P P- — 3 Φ Tr P CL P- φ tr P tr P- Φ P P iQ
P- cn rt N P P Φ er tn Φ P Φ P <! Φ J^ P cn rt C i 1 P tn iQ P- cn Φ tn p: P cn Ω N z cn P P P P P O P- rt rt Φ Φ rt N P- P1 Φ P- <! rt CL P rt tr rt φ Pi φ CL P CΛ Ω N to P P N P- cn P CL P Φ tr iQ Φ <Q P φ Φ P- P1
P- : P- Φ P- L TJ J tr Pi P- φ Φ o P- P- φ p: P Φ P p- cn P d P P fr
Tr rt cn rt tr P < P- P P cn P Ω Φ P- P iQ cn 3 rt cn P P Ω TJ P cn P rt i ιsι o Φ P> φ o iQ P O P- Φ tr P- <! iQ φ P rt ^ Φ P1 tr φ P1 P TJ P- Φ tr rt Z P φ 3 P Ω N iQ Λ rt P P- rt P P P- er tr P- cn Tr <1 CL tr Φ O P φ Φ p- P iQ tf Φ P d d Φ φ P" fr Φ P CL Ω 3 rt Φ Φ Φ cn P P
P P φ TJ cn ω φ Φ tn cn P Φ P 3 P P d: φ P P Φ tr p- P P P P- rt cn P φ P P- P P- Pi P- cn P1 P i rt P tr P CL Φ 0- P Z rt P P rt cn 3 P
Ω ^ P- o vQ cn P P- vQ Φ cn N PI Φ tf Φ φ d Ω tr P p- P1 P t^ d P- φ rt tr P- P N P rt φ P1 P tn . CL φ P P P P tr Φ CL P Φ P- Φ tr P P iQ rt ->
P P" Φ P Φ 3 rt P 1 Φ P1 S P iQ Ω P iQ P tr Φ Φ Ω iQ P tr φ rt φ cn P" P Φ Z O P φ Φ CL CL P- p- Φ P cn Φ P- 3 ^ P- tr cn P o CL rt Φ P- tn tn P P- Φ N fr rt P- φ iQ rt Φ N P O rt cn P1 CL d
P P cn tr TJ Ω rt iQ P 3 d o tr Φ Φ Φ Φ P CΛ d p- P d P- Ω cn Φ P z Ω φ Ω N P tr Φ Φ CL pj: d P 3 o P- P- Hi P N TJ ^ P 3 P rt pr Ω
P- tr 3 tr z O 3 tn tn EP • rt p CL P t^ P d: rt P Φ H iQ Φ P Φ tr tr
P P P • N P Φ z Φ d φ φ P- tr t P tr cn -J. CL 5 P P- P Φ
CL P CL P- Φ -> CΛ P p- CL co P P — tn P1 d P φ tr Ω Φ H Φ "> P rt rt P CL
• P P rt to cn tr TJ CL φ Φ o Φ P- rt P rt cn P tr P t cn cn rt rt Hl Φ P- fT P- rt φ cn P P Φ CL 3 o P fr N rt cn α d Φ P Ω Φ rt rt cn cn P P rt Φ P d B Φ rt rt
P Φ cn ^ P- P- ιo t Φ Φ P P1 tr
Φ rt TJ rt Ω α Ω • P > w ^ rt P P1 Ω P ≤ P- iQ tn CL P d tr P1 P P
P Φ P1 cn tr P- tr d N P P- P tr cn O Q P P rt to cn tr — ^ φ φ φ d
P- P • P- P iQ tn C <! cn Φ o H d P Ω tr P er P Φ Ω rt P < Tr P rt cn cn Λ. ιQ P- P- tn o iQ 1 > P P Pi P tr Φ P Pi P< d P Φ Φ P P rt J P rt iQ i P P d cn z CL P P- P- P1 p: P rt CL P P P P fr z CL
P- P CL P rt Φ P P CL Φ Q φ P- fr Φ P1 P- CL P P "< P P P- φ fT O P- P1 Hi P P- CL iQ Φ P Φ P- P rt CL P- Φ P- 3 Φ P to CΛ rt P P P
N φ TJ P- P- Φ φ cn tn N P rt Q Φ P P- rt P1 tr iQ Φ rt P CL
Φ Φ tr O P1 i 3 N Φ p: Φ P P P- tn P φ φ Φ cn d tu P- tr
P- tn t=i Φ • rt <! rt d cn P rt P P P- Ω tr Φ P CL e ω rt rt φ cn p-
P cn P- P Λ» Φ o H-3 cn Ω d 3 cn tr φ s: rt P- P rt cn rt d rt z z rt φ cn P" Φ P P cn φ rt tr d iQ P 3 rt Φ cn CΛ P- Hl Q P Φ P- iQ rt . φ o Φ
Ω rt Ω CL rt • o P- P 3 P Φ cQ ω P- P O Ω P Φ P1 iQ P Φ P tr P
P- tr φ tr P Φ 3 Φ P P rt tn Tr P tr α P P- P1 P P P Φ P
P P P P tn P P- fr CL P1 φ Φ CL Φ t^l CL p: P Ω P- rt P rt P- rt
< P- Ω Φ rt o tr P P φ p- P> P φ rt 3 rt tr 3 Φ P1 tu φ d φ rt tr rt N CΛ 3 P tr CL P P P- Φ P N P- Φ P cn P1 Φ cn P
P rt P d TJ Z p N P P Φ φ Φ & φ d rt P P d: UD tn P- cn P iQ P P- d CL P1 rt Cd P Pi d P P tr CΛ υD ω cn φ tr
Φ J P cn Φ P φ P CL P- tr Φ P φ Φ φ iQ φ TJ P- 00 «• Ω Φ r Tr O tr Ω CL P- Φ ιQ P P < P P P- P- O CL P Φ P - — tr Cd fr
Tl • rt O: tr Φ fr cn Φ P P- rt N P CL φ 3 φ rt fr cn ^ o φ P
P- j- Φ CL P tn P P Q P- CΛ CL φ • tr φ Φ cn p P P rt er tr σ P P P
P P P- P- rt CL Φ P TJ tr P p: P Φ d P P Φ Φ P- Φ P rt P P- tn i iQ Φ P- P Hl Φ P P rt P s P P t^l Q d tn Tr iQ CL Ω rt
Φ P cn tn φ P P- o P P- P P Φ Φ CL φ ^ P- P1 Φ 3 O P P- d tr Φ
P tr rt P P P iQ P1 Ω P- P φ cn P- « fr P P P P rt P P
Ω P P- P- J n Φ rt N tr rt P cn Φ P P φ CL P- P P Ω d t-i tr P fr P P iQ 1 Φ z cn φ TJ P d rt P rt fr P Φ φ rt P" tr P P-
P CL p: φ P φ P- P P Φ P P- Φ cn P Φ iQ P 1 1 1 1 p- iQ o Q P rt 1 P φ Φ
1 1 1 1 1 1
Mit der inversen Filtercharakteristik wird anschließend in einem vierten Prozessschritt P3.4 ein inverses Filter berechnet, mit dem das zugrundeliegende schmalbandige Sprachsignal entzerrt wird sowie die tiefen Frequenzen angehoben werden, wobei es hierzu erforderlich ist, dass die notwendige Verstärkung der tiefen Frequenzen nicht zu groß gewählt wird, da sich sonst das Verhältnis von Signal zu Störleistung, im Allgemeinen mit Störabstand bezeichnet, deutlich verschlechtert.
Unter Einhaltung dieser Bedingung liegt nach erfolgter Entzerrung das breitbandige in Richtung der unteren Frequenzen erweiterte Sprachsignal vor, so dass eine Qualitätsverbesserung von Sprache in einem Telekommunikationsendgerät bei Einsatz dieses Verfahrens erzielt wird.
Die Entzerrung bedeutet hierbei das Filtern des schmalbandigen Sprachsignals mit der geschätzten inversen Filtercharak- teristik, d.h. tiefe Frequenzen werden verstärkt und die Verstärkung wird anhand der inversen Filtercharakteristik be- stimmt.
Weiterhin kann das in EP 0 994 464 beschriebene Verfahren dadurch verbessert werden, dass die nichtlineare Signalverarbeitung, bei der subharmonische Frequenzen des Sprachsignals erzeugt werden, durch eine Betragsbildung des Signals (Doppelgleichrichtung) oder durch eine Einweggleichrichtung des Signals, die einfacher als die bereits bekannte Multiplikation des schmalbandigen Sprachsignals mit einer Funktion dieses Signals zu realisieren ist, ersetzt wird, was den relativ ho- hen Signalverarbeitungsaufwand, den die in EP 0 994 464 beschriebene nichtlineare Signalverarbeitung zur Folge hat, vermeidet .
FIGUR 5 zeigt anhand eines Ablaufdiagramms einen fünften Pro- zess (eine fünfte Methode) zur Erweiterung der Brandbreite eines von einem Telekommunikationsgerät gesendeten Sprachsignals in Richtung der unteren Frequenzen unterhalb einer zwei- co co > N> P1 P1 cπ o cπ 0 cn 0 cπ
d φ
P P cn
TJ d z:
P P cn
P O iQ tr
PJ rt
P- Φ
Ω tr ^
Φ P
P Φ
Λ
CΛ d
P- φ iQ P
P N
P Φ
P1 P iQ φ
Φ P tr N
O: φ
P d φ iQ
P rt
.
Z φ
P
CL φ
P
Tr
O:
P
P φ
P
-<
CL
P-
Φ
P
P-
Ω tr rt
N d
3
In einem fünften Prozessschritt P4.5 wird das Ergebnis der nichtlinearen Signalverarbeitung einer Bandpassfilterung unterzogen, um unerwünschte Signalanteile zu reduzieren, die außerhalb des zu synthetisierenden Frequenzbereichs liegen.
Alternativ zur Bandpassfilterung kann auch eine Tiefpassfilterung vorgenommen werden. Die Tiefpassfilterung kommt im Allgemeinen dann zum Einsatz, wenn der im zu filternden Signal immer vorhandene Gleichanteil gering ist.
Schließlich wird in einem sechsten Prozessschritt P5.5 das derart gefilterte Signal mit dem zugrundeliegenden Sprachsignal vorzugsweise durch Addition verknüpft, so dass als Ergebnis das breitbandige in Richtung der unteren Frequenzen er- weiterte Sprachsignal vorliegt.
Eine nicht dargestellte Kombination der in FIGUR 4 und FIGUR 5 dargestellten Verfahren, d.h. eine Kombination von nichtlinearer Signalverarbeitung und Entzerrung des schmalbandigen Sprachsignals ist ebenso denkbar, solange die bei dem Ausführungsbeispiel gemäß FIGUR 4 diskutierte Bedingung, dass die notwendige Verstärkung nicht zu groß ist, erfüllt ist.
Dabei werden die beiden Verfahren derart kombiniert, dass zu- nächst das schmalbandige Signal mit dem berechneten inversen Filter entzerrt und anschließend die nichtlineare Signalverarbeitung angewendet wird.
Des Weiteren ist eine - ebenfalls nicht dargestellte - Kombi- nation des erfindungsgemäßen Verfahrens zur Erweiterung schmalbandiger Sprachsignale im oberen Frequenzbereich mit dem Verfahren zur Erweiterung schmalbandiger Sprachsignale im unteren Frequenzbereich, die man als "Wideband Speech Exten- der" bezeichnen kann, besonders vorteilhaft, da sie die Syn- these eines breitbandigen Sprachsignals gewährleistet, das dem zugrundeliegenden Sprachsignal am nächsten kommt, so dass ein Nutzer eines Telekommunikationsendgerätes, welches den „Wideband Speech Extender* einsetzt, ein Sprachsignal hoher Qualität, vergleichbar mit der Qualität bei Sprachsignalen in Radio- und Fernsehgeräten, hört.
Damit kann der „Wideband Speech Extender* in Telekommunikationsgeräten, wo eine bandbegrenzte Übertragung von Sprachsignalen stattfindet, eingesetzt werden, um beim Benutzer den Eindruck einer breitbandige Übertragung zu erzeugen.
Neben dem erfindungsgemäßen Verfahren zur Erweiterung eines schmalbandigen Sprachsignales im oberen Frequenzbereich kann auch der „Wideband Speech Extender* in Telekommunikationssystemen eingesetzt werden, wo das „WB/NB-Switchingλ -Problem auftritt, so dass stets ein breitbandiges Sprachsignal und damit eine weitgehend konstante Qualität gewährleistet ist.

Claims

Patentansprüche
1. Verfahren zur Erweiterung der Brandbreite eines schmalbandig gefilterten Sprachsignals, insbesondere eines von einem Telekommunikationsgerät gesendeten Sprachsignals, dadurch gekennzeichnet, dass das schmalbandige Sprachsignal in bezug auf Frequenzanteile oberhalb einer ersten Grenzfrequenz und unterhalb einer zweiten Grenzfrequenz getrennt voneinander geschätzt und auf der Basis dieser jeweiligen Schätzung erweitert wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Schätzung im Zeitbereich durchgeführt wird.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Schätzung im Frequenzbereich durchgeführt wird.
4. Verfahren zur Erweiterung der Brandbreite eines schmalbandig gefilterten Sprachsignals, insbesondere eines von einem Telekommunikationsgerät gesendeten Sprachsignals, oberhalb einer ersten Grenzfrequenz des schmalbandigen Sprachsignals, bei dem a) das schmalbandige Sprachsignal in Sprachsignalzeitabschnitte unterteilt wird (P0.1) und jeweils eine spektrale Struktur der Sprachsignalzeitabschnitte berechnet wird (Pl.l), b) jeder schmalbandige Sprachsignalzeitabschnitt als ein stimmhafter Laut oder als ein stimmloser Laut klassifiziert wird (P2.1) , dadurch gekennzeichnet, dass c) eine spektrale Struktur aufweisende Ergänzungen zur Erweiterung des schmalbandigen Sprachsignals in bezug auf die in b) vorgenommene lautartbezogene Klassifizierung erzeugt werden (P3.1), wobei insbesondere zumindest für den Fall des stimmhaften Lautes die Ergänzung unabhängig von dem jeweiligen Laut ist, d) die spektrale Struktur des schmalbandigen Sprachsignal- zeitabschnittes und die spektrale Struktur der erzeugten Ergänzung zeitabschnittsweise derart verknüpft werden
(P3.1), dass jeweils eine erweiterte spektrale Struktur entsteht, e) aus der erweiterten spektralen Struktur jeweils ein breitbandiger erweiterter Sprachsignalzeitabschnitt erzeugt wird (P3.1), f) aus den einzelnen breitbandigen erweiterten Sprachsignalzeitabschnitten ein breitbandiges erweitertes Sprachsignal erzeugt wird (P6.1).
5. Verfahren nach Anspruch 1 oder 3, dadurch gekennzeichnet, dass oberhalb der ersten Grenzfrequenz des schmalbandigen Sprachsignals a) das schmalbandige Sprachsignal in Sprachsignalzeitabschnitte unterteilt wird (P0.1) und jeweils eine spektrale Struktur der Sprachsignalzeitabschnitte berechnet wird (Pl.l), b) jeder schmalbandige Sprachsignalabschnitt als ein stimmhafter Laut oder als ein stimmloser Laut klassifiziert wird (P2.1), c) eine spektrale Struktur aufweisende Ergänzungen zur Erweiterung des schmalbandigen Sprachsignals in bezug auf die in b) vorgenommene lautartbezogene Klassifizierung erzeugt werden (P3.1), wobei insbesondere zumindest für den Fall des stimmhaften Lautes die Ergänzung unabhängig von dem jeweiligen Laut ist, d) die spektrale Struktur des schmalbandigen Sprachsignalzeitabschnittes und die spektrale Struktur der erzeugten Ergänzung zeitabschnittsweise derart verknüpft werden (P3.1), dass jeweils eine erweiterte spektrale Struktur entsteht, e) aus der erweiterten spektralen Struktur jeweils ein breitbandiger erweiterter Sprachsignalzeitabschnitt erzeugt wird (P3.1), f) aus den einzelnen breitbandigen erweiterten Sprachsignal- Zeitabschnitten ein breitbandiges erweitertes Sprachsignal erzeugt wird (P6.1).
6. Verfahren nach Anspruch 4 oder 5, dadurch gekennzeichnet , dass die spektrale Struktur des schmalbandigen Sprachsignalzeitabschnittes durch eine FFT-Analyse berechnet wird und aus der erweiterten spektralen Struktur durch eine IFFT-Analyse der breitbandige erweiterte Sprachsignalzeitabschnitt erzeugt wird.
7. Verfahren zur Erweiterung der Brandbreite eines schmalbandig gefilterten Sprachsignals, insbesondere eines von einem Telekommunikationsgerät gesendeten Sprachsignals, oberhalb einer ersten Grenzfrequenz des schmalbandigen Sprachsignals, bei dem a) das schmalbandige Sprachsignal in Sprachsignalzeitabschnitte unterteilt wird (PO.2) und jeweils eine spektrale Struktur der Sprachsignalzeitabschnitte berechnet wird (P1.2, P2.2), b) jeder schmalbandige Sprachsignalzeitabschnitt als ein stimmhafter Laut oder als ein stimmloser Laut klassifiziert wird (P3.2) , dadurch gekennzeichnet, dass c) eine spektrale Struktur aufweisende Ergänzungen zur Erwei- terung des schmalbandigen Sprachsignals in bezug auf die in b) vorgenommene lautartbezogene Klassifizierung erzeugt werden (P4.2), wobei zumindest für den Fall des stimmhaften Lautes die Ergänzung unabhängig von dem jeweiligen Laut ist, d) die spektrale Struktur des schmalbandigen Sprachsignalzeitabschnittes und die spektrale Struktur der erzeugten Ergänzung zeitabschnittsweise derart verknüpft werden (P4.2), dass jeweils eine erweiterte spektrale Struktur entsteht, e) bezuglich der Zeitabschnittdauer den schmalbandigen Sprachsignalzeitabschnitten entsprechende Pradiktionsfeh- lersignalzeitabschnitte eines breitbandigen Pradiktions- fehlersignals erzeugt werden (P5.2) und aus der erweiterten spektralen Struktur und dem jeweiligen breitbandigen Pradiktionsfehlersignalzeitabschnitt jeweils ein breitbandiger erweiterter Sprachsignalzeitabschnitt erzeugt wird (P6.2, P7.2), f) aus den einzelnen breitbandigen erweiterten Sprachsignalzeitabschnitten ein breitbandiges erweitertes Sprachsignal erzeugt wird (P10.2).
8. Verfahren nach Anspruch 1 oder 3, dadurch gekennzeichnet, dass oberhalb der ersten Grenzfrequenz des schmalbandigen Sprachsignals a) das schmalbandige Sprachsignal in Sprachsignalzeitabschnitte unterteilt wird (PO.2) und jeweils eine spektrale Struktur der Sprachsignalzeitabschnitte berechnet wird (P1.2, P2.2), b) jeder schmalbandige Sprachsignalzeitabschnitt als ein stimmhafter Laut oder als ein stimmloser Laut klassifiziert wird (P3.2) , c) eine spektrale Struktur aufweisende Ergänzungen zur Erweiterung des schmalbandigen Sprachsignals m bezug auf die m b) vorgenommene lautartbezogene Klassifizierung erzeugt werden (P4.2), wobei zumindest für den Fall des stimmhaften Lautes die Ergänzung unabhängig von dem jeweiligen d) die spektrale Struktur des schmalbandigen Sprachsignalzeitabschnittes und die spektrale Struktur der erzeugten Ergänzung zeitabschnittsweise derart verknüpft werden
(P4.2), dass jeweils eine erweiterte spektrale Struktur entsteht, e) bezuglich der Zeitabschnittdauer den schmalbandigen Sprachsignalzeitabschnitten entsprechende Pradiktionsfeh- lersignalzeitabschnitte eines breitbandigen Prädiktions- fehlersignals erzeugt werden (P5.2) und aus der erweiterten spektralen Struktur und dem jeweiligen breitbandigen Prädiktionsfehlersignalzeitabschnitt jeweils ein breitbandiger erweiterter Sprachsignalzeitabschnitt erzeugt wird (P6.2, P7.2), f) aus den einzelnen breitbandigen erweiterten Sprachsignalzeitabschnitten ein breitbandiges erweitertes Sprachsignal erzeugt wird (P10.2).
9. Verfahren nach Anspruch 7 oder 8, dadurch gekennzeichnet, dass die für die als stimmhafte Laute klassifizierten schmalbandigen Sprachsignalzeitabschnitte jeweils erzeugte Ergänzung derart erzeugt wird (P4.2), dass die Energie dieser Ergänzung in bezug auf die Gesamtenergie des schmalbandigen Sprachsignalabschnittes vernachlässigbar ist.
10. Verfahren nach einem der Ansprüche 7 bis 9, dadurch gekennzeichnet, dass die für die als stimmlose Laute klassifizierten schmalbandigen Sprachsignalabschnitte jeweils erzeugte Ergänzung derart erzeugt wird (P4.2), dass die Energie dieser Ergänzung in bezug auf die Gesamtenergie des schmalbandigen Sprachsignalab- Schnittes nicht vernachlässigbar ist.
11. Verfahren nach einem der Ansprüche 7 bis 9, dadurch gekennzeichnet, dass die für die als stimmlose Laute klassifizierten schmalbandi- gen Sprachsignalzeitabschnitte jeweils erzeugte Ergänzung derart erzeugt wird (P4.2), dass auf Basis von zumindest einem Breitband-Codebuch aus ersten Filterkoeffizienten des schmalbandigen Sprachsignalzeitabschnittes zweite Filterkoeffizienten eines breitbandigen Sprachsignalzeitabschnittes er- mittelt werden.
12. Verfahren nach einem der Ansprüche 7 bis 10, dadurch gekennzeichnet, dass aus der erweiterten spektralen Struktur jeweils dritte Filterkoeffizienten berechnet werden (P6.2).
13. Verfahren nach Anspruch 11 oder 12, dadurch gekennzeichnet, dass mit den zweiten oder dritten Filterkoeffizienten und dem breitbandigen Prädiktionsfehlersignalzeitabschnitt breitban- dige erweiterte Sprachsignalzeitabschnitte und damit das breitbandige erweiterte Sprachsignal synthetisiert werden (P7.2) .
14. Verfahren nach Anspruch 12, dadurch gekennzeich- n e t , dass a) die dritten Filterkoeffizienten mit den Einträgen aus einem Breitband-Codebuch verglichen werden und b) der Eintrag in dem Breitband-Codebuch, der am besten zu den dritten Filterkoeffizienten passt, als Filterkoeffi- zient der Synthese des breitbandigen erweiterten Sprach- signals zugrundegelegt wird.
15. Verfahren nach Anspruch 4, 5, 7, 8, 9 oder 10, dadurch gekennzeichnet, dass die erzeugte Ergänzung abfällt, exponentiell abfällt, ansteigt, gleichbleibendes Nullniveau aufweist oder gleichbleibendes Niveau aufweist.
16. Verfahren nach Anspruch 4, 5, 7, oder 8, dadurch ge- ke nzeichnet, dass der aus der erweiterten spektralen Struktur jeweils erzeugte breitbandige erweiterte Sprachsignalzeitabschnitt hochpassge- filtert wird (P4.1, P8.2), der hochpassgefilterte Sprachsignalzeitabschnitt mit dem entsprechenden schmalbandigen Sprachsignalzeitabschnitt verknüpft wird (P5.1, P9.2) und aus den einzelnen verknüpften Sprachsignalzeitabschnitten das breitbandige erweiterte Sprachsignal erzeugt wird (P6.1, P10.2) .
17. Verfahren zur Erweiterung der Brandbreite eines sch al- bandig gefilterten Sprachsignals, insbesondere eines von einem Telekommunikationsgerät gesendeten Sprachsignals, oberhalb einer ersten Grenzfrequenz des schmalbandigen Sprachsignals, bei dem a) das schmalbandige Sprachsignal in Sprachsignalzeitab- schnitte unterteilt wird (PO.3), b) jeder schmalbandige Sprachsignalzeitabschnitt als ein stimmhafter Laut oder als ein stimmloser Laut klassifiziert wird (PI .3) , dadurch gekennzeichnet, dass c) die schmalbandigen Sprachsignalzeitabschnitte derart nichtlinear verarbeitet werden (P2.3), dass jeweils ein modifizierter Sprachsignalzeitabschnitt erzeugt wird, der einerseits den jeweiligen im wesentlichen unveränderten schmalbandige Sprachsignalzeitabschnitt und andererseits oberhalb der ersten Grenzfrequenz durch die nichtlineare Signalverarbeitung erzeugte Signalanteile enthält, d) die modifizierten Sprachsignalzeitabschnitte in bezug auf die in b) vorgenommene lautartbezogene Klassifizierung derart unterschiedlich gefiltert werden (P3.3), dass aus den modifizierten Sprachsignalzeitabschnitten breitbandige erweiterte Sprachsignalzeitabschnitte und damit ein breitbandiges erweitertes Sprachsignal entsteht.
18. Verfahren nach Anspruch 1 oder 2, dadurch gekenn- zeichnet, dass oberhalb der ersten Grenzfrequenz des schmalbandigen Sprachsignals a) das schmalbandige Sprachsignal in Sprachsignalzeitabschnitte unterteilt wird (PO.3), b) jeder schmalbandige Sprachsignalzeitabschnitt als ein stimmhafter Laut oder als ein stimmloser Laut klassifiziert wird (PI .3) , c) die schmalbandigen Sprachsignalzeitabschnitte derart nichtlinear verarbeitet werden (P2.3), dass jeweils ein modifizierter Sprachsignalzeitabschnitt erzeugt wird, der einerseits den jeweiligen im wesentlichen unveränderten schmalbandige Sprachsignalzeitabschnitt und andererseits oberhalb der ersten Grenzfrequenz durch die nichtlineare Signalverarbeitung erzeugte Signalanteile enthält, e) die modifizierten Sprachsignalzeitabschnitte in bezug auf die in b) vorgenommene lautartbezogene Klassifizierung derart unterschiedlich gefiltert werden (P3.3), dass aus den modifizierten Sprachsignalzeitabschnitten breitbandige erweiterte Sprachsignalzeitabschnitte und damit ein breitbandiges erweitertes Sprachsignal entsteht.
19. Verfahren nach Anspruch 17 oder 18, dadurch gekennzeichnet, dass die für die als stimmhafte Laute klassifizierten schmalbandigen Sprachsignalzeitabschnitte jeweils durch die nichtlineare Signalverarbeitung erzeugten Signalanteile derart erzeugt werden (P2.3), dass die Energie des jeweiligen Signalanteils in bezug auf die Gesamtenergie des schmalbandigen Sprachsig- nalzeitabschnittes vernachlässigbar ist.
20. Verfahren nach einem der Ansprüche 17 bis 19, dadurch geke nzeichnet, dass die für die als stimmlose Laute klassifizierten schmalbandigen Sprachsignalabschnitte jeweils durch die nichtlineare Signalverarbeitung erzeugten Signalanteile derart erzeugt werden (P2.3), dass die Energie des jeweiligen Signalanteils in bezug auf die Gesamtenergie des schmalbandigen Sprachsignalzeitabschnittes nicht vernachlässigbar ist
21. Verfahren nach einem der Ansprüche 17 bis 20, dadurc gekennzeichnet, dass die Signalanteile durch spektrale Spiegelung erzeugt werden.
22. Verfahren nach einem der Ansprüche 4 bis 21, dadurch gekennzeichnet, dass die schmalbandigen Sprachsignalzeitabschnitte gleich lang gewählt werden. 5
23. Verfahren zur Erweiterung der Brandbreite eines schmalbandig gefilterten Sprachsignals, insbesondere eines von einem Telekommunikationsgerät gesendeten Sprachsignals, unterhalb einer zweiten Grenzfrequenz des schmalbandigen Sprach-
10 Signals, bei dem a) ein Prädiktionsfehlersignal des schmalbandigen Sprachsignals berechnet wird (PO.4, PO.5), dadurch gekennzeichnet, dass b) die Filtercharakteristik des schmalbandig gefilterten 15 Sprachsignals anhand des Prädiktionsfehlersignals geschätzt wird (P1.4, P1.5), c) auf Basis der Filtercharakteristik ein Prozess zur Bearbeitung des schmalbandigen Sprachsignals derart gesteuert wird (P2.4, P2.5, P3.5, P4.5, P5.5), dass ein breitbandi-
20 ges erweitertes Sprachsignal erzeugt wird.
24. Verfahren nach einem der Ansprüche 1 bis 22, dadurch gekennzeichnet, dass unterhalb der zweiten Grenzfrequenz des schmalbandigen Sprachsignals,
25 a) ein Prädiktionsfehlersignal des schmalbandigen Sprachsignals berechnet wird (PO.4, PO.5), b) die Filtercharakteristik des schmalbandig gefilterten Sprachsignals anhand eines Prädiktionsfehlersignals des schmalbandigen Sprachsignals geschätzt wird (P1.4, P1.5),
30. c) auf Basis der Filtercharakteristik ein Prozess zur Bearbeitung des schmalbandigen Sprachsignals derart gesteuert wird (P2.4, P2.5, P3.5, P4.5, P5.5), dass ein breitbandiges erweitertes Sprachsignal erzeugt wird.
35 25. Verfahren nach Anspruch 23 oder 24, dadurch gekennzeichnet, dass die Filtercharakteristik des schmalbandig gefilterten Sprachsignals geschätzt wird, indem die in mindestens zwei Frequenzbereichen gemessenen Teilenergien des Prädiktionsfehlersignals verglichen und aus den daraus resultierenden Energiedifferenzen Rückschlüsse auf die Filtercharakteristik des schmalbandig gefilterten Sprachsignals gewon- nen werden.
26. Verfahren nach einem der Ansprüche 23 bis 25, dadurch gekennzeichnet, dass a) auf Basis der geschätzten Filtercharakteristik eine dazu inverse Filtercharakteristik ermittelt wird, b) in dem Bearbeitungsprozess das schmalbandigen Sprachsignal gemäß der inversen Filtercharakteristik entzerrt wird.
27. Verfahren nach einem der Ansprüche 23 bis 25, dadurch gekennzeichnet, dass in dem Bearbeitungsprozess a) durch nichtlineare Signalverarbeitung des schmalbandig gefilterten Sprachsignals unter Einbeziehung von auf der Basis der geschätzten Filtercharakteristik ermittelten
Steuerparametern die Grundfrequenz und/oder zumindest eine Oberwelle des schmalbandig gefilterten Sprachsignals wiederhergestellt wird, b) das bezüglich der Grundfrequenz und/oder zumindest einer Oberwelle wiederhergestellte Sprachsignal band- oder tiefpassgefiltert wird, c) das band- oder tiefpassgefilterte, wiederhergestellte Sprachsignal und das schmalbandig gefilterte Sprachsignal verknüpft, insbesondere addiert, werden.
28. Verfahren nach Anspruch 27, dadurch gekennzeichnet, dass das schmalbandig gefilterte Sprachsignal vor der nichtlinearen Signalverarbeitung gefiltert wird.
EP01943072A 2001-05-11 2001-05-11 Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals Expired - Lifetime EP1388147B1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/DE2001/001826 WO2002093561A1 (de) 2001-05-11 2001-05-11 Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals

Publications (2)

Publication Number Publication Date
EP1388147A1 true EP1388147A1 (de) 2004-02-11
EP1388147B1 EP1388147B1 (de) 2004-12-29

Family

ID=5648243

Family Applications (1)

Application Number Title Priority Date Filing Date
EP01943072A Expired - Lifetime EP1388147B1 (de) 2001-05-11 2001-05-11 Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals

Country Status (5)

Country Link
US (1) US20040153313A1 (de)
EP (1) EP1388147B1 (de)
CN (1) CN1529882A (de)
DE (1) DE50104998D1 (de)
WO (1) WO2002093561A1 (de)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7987095B2 (en) * 2002-09-27 2011-07-26 Broadcom Corporation Method and system for dual mode subband acoustic echo canceller with integrated noise suppression
DE10252070B4 (de) * 2002-11-08 2010-07-15 Palm, Inc. (n.d.Ges. d. Staates Delaware), Sunnyvale Kommunikationsendgerät mit parametrierter Bandbreitenerweiterung und Verfahren zur Bandbreitenerweiterung dafür
DE10252327A1 (de) * 2002-11-11 2004-05-27 Siemens Ag Verfahren zur Erweiterung der Bandbreite eines schmalbandig gefilterten Sprachsignals, insbesondere eines von einem Telekommunikationsgerät gesendeten Sprachsignals
SG163555A1 (en) * 2005-04-01 2010-08-30 Qualcomm Inc Systems, methods, and apparatus for highband burst suppression
DK1875463T3 (en) 2005-04-22 2019-01-28 Qualcomm Inc SYSTEMS, PROCEDURES AND APPARATUS FOR AMPLIFIER FACTOR GLOSSARY
US20070055519A1 (en) * 2005-09-02 2007-03-08 Microsoft Corporation Robust bandwith extension of narrowband signals
US20080300866A1 (en) * 2006-05-31 2008-12-04 Motorola, Inc. Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101390188B1 (ko) 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
US8010352B2 (en) * 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
EP1970900A1 (de) * 2007-03-14 2008-09-17 Harman Becker Automotive Systems GmbH Verfahren und Vorrichtung zum Bereitstellen eines Codebuchs für die Bandbreitenerweiterung eines akustischen Signals
GB0705324D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
US8015002B2 (en) 2007-10-24 2011-09-06 Qnx Software Systems Co. Dynamic noise reduction using linear model fitting
US8606566B2 (en) * 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction
US8326617B2 (en) 2007-10-24 2012-12-04 Qnx Software Systems Limited Speech enhancement with minimum gating
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
CN101996640B (zh) * 2009-08-31 2012-04-04 华为技术有限公司 频带扩展方法及装置
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9245538B1 (en) * 2010-05-20 2016-01-26 Audience, Inc. Bandwidth enhancement of speech signals assisted by noise reduction
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
PT2951814T (pt) * 2013-01-29 2017-07-25 Fraunhofer Ges Forschung Ênfase de baixa frequência para codificação com base em lpc em domínio de frequência
US10043534B2 (en) * 2013-12-23 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
CN108198571B (zh) * 2017-12-21 2021-07-30 中国科学院声学研究所 一种基于自适应带宽判断的带宽扩展方法及系统
CN113287167B (zh) * 2019-01-03 2024-09-24 杜比国际公司 用于混合语音合成的方法、设备及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4700390A (en) * 1983-03-17 1987-10-13 Kenji Machida Signal synthesizer
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH10509256A (ja) * 1994-11-25 1998-09-08 ケイ. フインク,フレミング ピッチ操作器を使用する音声信号の変換方法
EP0945852A1 (de) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Sprachsynthese
EP0994464A1 (de) * 1998-10-13 2000-04-19 Koninklijke Philips Electronics N.V. Verfahren und Vorrichtung zur Vergrösserung der Bandbreite von einem schmalbandigen Signal und solch eine Vorrichtung aufweisende Telefoneinrichtung
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO02093561A1 *

Also Published As

Publication number Publication date
EP1388147B1 (de) 2004-12-29
US20040153313A1 (en) 2004-08-05
CN1529882A (zh) 2004-09-15
DE50104998D1 (de) 2005-02-03
WO2002093561A1 (de) 2002-11-21

Similar Documents

Publication Publication Date Title
WO2002093561A1 (de) Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals
DE69910239T2 (de) Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale
DE60222445T2 (de) Verfahren zum verbergen von bitfehlern für die sprachcodierung
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE69122648T2 (de) Digitale Teilbandkodierungsvorrichtung
DE69226500T2 (de) Verfahren und Gerät zur Sprachsignalübertragung
AT405346B (de) Verfahren zum herleiten der nachwirkperiode in einem sprachdecodierer bei diskontinuierlicher übertragung, sowie sprachcodierer und sender-empfänger
DE60029990T2 (de) Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE60214599T2 (de) Skalierbare audiokodierung
DE60118553T2 (de) Verfahren und anordnung zur änderung der signalquellenbandbreite in einer telekommunikationsverbindung mit mehrfach-bandbreitenfähigkeit
DE69901273T2 (de) Verfahren zur Codierung und Quantisierung von Audiosignalen
DE60220485T2 (de) Verfahren und Vorrichtung zur Verschleierung von Rahmenausfall von prädiktionskodierter Sprache unter Verwendung von Extrapolation der Wellenform
DE69132885T2 (de) CELP-Kodierung niedriger Verzögerung und 32 kbit/s für ein Breitband-Sprachsignal
DE60319590T2 (de) Verfahren zur codierung und decodierung von audio mit variabler rate
EP0978172B1 (de) Verfahren zum verschleiern von fehlern in einem audiodatenstrom
DE19935808A1 (de) Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
WO2007073949A1 (de) Verfahren und vorrichtung zur künstlichen erweiterung der bandbreite von sprachsignalen
DE69820362T2 (de) Nichtlinearer Filter zur Geräuschunterdrückung in linearen Prädiktions-Sprachkodierungs-Vorrichtungen
DE69807806T2 (de) Verfahren und vorrichtung zur kodierung eines audiosignals mittels &#34;vorwärts&#34;- und &#34;rückwärts&#34;-lpc-analyse
DE19743662A1 (de) Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
DE60300267T2 (de) Verfahren und Vorrichtung zur multi-referenz Korrektur der durch ein Kommunikationsnetzwerk verursachten spektralen Sprachverzerrungen
EP0658874A1 (de) Verfahren und Schaltungsanordnung zur Vergrösserung der Bandbreite von schmalbandigen Sprachsignalen
EP0378609B1 (de) Verfahren zur übertragung eines audiosignals
DE10252070B4 (de) Kommunikationsendgerät mit parametrierter Bandbreitenerweiterung und Verfahren zur Bandbreitenerweiterung dafür

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20031107

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE TR

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

RIN1 Information on inventor provided before grant (corrected)

Inventor name: LORENZ, FRANNK

Inventor name: KLINKE, STEFANO, AMBROSIUS

Inventor name: AUBAUER, ROLAND

RIN1 Information on inventor provided before grant (corrected)

Inventor name: LORENZ, FRANNK

Inventor name: KLINKE, STEFANO, AMBROSIUS

Inventor name: AUBAUER, ROLAND

RBV Designated contracting states (corrected)

Designated state(s): DE FR GB

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): DE FR GB

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20041230

REF Corresponds to:

Ref document number: 50104998

Country of ref document: DE

Date of ref document: 20050203

Kind code of ref document: P

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20050505

Year of fee payment: 5

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20050520

Year of fee payment: 5

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20050721

Year of fee payment: 5

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

ET Fr: translation filed
26N No opposition filed

Effective date: 20050930

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060511

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20061201

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20060511

REG Reference to a national code

Ref country code: FR

Ref legal event code: ST

Effective date: 20070131

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: FR

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060531