[go: up one dir, main page]

WO2002069327A1 - Procede de reconstruction spectrale de signal audio a spectre incomplet et dispositif correspondant - Google Patents

Procede de reconstruction spectrale de signal audio a spectre incomplet et dispositif correspondant Download PDF

Info

Publication number
WO2002069327A1
WO2002069327A1 PCT/FR2002/000617 FR0200617W WO02069327A1 WO 2002069327 A1 WO2002069327 A1 WO 2002069327A1 FR 0200617 W FR0200617 W FR 0200617W WO 02069327 A1 WO02069327 A1 WO 02069327A1
Authority
WO
WIPO (PCT)
Prior art keywords
signals
signal
spectral
spectrum
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/FR2002/000617
Other languages
English (en)
Inventor
Pierrick Philippe
Patrice Collen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telediffusion de France ets Public de Diffusion
Orange SA
Original Assignee
Telediffusion de France ets Public de Diffusion
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telediffusion de France ets Public de Diffusion, France Telecom SA filed Critical Telediffusion de France ets Public de Diffusion
Publication of WO2002069327A1 publication Critical patent/WO2002069327A1/fr
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Definitions

  • the present invention relates to a method and a device for spectral reconstruction of an audio signal with an incomplete spectrum, in particular of an audio signal resulting from coding with spectrum limitation.
  • the present invention also relates to a corresponding reconstruction device and an audio coding / decoding system comprising it.
  • This coding can be a bit rate reduction coding.
  • Known rate reduction coders are for example transform type coders, CELP type coders and even parametric type coders, such as a parametric MPEG4 type coder.
  • the present invention can also relate to non-coded signals, for example signals which have simply undergone subsampling.
  • bit rate reduction audio coding the audio signal often has to undergo bandwidth limitation when the bit rate becomes low. This limitation of bandwidth is necessary to avoid the introduction of audible quantization noise into the encoded signal. It is therefore desirable to regenerate as far as possible the high frequency content of the original signal.
  • non-linearity such as, for example, the spectral widening method known as the HFR (High-Frequency Regeneration) method.
  • HFR High-Frequency Regeneration
  • the decoded low-frequency, band-limited signal is subjected to a non-linear device to obtain a signal enriched in harmonics which, after bleaching and shaping based on information describing the spectral envelope of the full band signal before coding, allows the generation of a high frequency signal corresponding to the high frequency content of the signal before coding.
  • Figs. 1A, IB and IC respectively represent the spectra of three signals limited to a band going from 0 to 2 kHz, the first spectrum corresponding to a noise signal, the second spectrum corresponding to a sine comb of fundamental frequency equal to 400 Hz, the third spectrum corresponding to two combs of superimposed sines, of respective fundamental frequencies equal to 400 Hz and 450 Hz.
  • the first signal will be designated by the term "noise”
  • the second signal by the term "mono-harmonic”
  • the third signal by the term "bi-harmonic".
  • Figs. 2A, 2B and 2C respectively represent the spectra of three signals corresponding to the three signals of Figs. 1A, IB and IC to which high frequency components have been added by application of a non-linearity, as described above.
  • non-linearity recreates noise at high frequencies with low energy.
  • the synthesized high frequency spectrum is equivalent in nature to the low frequency spectrum.
  • the non-linearity recreates harmonics of the fundamental frequency, and one thus obtains an extended comb.
  • the harmonic structure of the signal is preserved.
  • the synthesized high frequency spectrum is again of an equivalent nature to the low frequency spectrum.
  • the non-linearity recreates multiple harmonics of the two fundamental frequencies, but also harmonics of the beat frequency between these two frequencies.
  • the synthesized high frequency spectrum is not of the same nature as the low frequency spectrum. The same goes of course for all multi-harmonic signals.
  • the problem underlying the invention is the improvement of a spectral reconstruction method of the type which has just been described to allow the reconstruction of all kinds of audio signals, including of musical nature, without reduction in performance or increase in complexity.
  • the problem underlying the invention is solved by a method of reconstructing an audio signal with an incomplete spectrum, said method comprising:
  • the first signal a step of decomposing the incomplete spectrum signal, called the first signal, into a plurality of second signals, at least one of said second signals corresponding to a harmonic series of said audio signal with incomplete spectrum;
  • Said combining step can consist of summing said first signal and said fourth signal.
  • all of said second signals consist of a noise signal and one or more signals corresponding to harmonic series of different fundamental frequencies.
  • said third signals can undergo a spectral bleaching operation before or after their combination. The spectral bleaching operation is carried out on the basis of an evaluation of the spectral envelopes of said third signals or, if they have been previously combined, from the spectral envelope of the first signal.
  • said second signals undergo a spectral whitening operation prior to the generation step.
  • the operation spectral bleaching is carried out from an evaluation of the spectral envelopes of the second signals or from an evaluation of the spectral envelope of said first signal.
  • said fourth signal undergoes a spectral shaping operation prior to its combination with said first signal. If the incomplete spectrum audio signal has been obtained by a spectrum limitation coding of an original audio signal, said spectral shaping operation is performed on the basis of information giving the spectral envelope of said audio signal d 'origin.
  • the step of generating the third signals applies a non-linear function to at least one of said second signals.
  • the generation step performs a spectral transposition operation on at least one of said second signals.
  • Said spectral transposition operation can be a translation accompanied or not by a reversal.
  • the step of generating said second signals performs an extrapolation operation based on the pitch of at least one of said second signals.
  • the invention is also defined by a device for reconstructing an audio signal with an incomplete spectrum, for example an audio signal having undergone a spectrum limitation coding operation, said device being suitable for implementing the steps of the method. set out above.
  • the invention is further defined by a system for coding / decoding an audio signal comprising a spectrum limiting coder and a decoder, said system comprising, at the output of the decoder, said device for reconstructing an audio signal.
  • the coding / decoding system can comprise means associated with the coder for estimating and transmitting to the decoder spectral envelope information for at least one spectral band not transmitted by said coder.
  • the coder is advantageously adapted to generate and supply information characteristic of at least one non-linear function, at least one of the third signals being generated from one of said second signals by means of said non-linear function.
  • Fig.lA, IB and IC represent the spectra of three limited band signals, corresponding respectively to a noise signal, a mono-harmonic signal and a bi-harmonic signal;
  • Figs. 2A, 2B and 2C represent the spectra of three signals corresponding respectively to the signals of Figs. 1A, IB and IC to which high frequency components have been added according to a process of the state of the art;
  • FIGS. 3A to 3H represent the spectra of signals corresponding to various stages of a method of spectral reconstruction of an audio signal according to the invention;
  • Fig. 4 schematically represents a device for spectral reconstruction of an audio signal according to the invention.
  • a method of spectral reconstruction of an audio signal with incomplete spectrum applies in particular to a signal resulting from the decoding of an audio signal coded by an encoder with spectral band limitation.
  • the encoder can be of the transform type (MPEG1, MPEG2 or MPEG4-GA), of the CELP type (ITU G72X), or even of the parametric type (parametric MPEG4).
  • the invention can also be applied to an uncoded signal which has, for example, simply been subjected to undersampling or spectral limitation.
  • a multi-harmonic signal for example of musical type, is broken down into mono-harmonic signals and into noise signals, then signals with high frequency spectra are generated for each of these signals, for example by application of 'a nonlinear function.
  • the decomposition can be carried out relatively roughly so that it is not too costly in terms of calculations to be carried out. Phase and energy adjustment problems are mitigated during spectral fitness.
  • FIG. 4 shows a spectral reconstruction device applying a spectral reconstruction method according to the invention.
  • An audio signal is encoded by an encoder 100 and, after transmission of the encoded signal by any means, the encoded signal is decoded by a decoder 110.
  • a module 105 for estimating the spectral envelope.
  • the module 105 is adapted to provide information concerning the spectral envelope of the audio signal before coding. It can for example model an envelope of this signal by an LPC analysis, as described in the article by J. Makhoul, entitled “Linear Prediction: a tutorial review”, Proceedings of the IEEE, Vol. 63, N ° 4, pp 561-580.
  • the module 105 can supply the LPC coefficients directly or in their reduced and quantified form.
  • the module 105 only provides spectral envelope information for the non-transmitted high frequency spectrum.
  • the cost in transmission behavior, that is to say the corresponding increase in bit rate, of the spectral envelope information is very low.
  • four modules 140, 160, 150, 170 and a summator 180 intervene adapted to execute a spectral reconstruction operation.
  • the module 140 is a module for decomposing the signal from the decoder 110. This module is first of all adapted to analyze a signal in order to extract a plurality of harmonics therefrom. Then, this module is adapted to decompose this signal into a plurality of signals corresponding respectively to harmonic series of different fundamental frequencies and into a noise signal.
  • the module 160 is a high frequency spectrum signal generation module.
  • This module 160 is adapted to independently process the different signals resulting from the decomposition performed by the module 140 to generate signals with corresponding high frequency spectra. This generation can be carried out for example with the technique used in the HFR (High-Frequency Regeneration) method already mentioned.
  • HFR High-Frequency Regeneration
  • each of the signals is subjected to a non-linear filter to obtain a high frequency signal.
  • the nonlinear function will belong to a polynomial family.
  • the coefficients of the polynomial to be applied can be supplied dynamically by the coder 100, in the form of auxiliary information.
  • the generation of the high frequency components of the signals corresponding to harmonic series can also be carried out by extrapolation techniques based on the value of the pitch.
  • the generation of the high frequency components of the noise signals can also be carried out by a spectral transposition operation, such as for example a simple translation or a translation with turnaround. Spectral transposition makes it possible to obtain a signal with an offset spectrum, for example a spectrum translated towards high frequencies.
  • the module 160 can operate in the frequency domain or in the time domain.
  • the module 150 is a whitening filter. We know that if we have a description of the spectral envelope of the signal, it is possible to whiten its spectrum by passing it through a whitening filter with transfer function (approximately) inverse to the envelope function in the strip to be bleached. An approximation of the initial excitation signal is thus obtained, free of the influence of the spectral shape in the band considered.
  • the module 115 is adapted to provide information concerning the spectral envelope of each of the signals from the module 140. Like the module 105, it can for example model an envelope of each of these signals by an LPC analysis. The transfer function of the whitening filter is then the inverse of the envelope function given by the module 115.
  • This module 150 is therefore suitable for whitening the spectra of the signals coming from the module 160.
  • the module 150 can operate in the frequency domain or in the time domain.
  • the envelope information relating to the band to be bleached can be used directly by the module 150. In this case, the module 11 is unnecessary. This variant is symbolized by the broken line connection between the module 105 and the module 150.
  • the signals with high frequency spectra generated by the module 160 can be summed before being bleached, the bleaching then being carried out on a single signal which is the sum of the signals generated by the module 160.
  • the transfer function of the whitening filter can be determined either by an analysis of the decoded signal in the module 115 or by envelope information in the low frequency band, if the module 105 is adapted to transmit full envelope information. bandaged.
  • the module 170 is a spectral shaping filter. Its transfer function can be determined from a spectral envelope function transmitted by the module 105 or else by extrapolation of the spectral envelope function of the low frequency part determined by the module 1 15.
  • This second possibility is symbolized by the broken line connection between the module 1 15 and the module 170.
  • filtering is performed on the sum of signals from module 150 (or from module 160 if modules 150 and 160 have been inverted) corresponding to the decomposition performed by module 140.
  • the spectrum of the target band has the shape of the envelope in the strip considered.
  • the spectral enrichment signal supplied by the module 170 is then summed by the summator 180 to the incomplete spectrum signal from the decoder 110.
  • the limited spectrum signal can be a band limited signal between 0 and 2 kHz as shown in FIG. 3A.
  • This signal can be analyzed as the superposition of noise, harmonics belonging to a first harmonic series and harmonics belonging to a second harmonic series of different fundamental frequency.
  • the module 140 extracts the harmonics and decomposes the signal A into a first noise signal Bl whose spectrum is shown in FIG. 3B, in a second signal B2 corresponding to the first harmonic series whose spectrum is shown in FIG. 3 C and in a third signal B3 corresponding to the second harmonic series whose spectrum is shown in FIG. 3D.
  • the module 160 generates a high frequency spectrum signal for each of these three signals.
  • the module 150 performs the whitening of the high frequency spectrum signals thus generated.
  • Figs. 3E to 3G represent the spectra after bleaching of the high frequency signals generated C1, C2, C3 for the signals B1, B2, B3 respectively.
  • the device according to the invention has been shown in the form of functional modules, it goes without saying that all or part of this device can be produced by means of a single processor or a plurality of dedicated or non-dedicated processors.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

L'invention a trait à un procédé de reconstruction d'un signal audio à spectre incomplet, ledit procédé comprenant: une étape de décomposition (140) du signal (A) à spectre incomplet, dit premier signal, en une pluralité de seconds signaux (B1,B2,B3); une étape de génération (160) de troisièmes signaux (C1,C2,C3) à partir desdits seconds signaux, les troisièmes signaux présentant des spectres respectivement extrapolés des spectres desdits seconds signaux; une étape de combinaison desdits troisièmes signaux fournissant un quatrième signal (D); une étape de combinaison (180) dudit premier signal (A) et dudit quatrième signal (D) pour fournir un signal à spectre reconstruit. L'invention a également trait au dispositif de reconstruction correspondant, et à un système de codage/décodage le comprenant.

Description

Procédé de reconstruction spectrale de signal audio à spectre incomplet et dispositif correspondant
La présente invention concerne un procédé et un dispositif de reconstruction spectrale d'un signal audio à spectre incomplet, notamment d'un signal audio issu d'un codage à limitation de spectre. La présente invention concerne également un dispositif de reconstruction correspondant et un système de codage/décodage audio le comprenant.
Dans l'état de la technique de la transmission de signaux audio, il est bien connu de procéder avant la transmission à une opération de codage d'un signal original, le signal reçu subissant une opération inverse de décodage. Ce codage peut être un codage à réduction de débit. Des codeurs à réduction de débit connus sont par exemple les codeurs de type par transformée, les codeurs de type CELP et même des codeurs de type paramétrique, comme un codeur de type MPEG4 paramétrique. La présente invention peut également concerner des signaux non codés, par exemple des signaux qui ont simplement subi un sous-échantillonnage. En codage audio à réduction de débit, le signal audio doit souvent subir une limitation de bande passante lorsque le débit binaire devient faible. Cette limitation de bande passante est nécessaire pour éviter l'introduction de bruit de quantification audible dans le signal codé. Il est alors souhaitable de régénérer dans la mesure du possible le contenu haute fréquence du signal original.
Il est connu de l'état de la technique l'élargissement de bande par non linéarité comme, par exemple, la méthode d'élargissement spectral connue sous le nom de méthode HFR (High-Frequency Régénération). Le signal basse fréquence décodé, à bande limitée, est soumis à un dispositif non linéaire pour obtenir un signal enrichi en harmoniques qui, après blanchiment et mise en forme fondée sur une information décrivant l'enveloppe spectrale du signal pleine bande avant codage, permet la génération d'un signal haute fréquence correspondant au contenu haute fréquence du signal avant codage.
Les Fig. 1A, IB et IC représentent respectivement les spectres de trois signaux limités à une bande allant de 0 à 2 kHz, le premier spectre correspondant à un signal de bruit, le second spectre correspondant à un peigne de sinus de fréquence fondamentale égale à 400 Hz, le troisième spectre correspondant à deux peignes de sinus superposés, de fréquences fondamentales respectives égales à 400 Hz et 450 Hz. On désignera le premier signal par le terme de « bruit », le second signal par le terme « mono-harmonique » et le troisième signal par le terme « bi-harmonique ».
Les Figs. 2A, 2B et 2C représentent respectivement les spectres de trois signaux correspondant aux trois signaux des Figs. 1A, IB et IC auxquels ont été ajoutés des composantes haute fréquence par application d'une non-linéarité, ainsi qu'il a été décrit précédemment. Dans le cas du bruit, la non-linéarité recrée un bruit en haute fréquence d'énergie faible. Le spectre haute fréquence synthétisé est de nature équivalente au spectre basse fréquence. Dans le cas du signal mono-harmonique, la non linéarité recrée des harmoniques de la fréquence fondamentale, et on obtient ainsi un peigne étendu. La structure harmonique du signal est préservée. Le spectre haute fréquence synthétisé est là encore de nature équivalente au spectre basse fréquence. Dans le cas du signal bi-harmonique, la non-linéarité recrée des harmoniques multiples des deux fréquences fondamentales, mais également des harmoniques de la fréquence de battement entre ces deux fréquences. Le spectre haute fréquence synthétisé n'est pas de même nature que le spectre basse fréquence. Il en va bien entendu de même pour tous les signaux multi-harmoniques.
Dans le cas du bruit et du signal mono-harmonique, le spectre haute fréquence synthétisé étant de même nature que le spectre basse fréquence, l'on peut, après blanchiment et mise en forme adéquate, obtenir un signal dont la perception par l'oreille humaine est proche de celle du signal d'origine. Cette technique est donc bien adaptée à la reconstruction spectrale de signaux audio de parole qui sont généralement constitués de signaux de bruit et de signaux mono-harmoniques. En revanche, pour des signaux musicaux, où prédominent généralement des signaux multi-harmoniques, cette technique n'est pas adaptée.
Le problème à la base de l'invention est l'amélioration d'un procédé de reconstruction spectrale du type qui vient d'être décrit pour permettre la reconstruction de toutes sortes de signaux audio, y compris de nature musicale, sans diminution de performance ou d'augmentation de complexité.
Le problème à la base de l'invention est résolu par un procédé de reconstruction d'un signal audio à spectre incomplet, ledit procédé comprenant:
- une étape de décomposition du signal à spectre incomplet, dit premier signal, en une pluralité de seconds signaux, l'un au moins desdits seconds signaux correspondant à une série harmonique dudit signal audio à spectre incomplet ;
- une étape de génération de troisièmes signaux à partir desdits seconds signaux, les troisièmes signaux présentant des spectres respectivement extrapolés des spectres desdits seconds signaux ; - une étape de combinaison desdits troisièmes signaux fournissant un quatrième signal de spectre distinct du spectre dudit premier signal ;
- une étape de combinaison dudit premier signal et dudit quatrième signal pour fournir un signal à spectre reconstruit.
Ladite étape de combinaison peut consister en une sommation dudit premier signal et dudit quatrième signal.
Avantageusement, l'ensemble desdits seconds signaux est constitué d'un signal de bruit et d'un ou plusieurs signaux correspondant à des séries harmoniques de fréquences fondamentales différentes. En outre, lesdits troisièmes signaux peuvent subir une opération de blanchiment spectral préalablement ou postérieurement à leur combinaison. L'opération de blanchiment spectral est effectuée à partir d'une évaluation des enveloppes spectrales desdits troisièmes signaux ou, s'ils ont été préalablement combinés, à partir de l'enveloppe spectrale du premier signal.
Selon une variante, lesdits seconds signaux subissent une opération de blanchiment spectral préalablement à l'étape de génération. Dans ce cas, l'opération de blanchiment spectral est effectuée à partir d'une évaluation des enveloppes spectrales des seconds signaux ou d'une évaluation de l'enveloppe spectrale dudit premier signal.
Avantageusement ledit quatrième signal subit une opération de mise en forme spectrale préalablement à sa combinaison avec ledit premier signal. Si le signal audio à spectre incomplet a été obtenu par un codage à limitation de spectre d'un signal audio d'origine, ladite opération de mise en forme spectrale est effectuée à partir d'une information donnant l'enveloppe spectrale dudit signal audio d'origine.
Selon une première possibilité, l'étape de génération des troisièmes signaux applique une fonction non linéaire à au moins un desdits seconds signaux.
Selon une seconde possibilité, l'étape de génération effectue une opération de transposition spectrale sur au moins un desdits seconds signaux. Ladite opération de transposition spectrale peut être une translation accompagnée ou non d'un retournement. Selon une troisième possibilité, l'étape de génération desdits seconds signaux effectue une opération d'extrapolation basée sur le pitch d'au moins un desdits seconds signaux.
L'invention est également définie par un dispositif de reconstruction d'un signal audio à spectre incomplet, par exemple d'un signal audio ayant subi une opération de codage à limitation de spectre, ledit dispositif étant adapté à mettre en œuvre les étapes du procédé exposé ci-dessus.
L'invention est encore définie par système de codage/décodage d'un signal audio comprenant un codeur à limitation de spectre et un décodeur, ledit système comprenant en sortie du décodeur ledit dispositif de reconstruction d'un signal audio. Le système de codage/décodage peut comprendre des moyens associés au codeur pour estimer et transmettre au décodeur une information d'enveloppe spectrale pour au moins une bande spectrale non transmise par ledit codeur. Enfin, le codeur est avantageusement adapté à générer et à fournir une information caractéristique d'au moins une fonction non linéaire, au moins un des troisièmes signaux étant généré à partir de l'un desdits seconds signaux au moyen de ladite fonction non linéaire.
Les caractéristiques de l'invention mentionnées ci-dessus, ainsi que d'autres, apparaîtront plus clairement à la lecture de la description suivante d'un exemple de réalisation, ladite description étant faite en relation avec les dessins joints, parmi lesquels: les Fig.lA, IB et IC représentent les spectres de trois signaux à bande limitée, correspondant respectivement à un signal de bruit, à un signal mono-harmonique et à un signal bi-harmonique ; les Figs. 2A, 2B et 2C représentent les spectres de trois signaux correspondant respectivement aux signaux des Figs. 1A, IB et IC auxquels ont été ajoutés des composantes haute fréquence selon un procédé de l'état de la technique ; les Figs 3A à 3H représentent les spectres de signaux correspondant à diverses étapes d'un procédé de reconstruction spectrale d'un signal audio selon l'invention ; et la Fig. 4 représente schématiquement un dispositif de reconstruction spectrale de signal audio selon l'invention.
Un procédé de reconstruction spectrale de signal audio à spectre incomplet selon l'invention s'applique notamment à un signal issu du décodage d'un signal audio codé par un codeur à limitation de bande spectrale. Il peut s'agir de tous types de codeur à réduction de débit. Le codeur peut être de type par transformée (MPEG1, MPEG2 ou MPEG4-GA), de type CELP (ITU G72X), ou même de type paramétrique (MPEG4 paramétrique). L'invention peut également s'appliquer à un signal non codé qui a, par exemple, simplement subi un sous-échantillonnage ou une limitation spectrale.
Selon l'invention, un signal multi-harmonique, par exemple de type musical, est décomposé en signaux mono-harmoniques et en signaux de bruit, puis des signaux à spectres haute fréquence sont générés pour chacun de ces signaux, par exemple par application d'une fonction non linéaire. La somme des signaux obtenus, après blanchiment éventuel, est ensuite effectuée. Il est alors possible de réaliser la remise en forme spectrale, par exemple à partir d'une information décrivant l'enveloppe spectrale du signal pleine bande avant codage. La décomposition peut être réalisée de manière relativement grossière de sorte qu'elle n'est pas trop coûteuse en termes de calculs à effectuer. Les problèmes d'ajustement de phase et d'énergie sont atténués lors de la remise en forme spectrale.
Plus précisément, la Fig. 4 représente un dispositif de reconstruction spectrale appliquant un procédé de reconstruction spectrale selon l'invention. Un signal audio est codé par un codeur 100 et, après transmission du signal codé par un moyen quelconque, le signal codé est décodé par un décodeur 1 10.
Au niveau du codeur 100 intervient un module 105 d'estimation d'enveloppe spectrale. L'on sait que sous certaines hypothèses de stationnarité, un signal peut être modélisé comme le résultat du filtrage d'un signal d'excitation par un filtre d'enveloppe spectrale. Le module 105 est adapté à fournir une information concernant l'enveloppe spectrale du signal audio avant codage. Il peut par exemple modéliser une enveloppe de ce signal par une analyse LPC, telle que décrite dans l'article de J. Makhoul, intitulé « Linear Prédiction : a tutorial review », Proceedings of the IEEE, Vol. 63, N°4, pp 561-580. Le module 105 peut fournir les coefficients LPC directement ou sous leur forme réduite et quantifiée. Avantageusement, le module 105 ne fournit une information d'enveloppe spectrale que pour le spectre haute fréquence non transmis. Le coût en tenue de transmission, c'est à dire l'augmentation de débit correspondante, de l'information d'enveloppe spectrale est très faible. Au niveau du décodeur, interviennent quatre modules 140, 160, 150, 170 et un sommateur 180 adaptés à exécuter une opération de reconstruction spectrale.
Le module 140 est un module de décomposition du signal issu du décodeur 110. Ce module est tout d'abord adapté à analyser un signal afin d'en extraire une pluralité d'harmoniques. Ensuite, ce module est adapté à décomposer ce signal en une pluralité de signaux correspondant respectivement à des séries harmoniques de fréquences fondamentales différentes et en un signal de bruit.
Le module 160 est un module de génération de signal à spectre haute fréquence. Ce module 160 est adapté à traiter indépendamment les différents signaux issus de la décomposition effectuée par le module 140 pour générer des signaux à spectres haute fréquence correspondants. Cette génération peut être effectuée par exemple avec la technique utilisée dans la méthode HFR (High-Frequency Régénération) déjà mentionnée. Selon une première variante, chacun des signaux est soumis à un filtre non linéaire pour obtenir un signal haute fréquence.
Par exemple, la fonction non linéaire sera définie par la formule suivante : y(t) = [ (l + γ) | χ(t) l + (l - γ)x(t) ] / 2 où γ désigne une constante comprise entre 0 et 1.
Avantageusement, la fonction non linéaire appartiendra à une famille polynomiale. Les coefficients du polynôme à appliquer pourront être fournis de manière dynamique par le codeur 100, sous la forme d'une information auxiliaire. La génération des composantes haute fréquence des signaux correspondant à des séries harmoniques peut également être effectuée par des techniques d'extrapolation basées sur la valeur du pitch. La génération des composantes haute fréquence des signaux de bruit peut être également effectuée par une opération de transposition spectrale, comme par exemple une simple translation ou une translation avec retournement. La transposition spectrale permet d'obtenir un signal à spectre décalé, par exemple un spectre translaté vers les hautes fréquences. Le module 160 peut opérer dans le domaine fréquentiel ou dans le domaine temporel.
Le module 150 est un filtre blanchisseur. On sait que si l'on dispose d'une description de l'enveloppe spectrale du signal, il est possible de blanchir son spectre en le faisant passer dans un filtre blanchisseur de fonction de transfert (approximativement) inverse à la fonction d'enveloppe dans la bande à blanchir. On obtient ainsi une approximation du signal d'excitation initial, débarrassée de l'influence de la forme spectrale dans la bande considérée. Le module 115 est adapté à fournir une information concernant l'enveloppe spectrale de chacun des signaux issus du module 140. Comme le module 105, il peut par exemple modéliser une enveloppe de chacun de ces signaux par une analyse LPC. La fonction de transfert du filtre blanchisseur est alors l'inverse de la fonction d'enveloppe donnée par le module 115. Ce module 150 est donc adapté à blanchir les spectres des signaux issus du module 160. Le module 150 peut opérer dans le domaine fréquentiel ou dans le domaine temporel. Selon une variante, lorsque le module 105 transmet une information d'enveloppe spectrale pleine bande, l'information d'enveloppe concernant la bande à blanchir peut être utilisée directement par le module 150. Dans ce cas, le module 1 15 est inutile. Cette variante est symbolisée par la liaison en traits interrompus entre le module 105 et le module 150.
Il faut noter que l'opération de génération de signal à spectre haute fréquence en 160 et celle de blanchiment peuvent être interverties.
Selon une variante de réalisation, les signaux à spectres haute fréquence générés par le module 160 peuvent être sommés avant d'être blanchis, le blanchiment se faisant alors sur un seul signal qui est la somme des signaux générés par le module 160. Dans ce cas également, la fonction de transfert du filtre blanchisseur pourra être déterminée soit par une analyse du signal décodé dans le module 115 soit par une information d'enveloppe dans la bande basse fréquence, si le module 105 est adapté à transmettre une information d'enveloppe pleine bande. Le module 170 est un filtre de mise en forme spectrale. Sa fonction de transfert peut être déterminée à partir d'une fonction d'enveloppe spectrale transmise par le module 105 ou bien par extrapolation de la fonction d'enveloppe spectrale de la partie basse fréquence déterminée par le module 1 15. Cette seconde possibilité est symbolisée par la liaison en traits interrompus entre le module 1 15 et le module 170. Dans tous les cas, le filtrage est effectué sur la somme de signaux issus du module 150 (ou de module 160 si les modules 150 et 160 ont été intervertis) correspondant à la décomposition effectuée par le module 140. Le spectre de la bande cible a la forme de l'enveloppe dans la bande considérée. Le signal d'enrichissement spectral fourni par le module 170 est ensuite sommé grâce au sommateur 180 au signal à spectre incomplet issu du décodeur 1 10.
A titre d'exemple, le signal à spectre limité peut être un signal à bande limitée entre 0 et 2 kHz comme représenté sur la Fig. 3A. Ce signal peut être analysé comme la superposition de bruit, d'harmoniques appartenant à une première série harmonique et d'harmoniques appartenant à une seconde série harmonique de fréquence fondamentale différente.
Le module 140 extrait les harmoniques et décompose le signal A en un premier signal de bruit Bl dont le spectre est représenté sur la Fig. 3B, en un second signal B2 correspondant à la première série harmonique dont le spectre est représenté sur la Fig. 3 C et en un troisième signal B3 correspondant à la seconde série harmonique dont le spectre est représenté sur la Fig. 3D.
Le module 160 génère un signal à spectre haute fréquence pour chacun de ces trois signaux. Le module 150 effectue le blanchiment des signaux à spectres haute fréquence ainsi générés. Les Figs. 3E à 3G représentent les spectres après blanchiment des signaux haute fréquence générés C1,C2,C3 pour les signaux B1,B2,B3 respectivement.
Bien que le dispositif selon l'invention ait été représenté sous la forme de modules fonctionnels, il va de soi que tout ou partie de ce dispositif peut être réalisé au moyen d'un processeur unique ou une pluralité de processeurs dédiés ou non.

Claims

REVENDICATIONS
1) Procédé de reconstruction d'un signal audio à spectre incomplet, ledit procédé étant caractérisé en ce qu'il comprend :
- une étape de décomposition (140) du signal (A) à spectre incomplet, dit premier signal, en une pluralité de seconds signaux (B1,B2,B3), l'un au moins desdits seconds signaux correspondant à une série harmonique dudit signal audio à spectre incomplet ;
- une étape de génération (160) de troisièmes signaux (C1,C2,C3) à partir desdits seconds signaux, les troisièmes signaux présentant des spectres respectivement extrapolés des spectres desdits seconds signaux ;
- une étape de combinaison desdits troisièmes signaux fournissant un quatrième signal (D);
- une étape de combinaison (180) dudit premier signal (A) et dudit quatrième signal (D) pour fournir un signal à spectre reconstruit.
2) Procédé de reconstruction selon la revendication 1, caractérisé en ce que ladite étape de combinaison dudit premier signal et dudit quatrième signal consiste en une sommation.
3) Procédé de reconstruction selon la revendication 1 ou 2, caractérisé en ce que l'ensemble desdits seconds signaux est constitué d'un signal de bruit (Bl) et d'un ou plusieurs signaux (B2,B3) correspondant à des séries harmoniques de fréquences fondamentales différentes.
4) Procédé de reconstruction selon l'une des revendications précédentes, caractérisé en ce que lesdits troisièmes signaux subissent une opération de blanchiment spectral (150) préalablement ou postérieurement à leur combinaison.
5) Procédé de reconstruction selon la revendication 4, caractérisé en ce que ladite opération de blanchiment spectral est effectuée à partir d'une évaluation des enveloppes spectrales desdits troisièmes signaux ou, s'ils ont été préalablement combinés, à partir de l'enveloppe spectrale du premier signal. 6) Procédé de reconstruction selon l'une des revendications 1 à 3, caractérisé en ce que lesdits seconds signaux subissent une opération de blanchiment spectral (150) préalablement à l'étape de génération.
7) Procédé de reconstruction selon la revendication 6, caractérisé en ce que ladite opération de blanchiment spectral est effectuée à partir d'une évaluation des enveloppes spectrales des seconds signaux ou d'une évaluation de l'enveloppe spectrale dudit premier signal.
8) Procédé de reconstruction selon l'une des revendications précédentes, caractérisé en ce que ledit quatrième signal subit une opération de mise en forme spectrale (170) préalablement à sa combinaison avec ledit premier signal.
9) Procédé de reconstruction selon la revendication 8, caractérisé en ce que, ledit signal audio à spectre incomplet ayant été obtenu par un codage à limitation de spectre d'un signal audio d'origine, ladite opération de mise en forme spectrale est effectuée à partir d'une information donnant l'enveloppe spectrale dudit signal audio d'origine.
10) Procédé de reconstruction selon l'une quelconque des revendications précédentes, caractérisé en ce que l'étape de génération des troisièmes signaux applique une fonction non linéaire à au moins un desdits seconds signaux.
11) Procédé de reconstruction selon l'une quelconque des revendications précédentes, caractérisé en ce que l'étape de génération effectue une opération de transposition spectrale sur au moins un desdits seconds signaux.
12) Procédé de reconstruction selon la revendication 11, caractérisé en ce que ladite opération de transposition spectrale est une translation accompagnée ou non d'un retournement.
13) Procédé de reconstruction selon l'une quelconque des revendications précédentes, caractérisé en ce que l'étape de génération desdits seconds signaux effectue une opération d'extrapolation basée sur le pitch d'au moins un desdits seconds signaux.
14) Dispositif de reconstruction d'un signal audio à spectre incomplet, par exemple d'un signal audio ayant subi une opération de codage à limitation de spectre, caractérisé en ce qu'il est adapté à mettre en œuvre les étapes du procédé selon l'une quelconque des revendications 1 à 13.
15) Système de codage/décodage d'un signal audio comprenant un codeur à limitation de spectre (100) et un décodeur (110), caractérisé en ce qu'il comprend en sortie du décodeur un dispositif de reconstruction d'un signal audio selon la revendication 14.
16) Système de codage/décodage d'un signal audio selon la revendication 15, caractérisé en ce qu'il comprend des moyens (105) associés au codeur (100) pour estimer et transmettre au décodeur une information d'enveloppe spectrale pour au moins une bande spectrale non transmise par ledit codeur.
17) Système de codage/décodage d'un signal audio selon la revendication 15, caractérisé en ce que le codeur est adapté à générer et à fournir une information caractéristique d'au moins une fonction non linéaire, au moins un des troisièmes signaux étant généré à partir de l'un desdits seconds signaux au moyen de ladite fonction non linéaire.
PCT/FR2002/000617 2001-02-23 2002-02-18 Procede de reconstruction spectrale de signal audio a spectre incomplet et dispositif correspondant Ceased WO2002069327A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR01/02608 2001-02-23
FR0102608A FR2821476B1 (fr) 2001-02-23 2001-02-23 Procede de reconstruction spectrale de signal audio a spectre incomplet et dispositif correspondant

Publications (1)

Publication Number Publication Date
WO2002069327A1 true WO2002069327A1 (fr) 2002-09-06

Family

ID=8860462

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2002/000617 Ceased WO2002069327A1 (fr) 2001-02-23 2002-02-18 Procede de reconstruction spectrale de signal audio a spectre incomplet et dispositif correspondant

Country Status (2)

Country Link
FR (1) FR2821476B1 (fr)
WO (1) WO2002069327A1 (fr)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140098981A1 (en) * 2012-10-08 2014-04-10 Oticon A/S Hearing device with brainwave dependent audio processing
CN109616128A (zh) * 2019-01-30 2019-04-12 努比亚技术有限公司 语音发送方法、装置和计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4700390A (en) * 1983-03-17 1987-10-13 Kenji Machida Signal synthesizer
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
WO1998057436A2 (fr) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Amelioration de codage de la source par reproduction de la bande spectrale

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4700390A (en) * 1983-03-17 1987-10-13 Kenji Machida Signal synthesizer
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
WO1998057436A2 (fr) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Amelioration de codage de la source par reproduction de la bande spectrale

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140098981A1 (en) * 2012-10-08 2014-04-10 Oticon A/S Hearing device with brainwave dependent audio processing
US9432777B2 (en) * 2012-10-08 2016-08-30 Oticon A/S Hearing device with brainwave dependent audio processing
CN109616128A (zh) * 2019-01-30 2019-04-12 努比亚技术有限公司 语音发送方法、装置和计算机可读存储介质

Also Published As

Publication number Publication date
FR2821476A1 (fr) 2002-08-30
FR2821476B1 (fr) 2003-04-11

Similar Documents

Publication Publication Date Title
EP0002998B1 (fr) Procédé de compression de données relatives au signal vocal et dispositif mettant en oeuvre ledit procédé
EP1593116B1 (fr) Procédé pour le traitement numérique différencié de la voix et de la musique, le filtrage de bruit, la création d'effets spéciaux et dispositif pour la mise en oeuvre dudit procédé
FR2888699A1 (fr) Dispositif de codage/decodage hierachique
EP1395981B1 (fr) Dispositif et procede de traitement d'un signal audio.
WO2005106852A1 (fr) Procede et systeme ameliores de conversion d'un signal vocal
EP0511095A1 (fr) Procédé et dispositif de codage-décodage d'un signal numérique
EP1275109B2 (fr) Méthode et dispositif d'enrichissement spectral
EP2347411B1 (fr) Attenuation de pre-echos dans un signal audionumerique
EP1849157B1 (fr) Procede de mesure de la gene due au bruit dans un signal audio
EP4487323B1 (fr) Codage et décodage optimisé d'un signal audio utilisant un auto-encodeur à base de réseau de neurones
WO2002069327A1 (fr) Procede de reconstruction spectrale de signal audio a spectre incomplet et dispositif correspondant
CA2108663C (fr) Procede et dispositif de filtrage pour la reduction des preechos d'un signal audio-numerique
EP1362344A1 (fr) Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies
FR2821501A1 (fr) Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
EP1192619B1 (fr) Codage et decodage audio par interpolation
EP1192618B1 (fr) Codage audio avec liftrage adaptif
EP2126904A1 (fr) Procede et dispositif de codage audio
EP1192621B1 (fr) Codage audio avec composants harmoniques
EP1194923B1 (fr) Procedes et dispositifs d'analyse et de synthese audio
FR2749723A1 (fr) Procede et dispositif de codage en compression d'un signal numerique
FR3155618A1 (fr) Procédé de synthèse de voix et dispositifs de synthèse, produit programme d’ordinateur et support lisible d’information associés
FR3155617A1 (fr) Procédé de synthèse de voix et dispositifs associés
FR2751776A1 (fr) Procede d'extraction de la frequence fondamentale d'un signal de parole
EP1190414A1 (fr) Codage et decodage audio avec composantes harmoniques et phase minimale
EP1192620A1 (fr) Codage et decodage audio incluant des composantes non harmoniques du signal

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SD SE SG SI SK SL TJ TM TN TR TT TZ UA UG US UZ VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP