[go: up one dir, main page]

EP0957471B1 - Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen - Google Patents

Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen Download PDF

Info

Publication number
EP0957471B1
EP0957471B1 EP99106223A EP99106223A EP0957471B1 EP 0957471 B1 EP0957471 B1 EP 0957471B1 EP 99106223 A EP99106223 A EP 99106223A EP 99106223 A EP99106223 A EP 99106223A EP 0957471 B1 EP0957471 B1 EP 0957471B1
Authority
EP
European Patent Office
Prior art keywords
filter
signal
test
signals
smearing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
EP99106223A
Other languages
English (en)
French (fr)
Other versions
EP0957471A2 (de
EP0957471A3 (de
Inventor
Thilo Thiede
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Telekom AG
Original Assignee
Deutsche Telekom AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Telekom AG filed Critical Deutsche Telekom AG
Publication of EP0957471A2 publication Critical patent/EP0957471A2/de
Publication of EP0957471A3 publication Critical patent/EP0957471A3/de
Application granted granted Critical
Publication of EP0957471B1 publication Critical patent/EP0957471B1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Definitions

  • the invention relates to a measuring method for aurally quality assessment of audio signals according to the preamble of patent claim 1.
  • the invention has for its object to provide an objective measurement method for aurally quality assessment of audio signals by means of new fast algorithms for calculating linear phase filter, the duration of the audible noise calculated taking into account the temporal change of the envelopes at the individual filter outputs and a ge surgicalangepasste filter bank are used should, whereby an optimal temporal resolution is to be achieved and that while significantly saving of processing time compared to other filter banks.
  • the inventive solution of the problem is characterized in the characterizing part of claim 1.
  • a significant advantage of the method according to the invention is that a more precise hearing model is achieved, since audible disturbances are calculated taking into account the temporal change of the envelopes at the individual filter outputs.
  • a hearing-adapted filter bank is used, whereby an optimal temporal resolution is achieved, and the temporal behavior of the filter (impulse response, etc.) directly corresponds to the level dependence of the transfer functions.
  • the phase information in the filter channels is retained.
  • the folding with smearing function takes place only after the rectification or amount formation.
  • a signal dependence of the filter characteristics is achieved by convoluting the filter outputs in the frequency domain prior to rectification / magnitude formation with a level dependent smear function.
  • the signal components present in the original signal and changed only in their spectral distribution are separated from interferences generated by nonlinearities, the separation taking place by evaluating the orthogonality relationship between the time profiles of the envelopes at corresponding filter outputs of the signal to be evaluated and the original signal.
  • the separation of these noise components corresponds better to the actual hearing impression.
  • the present measuring method evaluates the noise of an audio signal by comparison with an undistorted reference signal.
  • the input signals After filtering with the Transmission functions of the outer and middle ear, the input signals are converted by a gehöangep gratuitte filter bank in a time-tonal representation.
  • the absolute squares of the filter output signals are calculated (rectification) and a convolution of the filter outputs is performed with a smear function.
  • the folding can be done in contrast to the previously known methods before the rectification or even afterwards.
  • Level differences between test and reference signal as well as linear distortions in the test signal are compensated and evaluated separately.
  • a frequency-dependent offset is added to model the self-noise of the ear and there is a temporal smearing of the output signals.
  • the left and right channel test signals 1a, 1b, and the left and right channel reference signals 1c, 1d are respectively applied to pre-filters 2 for pre-filtering.
  • the actual filtering takes place in the filter bank 3.
  • the spectral smearing 4 and the calculation of the squares squares 5.
  • the box marked 6 in the figure symbolically represent the temporal smearing.
  • the level and frequency response equals 7, wherein also output parameters 11 are supplied.
  • the addition of self-noise 8 and then the temporal smearing 9 takes place.
  • the calculation of output parameters 11 takes place in the structure shown in the symbolically represented block 10.
  • the level and Frequenzganganmaschine 7 can also be done between step or operation 9 and 10.
  • the filter bank 3 consists of an arbitrarily selectable number of filter pairs for test and reference signal 1a, b and 1d, c (meaning values between 30 and 200)
  • the filters can be distributed evenly on largely arbitrary pitch scales.
  • a suitable pitch scale is z.
  • z / barque 7 ⁇ arsinh ( ⁇ / Hz 650 )
  • ⁇ 1 2 ⁇ bw and H in the ( t ) cos n ( ⁇ ⁇ bw ⁇ t ) ⁇ sin ( 2 ⁇ ⁇ ⁇ c ⁇ t )
  • the output values of the filter bank 3 are spectrally blurred to account for simultaneous masking at 31 dB / Bark at the lower edge and between -24 and -6 dB / Bark at the upper edge, that is, crosstalk is produced between the filter outputs.
  • the level L is calculated independently for each filter output from the least squares amount 5 of the corresponding output value filtered with a time constant of 10 ms. This blurring is performed independently for the filters representing the real part of the signal (G1.2) and the filters representing the imaginary part (G1.3) of the signal.
  • the level may be calculated without a low-pass filter, and instead the low-pass filtering factor obtained by delogarithmizing the slew rate (G1.4) may be filtered low. Since this convolution operation is quasi linear and therefore preserves the relation between the resulting frequency response and the resulting impulse response, it can be considered as part of the filter bank 3.
  • the temporal smearing of the filter output signals takes place in two stages.
  • the signals are averaged over a cos 2- shaped time window, which primarily models the pre-masking.
  • the after-mask is modeled, which will be described in more detail later.
  • the cos 2- shaped time window has a length of 400 samples at a 48 kHz sampling rate. The distance between the maximum of the time window and its 3 dB point is thus about 100 samples or 2 ms, which corresponds approximately to a time period often assumed for the pre-occlusion.
  • Level differences and linear distortions (frequency responses of the test object) between the test and reference signals 1a, b and 1c, d can be compensated and thus from the evaluation other types of disturbances are separated.
  • the instantaneous absolute squares at the filter outputs are temporally smoothed by first-order low-pass filters.
  • corr total ( ⁇ P test ⁇ P Ref ⁇ P test ) 2
  • the time constants are calculated according to Eq. 6 determined. If ratio f, t is greater than one, the correction factor for the test signal is set to ratio f, t -1 and the correction factor for the reference signal is set to one. In the reverse In the case, the correction factor for the reference signal is set to ratio f, t and the correction factor for the test signal is set to one.
  • correction factors are temporally smoothed over several adjacent filter channels, and with the same time constants, as indicated above.
  • a frequency-dependent offset for modeling the self-noise of the ear is added to the absolute squares at all filter outputs. Another offset to account for background noise can also be added (but normally set to 0).
  • e ( ⁇ c . t ) e ( ⁇ . t ) + 10 0364 ( ⁇ c kHz ) - 0.8
  • the instantaneous absolute squares in each filter channel are time-blurred by a first-order low-pass filter with a time constant of approximately 10 ms.
  • the time constant can also be calculated as a function of the center frequency of the respective filter. In this case it is 50 ms for low frequencies and 8 ms for high frequencies (like G1.6).
  • Figure 11 has here been designed to provide the specific loudness of the disturbance when no masker is present and provides approximately the ratio between the disturbance and the masker when the disturbance is very small relative to the masker.
  • the "throttled noise” corresponds to the mean of this variable over time and filter channels.
  • the resulting output parameter is referred to as the "loudness of missing signal components".
  • linear distortions can also be determined by using the reference signal before signal equalization as the test signal.
  • the modulation difference is averaged over time and filter bands.
  • the modulation used on the input side is obtained by normalizing the time derivative of the instantaneous values to their time-smoothed value.
  • FIG. 2 shows a filter structure for the recursive calculation of a simple finite impulse response (FIR) bandpass filter.
  • FIR finite impulse response
  • the signal is processed separately according to real part (upper path) and imaginary part (lower path). Since the input signal X was originally purely real, the lower path is missing first.
  • the input signal X is delayed by N samples (21) and, after multiplication by a complex-valued factor cos (N, ⁇ ) + j.sin (N, ⁇ ) from the original input signal subtracted (22).
  • the resulting signal V is added to the one-sample delayed output (23).
  • the result multiplied by another complex-valued factor cos ( ⁇ ) + j.sin ( ⁇ ) gives the new output signal Y (24).
  • the swept identifiers for V and Y each mark the imaginary part.
  • the second complex multiplication continues the input signal periodically.
  • the addition of the delayed and weighted by the first complex multiplication input signal aborts the continuation of the input signal after N samples again.
  • f A denotes the sampling frequency
  • the initially low stopband attenuation of these bandpasses can be increased by calculating K + 1 of such bandpass filters with the same impulse response length N but different values of ⁇ in parallel, adapting their phase responses to one another by a further complex multiplication and adding their output signals weighted:
  • 0 ⁇ n ⁇ N for the real part and a K ( n ) sin K ( ⁇ N n ) ⁇ sin ( 2 ⁇ ⁇ ⁇ ⁇ M ⁇ A ⁇ n )

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Description

  • Die Erfindung betrifft ein Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen nach dem Oberbegriff des Patentanspruchs 1.
  • Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen sind grundsätzlich bekannt. Die grundsätzliche Struktur eines solchen Messverfahrens besteht in der Abbildung der Eingangssignale auf eine gehörgerechte Zeit-Frequenz-Repräsentation, einem Vergleich dieser Darstellung und der Berechnung von Einzelzahlwerten zur Abschätzung der wahrnehmbaren Störungen. Hierzu wird auf folgende Veröffentlichungen verwiesen:
    • Schroeder, M.R.; Atal, B. S.; Hall, J.L: Optimizing digital speech coders by exploiting masking properties of the human ear. J. Acoust. Soc. Am., Vol. 66 (1979), No. 6, December, Seiten 1647 - 1652.
    • Beerends, J.G.; Stemerdink, J.A.: A Perceptual Audio Quality Measure Based on a Psychoacoustic Sound Representation. J. AES, Voi. 40 (1992), No. 12, December, Seiten 963 - 978.
    • Brandenburg, K.H.; Sporer, Th.: NMR* and Masking Flag: Evaluation of Quality Using Perceptual Criteria. Proceedings of the AES 11th International Conference, Portland, Oregon, USA, 1992, Seiten 169-179.
  • Wie aus diesen Veröffentlichungen hervorgeht, benutzen die für die Beurteilung von codierten Audiosignalen verwendeten Modelle jedoch FFT Algorithmen und erfordern daher eine Umrechnung von der durch die FFT vorgegebenen linearen Frequenzeinteilung auf eine gehörgerechte Frequenzeinteilung. Dadurch ist die zeitliche Auflösung suboptimal. Außerdem erfolgt die Faltung mit Verschmierungsfunktion nach der Gleichrichtung bzw. Betragsbildung.
  • Aus der Fachveröffentlichung Hansen et. Al. "Using a qualitative Psychoacoustical Signal representation for Objective Speech Quality Measurements" ICASSP' 97, S. 1387 - 1390, ist ein Meßverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen mit Hilfe von Filtern bzw. einer Filterbank bekannt. Das Signal wird in 19 Frequenzbänder von 350 Hz - 3500 Hz aufgeteilt.
  • Der Erfindung liegt die Aufgabe zugrunde, ein objektives Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen mittels neuer schneller Algorithmen zur Berechnung linearphasiger Filter zu schaffen, wobei die Laufzeit der hörbaren Störungen unter Berücksichtigung der zeitlichen Änderung der Hüllkurven an den einzelnen Filterausgängen berechnet und eine gehörangepasste Filterbank verwendet werden soll, wodurch eine optimale zeitliche Auflösung erreicht werden soll und zwar bei signifikanter Einsparung von Rechenzeit gegenüber anderen Filterbänken. Die erfindungsgemäße Lösung der Aufgabe ist im Kennzeichen des Patentanspruchs 1 charakterisiert.
  • Weitere Lösungen bzw. Ausgestaltungen der Erfindung sind in den Patentansprüchen 2 bis 23 charakterisiert.
  • Ein wesentlicher Vorteil des erfindungsgemäßen Verfahrens besteht darin, dass ein genaueres Gehörmodell erzielt wird, da hörbare Störungen unter Berücksichtigung der zeitlichen Änderung der Hüllkurven an den einzelnen Filterausgängen berechnet werden.
  • Außerdem wird eine gehörangepasste Filterbank verwendet, wodurch eine optimale zeitliche Auflösung erreicht wird, und das zeitliche Verhalten der Filter (Impulsantwort u.s.w.) direkt mit der Pegelabhängigkeit der Übertragungsfunktionen korrespondiert. Die Phaseninformation in den Filterkanälen bleibt erhalten. Wie bereits ausgeführt, erfolgt bei den bisher bekannten Lösungen die Faltung mit Verschmierfunktion erst nach der Gleichrichtung bzw. Betragsbildung. Eine Signalabhängigkeit der Filtercharakteristiken wird dadurch erreicht, dass die Filterausgänge vor der Gleichrichtung/Betragsbildung mit einer pegelabhängigen Verschmierfunktion im Frequenzbereich gefaltet werden.
  • Dadurch, dass ein neuer schneller Algorithmus zur rekursiven Berechnung linearphasiger Filter verwendet wird, ergibt sich eine wesentliche Einsparung an Rechenzeit, ein einfacher Entwurf und Filter, die leichter variierbar als die bisher angewandten konventionellen rekursiven Filter sind.
  • Im Originalsignal vorhandene und lediglich in ihrer spektralen Verteilung veränderten Signalanteile werden von additiven bzw. von durch Nichtlinearitäten erzeugten Störungen getrennt, wobei die Trennung durch Auswertung der Orthogonalitätsbeziehung zwischen den zeitlichen Verläufen der Hüllkurven an einander entsprechenden Filterausgängen des zu bewertenden Signals und des Originalsignals erfolgt. Die Trennung dieser Störanteile entspricht besser dem tatsächlichen Höreindruck.
  • Der Filterbankalgorithmus wird in folgender Weise realisiert:
    • Aus jedem einlaufendem Impuls wird durch rekursive komplexe Multiplikation eine ungedämpfte Sinusschwingung mit der gewünschten Filtermittenfrequenz erzeugt.
    • Die zu einem Eingangsimpuls gehörende Sinusschwingung wird durch Subtraktion des um dem Kehrwert der gewünschten Filterbandbreite entsprechende Zeit verzögerten und mit dem der Verzögerung entsprechenden Phasenwinkel multiplizierten Eingangsimpuls wieder abgebrochen.
      • Durch Faltung im Frequenzbereich wird durch gewichtete Summation von je n Filterausgängen gleicher Bandbreite und um jeweils eine Periode versetzter Mittenfrequenz aus dem nach Schritt 2 resultierendem sin(x)/x-förmigen Dämpfungsverlauf ein der Fouriertransformierten eines cos^(n-1) förmigen Zeitfensters entsprechender Dämpfungsverlauf erzeugt. Hierdurch kann der Dämpfungsverlauf in der Umgebung der Filtermittenfrequenzen geformt und eine ausreichend hohe Sperrdämpfung ermöglicht werden.
      • Der Dämpfungsverlauf in größerer Entfernung von der Filtermittenfrequenz kann durch eine weitere Faltung im Frequenzbereich bestimmt werden (Übergang zwischen Durchlaßbereich und Sperrbereich).
  • Weitere Vorteile, Merkmale und Anwendungsmöglichkeiten der vorliegenden Erfindung ergeben sich aus der nachfolgenden Beschreibung in Verbindung mit den in der Zeichnung dargestellten Ausführungsbeispielen.
  • Die Erfindung wird im folgenden anhand von in den Zeichnungen dargestellten Ausführungsbeispielen näher beschrieben. In der Beschreibung, in den Patentansprüchen, der Zusammenfassung und in der Zeichnung werden die in der hinten angeführten Liste der Bezugszeichen verwendeten Begriffe und zugeordneten Bezugszeichen verwendet.
  • In den Zeichnungen bedeuten:
  • Fig. 1
    eine Struktur des Meßverfahrens und
    Fig. 2
    eine Filterstruktur.
  • Das vorliegende Meßverfahren bewertet die Störungen eines Audiosignals durch Vergleich mit einem ungestörten Referenzsignal. Nach einer Filterung mit den Übertragungsfunktionen von Außen- und Mittelohr werden die Eingangssignale durch eine gehörangepaßte Filterbank in eine Zeit-Tonheits-Darstellung umgerechnet. Es werden die - Betragsquadrate der Filterausgangssignale berechnet (Gleichrichtung) und es wird eine Faltung der Filterausgänge mit einer Verschmierfunktion durchgeführt. Die Faltung kann im Gegensatz zu den bisher bekannten Verfahren vor der Gleichrichtung erfolgen oder auch danach. Pegelunterschiede zwischen Test- und Referenzsignal sowie lineare Verzerrungen im Testsignal werden kompensiert und getrennt ausgewertet. Anschließend wird ein frequenzabhängiger Offset addiert, um das Eigenrauschen des Gehörs zu modellieren und es wird eine zeitliche Verschmierung der Ausgangssignale vorgenommen. Ein Teil dieser zeitlichen Verschmierung kann bereits direkt nach der Gleichrichtung erfolgen, um Rechenzeit zu sparen. Nach der zeitlichen Verschmierung (Tiefpaßfilterung) ist dann eine Unterabtastung der Signale zulässig. Durch einen Vergleich zwischen dem sich ergebenden gehörgerechten Zeit-Frequenzmustern von Test- und Referenzsignal können eine Reihe von Ausgangsgrößen berechnet werden, die eine Abschätzung der wahrnehmbaren Störungen liefern.
  • Zunächst soll die in Fig. 1 als Ausführungsbeispiel dargestellte Struktur bzw. der Aufbau des Meßverfahrens erklärt werden. Die Testsignale 1a, 1b, für den linken bzw. rechten Kanal und die Referenzsignale 1c, 1d, für den linken bzw. rechten Kanal werden zur Vorfilterung jeweils auf Vorfilter 2 gegeben. Nach der Vorfilterung erfolgt die eigentliche Filterung in der Filterbank 3. Danach erfolgt die spektrale Verschmierung 4 und die Berechnung der Betragsquadrate 5. Die mit 6 bezeichneten Kästchen in der Figur stellen symbolisch die zeitliche Verschmierung dar. Danach erfolgt der Pegel- und Frequenzgangangleich 7, wobei auch Ausgangsparameter 11 geliefert werden. Nach dem Pegel-und Frequenzangleich 7 erfolgt die Addition von Eigenrauschen 8 und danach die zeitliche Verschmierung 9.
  • Die Berechnung von Ausgangsparametern 11 erfolgt in der dargestellten Struktur bei dem symbolisch dargestellten Block 10. Der Pegel- und Frequenzgangangleich 7 kann auch zwischen Schritt bzw. Operation 9 und 10 erfolgen.
  • Zunächst wird die Berechnung der Erregungsmuster mittels der gehörangepaßten Filterbank 3 beschrieben.
  • Die Filterbank 3 besteht aus einer beliebig wählbaren Anzahl von Filterpaaren für Test- und Referenzsignal 1a,b bzw. 1d,c (sinnvoll sind Werte zwischen 30 und 200) Die Filter können auf weitgehend beliebigen Tonhöhenskalen gleichmäßig verteilt werden. Eine geeignete Tonhöhenskala ist z. B. folgende von Schroeder vorgeschlagen Näherung: z / Bark = 7 arsinh ( ƒ / Hz 650 )
    Figure imgb0001
  • Die Filter sind lineärphasig und werden durch Impulsantworten folgender Form definiert: h re ( t ) = cos n ( π bw t ) cos ( 2 π ƒ c t ) | | t | < 1 2 bw
    Figure imgb0002
    und h im ( t ) = cos n ( π bw t ) sin ( 2 π ƒ c t ) | | t | < 1 2 bw
    Figure imgb0003
  • Der Wert n bestimmt die Sperrdämpfung der Filter und sollte >= 2 sein.
  • Die Ausgangswerte der Filterbank 3 werden zur Berücksichtigung der Simultanverdeckung mit 31 dB/Bark an der unteren Flanke und zwischen -24 und -6 dB/Bark an der oberen Flanke spektral verschmiert, das heißt, es wird ein Übersprechen zwischen den Filterausgängen erzeugt. Die obere Flanke wird pegelabhängig berechnet: s = min ( - 6 dB Bark , - 24 dB Bark + 0.2 Bark - 1 L / dB )
    Figure imgb0004
  • Der Pegel L wird unabhängig für jeden Filterausgang aus dem mit einer Zeitkonstante von 10ms tiefpaßgefilterten Betragsquadrat 5 des entsprechenden Ausgangswertes berechnet. Diese Verschmierung wird unabhängig für die Filter, die den Realteil des Signals representieren (G1. 2) und die Filter, die den Imaginärteil (G1. 3) des Signals representieren durchgeführt. Als Alternative kann der Pegel auch ohne Tiefpaßfilter berechnet werden und stattdessen der das Übersprechen bestimmende Faktor, der sich durch Delogarithmierung der Flankensteilheit (G1. 4) ergibt, tiefpaßgefiltert werden. Da diese Faltungsoperation quasi linear ist und daher die Relation zwischen dem resultierenden Frequenzgang und der resultierenden Impulsantwort bewahrt, kann sie als Teil der Filterbank 3 aufgefaßt werden.
  • Da die Filterbank 3 Paare von Ausgangssignalen mit um 90° verschobenen Phasen liefert, kann die Gleichrichtung durch Bildung der Betragsquadrate 5 der Filterausgänge erfolgen: E ( ƒ c , t ) = A re 2 ( ƒ c , t ) + A im 2 ( ƒ c , t )
    Figure imgb0005
  • Die zeitliche Verschmierung der Filterausgangssignale erfolgt in zwei Stufen. In der ersten Stufe werden die Signale über ein cos2-förmiges Zeitfenster gemittelt, wodurch in erster Linie die Vorverdeckung modelliert wird. In der zweiten Stufe wird dann die Nachverdeckung modelliert ,die später genauer beschrieben wird. Das cos2-förmige Zeitfenster hat eine Länge von 400 Abtastwerten bei einer Abtatstrate von 48 kHz. Der Abstand zwischen dem Maximum des Zeitfensters und seinem 3 dB Punkt beträgt damit etwa 100 Abtastwerte oder 2 ms, was etwa einer oft für die Vorverdeckung angenommenen Zeitspanne enspricht.
  • Pegeldifferenzen und lineare Verzerrungen (Frequenzgänge des Testobjekts) zwischen Test- und Referenzsignal 1a,b bzw. 1c,d können kompensiert und damit von der Bewertung anderer Störungsarten getrennt werden.
  • Für den Pegelangleich werden die momentanen Betragsquadrate an den Filterausgängen durch Tiefpässe erster Ordnung zeitlich geglättet. Die verwendeten Zeitkonstanten werden in Abhängigkeit von der Mittenfrequenz des jeweiligen Filters gewählt: τ = τ 0 + 100 Hz ƒ c ( τ 100 - τ 0 ) | τ 100 = 0 , 004 - l s τ 0 = 0 , 004 - l s , wobei
    Figure imgb0006
    τ100 ≥ τ0.
  • Aus den so geglätteten Filterausgangswerten P test and P ref wird ein Korrekturfaktor corr total berechnet: corr total = ( Σ P Test P Ref Σ P Test ) 2
    Figure imgb0007
  • Ist dieser Korrekturfaktor größer eins, wird das Referenzsignal 1a; b durch den Korrekturfaktor geteilt, ansonsten wird das Testsignal 1c; d mit dem Korrekturfaktor multipliziert.
  • Für jeden Filterkanal werden Korrekturfaktoren aus der Orthogonalitätsbeziehung zwischen den zeitlichen Hüllkurven der Filterausgänge von Test- und Referenzsignal 1a,b; 1c,d berechnet: ratio ƒ , t = - 0 e t τ X Test X Ref dt - 0 e t τ X Ref X Ref dt
    Figure imgb0008
  • Die Zeitkonstanten werden nach Gl. 6 bestimmt. Wenn ratio f,t größer eins ist, wird der Korrekturfaktor für das Testsignal zu ratio f,t -1 gesetzt und der Korrekturfaktor für das Referenzsignal auf eins gesetzt. Im umgekehrten Fall wird der Korrekturfaktor für das Referenzsignal zu ratio f,t gesetzt und der Korrekturfaktor für das Test signal auf eins gesetzt.
  • Die Korrekturfaktoren werden über mehrere benachbarte Filterkanäle, und mit denselben Zeitkonstanten zeitlich geglättet, wie oben angegeben.
  • Ein frequenzabhängiger Offset zur Modellierung des Eigenrauschens des Gehörs wird zu den Betragsquadraten an allen Filterausgängen addiert. Ein weiterer Offset zur Berücksichtung von Hintergrundgeräuschen kann ebenfalls addiert werden (wird aber im Normalfall auf 0 gesetzt). E ( ƒ c , t ) = E ( ƒ , t ) + 10 0.364 ( ƒ c kHz ) - 0.8
    Figure imgb0009
  • Zur Modellierung der Nachverdeckung werden die momentanen Betragsquadrate in jedem Filterkanal durch einen Tiefpaß erster Ordnung mit einer Zeitkonsante von ca. 10 ms zeitlich verschmiert. Die Zeitkonstante kann wahlweise auch in Abhängigkeit von der Mittenfrequenz des jeweiligen Filters berechnet werden. In diesem Fall liegt sie bei 50 ms für niedrige Frequenzen und bei 8 ms bei hohen Frequenzen (wie G1. 6) .
  • Vor der soeben beschriebenen zweiten Stufe der zeitlichen Verschmierung, wird eine einfache Näherung für die Lautheit berechnet, indem die Betragsquadrate an den Filterausgängen hoch 0.3 genommen werden. Dieser Wert E
    Figure imgb0010
    und der Betrag seiner zeitlichen Ableitung d E / dt
    Figure imgb0011
    werden mit denselben Zeitkonstanten geglättet wie bereits beschrieben. Aus dem Ergebnis der zeitlichen Glättung E der
    Figure imgb0012
    wird ein Maß für die Hüllkurvenmodulation in jedem Kanal bestimmt: mod ( ƒ c , t ) = E der ( ƒ c , t ) 1 + E ( ƒ c , t )
    Figure imgb0013
  • Der wichtigste und am höchsten mit subjektiven Hörtestdaten korrelierte Ausgangsparameter des Verfahrens ist die Lautheit der Störung bei Drosselung durch das Nutzsignal. Die Eingangswerte hierzu sind die Betragsquadrate in jedem Filterkanal Eref und Etest ("Erregung"), die Hüllkurvenmodulation, das Eigenrauschen des Gehörs ("Grunderregung") EHS und die Konstanten Eo und α. Die gedrosselte Störlautheit wird nach NL ( ƒ c , t ) = ( 1 s test E HS E 0 ) 0.23 [ ( 1 + max ( s test E test - s ref E ref , 0 ) E HS + s ref E ref β ) 0.23 - 1 ]
    Figure imgb0014
    berechnet, wobei gilt:
    • E HS = 10 0.364 - ( ƒ c kHz ) - 0.8
      Figure imgb0015
    • E 0 = 104
    • α = 1.0
    • s = 0.04·mod(f c ,t) / Hz + 1
  • G1. 11 ist hier so entworfen worden, daß sie die spezifische Lautheit der Störung liefert, wenn kein Maskierer vorhanden ist und in etwa das Verhältnis zwischen Störung und Maskierer liefert, wenn die Störung im Verhältnis zum Maskierer sehr klein ist. Der die Drosselung bestimmende Faktor β wird nach folgender Gleichung berechnet: β = exp ( - α E test - E ref E ref )
    Figure imgb0016
  • Die "Gedrosselte Störlautheit" entspricht dem Mittelwert dieser Größe über Zeit und Filterkanäle. Um lineare Verzerrungen zu bestimmen, wird dieselbe Berechnung nochmals ohne Frequenzgangangleich durchgeführt, wobei in den oben angegebenen Gleichungen Test- und Referenzsignal vertauscht werden. Der sich ergebende Ausgangsparameter wird als "Lautheit fehlender Signalanteile" bezeichnet. Mit Hilfe dieser beiden Ausgangsgrößen ist eine gute Vorhersage der subjektiv empfundenen Signalqualität eines codierten Audiosignals möglich. Alternativ können lineare Verzerrungen auch bestimmt werden, indem das Referenzsignal vor dem Signalangleich als Testsignal verwendet wird. Eine weitere Ausgangsgröße ist die Modulationsdifferenz, die sich durch Normierung des Betrages der Differenz der Modulation von Test- und Referenzsignal auf die Modulation des Referenzsignals ergibt. Dabei wird bei der Normierung auf das Referenzsignal ein Offset addiert, um die berechneten Werte bei sehr kleiner Modulation des Referenzsignals zu begrenzen: Modulationsdifferenz = modtest - modref Offset - modref
    Figure imgb0017
  • Die Modulationsdifferenz wird über Zeit und Filterbänder gemittelt.
  • Die eingangsseitig verwendete Modulation ergibt sich durch Normierung der zeitlichen Ableitung der Momentanwerte auf ihren zeitlich geglätteten Wert.
  • In Fig. 2 ist eine Filterstruktur zur rekursiven Berechnung eines einfachen Bandpass mit endlicher Impulsantwort (FIR) dargestellt.
  • Das Signal wird getrennt nach Realteil (oberer Pfad) und Imaginärteil (unterer Pfad) verarbeitet. Da das Eingangssignal X ursprünglich rein reell ist, fehlt der untere Pfad zunächst. Das Eingangssignal X wird um N Abtastwerte verzögert (21) und nach einer Multiplikation mit einem komplexwertigen Faktor cos(N.ϕ)+j.sin(N.ϕ)vom ursprünglichen Eingangssignal subtrahiert (22). Das resultierende Signal V wird zu dem um einen Abtastwert verzögerten Ausgangssignal addiert (23). Das Resultat multipliziert mit einem weiteren komplexwertigen Faktor cos(ϕ)+j.sin(ϕ) ergibt das neue Ausgangssignal Y (24). Die überstrichenen Bezeichner für V und Y markieren jeweils den Imaginärteil.
  • Die zweite komplexe Multiplikation setzt das Eingangssignal periodisch fort. Die Addition des verzögerten und durch die erste komplexe Multiplikation gewichteten Eingangssignals bricht die Fortsetzung des Eingangssignals nach N Abtastwerten wieder ab.
  • Das gesamte Filter, bestehend aus Real- und Imaginärteilausgang, hat den Amplitudenfrequenzgang A ( ƒ ) = N si ( N 2 ( φ - 2 π ƒ ƒ A ) ) si ( 1 2 ( φ - 2 π ƒ ƒ A ) )
    Figure imgb0018

    Wobei fA die Abtastfrequenz bezeichnet.
  • Die zunächst geringe Sperrdämpfung dieser Bandpässe läßt sich erhöhen, indem man K+1 solcher Bandpässe mit gleicher Impulsantwortlänge N, aber verschiedenen Werten von ϕ parallel berechnet, ihre Phasengänge durch eine weitere komplexe Multiplikation einander anpaßt und ihre Ausgangssignale gewichtet aufaddiert: A ( ƒ ) = k = 0 K w k A k ( ƒ )
    Figure imgb0019
    mit φ k = 2 π ƒ M A + ( k - K 2 ) 2 π N
    Figure imgb0020

    (fM: Mittenfrequenz des Bandpasses) und w k = 2 π N 2 - K ( K k )
    Figure imgb0021
  • Die Sperrdämpfung der resultierenden Filter nimmt mit der (K+1) ten Potenz des Abstandes der Signalfrequenz zur Mittenfrequenz des Filters ab: Die Impulsantwort des gesamten Filters hat die Form a K ( n ) = sin K ( π N n ) cos ( 2 π ƒ M ƒ A n ) | 0 n < N
    Figure imgb0022

    für den Realteil und a K ( n ) = sin K ( π N n ) sin ( 2 π ƒ M ƒ A n ) | 0 n < N
    Figure imgb0023

    für den Imaginärteil. Dies entspricht den in Gl. 2 und 3 beschriebenen Charakteristiken.
  • Liste der Bezugszeichen
  • 1a
    Testsignal, linker Kanal
    1b
    Testsignal, rechter Kanal
    1c
    Referenzsignal, linker Kanal
    1d
    Referenzsignal, rechter Kanal
    2
    Vorfilterung
    3
    Filterbank
    4
    spektrale Verschmierung
    5
    Berechnung der Betragsquadrate
    6
    zeitliche Verschmierung
    7
    Pegel- und Frequenzgangangleich
    8
    Addition von Eigenrauschen
    9
    zeitliche Verschmierung
    10
    Berechnung von Ausgangsparametern
    11
    Ausgangsparameter

Claims (23)

  1. Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen mit Hilfe von Filtern, zeitlicher Verschmierung, Pegel- und Frequenzgangleich, dadurch gekennzeichnet, dass das zu bewertende Audiosignal als Testsignal (1a, 1b) mit einem als Referenzsignal (1c, 1d) gelieferten Originalsignal verglichen wird, dass das Testsignal (1a,1b) und das Referenzsignal (1c,1d) zunächst einer Vorfilterung (2) unterworfen werden, danach in eine Filterbank (3) geleitet werden, so dass danach eine spektrale Verschmierung (4) erfolgt, dass dann die Berechnung von Betragsquadraten (5) erfolgt, worauf eine zeitliche Verschmierung durchgeführt wird, dass die so erzielten Ausgangsgrößen einem Pegel- und Frequenzgangangleich (7) unterworfen werden und dass danach eine Addition von Eigenrauschen des Gehörs (8) erfolgt, worauf wiederum eine zeitliche Verschmierung (9) und eine Berechnung (10) von Ausgangsparametern (11) erfolgt oder der Regel- und Frequenzangleich zwischen der zeitlichen Verschmierung und der Berechnung von Ausgangsparametern durchgeführt wird.
  2. Verfahren nach Patentanspruch 1, dadurch gekennzeichnet, dass die Filterbank (3) gehörangepasst ist und aus jedem einlaufenden Signal durch rekursive komplexe Multiplikation eine ungedämpfte Sinusschwingung mit der gewünschten Filtermittenfrequenz erzeugt, dass die zu einem Testsignal (1a,1b) gehörende Sinusschwingung durch Subtraktion des um den Kehrwert der gewünschten Filterbandbreite um eine entsprechende Zeit verzögerten und mit dem der Verzögerung entsprechenden Phasenwinkel multiplizierten Eingangstestsignal (1a,1b) wieder abgebrochen wird.
  3. Verfahren nach Patentanspruch 1, dadurch gekennzeichnet, dass durch Faltung im Frequenzbereich aus je n Filterausgängen gleicher Bandbreite und um jeweils den Kehrwert der Fensterlänge versetzter Mittenfrequenz ein der Fouriertransformierten eines cosn (n-1) förmigen Zeitfensters ein entsprechender Dämpfungsverlauf erzeugt wird.
  4. Verfahren nach einem der Patentansprüche 2 oder 3, dadurch gekennzeichnet, dass der Dämpfungsverlauf in größerer Entfernung von der Filtermittenfrequenz im Übergang zwischen Durchlassbereich und Sperrbereich durch eine weitere Faltung im Frequenzbereich bestimmt wird.
  5. Verfahren nach einem der vorhergehenden Patentansprüche, dadurch gekennzeichnet, dass aus jedem einlaufenden Testsignal (1a,1b) durch rekursive komplexe Multiplikation eine ungedämpfte Sinusschwingung mit der gewünschten Filtermittenfrequenz erzeugt wird, dass die zu einem Eingangstestsignal (1a, 1b) gehörende Sinusschwingung durch Subtraktion des um den Kehrwert der gewünschten Filterbandbreite entsprechende Zeit verzögerten und mit dem der Verzögerung entsprechenden Phasenwinkel multiplizierten Eingangstestsignal (1a,1b) wieder abgebrochen wird, dass durch Faltung im Frequenzbereich aus je n Filterausgängen gleicher Bandbreite und jeweils den Kehrwert der Fensterlänge versetzter Mittenfrequenzen ein der Fouriertransformierten eines cosn (n-1) förmigen Zeitfensters entsprechender Dämpfungsverlauf erzeugt wird und dass der Dämpfungsverlauf in größerer Entfernung von der Filtermittenfrequenz durch eine weitere Faltung im Frequenzbereich bestimmt wird.
  6. Verfahren nach einem der Patentansprüche 1 bis 5, dadurch gekennzeichnet, dass die Eingangstestsignale (1a,1b) und die Referenzsignale (1c,1d) jeweils für einen linken und einen rechten Kanal, das heißt paarweise als Eingangsgröße eingeführt werden.
  7. Verfahren nach einem der vorhergehenden Patentansprüche, dadurch gekennzeichnet, dass beide Signale bzw. Signalpaare (1a,1b; 1c,1d) nach einer Vorfilterung (2) durch eine Filterbank (3) in den Frequenzbereich zerlegt werden, dass durch die Charakteristik der Filterbank (3) und eine anschließende zeitliche Verschmierung (9) der Filterausgangssignale eine gehörgerechte Darstellung der als Testsignal (1a,1b) zu bewertenden Audiosignale erzeugt wird und dass durch Vergleich der gehörgerechten Darstellungen von Testsignal (1a,1b) und Referenzsignal (1c,1d) nach nichtlinearen Umformungen eine Abschätzung des zu erwartenden Höreindrucks geliefert wird.
  8. Verfahren nach einem der Patentansprüche 1 bis 7, dadurch gekennzeichnet, dass nach der Filterung mit Übertragungsfunktionen von Außen- und Mittelohr Eingangssignale durch eine gehörangepasste Filterbank (3) eine Umrechnung in eine Zeit-Tonheits-Darstellung durchgeführt wird, dass danach Betragsquadrate (5) der Filterausgangssignale berechnet werden und eine Faltung der Filteräusgangssignale mit einer Verschmierungsfunktion (6) durchgeführt wird.
  9. Verfahren nach Patentanspruch 8, dadurch gekennzeichnet, dass die Faltung vor oder nach der Gleichrichtung erfolgt.
  10. Verfahren nach einem der Patentansprüche 1 bis 9, dadurch gekennzeichnet, dass Pegelunterschiede zwischen Test- und Referenzsignal (1a,1b bzw. 1c,1d) sowie lineare Verzerrungen des Referenzsignales (1c,1d) kompensiert und getrennt ausgewertet werden.
  11. Verfahren nach einem der Patentansprüche 1 bis 9, dadurch gekennzeichnet, dass ein Teil der zeitlichen Verschmierung direkt nach der Gleichrichtung erfolgt.
  12. Verfahren nach einem der Patentansprüche 1 oder 5, dadurch gekennzeichnet, dass eine gehörangepasste Filterbank (3) verwendet wird, die eine Signalabhängigkeit der Filtercharakteristiken dadurch erreicht, dass die Filterausgänge vor der Gleichrichtung/Betragsbildung mit einer pegelabhängigen Verschmierungsfunktion im Frequenzbereich gefaltet werden
  13. Verfahren nach einem der Patentansprüche 1 bis 12, dadurch gekennzeichnet, dass im Referenzsignal (1c,1d) vorhandene und lediglich in ihrer spektralen Verteilung veränderten Signalanteile von additiven bzw. von durch nicht Linearitäten erzeugten Störungen getrennt werden und dass die Trennung dieser Störanteile durch Auswertung der Orthogonalitätsbeziehung zwischen den zeitlichen Verläufen der Hüllkurven an einander entsprechenden Filterausgängen des zu bewertenden Testsignals (1a,1b) und des Referenzsignals (1c,1d) erfolgt.
  14. Verfahren nach einem der Patentansprüche 1 bis 13, dadurch gekennzeichnet, dass die Filterbank (3) aus einer beliebigen wählbaren Anzahl von Filterpaaren für Test- und Referenzsignal (1a,1b) bzw. 1c,1d) besteht und dass die Filter auf weitgehend beliebigen Tonhöhenskalen gleichmäßig verteilt werden.
  15. Verfahren nach einem der Patentansprüche 1 bis 14, dadurch gekennzeichnet, dass die Ausgangswerte der Filterbank (3) zur Berücksichtigung der Simultanverdeckung an der oberen Flanke spektral verschmiert werden, dass der Pegel (L) abhängig für jeden Filterausgang aus dem mit einer Zeitkonstante tiefpassgefilterten Betragsquadrat (5) des entsprechenden Ausgangswertes berechnet wird oder ohne Tiefpassfilter bestimmt und stattdessen der Verschmierungsfaktor tiefpassgefiltert wird und dass die Verschmierung unabhängig für die Filter, die den Realteil des Signals repräsentieren und die Filter, die den Imaginärteil des Signals repräsentieren, durchgeführt wird.
  16. Verfahren nach einem der Patentansprüche 1 bis 15, dadurch gekennzeichnet, dass die zeitliche Verschmierung der Filterausgangssignale in zwei Stufen erfolgt, wobei in der ersten Stufe die Signale über ein Cosinus2-förmiges Zeitfenster ermittelt werden und in der zweiten Stufe eine Nachverdeckung moduliert wird.
  17. Verfahren nach Patentanspruch 16, dadurch gekennzeichnet, dass die Cosinus2-förmigen Zeitfenster eine Länge zwischen 1 bis 16 ms haben.
  18. Verfahren nach einem der Patentansprüche 1 bis 17, dadurch gekennzeichnet, dass zum Pegelangleich die momentanen Betragsquadrate (5) an den Filterausgängen durch Tiefpässe erster Ordnung zeitlich geglättet werden, dass die verwendeten Zeitkonstanten in Abhängigkeit von der Mittenfrequenz des jeweiligen Filters gewählt werden und dass ein Korrekturfaktor aus der Orthogonalitätsbeziehung zwischen spektraler Hüllkurven der zeitlich geglätteten Filterausgänge von Test- und Referenzsignal (1a, 1b; 1c, 1d) berechnet wird.
  19. Verfahren nach Patentanspruch 18, dadurch gekennzeichnet, dass das Testsignal mit dem Korrekturfaktor multipliziert wird, wenn der Korrekturfaktor < 1 ist und das Referenzsignal durch den Korrekturfaktor geteilt wird, wenn der Korrekturfaktor > 1 ist.
  20. Verfahren nach einem der Patentansprüche 1 bis 19, dadurch gekennzeichnet, dass für jeden Filterkanal Korrekturfaktoren aus der Orthogonalitätsbeziehung zwischen den zeitlichen Hüllkurven der Filterausgänge von Test- und Referenzsignal (1a,1b; 1c,1d) berechnet werden.
  21. Verfahren nach Patentanspruch 1, dadurch gekennzeichnet, dass aus der auf die Modulation des Referenzsignals normierten (absolute) Differenz der Hüllkurven von Test- und Referenzsignal für jeden Filterkanal und jedes Filterband eine Modulationsdifferenz bestimmt wird, die nach zeitlicher und spektraler Mittelung zur Abschätzung bestimmter hörbarer Störungen geeignet ist.
  22. Verfahren nach einem der Patentansprüche 1 bis 21, dadurch gekennzeichnet, dass aus Eingangswerten in Form der Betragsquadrate (5) in jedem Filterkanal, die Hüllkurvenmodulation, das Eigenrauschen des Gehörs und Konstanten eine gedrosselte Störlautheit ermittelt und über Zeit und Filterkanäle gemittelt wird.
  23. Verfahren nach einem der Patentansprüche 1 bis 22, dadurch gekennzeichnet, dass das Eingangssignal (X) um N Abtastwerte verzögert und nach einer Multiplikation mit einem komplexwertigen Faktor vom ursprünglichen Eingangssignal subtrahiert wird, dass das resultierende Signal (V) zu dem um einen Abtastwert verzögerten Ausgangssignal addiert wird und dass das Resultat multipliziert mit einem weiteren komplexwertigen Faktor das neue Ausgangssignal ergibt.
EP99106223A 1998-05-13 1999-04-12 Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen Expired - Lifetime EP0957471B1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19821273 1998-05-13
DE19821273A DE19821273B4 (de) 1998-05-13 1998-05-13 Meßverfahren zur gehörrichtigen Qualitätsbewertung von codierten Audiosignalen

Publications (3)

Publication Number Publication Date
EP0957471A2 EP0957471A2 (de) 1999-11-17
EP0957471A3 EP0957471A3 (de) 2004-01-02
EP0957471B1 true EP0957471B1 (de) 2006-02-01

Family

ID=7867531

Family Applications (1)

Application Number Title Priority Date Filing Date
EP99106223A Expired - Lifetime EP0957471B1 (de) 1998-05-13 1999-04-12 Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen

Country Status (6)

Country Link
US (1) US7194093B1 (de)
EP (1) EP0957471B1 (de)
AT (1) ATE317151T1 (de)
CA (1) CA2271445C (de)
DE (2) DE19821273B4 (de)
DK (1) DK0957471T3 (de)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001236293A1 (en) * 2000-02-29 2001-09-12 Telefonaktiebolaget Lm Ericsson (Publ) Compensation for linear filtering using frequency weighting factors
US7278289B2 (en) * 2003-04-28 2007-10-09 Sonora Medical Systems, Inc. Apparatus and methods for testing acoustic systems
US7373296B2 (en) * 2003-05-27 2008-05-13 Koninklijke Philips Electronics N. V. Method and apparatus for classifying a spectro-temporal interval of an input audio signal, and a coder including such an apparatus
US20050085316A1 (en) * 2003-10-20 2005-04-21 Exelys Llc Golf ball location system
DE102004029872B4 (de) * 2004-06-16 2011-05-05 Deutsche Telekom Ag Verfahren und Anordnung zur Verbesserung der Qualität bei der Übertragung codierter Audio-/Video-Signale
US20070239295A1 (en) * 2006-02-24 2007-10-11 Thompson Jeffrey K Codec conditioning system and method
DE102006025403B3 (de) * 2006-05-31 2007-08-16 Siemens Audiologische Technik Gmbh Verfahren zum Analysieren eines nichtlinearen Signalverarbeitungssystems
KR101600082B1 (ko) * 2009-01-29 2016-03-04 삼성전자주식회사 오디오 신호의 음질 평가 방법 및 장치
US9299362B2 (en) * 2009-06-29 2016-03-29 Mitsubishi Electric Corporation Audio signal processing device
US20110015922A1 (en) * 2009-07-20 2011-01-20 Larry Joseph Kirn Speech Intelligibility Improvement Method and Apparatus
US8682621B2 (en) * 2010-07-16 2014-03-25 Micron Technology, Inc. Simulating the transmission of asymmetric signals in a computer system
CN102881289B (zh) * 2012-09-11 2014-04-02 重庆大学 一种基于听觉感知特性的语音质量客观评价方法
CN104361894A (zh) * 2014-11-27 2015-02-18 湖南省计量检测研究院 一种基于输出的客观语音质量评估的方法
CN113077815B (zh) * 2021-03-29 2024-05-14 腾讯音乐娱乐科技(深圳)有限公司 一种音频评估方法及组件

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4450531A (en) * 1982-09-10 1984-05-22 Ensco, Inc. Broadcast signal recognition system and method
US4860360A (en) * 1987-04-06 1989-08-22 Gte Laboratories Incorporated Method of evaluating speech
JPH0398318A (ja) * 1989-09-11 1991-04-23 Fujitsu Ltd 音声符号化方式
US5210820A (en) * 1990-05-02 1993-05-11 Broadcast Data Systems Limited Partnership Signal recognition system and method
DE4431481A1 (de) * 1994-09-03 1996-03-07 Philips Patentverwaltung Schaltungsanordnung mit steuerbarem Übertragungsverhalten
DE4437287C2 (de) * 1994-10-18 1996-10-24 Fraunhofer Ges Forschung Verfahren zur Messung der Erhaltung stereophoner Audiosignale und Verfahren zur Erkennung gemeinsam codierter stereophoner Audiosignale
DE19523327C2 (de) * 1995-06-27 2000-08-24 Siemens Ag Verfahren zur verbesserten Schätzung der Impulsantwort eines Übertragungskanals
DE19647399C1 (de) * 1996-11-15 1998-07-02 Fraunhofer Ges Forschung Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen

Also Published As

Publication number Publication date
EP0957471A2 (de) 1999-11-17
US7194093B1 (en) 2007-03-20
CA2271445C (en) 2011-02-22
ATE317151T1 (de) 2006-02-15
DE19821273B4 (de) 2006-10-05
DE19821273A1 (de) 1999-12-02
DK0957471T3 (da) 2006-06-06
EP0957471A3 (de) 2004-01-02
DE59913088D1 (de) 2006-04-13
CA2271445A1 (en) 1999-11-13

Similar Documents

Publication Publication Date Title
EP0957471B1 (de) Messverfahren zur gehörrichtigen Qualitätsbewertung von Audiosignalen
DE60303214T2 (de) Verfahren zur reduzierung von aliasing-störungen, die durch die anpassung der spektralen hüllkurve in realwertfilterbanken verursacht werden
DE3506912C2 (de)
EP1741039B1 (de) Informationssignalverarbeitung durch modifikation in der spektral-/modulationsspektralbereichsdarstellung
EP1525576B1 (de) Vorrichtung und verfahren zum erzeugen einer komplexen spektraldarstellung eines zeitdiskreten signals
EP1386307B2 (de) Verfahren und vorrichtung zur bestimmung eines qualitätsmasses eines audiosignals
DE2919085A1 (de) Vorverarbeitungsverfahren und -vorrichtung fuer eine spracherkennungsvorrichtung
EP0065210A2 (de) Verfahren zur Aufbereitung elektrischer Signale mit einer digitalen Filteranordnung
DE2749132A1 (de) Rauschfilter-anordnung
DE4330243A1 (de) Sprachverarbeitungseinrichtung
WO1998023130A1 (de) Gehörangepasste qualitätsbeurteilung von audiosignalen
DE69317802T2 (de) Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern
EP0485390B1 (de) Verfahren zur übertragung eines signals
DE69803202T2 (de) Verfahren und vorrichtung zur sprachdetektion
EP3089481A1 (de) Verfahren zur frequenzabhängigen rauschunterdrückung eines eingangssignals
DE10157535B4 (de) Verfahren und Vorrichtung zur Reduzierung zufälliger, kontinuierlicher, instationärer Störungen in Audiosignalen
DE19505435C1 (de) Verfahren und Vorrichtung zum Bestimmen der Tonalität eines Audiosignals
WO2015049332A1 (de) Ableitung von multikanalsignalen aus zwei oder mehreren grundsignalen
EP1239455A2 (de) Verfahren und Anordnung zur Durchführung einer an die Übertragungsfunktion menschilcher Sinnesorgane angepassten Fourier Transformation sowie darauf basierende Vorrichtungen zur Geräuschreduktion und Spracherkennung
EP1458216B1 (de) Vorrichtung und Verfahren zur Adaption von Hörgerätemikrofonen
EP1453355B1 (de) Signalverarbeitung in einem Hörgerät
DE3230391C2 (de)
EP0075311B1 (de) Anordnung zur Übertragung von Sprache nach dem Kanalvocoderprinzip
DE69802431T2 (de) Verfahren und vorrichtung zur verbesserung eines digitalen sprachsignals
EP0535425B1 (de) Verfahren zur Verstärkung von akustischen Signalen für Hörbehinderte, sowie Vorrichtung zur Durchführung des Verfahrens

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

AX Request for extension of the european patent

Free format text: AL;LT;LV;MK;RO;SI

PUAL Search report despatched

Free format text: ORIGINAL CODE: 0009013

AK Designated contracting states

Kind code of ref document: A3

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

AX Request for extension of the european patent

Extension state: AL LT LV MK RO SI

RIC1 Information provided on ipc code assigned before grant

Ipc: 7G 10L 19/00 A

17P Request for examination filed

Effective date: 20040702

AKX Designation fees paid

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

17Q First examination report despatched

Effective date: 20050404

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT;WARNING: LAPSES OF ITALIAN PATENTS WITH EFFECTIVE DATE BEFORE 2007 MAY HAVE OCCURRED AT ANY TIME BEFORE 2007. THE CORRECT EFFECTIVE DATE MAY BE DIFFERENT FROM THE ONE RECORDED.

Effective date: 20060201

Ref country code: IE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20060201

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20060201

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: GERMAN

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: AT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060412

REF Corresponds to:

Ref document number: 59913088

Country of ref document: DE

Date of ref document: 20060413

Kind code of ref document: P

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MC

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060430

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060430

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060430

Ref country code: BE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060430

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: ES

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20060512

REG Reference to a national code

Ref country code: SE

Ref legal event code: TRGR

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20060502

REG Reference to a national code

Ref country code: DK

Ref legal event code: T3

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20060703

REG Reference to a national code

Ref country code: IE

Ref legal event code: FD4D

ET Fr: translation filed
PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

26N No opposition filed

Effective date: 20061103

BERE Be: lapsed

Owner name: DEUTSCHE TELEKOM A.G.

Effective date: 20060430

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20060502

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LU

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060412

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20060201

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 18

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 19

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: NL

Payment date: 20180423

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20180423

Year of fee payment: 20

Ref country code: DK

Payment date: 20180424

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20180424

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: SE

Payment date: 20180424

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20180403

Year of fee payment: 20

REG Reference to a national code

Ref country code: DE

Ref legal event code: R071

Ref document number: 59913088

Country of ref document: DE

REG Reference to a national code

Ref country code: DK

Ref legal event code: EUP

Effective date: 20190412

REG Reference to a national code

Ref country code: NL

Ref legal event code: MK

Effective date: 20190411

REG Reference to a national code

Ref country code: GB

Ref legal event code: PE20

Expiry date: 20190411

REG Reference to a national code

Ref country code: SE

Ref legal event code: EUG

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20190411