-
Die
vorliegende Erfindung bezieht sich auf die Verarbeitung von Informationssignalen
im allgemeinen, wie z.B. von Audiosignalen, Videosignalen oder anderen
Multimediasignalen, und insbesondere auf die Verarbeitung von Informationssignalen
im Spektral-/Modulationsspektralbereich.
-
Im
Bereich der Signalverarbeitung, beispielsweise bei der Verarbeitung
digitaler Audiosignale, existieren häufig Signale, die aus einem
Trägersignalanteil
und einem Modulationsanteil bestehen. In dem Fall modulierter Signale
wird eine Repräsentation,
in der die Signale in Träger-
und Modulationskomponenten zerlegt sind, häufig benötigt, um diese beispielsweise
filtern, codieren oder anderweitig modifizieren zu können.
-
Zu
Zwecken der Audiocodierung ist es beispielsweise bekannt, das Audiosignal
einer sogenannten Modulationstransformation zu unterziehen. Dabei
wird das Audiosignal durch eine Transformation in Frequenzbänder zerlegt.
Anschließend
wird eine Zerlegung in Betrag und Phase vorgenommen. Während die
Phase nicht weiterverarbeitet, werden die Beträge je Teilband über eine
Anzahl von Transformationsblöcken
in einer zweiten Transformation erneut transformiert. Das Ergebnis
ist eine Frequenzzerlegung der zeitlichen Hüllkurve des betreffenden Teilbandes
in Modulationskoeffizienten. Audiocodierungen, die auf einer solchen
Modulationstransformation bestehen, sind beispielsweise in M. Vinton und
L. Atlas, „A
Scalable and Progressive Audio Codec", in Proceedings of the 2001 IEEE ICASSP, 7.-11.
Mai 2001, Salt Lake City, United States Patent Application US 2002/0176353A1:
Atlas et al., "Scalable
And Perceptually Ranked Signal Coding And Decoding", 11/28/2002, und
J. Thompson und L.Atlas, "A
Non-uniform Modulation Transform for Audio Coding with Increased
Time Resolution",
in Proceedings of the 2003 IEEE ICASSP, 6.-10. April, Hong Kong,
2003, beschrieben.
-
Ein Überblick über weitere
verschiedene Demodulationstechniken über die volle Bandbreite des zu
demodulierenden Signals, einschließlich asynchroner und synchroner
Demodulationstechniken etc., gibt beispielsweise der Artikel L.
Atlas, „Joint Acoustic
And Modulation Frequency",
Journal on Applied Signal Processing 7 EURASIP, S. 668-675, 2003,
beschrieben.
-
Ein
Nachteil der oben genannten Schemata zur Audiocodierung unter Verwendung
einer Modulationstransformation besteht in der folgenden Tatsache.
Solange an den Modulationskoeffizienten zusammen mit den Phasen
keine weitere Bearbeitungsschritte vorgenommen werden, bilden die
Modulationskoeffizienten eine Spektral-/Modulationsspektraldarstellung
des Audiosignals, die reversibel und perfekt rekonstruierend ist,
d.h. ohne Veränderungen
wieder ins ursprüngliche
Audiosignal im Zeitbereich rückkonvertierbar
ist. Bei diesen Verfahren werden jedoch die Modulationskoeffizienten
gefiltert, um nach psychoakustischen Kriterien die Modulationskoeffizienten
auf möglichst
kleine Werte zu verringern bzw. quantisieren, so dass eine möglichst
hohe Kompressionsrate erzielt wird. Hierdurch erreicht man jedoch
im allgemeinen nicht das gewünschte Ziel,
die betreffenden Modulationskomponenten aus dem resultierenden Signal
zu entfernen oder bei dieser Komponente gezielt Quantisierungsrauschen einzubringen.
Der Grund dafür
besteht darin, dass die Phasen der Teilbänder nach der Rücktransformation
der veränderten
Modulationskoeffizienten nicht mehr konsistent mit den veränderten
Beträgen
dieser Teilbänder
sind und auch weiterhin starke Komponenten des Modulationsanteiles
des Originalsignals enthalten. Werden nun die Phasen der Teilbänder mit den
veränderten
Beträgen
rekombiniert, werden diese Modulationsanteile bzw. -komponenten
durch die Phase wieder in das gefilterte oder quantisierte Signal
eingebracht. Mit anderen Worten ausgedrückt, liefert eine Modulationstrans formation
gefolgt von einer Modifikation der Modulationskoeffizienten auf
die oben dargestellte Weise, also durch Filterung der Modulationskoeffizienten,
zusammen mit einer anschließenden
Synthese des Phasen- und Betragsanteils ein Signal, das bei einer
erneuten Analyse bzw. Modulationstransformation immer noch erhebliche Modulationskomponenten
an denjenigen Stellen in der Spektral-/Modulationsspektralbereichsdarstellung
enthält,
die ausgefiltert werden sollten. Eine wirksame Filterung ist also
basierend auf den eingehend genannten Modulationstransformations-basierten
Signalverarbeitungsschemata nicht möglich.
-
Es
besteht deshalb ein Bedarf nach einem Informationssignalverarbeitungsschema,
das es ermöglicht,
modulierte Signale mit einem Trägeranteil und
einem Modulationsanteil gezielter nach Modulations- und Trägeranteil
getrennt verarbeiten zu können.
-
Die
Aufgabe der vorliegenden Erfindung besteht folglich darin, ein Verarbeitungsschema
für Informationssignale
zu schaffen, das eine gezielter nach Modulations- und Trägeranteilen
getrennte Verarbeitung von Informationssignalen ermöglicht.
-
Diese
Aufgabe wird durch eine Vorrichtung gemäß Anspruch 1 und ein Verfahren
gemäß Anspruch
17 gelöst.
-
Eine
erfindungsgemäße Vorrichtung
zum Verarbeiten eines Informationssignals umfasst eine Einrichtung
zum Überführen des
Informationssignals in eine Zeit-/Spektraldarstellung durch blockweises Transformieren
des Informationssignals sowie eine Einrichtung zum Überführen des
Informationssignals von der Zeit-/Spektraldarstellung in eine Spektral-/Modulationsspektraldarstellung,
wobei die Einrichtung zum Überführen derart
ausgebildet ist, dass die Spektral-/Modulationsspektraldarstellung abhängig von
sowohl einem Betragsanteil als auch einem Phasenanteil der Zeit-/Spek traldarstellung
des Informationssignals ist. Eine Einrichtung nimmt dann eine Manipulation
bzw. Modifikation des Informationssignals in der Spektral-/Modulationsspektraldarstellung vor,
um eine modifizierte Spektral-/Modulationsspektraldarstellung
zu erhalten. Eine weitere Einrichtung bildet schließlich ein
verarbeitetes Informationssignal, das eine verarbeitete Version
des Informationssignals darstellt, basierend auf der modifizierten
Spektral-/Modulationsspektraldarstellung.
-
Der
Kerngedanke der vorliegenden Erfindung besteht darin, dass sich
eine strikter nach Modulations- und Trägeranteilen getrennte Verarbeitung von
Informationssignalen erzielen lässt,
wenn die Überführung des
Informationssignals von der Zeit-/Spektraldarstellung bzw. der Zeit-/Frequenzdarstellung
in die Spektral-/Modulationsspektraldarstellung bzw. die Frequenz-/Modulationsfrequenzdarstellung
abhängig
von sowohl einem Betragsanteil als auch einem Phasenanteil der Zeit-/Spektraldarstellung
des Informationssignals durchgeführt
wird. Hierdurch entfällt
eine Rekombination zwischen Phase und Betrag, und damit die Wiedereinführung von unerwünschten
Modulationskomponenten in die Zeitdarstellung des verarbeiteten
Informationssignals auf der Syntheseseite.
-
Die Überführung des
Informationssignals von der Zeit-/Spektraldarstellung
in die Spektral-/Modulationsspektraldarstellung unter Berücksichtigung sowohl
des Betrags als auch der Phase bringt das Problem mit sich, dass
die Zeit-/Spektraldarstellung des
Informationssignals tatsächlich
nicht nur von dem Informationssignal sondern auch von dem Phasenversatz
der Zeitblöcke
zu der Trägerspektralkomponente
des Informationssignals abhängt.
Anders ausgedrückt
bewirkt die blockweise Transformation des Informationssignals von
der Zeitdarstellung in die Zeit/Spektraldarstellung, dass die pro
Spektralkomponente in der Zeit-/Spektraldarstellung
des Informationssignals erhaltenen Folgen von Spektralwerten einen
aufmodulierten komplexen Träger
aufweisen, der lediglich von der Asynchronität der Blockwiederholfrequenz
zu der Trägerfrequenzkomponente
des Informationssignals abhängt.
Gemäß den Ausführungsbeispielen
der vorliegenden Erfindung wird deshalb pro Spektralkomponente eine
Demodulation der Folge von Spektralwerten in der Zeit-/Spektraldarstellung
des Informationssignals vorgenommen, um pro Spektralkomponente eine
demodulierte Folge von Spektralwerten zu erhalten. Die anschließende Überführung der
so erhaltenen demodulierten Folgen von Spektralwerten wird durch
blockweise Transformationen von der Zeit/Spektraldarstellung in
die Spektral/Modulationsspektraldarstellung bzw. durch blockweises
spektrales Zerlegen derselben durchgeführt, wodurch Blöcke von
Modulationswerten erhalten werden. Diese werden manipuliert bzw.
modifiziert, wie z.B. zur Bandpassfilterung zur Entfernung des Modulationsanteils
aus dem ursprünglichen
Informationssignal mit einer entsprechenden Gewichtungsfunktion
gewichtet. Das Ergebnis ist eine modifizierte demodulierte Folge
von Spektralwerten bzw. modifizierte demodulierte Zeit/Spektraldarstellung. Auf
die so erhaltenen modifizierten demodulierten Folgen von Spektralwerten
wird der komplexe Träger wieder
aufmoduliert, wodurch eine modifizierte Folge von Spektralwerten
erhalten wird, die einen Teil einer Zeit-/Spektraldarstellung des
verarbeiteten Informationssignals darstellt. Eine Rücküberführung dieser Darstellung
in die Zeitdarstellung ergibt ein verarbeitetes Informationssignal
in der Zeitdarstellung bzw. Zeitbereich, das im Hinblick auf Modulations-
und Trägeranteile äußerst genau
bezüglich
des ursprünglichen
Informationssignals verändert
sein kann.
-
Bevorzugte
Ausführungsbeispiele
der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf
die beiliegenden Zeichnungen näher
erläutert.
Es zeigen:
-
1 ein
Blockschaltbild einer Vorrichtung zur Verarbeitung eines Informationssignals
gemäß einem Ausführungsbeispiel
der vorliegenden Erfindung; und
-
2 eine
schematische Skizze zur Veranschaulichung der Funktionsweise der
Vorrichtung nach 1.
-
1 zeigt
eine Vorrichtung zur Verarbeitung eines Informationssignals gemäß einem
Ausführungsbeispiel
der vorliegenden Erfindung. Die Vorrichtung von 1,
die allgemein mit 10 angezeigt ist, umfasst einen Eingang 12,
an welchem dieselbe das zu verarbeitende Informationssignal 14 erhält. Die
Vorrichtung von 1 ist exemplarisch dazu vorgesehen,
das Informationssignal 14 derart zu verarbeiten, dass der
Modulationsanteil aus dem Informationssignal 14 entfernt
wird, und um somit ein verarbeitetes Informationssignal mit lediglich
dem Trägeranteil
zu erhalten. Ferner umfasst die Vorrichtung 10 einen Ausgang 16,
um den Trägeranteil
als das Verarbeitungsergebnis bzw. das verarbeitete Informationssignal 18 auszugeben.
-
Intern
gliedert sich die Vorrichtung 10 im wesentlichen in einen
Teil 20 zur Überführung des
Informationssignals 14 von einer Zeitdarstellung in eine Zeit-/Frequenzdarstellung,
eine Einrichtung 22 zur Überführung des Informationssignals
von der Zeit-/Frequenzdarstellung in die Frequenz-/Modulationsfrequenzdarstellung,
einen Teil 24, in welchem die eigentliche Verarbeitung
stattfindet, nämlich
die Modifikation des Informationssignals, und einen Teil 26 zur
Rücküberführung des
in der Frequenz-/Modulationsfrequenzdarstellung verarbeiteten Informationssignals
von dieser Darstellung in die Zeitdarstellung. Die genannten vier
Teile sind in dieser Reihenfolge zwischen den Eingang 12 und
den Ausgang 16 in Reihe geschaltet, wobei deren genauerer
Aufbau und deren genauere Funktionsweise im folgenden beschrieben
wird.
-
Der
Teil 20 der Vorrichtung 10 umfasst eine Fensterungseinrichtung 28 und
eine Transformationseinrichtung 30, die sich in dieser
Reihenfolge an den Eingang 12 anschließen. Insbesondere ist ein Eingang
der Fensterungseinrichtung 28 mit dem Eingang 12 verbunden,
um das Informationssignal 14 als eine Folge von Informationswerten
zu erhalten. Sollte das Informationssignal noch als analoges Signal
vorliegen, kann dies beispielsweise durch einen A/D-Wandler bzw.
eine diskrete Abtastung in eine Folge von Informations- bzw. Abtastwerten überführt werden.
Die Fensterungseinrichtung 28 bildet aus der Folge von
Informationswerten Blöcke
zu je gleicher Anzahl an Informationswerten und führt an jedem
Block von Informationswerten zudem eine Gewichtung mit einer Gewichtungsfunktion
durch, die beispielsweise aber nicht ausschließlich einem Sinusfenster oder
einem KBD-Fenster
entsprechen kann. Die Blöcke
können
sich überlappen,
wie z.B. um 50%, oder nicht. Im folgenden wird lediglich exemplarisch
von einer 50%-Überlappung
ausgegangen. Bevorzugt werden Fensterfunktionen mit der Eigenschaft,
dass sie eine gute Teilbandtrennung in der Zeit/Spektraldarstellung
ermöglichen
und sich die Quadrate ihrer einander korrespondierenden, da auf ein
und denselben Informationswert angewendeten, Gewichtungswerte im Überlappungsbereich
zu Eins addieren.
-
Ein
Ausgang der Fensterungseinrichtung 28 ist mit einem Eingang
der Transformationseinrichtung 30 verbunden. Die von der
Fensterungseinrichtung 28 ausgegeben Blöcke von Informationswerten werden
von der Transformationseinrichtung 30 empfangen. Dieselben
unterzieht die Transformationseinrichtung 30 dann blockweise
einer spektral zerlegenden Transformation, wie z.B. einer DFT oder
einer anderen komplexen Transformation. Die Transformationseinrichtung 30 erzielt
somit blockweise eine Zerlegung des Informationssignals 14 in
Spektralkomponenten und erzeugt somit insbesondere pro Zeitblock,
wie er von der Fensterungseinrichtung 28 erhalten wird,
einen Block von Spektralwerten, der einen Spektralwert pro Spektralkomponente
umfasst. Mehrere Spektralwerte können
zu Teilbändern
zusammengefasst sein. Im folgenden werden allerdings die Begriffe
Teilband und Spektralkomponente synonym verwendet. Für jede Spektralkomponente bzw.
jedes Teilband ergibt sich somit pro Zeitblock ein Spektralwert,
oder mehrere, falls eine Teilbandzusammenfassung vorliegt, was im
folgenden jedoch nicht angenommen wird. Dementsprechend gibt die Transformationseinrichtung 30 pro
Spektralkomponente bzw. Teilband eine Folge von Spektralwerten aus,
die den zeitlichen Verlauf dieser Spektralkomponente bzw. dieses
Teilbandes darstellen. Die von der Transformationseinrichtung 30 ausgegebenen
Spektralwerte stellen eine Zeit-/Frequenzdarstellung des Informationssignals 14 dar.
-
Der
Teil 22 umfasst eine Trägerfrequenzbestimmungseinrichtung 32,
einen als Demodulationseinrichtung dienenden Mischer 34,
eine Fensterungseinrichtung 36, und eine zweite Transformationseinrichtung 38.
-
Die
Fensterungseinrichtung 32 umfasst einen Eingang, der mit
dem Ausgang der Transformationseinrichtung 30 verbunden
ist. Sie empfängt
dort die Spektralwertfolgen für
die einzelnen Teilbänder und
teilt die Spektralwertfolgen pro Teilband – ähnlich, wie es die Fensterungseinrichtung 28 bezüglich des
Informationssignals 14 tut – in Blöcke ein und gewichtet die Spektralwerte
jedes Blocks mit einer geeigneten Gewichtungsfunktion. Die Gewichtungsfunktion
kann eine der bereits im vorhergehenden bezüglich Einrichtung 28 exemplarisch
erwähnten
Gewichtungsfunktionen sein. Die aufeinanderfolgenden Blöcke in einem
Teilband können
sich überlappen oder
nicht, wobei im folgenden wieder exemplarisch von einer gegenseitigen Überlappung
um 50% ausgegangen wird. Im folgenden wird davon ausgegangen, dass
die Blöcke
verschiedener Teilbänder
zueinander ausgerichtet sind, wie es im folgenden bezugnehmend auf 1 noch
näher erläutert werden wird.
Eine andere Vorgehensweise mit zwischen den Teilbändern versetzten
Blockfolgen wäre
aber ebenfalls denkbar. Am Ausgang gibt die Fensterungseinrichtung
pro Teilband Folgen von gefensterten Spektralwertblöcken aus.
-
Auch
die Trägerfrequenzbestimmungseinrichtung 32 umfasst
einen Eingang, der mit dem Ausgang der Transformationseinrichtung 30 verbunden ist,
um die Spektralwerte der Teilbänder
bzw. Spektralkomponenten als Folgen von Spektralwerten pro Teilband
zu erhalten. Sie ist dazu vorgesehen, in jedem Teilband diejenige
Trägerkomponente
herauszufinden, die dadurch herrührt,
dass die einzelnen Zeitblöcke,
aus denen die einzelnen Spektralwerte der Teilbänder abgeleitet worden sind,
einen zeitlich variierenden Phasenversatz zu der Trägerfrequenzkomponente
des Informationssignals 14 aufweisen. Die pro Teilband
bestimmte Trägerkomponente
gibt die Trägerfrequenzbestimmungseinrichtung 32 an
ihrem Ausgang an einen Eingang des Mischers 34 aus, der
wiederum einen weiteren Eingang aufweist, der mit dem Ausgang der
Fensterungseinrichtung 36 verbunden ist.
-
Der
Mischer 34 ist derart ausgebildet, dass er je Teilband
die Blöcke
von gefensterten Spektralwerten, wie sie von der Transformationseinrichtung ausgegeben
werden, mit dem komplex Konjugierten der jeweiligen Trägerkomponente
multipliziert, wie sie durch die Trägerfrequenzbestimmungseinrichtung 30 für das jeweilige
Teilband bestimmt worden ist, wodurch die Teilbänder bzw. Blöcke von
gefensterten Spektralwerten demoduliert werden.
-
Am
Ausgang des Mischers 34 ergeben sich somit demodulierte
Teilbänder
bzw. ergibt sich pro Teilband eine Folge von demodulierten Blöcken von gefensterten
Spektralwerten. Der Ausgang des Mischers 34 ist mit einem
Eingang der Transformationseinrichtung 38 verbunden, so
dass letztere pro Teilband sich gegenseitig – hier exemplarisch 50% – überlappende
Blöcke
von gefensterten und demodulierten Spektralwerten erhält und diese
blockweise in die Spektral/Modulationsspektraldarstellung transformiert
bzw. spektral zerlegt, um durch Verarbeitung aller Teilbänder bzw.
Spektralkomponenten eine bisher lediglich in Hinblick auf die Demodulation
der Teilbandspektralwertfolgen modifi zierte Frequenz-/Modulationsfrequenzdarstellung
des Informationssignals 14 zu erzeugen. Die der Transformationseinrichtung 38 pro
Teilband zugrundeliegende Transformation kann beispielsweise eine
DFT, eine MDCT, MDST oder dergleichen sein, und insbesondere auch
die gleiche Transformation wie diejenige der Transformationseinrichtung 30.
In 1 ist exemplarisch davon ausgegangen worden, dass
es sich bei den Transformationen beider Transformationseinrichtungen 30, 38 um
eine DFT handelt.
-
Dementsprechend
gibt die Transformationseinrichtung 38 an ihrem Ausgang
für jedes
Teilband bzw. jede Spektralkomponente nacheinander Blöcke von
Werten aus, die im folgenden als Modulationswerte bezeichnet werden
und eine spektral Zerlegung der Blöcke von gefensterten und demodulierten
Spektralwerten darstellen. Die Blöcke von Spektralwerten pro
Teilband, bezüglich
derer die Transformationseinrichtung 38 die Transformationen
durchführt,
sind zeitlich zueinander ausgerichtet, so dass sich pro Zeitabschnitt
immer gleich eine sich aus einem Modulationswertblock pro Teilband
zusammensetzende Matrix von Modulationswerten ergibt. Die Modulationswerte
gibt die Transformationseinrichtung 38 an den Teil 24 weiter,
der lediglich eine Signalverarbeitungseinrichtung 40 aufweist.
-
Die
Signalverarbeitungseinrichtung 40 ist mit dem Ausgang der
Transformationseinrichtung 38 verbunden und erhält somit
die Blöcke
von Modulationswerten. In dem vorliegenden exemplarischen Fall,
da die Vorrichtung 10 der Modulationsanteilunterdrückung dient,
vollzieht die Signalverarbeitungseinrichtung 40 eine effektive
Tiefpassfilterung im Frequenzbereich an den eingehenden Blöcken von
Modulationswerten, nämlich
eine Gewichtung der Modulationswerte mit einer Funktion, die ausgehend
von der Modulationsfrequenz Null zu höheren bzw. niedrigeren Modulationsfrequenzen
abfällt.
Die derart modifizierten Blöcke
von Modulationswerten gibt die Signalverarbeitungseinrichtung 40 an
den Rücküberführungsteil 26 weiter.
Die von der Signalverarbei tungseinrichtung 40 ausgegebenen
modifizierten Blöcke
von Modulationswerten stellen eine modifizierte Frequenz-/Modulationsfrequenzdarstellung des
Informationssignals 14 dar, oder anders ausgedrückt eine
noch um die Demodulation durch den Mischer 34 von der Frequenz-/Modulationsfrequenzdarstellung
des modifizierten Informationssignals 18 abweichende Frequenz-/Modulationsfrequenzdarstellung.
-
Der
Rücküberführungsteil 26 gliedert
sich seinerseits wiederum in zwei Teile, nämlich einen Teil zur Überführung des
verarbeiteten Informationssignals 18 aus der Frequenz-/Modulationsfrequenzdarstellung,
wie sie von der Signalverarbeitungseinrichtung 40 ausgegeben
wird, in die Zeit-/Frequenzdarstellung,
und einen Teil zur Rücküberführung des
verarbeiteten Informationssignals von der Zeit-/Frequenzdarstellung in die Zeitdarstellung.
Der erstgenannte der beiden Teile umfasst eine Transformationseinrichtung 42 zur
Durchführung
einer zu der Transformation nach der Transformationseinrichtung 38 inversen
blockweisen Transformation, einen Mischer 46 und eine Zusammenfügungseinrichtung 44.
Der zweitgenannte Teil des Rückführungsteils 26 umfasst
eine Transformationseinrichtung 48 zur Durchführung einer
zu der Transformation der Transformationseinrichtung 30 inversen
blockweisen Transformation und eine Zusammenfügungseinrichtung 50.
-
Die
inverse Transformationseinrichtung 42 ist mit ihrem Eingang
an den Ausgang der Signalverarbeitungseinrichtung 40 angeschlossen
und transformiert die modifizierten Blöcke von Modulationswerten teilbandweise
von der Spektraldarstellung zurück
in die Zeit/Frequenzdarstellung und macht damit die spektrale Zerlegung
wieder rückgängig, um
pro Teilband eine Folge von modifizierten Blöcken von Spektralwerten zu
erhalten. Diese von der inversen Transformationseinrichtung 42 ausgegebenen
modifizierten Spektralwertblöcke
unterscheiden sich von den Spektralwertblöcken, wie sie von der Fensterungseinrichtung 36 ausgegeben
worden sind, aber nicht nur durch die Verarbeitung durch die Signalverarbeitungseinrichtung 40 sondern
auch durch die durch den Mischer 34 bewirkte Demodulation.
Deshalb empfängt
der Mischer 46 die von der inversen Transformationseinrichtung 42 pro
Teilband ausgegebenen Folgen von modifizierten Spektralwertblöcken und
mischt dieselben mit einem komplexen Träger, der zu demjenigen, der
an entsprechender Stelle bzw. für
den entsprechenden Block zur Demodulation des Informationssignals
an dem Mischer 34 verwendet worden ist, komplex konjugiert
ist, um die Spektralwertblöcke
wieder mit dem durch die Phasenversätze der Zeitblöcke bewirkten
Träger
zu modulieren. Das Ergebnis, das sich am Ausgang des Mischers 46 einstellt,
ist pro Teilband eine Folge von modifizierten nicht-demodulierten
Spektralwertblöcken.
-
Der
Ausgang des Mischer 46 ist mit einem Eingang der Zusammenfügungseinrichtung 44 verbunden.
Diese führt
pro Teilband die Folge von wieder mit dem komplexen Träger aufmodulierten
modifizierten Blöcken
von Spektralwerten zu einem einheitlichen Strom bzw. einer einheitlichen
Folge von Spektralwerten zusammen, indem sie einander entsprechende
Spektralwerte benachbarter bzw. aufeinanderfolgender Blöcke von
Spektralwerten für
ein Teilband, wie sie von dem Mischer 46 erhalten werden,
geeignet miteinander verknüpft.
In dem Fall der Verwendung oben exemplarisch genannter Gewichtungsfunktionen
mit der positiven Eigenschaft, dass sich bei Überlappung die Quadrate einander
korrespondierender Gewichtungswerte zu Eins summieren, besteht die
Verknüpfung
in einer einfachen Addition einander zugeordneter Spektralwerte.
Das am Ausgang der Zusammenfügungseinrichtung 44 (OLA
= overlap-add = Überlappaddierung)
ausgegebene Ergebnis setzt sich aus einer modifizierten Folge von Spektralwerten
pro Teilband zusammen. Das Ergebnis, das somit am Ausgang des der
OLA 44 ausgegeben wird, sind somit modifizierte Teilbänder bzw.
modifizierte Folgen von Spektralwerten für alle Spektralkomponenten
und stellt eine modifizierte Zeit-/Frequenzdarstellung des Informationssig nals 14 bzw. eine
Zeit-/Frequenzdarstellung des modifizierten Informationssignals 18 dar.
-
Die
Transformationseinrichtung 48 empfängt die Spektralwertfolgen
und somit insbesondere nacheinander jeweils einen Spektralwert für alle Teilbänder bzw.
Spektralkomponenten bzw. nacheinander eine spektrale Zerlegung eines
Abschnitts des modifizierten Informationssignals 18. Sie
erzeugt aus der Folge von spektralen Zerlegungen durch Rückgängigmachung
der Spektralzerlegung eine Folge von modifizierten Zeitblöcken. Diese
modifizierten Zeitblöcke
empfängt
wiederum die Zusammenfügungseinrichtung 50.
Die Zusammenfügungseinrichtung 50 arbeitet ähnlich der
Zusammenfügungseinrichtung 44.
Sie fügt
die sich exemplarisch um 50% überlappenden
modifizierten Zeitblöcke
dadurch zusammen, dass sie aus benachbarten bzw. aufeinanderfolgenden
modifizierten Zeitblöcken
einander entsprechende Informationswerte addiert. Das Ergebnis am
Ausgang der Zusammenfügungseinrichtung 50 ist
somit eine Folge von Informationswerten, die das verarbeitete Informationssignal 18 darstellen.
-
Nachdem
nun im vorhergehenden der Aufbau der Vorrichtung 10 sowie
die Funktionsweise der Einzelkomponenten beschrieben worden ist,
wird im folgenden die Funktionsweise derselben Bezug nehmend auf 1 und 2 näher erörtert.
-
Die
Verarbeitung des Informationssignals durch die Vorrichtung 10 beginnt
mit dem Empfang des Audiosignals 14 am Eingang 12.
Das Informationssignal 14 liegt dabei in einer abgetasteten
Form vor. Die Abtastung ist beispielsweise mittels eines Analog/Digital-Wandlers
vorgenommen worden. Die Abtastung erfolgte mit einer gewissen Abtastfrequenz ωs. Das Informationssignal 14 erreicht
den Eingang 12 folglich als eine Folge von Abtast- bzw. Informationswerten
si = s(2π/ωs·i),
wobei s das analoge Informationssignal, si die
Informationswerte und der Index i ein Index für die Informationswerte sein sollen.
Unter den eingehenden Abtastwer ten si fasst die
Fensterungseinrichtung 28 je 2N aufeinanderfolgende Abtastwerte
zu Zeitblöcken
zusammen, vorliegend exemplarisch mit einer 50%-igen Überlappung. Beispielsweise
fasst sie die Abtastwerte so bis s2N-1 zu
einem Zeitblock mit dem Index n = 0 zusammen, die Abtastwerte sN bis s3N-1 zu einem
zweiten Zeitblock mit dem Index n = 1, die Abtastwerte s2N bis s4N-1 zu einem
dritten Zeitblock von Informationswerten mit dem Index n = 2 usw.
zusammen. Jeden dieser Blöcke
gewichtet die Fensterungseinrichtung 28 mit einer Fenster-
bzw. Gewichtungsfunktion, wie es im Vorhergehenden beschrieben wurde.
Seien sn 0 bis sn 2N-1 beispielsweise
die 2N Informationswerte des Zeitblocks n, dann ergibt sich der
durch die Einrichtung 28 ausgegebene Block schließlich zu
sn 0 → sn 0·g0 bis sn 2N-1 → sn 2N-1·g2N-1, wobei gi mit
i = 0 bis 2N-1 die Gewichtungsfunktion sei.
-
In 2 sind
die auf die Informationswerte si angewendeten
Fensterungsfunktionen exemplarisch für vier aufeinanderfolgende
Zeitblöcke
n = 0, 1, 2, 3 in einem Diagramm 70 veranschaulicht, bei
dem entlang der x-Achse die Zeit t in willkürlichen Einheiten und entlang
der y-Achse die Amplitude der Fensterungsfunktionen in willkürlichen
Einheiten aufgetragen ist. Auf diese Weise gibt die Fensterungseinrichtung 28 nach
jeweils N Informationswerten einen neuen gefensterten Zeitblock
zu je 2N Informationswerten an die Transformationseinrichtung 30 weiter. Die
Wiederholfrequenz der Zeitblöcke
beträgt
somit ωs/N.
-
Die
Transformationseinrichtung 30 transformiert die gefensterten
Zeitblöcke
in eine Spektraldarstellung. Die Transformationseinrichtung 30 führt dabei
eine spektrale Zerlegung der Zeitblöcke von gefensterten Informationswerten
in eine Mehrzahl von vorbestimmten Teilbändern bzw. Spektralkomponenten
durch. Im vorliegenden Fall wird exemplarisch davon ausgegangen,
dass es sich bei der Transformation um eine DFT bzw. diskrete Fouriertransformation handelt.
Für jeden
Zeitblock zu 2N Informationswerten erzeugt die Transformationseinrichtung 30 in
diesem exemplarischen Fall N komplexwertige Spektralwerte für N Spektralkomponenten,
wenn das Informationssignal reell ist. Die von der Transformationseinrichtung 30 ausgegebenen
komplexen Spektralwerte stellen die Zeit-/Frequenzdarstellung 74 des Informationssignals
dar. Die komplexen Spektralwerte sind hierbei in 2 durch
Kästchen 76 veranschaulicht.
Da die Transformationseinrichtung 30 pro aufeinanderfolgendem
Zeitblock von Informationswerten pro Teilband bzw. Spektralkomponente
zumindest einen Spektralwert erzeugt, gibt die Transformationseinrichtung 30 somit
mit der Frequenz ωs/N pro Teilband bzw. Spektralkomponente
eine Folge von Spektralwerten 76 aus. Die zu einem Zeitblock
ausgegebenen Spektralwerte sind in 2 bei 74 horizontal
entlang der Frequenzachse 78 angeordnet dargestellt. Die
zu einem darauffolgenden Zeitblock ausgegebenen Spektralwerte schließen sich
direkt darunter in vertikaler Richtung entlang der Achse 80 an.
Die Achsen 78 und 80 stellen somit die Frequenz-
bzw. Zeitachse der Zeit-/Frequenzdarstellung des Informationssignals 14 dar.
Exemplarisch sind in 3 lediglich vier
Teilbänder
dargestellt. Die Folge von Spektralwerten pro Teilband verlaufen
in der exemplarischen Darstellung von 2 entlang der
Spalten und sind mit 82a, 82b, 82c und 82d dargestellt.
-
Es
wird wieder kurz auf 1 Bezug genommen, in der das
Informationssignal 14 exemplarisch als eine Funktion veranschaulicht
ist, die mit sin(bt)·(1+μ·sin(at))
darstellbar ist, wobei α beispielsweise
die Modulationsfrequenz der mit der gestrichelten Linie 84 angedeuteten
Hüllkurve
des Informationssignals 14 sei, während β die Trägerfrequenz des Informationssignals 14 darstelle,
t die Zeit sei und μ die
Modulationstiefe sei. Bei ausreichend hoher Abtastfrequenz ωs ergibt mit diesem exemplarischen Informationssignal
durch die Transformation 72 pro Zeitblock ein Block von
Spektralwerten 76, d.h. eine Zeile bei 74, bei
dem vornehmlich die Spektralkomponente bzw. der dazugehörige Spektralwert an
der Trägerfrequenz β ein ausgeprägtes Maximum aufweist.
Die Spektralwerte für
diese Spektralkomponente f = β variiert
jedoch in der Zeit für
aufeinanderfolgende Zeitblöcke
aufgrund der Variation der Hüllkurve 84.
Dementsprechend variiert der Betrag der Spektralwerte der Spektralkomponente β mit der
Modulationsfrequenz α.
-
Die
bisherige Betrachtung ließ aber
außer acht,
dass die verschiedenen Zeitblöcke
aufgrund einer Frequenzfehlanpassung zwischen der Zeitblockwiederholfrequenz ωs/N und der Trägerfrequenz des Informationssignals 14 jeweils
einen unterschiedlichen Phasenversatz zur Trägerfrequenz β aufweisen können. Je
nach dem Phasenversatz sind die Spektralwerte der Spektralblöcke, die
sich bei Transformation 72 aus den Zeitblöcken ergeben,
mit einem Träger
ejΔφf moduliert,
wobei j die imaginäre
Einheit, f die Frequenz und Δφ den Phasenversatz
des jeweiligen Zeitblocks darstelle. Bei im wesentlichen gleicher Trägerfrequenz,
wie es in dem vorliegenden exemplarischen Fall der Fall ist, nimmt
der Phasenversatz Δφ linear
zu. Deshalb erfahren auch die Spektralwerte eines Teilbandes aufgrund
einer Frequenzfehlanpassung zwischen der Zeitblockwiederholfrequenz und
der Trägerfrequenz
eine Modulation mit einer Trägerkomponente,
die von der Fehlanpassung der beiden Frequenzen abhängt.
-
Dies
in Betracht ziehend leitet nun die Trägerfrequenzbestimmungseinrichtung 32 aus
den Spektralwerten a(ωb,n) die durch den Phasenversatz der Zeitblöcke resultierende
bzw. durch den Zeitblockphasenversatz bewirkte Trägerkomponente
in den Teilbändern
ab, wobei ωb die Kreisfrequenz ω bzw. Frequenz f (ω=2πf) des jeweiligen
Teilbandes 0≤b<N unter allen N
Teilbändern
und n der Zeitblock- bzw. Spektralblockindex sei, der gemäß n = ωs·t
mit der Zeit t zusammenhängt.
Die so ermittelte Modulationsträgerfrequenz ω(m,f) bestimmt
die Trägerfrequenzbestimmungseinrichtung 32 für jedes
Teilband ωb bzw. jede Frequenz f blockweise, wobei
m einen Blockindex anzeige, wie er im folgenden noch näher erläutert wird.
Dazu fasst die Trägerfrequenzbestimmungseinrichtung 32 je
M aufeinanderfolgende Spektralwerte 76 eines Teilbandes ωb zusammen, wie z.B. die Spektralwerte a(ωb,0) bis a(ωb,M-1).
Unter diesen M Spektralwerten bestimmt sie einen Phasenverlauf durch
ein Phasenunwrapping. Anschließend
bestimmt sie beispielsweise mittels eines Algorithmus der kleinsten
Fehlerquadrate eine Geradengleichung, die dem Phasenverlauf am nächsten kommt.
Aus der Steigung und einem Achsenabschnitt bzw. einem Phasen- oder
Anfangsoffset der Geradengleichung erhält die Trägerfrequenzbestimmungseinrichtung 32 die
gewünschte
Modulationsträgerfrequenz ωd für
das Teilband b bezüglich
des Zeitblockes m bzw. einen Spektralwertblockphasenversatz φ für das Teilband
b bezüglich
des Zeitblockes m. Diese Bestimmung führt die Trägerfrequenzbestimmungseinrichtung
für alle
Teilbänder über zeitlich
gleiche Spektralwerte durch, also für alle Spektralwertblöcke a(ωb,0) bis a(ωb,M-1)
mit ωb für
alle Teilbänder
0≤b<N. Auf diese Weise
bestimmt die Trägerfrequenzbestimmungseinrichtung 32 für jedes
Teilband ωb eine Modulationsträgerfrequenz ωd und den Spektralwertblockphasenversatz φ, und das
für Block für Block.
Die Blockeinteilung, die der Bestimmung der komplexen Träger für alle Teilbänder durch
die Einrichtung 32 zugrunde liegt, ist diejenige, wie sie auch
von der Fensterungseinrichtung zur Fensterung verwendet wird. Die
Trägerfrequenzbestimmungseinrichtung 32 gibt
die bestimmten Werte für
die komplexen Träger
an die Demodulationseinrichtung bzw. den Mischer 34 aus.
-
Der
Mischer 34 mischt nun die gefensterten Blöcke von
Spektralwerten der einzelnen Teilbänder, wie sie von der Fensterungseinrichtung 36 ausgeben werden,
mit dem komplex konjugierten der jeweiligen Modulationsträgerfrequenzen ωd unter Berücksichtigung der Spektralwertblockphasenversätze φ durch Multiplikation
dieser Teilbandspektralwertblöcke
mit e-j·(ω_d·n+φ)) wobei,
wie oben erwähnt,
jeweils ein unterschiedliches Paar von ωd und φ für jedes
Teilband und innerhalb jedes Teilbands für die aufeinanderfolgenden
Blöcke
verwendet wird. Auf diese Weise gibt der Mischer 34 zueinander
ausgerichtete demodulierte Teilbandspektralwert blöcke aus,
d.h. zweidimensionale Blöcke
aus N Spektralwertblöcken
zu je M demodulierten Spektralwerten.
-
Da
die durch die Zeitblockversätze
verursachten Modulationen in den Teilbändern durch die Demodulation
mittels des Mischers 34 entfernt worden sind, ist der Phasenverlauf
der Spektralwerte in den Teilbändern
innerhalb der Blöcke
im Mittel flacher und verläuft
im wesentlichen um die Phase 0 herum. Auf diese Weise wird erzielt,
dass bei der anschließenden
Transformation durch die Transformationseinrichtung 38 die
demodulierten und gefensterten Blöcke von Spektralwerten zu einer
spektralen Zerlegung führen,
bei der die Frequenz 0 bzw. der Gleichanteil sehr gut zentriert
ist.
-
Die
sich an die Demodulation 84 durch den Mischer 34 anschließende Transformation 86 durch die
Transformationseinrichtung 38 wird blockweise an jedem
Teilband bzw. jeder Folge von demodulierten Blöcken von Spektralwerten durchgeführt. Durch die
Transformation 86 werden insbesondere die demodulierten
Spektralwertblöcke
der N Teilbänder blockweise
einer spektralen Zerlegung unterzogen. Das Ergebnis der spektralen
Zerlegung der Blöcke von
Spektralwerten kann auch als Modulationsfrequenzdarstellung bezeichnet
werden. Für
N zueinander ausgerichtete Blöcke
von gefensterten und demodulierten Spektralwerten ergibt die Transformation 86 folglich
eine Matrix von M × N
Modulationswerten, die die Frequenz-/Modulationsfrequenzdarstellung des
Informationssignals 14 über
die Zeitdauer der M Zeitblöcke
repräsentiert,
die zu dieser Matrix beigetragen haben. Die Modulationsmatrix ist
in 2 exemplarisch bei 88 für den Fall
N=M=4 gezeigt. Wie es zu sehen ist, hat die Frequenz-/Modulationsfrequenzdarstellung 88 zwei
Dimensionen, nämlich
die Frequenz 90 und die Modulationsfrequenz 92.
Die einzelnen Modulationswerte sind bei 88 mit Kästchen 93 versinnbildlicht.
-
Die
Transformationseinrichtung 38 gibt die Modulationsmatrix
an die Verarbeitungseinrichtung 40 weiter. Die Verar beitungseinrichtung 40 ist
gemäß dem vorliegenden
Ausführungsbeispiel
dazu vorgesehen, aus dem Informationssignal 14 den Modulationsanteil
herauszufiltern. In dem vorliegenden exemplarischen Fall führt die
Verarbeitungseinrichtung 40 deshalb eine Tiefpassfilterung
an den Modulationsfrequenzanteilen in der Frequenz-/Modulationsfrequenzmatrix
durch. In 1 ist zur Veranschaulichung
bei 94 ein Diagramm dargestellt, bei der entlang der x-Achse
die Modulationsfrequenz abgetragen und entlang der y-Achse der Betrag
der Modulationswerte abgetragen ist. Das Diagramm 94 stellt
einen Schnitt der Modulationsmatrix 88 für den exemplarischen
Fall des Informationssignals 14 von 1 dar, nämlich dem
sinusmodulierten Sinus. Insbesondere ist in dem Diagramm 94 der
Verlauf der Beträge der
Modulationswerte entlang der Modulationsfrequenz für das Teilband
mit der Frequenz β,
also der Trägerfrequenz,
dargestellt. Durch die Demodulation 84 mittels des Mischers 34 ist
das Modulationsfrequenzspektrum im wesentlichen perfekt zentriert – zumindest
im Falle der FFT als der Transformation 86 – bzw. korrekt
ausgerichtet. Insbesondere weist das Modulationsfrequenzspektrum
an der Trägerfrequenz β zwei Seitenbänder 96 und 98 auf,
die an der Modulationsfrequenz α,
also der Modulationsfrequenz der Hüllkurve 84 des Informationssignals 14 angeordnet
sind. Ferner weisen die Modulationswerte der Modulationsmatrix 88 an
der Frequenz β einen Gleichanteil 100 auf.
Die Signalverarbeitungseinrichtung 40 ist nun als Tiefpassfilter
mit einer Filtercharakteristik 102, die mit gestrichelter
Linie dargestellt ist, ausgestaltet, um die beiden Seitenbänder 96 und 98 aus
der Frequenz-/Modulationsfrequenzdarstellung 88 zu
entfernen. Auf diese Weise wird das Informationssignal 14 von
seiner Modulationskomponente befreit, wonach lediglich noch die
Trägerkomponente übrig bleibt.
Die derart veränderte
Modulationsmatrix gibt die Verarbeitungseinrichtung 40 an
die inverse Transformationseinrichtung 42 weiter. Die inverse
Transformationseinrichtung 42 verarbeitet die modifizierte
Modulationsmatrix für
jedes Teilband derart, dass der Block von Modulationswerten für das jeweilige
Teilband, also eine Spalte in der Modulationsmatrix 88,
einer zu der Transformation der Transformationseinrichtung 38 inversen
Transformation unterzogen wird, so dass diese Modulationswertblöcke von
der Frequenz/Modulationsfrequenzdarstellung zurück in die Zeit/Frequenzdarstellung überführt werden.
Auf diese Weise erzeugt die inverse Transformationseinrichtung 42 aus
jedem solchen Block von Modulationswerten für jedes Teilband einen Block
von Spektralwerten für
dieses Teilband.
-
Ab
der Ausgabe der Spektralwerte durch die Transformationseinrichtung 30 bezog
sich die vorhergehende Beschreibung vornehmlich auf die Verarbeitung
der ersten M Spektralwerte bzw, von M aufeinanderfolgenden Spektralwerten
für jedes
Teilband. Die Verarbeitungen durch die Einrichtungen 32, 34, 36, 38, 40 und 42 werden
aber auch für
nachfolgende Blöcke
zu je M Spektralwerten für
jedes der N Teilbänder
wiederholt, und zwar mit einer Überlappung der
Blöcke
zu je M Spektralwerten von in dem vorliegenden Fall exemplarisch
50%, also mit einer Überlappung
pro Teilband um M/2 Spektralwerte. Die Blöcke sind in 2 exemplarisch
mit m = 0, m = 1 und m = 2 in der Zeit-/Frequenzdarstellung 74 durch
exemplarische bogenförmige
Fensterungs- bzw. Gewichtungsfunktionen veranschaulicht, die sich
exemplarisch über
M=4 Spektralwerte in jedem Teilband erstrecken. Für jeden
dieser Blöcke
m erzeugt die Transformationseinrichtung 38 schließlich eine
Modulationsmatrix zu je M × N
Modulationswerten, die durch die Signalverarbeitungseinrichtung 40 auf
die oben beschriebene Weise gefiltert bzw. gewichtet werden. Die
inverse Transformationseinrichtung 42 erzeugt aus diesen
modifizierten Modulationsmatrizen 88 wiederum für jedes
Teilband einen Block von Spektralwerten, d.h. eine mit der Matrix
aus modifizierten aber noch demodulierten Blöcken von Spektralwerten.
-
Die
von der inversen Transformationseinrichtung 42 ausgegebenen
Blöcke
von Spektralwerten pro Teilband weichen von denjenigen, wie sie
aus dem Informationssignal 14 am Ausgang der Fensterungseinrichtung 36 erhalten
wurden, jedoch nicht nur durch die Verarbeitung durch die Verarbeitungseinrichtung 40 ab,
sondern auch durch die durch die Demodulation bewirkte Veränderung.
Die Spektralwertblöcke
werden deshalb in der Modulationseinrichtung 46 wieder
mit der Modulationsträgerkomponente
moduliert, mit der sie vorher demoduliert wurden. Insbesondere werden
also die entsprechenden Blöcke
von Spektralwerten, die zuvor mit e-j·(ω_d·n+φ)) multipliziert
worden sind, nun mit e+j·(ω_d·n+φ)) multipliziert, wobei
n den Index der Spektralwertefolge des jeweiligen Teilbandes anzeige
und ω d
bzw. ωd die Kreisfrequenz des komplexen durch die
Einrichtung 32 für
den jeweiligen Spektralwertblock bestimmten Modulationsträgers sei.
-
Die
sich nach der Modulationsstufe 46 ergebenden Folgen von
Blöcken
von Spektralwerten pro Teilband werden nun für jedes Teilband durch die
Zusammenfügungseinrichtung 44 zu
einem einheitlichen Strom 82a–82d von Spektralwerten
pro Teilband zusammengefügt,
indem dieselbe die Blöcke von
Spektralwerten entsprechend, vorliegend exemplarisch um 50%, miteinander überlappt
und einander entsprechende Spektralwerte je nach in der Fensterungseinrichtung 36 verwendeter
Gewichtungsfunktion kombiniert, nämlich durch Addieren in dem
Fall der oben exemplarisch angegebenen Sinus- oder KBD-Fenster.
-
Die
sich am Ausgang der Zusammenfügungseinrichtung 44 ergebenden
Ströme
von Spektralwerten pro Teilband stellen die Zeit-/Frequenzdarstellung
des verarbeiteten Informationssignals 18 dar. Die Ströme werden
von der inversen Transformationseinrichtung 48 empfangen.
Sie verwendet in jedem Zeitschritt n die Spektralwerte für alle Teilbänder ωb, also alle Spektralwerte a(ωb,n) mit 0≤b<N, um an denselben
eine Transformation von der Frequenz- in die Zeit-Darstellung durchzuführen, um
für jedes
n, d.h. mit einer Wiederholzeitdauer von 2πN/ωs,
einen Zeitblock zu erhalten. Diese Zeitblöcke werden durch die Zusammenfügungseinrichtung 50 durch
vorliegend exemplarisch 50%-ige Überlappung
und Kombinieren einander entsprechender Informationswerte in diesen
Zeitblöcken
zu einem einheitlichen Strom von Informationswerten zusammengeführt, der schließlich das
verarbeitete Informationssignal im Zeitbereich 18 darstellt,
das am Ausgang 16 ausgegeben wird.
-
Das
verarbeitete Informationssignal ist in 1 bei 18 in
einem Diagramm dargestellt, bei dem die x-Achse die Zeit und die
y-Achse die Amplitude des Informationssignals 18 ist. Wie
es zu sehen ist, ist lediglich noch die Trägerkomponente des eingangsseitigen
Informationssignals 14 übrig
geblieben. Die Modulationsanteile bzw. der Hüllkurvenanteil 84 ist
entfernt worden.
-
In
anderen Worten ausgedrückt
repräsentierte
das Ausführungsbeispiel
von 1 und 2 eine Verarbeitungsvorrichtung,
die eine signaladaptive Filterbank dazu verwendete, eine Zerlegung
von Signalen in Träger
und Modulationskomponenten vorzunehmen, und die entstehende Repräsentation der
modulierten Signale verwendete, um diese zu filtern. Ebenso wäre es jedoch
möglich,
anstatt der Filterverarbeitung in der Signalverarbeitungseinrichtung
eine Codierung, Verschlüsselung
oder Kompression durchzuführen,
oder die Modulationsmatrizen anderweitig zu modifizieren. Im Vergleich
zu den in der Beschreibungseinleitung beschriebenen zur Audiocodierung
verwendeten Modulationstransformationsverfahren, die eine Betragsbildung
durchführen,
wird bei diesem Ausführungsbeispiel
je Teilband eine Demodulation bezüglich einer Trägerkomponente
durchgeführt.
Nach Schätzung
dieser Teilbandträgerkomponente
in der Trägerfrequenzbestimmungseinrichtung 32 wird
die Demodulation pro Teilband durch Multiplikation mit der komplex
Konjugierten dieser Komponente erzielt. Die auf diese Weise demodulierten
Teilbandsignale werden anschließend durch
eine weitere Frequenzzerlegung mittels der Fenstereinrichtung 36 und
der Transformationseinrichtung 38 in den Modulationsbereich
transformiert.
-
Bei
dem Ausführungsbeispiel
von 1 wurde als die erste Transformation 72 exemplarisch
eine DFT mit 50% Überlappung
und Fensterung verwendet, wobei hiervon jedoch auch Abweichungen
und Variationen denkbar sind. Mehrere Blöcke der ersten Transformation 72 wurden
abermals – dort
mit exemplarisch 50% Überlappung – durch
die Fensterungseinrichtung 36 zusammengefasst und teilbandweise mit
einem komplexen Modulator, der durch die Trägerfrequenzbestimmungseinrichtung 32 bestimmt worden
ist, mittels des Mischers 34 demoduliert und anschließend mit
einer DFT transformiert. Bei dem vorhergehenden Ausführungsbeispiel
wurde in der Trägerfrequenzbestimmungseinrichtung
die Frequenz dieses Modulators aus den Phasen der entsprechenden
Blöcke
des zu demodulierenden Teilbandes gewonnen, nämlich durch näherungsweises Legen
einer Geraden durch den geunwrappten Phasenverlauf der Spektralwerte
der entsprechenden Blöcke.
Dies kann jedoch auch anders durchgeführt werden. Die Trägerfrequenzbestimmungseinrichtung 32 kann
beispielsweise pro Spektralblockabschnitt n bis n+M-1 eine Ebene
in den Phasenanteil aller Teilbänder
in diesem Abschnitt näherungsweise
legen. Ferner wäre
es möglich,
dass die Trägerfrequenzbestimmungseinrichtung 32 die
Bestimmung des komplexen Modulators nicht blockweise Vornimmt sondern
kontinuierlich über
den Strom von Spektralwerten pro Teilband. Dazu könnte beispielsweise
die Trägerfrequenzbestimmungseinrichtung 32 beispielsweise
die Phasen der Folge von Spektralwerten eines jeweiligen Teilbandes
zunächst
unwrappen, tiefpassfiltern und dann die lokale Steigerung des gefilterten
Phasenverlaufs zur Anpassung des komplexen Modulators heranziehen.
Dementsprechend würde
auch der Modulationsteil beim Mischer 46 geändert werden.
Ganz allgemein versucht die Trägerfrequenzbestimmungseinrichtung
den Phasenverlauf dadurch zu beeinflussen, dass die Phase der komplexen
Spektralwerte eines Teilbandes mit einem über die Folge hinweg zunehmenden
oder abnehmenden Betrag entweder erhöht oder reduziert wird, derart,
dass eine mittleren Steigung der Phase der Folge von Spektralwerten
verringert wird, bzw. sich der geunwrappte Phasenverlauf im wesentlichen
um einen festen Phasenwert, vorzugsweise die Phase 0, herum variiert.
-
Noch
einmal explizit wird auf die Tatsache hingewiesen, dass für die verwendeten
Transformationen 72, 86 und die hierzu inversen
Transformationseinrichtungen 42 und 48 auch andere
Typen denkbar sind als die DFT bzw. IDFT. So kann beispielsweise
das komplexe demodulierte Teilbandsignal auch mit je einer reellwertigen
Transformation getrennt nach Real- und Imaginärteil in die Frequenz/Modulationsfrequenzdarstellung
transformiert bzw. spektral zerlegt werden. Der Realteil repräsentierte
dann nach der Demodulationsstufe die Amplitudenmodulation des Subbandsignals
bezüglich
des zur Demodulation verwendeten Trägers. Der Imaginärteil repräsentierte
dann die Frequenzmodulation dieses Trägers. In dem Fall der DFT bzw.
IDFT für
die Einrichtungen 38 bzw. 42, spiegelt sich der
Amplitudenmodulationsanteil des Subbandsignals im symmetrischen
Anteil des DFT-Spektrums entlang der Modulationsfrequenzachse wieder,
während
der Frequenzmodulationsanteil des Trägers dem asymmetrischen Anteil
des DFT-Spektrums entlang der Modulationsfrequenzachse entspricht.
-
Das
im vorhergehenden beschriebene Ausführungsbeispiel wurde exemplarisch
an einem einfachen sinusmodulierten Sinussignal veranschaulicht.
Das Ausführungsbeispiel
von 1 und 2 ist aber auch für eine Filterung
des Verlaufs der Hüllkurve
eines Gemisches amplitudenmodulierter Signale beliebiger Frequenz,
wie z.B. amplitudenmodulierter tonaler Signale, geeignet. Die einzelnen
Frequenzkomponenten der Hüllkurve
sind zur konsistenten Bearbeitung in der Modulationsmatrix 88 direkt repräsentiert,
ganz im Gegensatz zur bereits bekannten Betrags-Phasen-Darstellung
nach den in der Beschreibungseinleitung beschriebenen Modulationstransformationsanalyseverfahren
zur Audiocodierung. Auch die Filterung von frequenzmodulierten Signalen
geringer Modulationstiefe, d.h. mit einem Frequenzhub, der wesentlich kleiner
als die Teilbandbreite der ersten DFT ist, ist mit dem Ausführungsbeispiel
von 1 und 2 möglich.
-
Das
Ausführungsbeispiel
von 1 und 2 betraf also eine Anordnung
zur Modulationsfilterung, die noch einmal in anderen Worten ausgedrückt auf
einer signaladaptiven Transformation, einer Filterung im Modulationsbereich
und einer entsprechenden Rücktransformation
basierte. Ohne Signalmanipulation im Modulationsbereich, im vorliegenden
Ausführungsbeispiel
der Filterung, ist die Anordnung aus 1 perfekt
rekonstruierend. Durch Einbringen eines geeigneten Spektralbereichsfilters, wie
exemplarisch dem Filter 102, d.h. einer Schwächung der
Modulationswerte mit zunehmender Entfernung von einer Mittenmodulationsfrequenz
von Null, können
die zu entfernenden Modulationsanteile wie gewünscht gedämpft werden. Es sind jedoch auch
andere Arten der Verarbeitung von Informationssignalen in der Frequenz-/Modulationsfrequenzdarstellung
denkbar. So könnte
es auch wünschenswert
sein, lediglich den Träger
zu entfernen. In diesem Fall bestünde die Filterung in einer
Hochpassfilterung, d.h. einer Gewichtung mit einer Gewichtungsfunktion
mit einer Modulationsfrequenzkante an einer bestimmten Modulationsfrequenz,
die Modulationswerte an geringeren Modulationsfrequenzen mehr schwächt als
solche an darüber
liegenden Modulationsfrequenzen. In wiederum anderen Anwendungsbereichen
bzw. Anwendungen könnte
die Signalverarbeitung in der Signalverarbeitungseinrichtung 40 wiederum
in einer Bandpassfilterung bestehen, also einer Gewichtung mit einer
Gewichtungsfunktion, die von einer bestimmten Mittenmodulationsfrequenz weg
abfällt,
um Anteile des Informationssignals, die von unterschiedlichen Quellen
stammen, zu separieren, d.h. eine Quellenseparation zu erzielen.
Weitere Anwendungen, bei denen das vorhergehende Ausführungsbeispiel
verwendet werden kann, können die
Audiocodierung zur Codierung von Audiosignalen, die Rekonstruktion
gestörter
Signale und die Fehlerverschleierung betreffen. Ganz allgemein könnte aber
auch die Vorrichtung 10 als Musikeffektgerät eingesetzt
werden, um spezielle akustische Effek te in dem eingehenden Audiosignal
zu verwirklichen. Die Verarbeitungen in der Signalverarbeitungseinrichtung 40 können dementsprechend
vielfältigste Formen
annehmen, wie z.B. die Quantisierung der Modulationswerte, das Nullsetzen
einiger Modulationswerte, die Gewichtung einzelner Abschnitte der oder
aller Modulationswerte oder dergleichen. Ein weiteres Anwendungsgebiet
wäre der
Einsatz der Vorrichtung 10 von 1 als Wasserzeichen-Einbetter.
Der Wasserzeichen-Einbetter würde
ein Audiosignal 14 empfangen, wobei die Verarbeitungseinrichtung 40 ein
empfangenes Wasserzeichen dadurch in das Audiosignal einbringen
könnte,
dass dieselbe einzelne Segmente bzw. Modulationswerte gemäß dem Wasserzeichen
modifiziert. Die Auswahl der Segmente bzw. Modulationswerte könnte für aufeinanderfolgende
Modulationsmatrizen verschieden bzw, zeitvariant erfolgen und würde derart
getroffen werden, dass durch psychoakustische Verdeckungseffekte
die Modifikationen durch die Wasserzeicheneinbringung für ein menschliches
Gehör in
dem sich ergebenden Wasserzeichen-behafteten Audiosignal 18 unhörbar sind.
-
Im
Hinblick auf die Transformationseinrichtungen wird noch darauf hingewiesen,
dass dieselben natürlich
auch als Filterbanken ausgebildet sein können, die eine Spektraldarstellung
durch viele einzelne Bandpassfilterungen erzeugen. Ferner wird darauf
hingewiesen, dass das sich ergebende Informationssignal 18 nach
der Verarbeitung nicht in der Zeitbereichsdarstellung ausgegeben
werden muss. Es wäre
ferner denkbar das Informationssignal beispielweise in einer Zeit/Spektraldarstellung
oder sogar in der Spektral/Modulationsspektraldarstellung auszugeben.
Im letztgenannten Fall müsste
dann natürlich
sichergestellt werden, dass empfängerseitig die
notwendige Modulation 46 wieder mit dem geeigneten Träger durchgeführt werden
kann, beispielsweise durch Mitlieferung der pro Teilband und Spektralwertblock
variierenden komplexen Träger,
die zur Demodulation 84 verwendet worden sind. Auf diese Weise
ließe
sich obiges Ausführungsbeispiel
zur Verwirklichung eines Kompressionsverfahrens verwenden.
-
Insbesondere
wird darauf hingewiesen, dass abhängig von den Gegebenheiten
das erfindungsgemäße Schema
auch in Software implementiert sein kann. Die Implementation kann
auf einem digitalen Speichermedium, insbesondere einer Diskette
oder einer CD mit elektronisch auslesbaren Steuersignalen erfolgen,
die so mit einem programmierbaren Computersystem zusammenwirken
können,
dass das entsprechende Verfahren ausgeführt wird. Allgemein besteht
die Erfindung somit auch in einem Computerprogrammprodukt mit auf
einem maschinenlesbaren Träger
gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn
das Computerprogrammprodukt auf einem Rechner abläuft. In
anderen Worten ausgedrückt kann
die Erfindung somit als ein Computerprogramm mit einem Programmcode
zur Durchführung
des Verfahrens realisiert werden, wenn das Computerprogramm auf
einem Computer abläuft.