-
Die
Erfindung betrifft ein Audioübertragungssystem,
das einen Sender und einen Empfänger
umfasst, wobei der Sender dazu eingerichtet ist, ein Eingangssignal über einen Übertragungskanal
an den Empfänger
zu übertragen,
wobei
der Sender einen Splitter zum Aufteilen des Eingangssignals in mindestens
ein erstes und ein zweites Frequenzbandsignal sowie weiterhin einen ersten
Kodierer zum Kodieren des ersten Frequenzbandsignals in ein erstes
kodiertes Frequenzbandsignal und einen zweiten Kodierer zum Kodieren
des zweiten Frequenzbandsignals in ein zweites kodiertes Frequenzbandsignal
umfasst und dazu eingerichtet ist, das erste und das zweite kodierte
Frequenzbandsignal über
den Übertragungskanal
an den Empfänger
zu übertragen,
wobei
der Empfänger
einen ersten Dekodierer zum Dekodieren des ersten kodierten Frequenzbandsignals
in ein erstes dekodiertes Frequenzbandsignal und einen zweiten Dekodierer
zum Dekodieren des zweiten kodierten Frequenzbandsignals in ein
-
zweites
dekodiertes Frequenzbandsignal sowie weiterhin einen Kombinator
zum Kombinieren des ersten und des zweiten dekodierten Frequenzbandsignals
zu einem Ausgangssignal und weiterhin Rekonstruktionsmittel umfasst,
die dazu dienen, das zweite dekodierte Frequenzbandsignal zu rekonstruieren,
wenn es nicht verfügbar
ist.
-
Die
Erfindung betrifft weiterhin einen Audioempfänger zum Empfangen eines ersten
und eines zweiten kodierten Frequenzbandsignals von einem Audiosender über einen Übertragungskanal,
ein Verfahren zum Übertragen
eines Audioeingangssignals über
einen Übertragungskanal,
ein Verfahren zum Empfangen eines ersten und eines zweiten kodierten Frequenzbandsignals,
die ein Audiosignal darstellen, über
einen Übertragungskanal
und einen Sprachdekodierer zum Dekodieren eines ersten und eines zweiten
kodierten Frequenzband-Sprachsignals.
-
Ein Übertragungssystem
gemäß dem Oberbegriff
von Anspruch 1 ist aus dem Fachbeitrag „An embedded sinusoidal transform
codec with measured phases and sampling rate scalability" (dt. „Eingebetteter
sinusförmiger
Transformationscodec mit Messphasen- und Abtastratenskalierbarkeit") von Gerard Aguilar
et al. im Tagungsband der Internationalen IEEE-Konferenz für Akustik,
Sprache und Signalverarbeitung 2000 („Proceedings of the ICASSP 2000"), Istanbul, Türkei, 5.–9. Juni
2000, Band II, S. 1141–1144,
bekannt.
-
Derartige Übertragungssysteme
können zum
Beispiel zur Übertragung
von Sprachsignalen oder Audiosignalen über ein Übertragungsmedium wie etwa
einen Funkkanal, ein Koaxialkabel oder eine optische Faser benutzt
werden. Derartige Übertragungssysteme
können
auch zur Aufzeichnung von Sprachsignalen auf einem Aufzeichnungsmedium wie
etwa einem Magnetband oder einer Magnetscheibe benutzt werden. Mögliche Anwendungsfälle sind
Mobiltelefone, Voice-over-IP-Kommunikation (Sprachübertragung über das
Internet-Protokoll), automatische Anrufbeantworter und Diktiergeräte.
-
1 zeigt
ein Blockdiagramm des bekannten Übertragungssystems,
bei dem es sich um ein so genanntes skalierbares Breitband-Sprachübertragungssystem
handelt. Dieses Übertragungssystem umfasst
einen Sender 12 und einen Empfänger 14. Der Sender 12 und
der Empfänger 14 sind über einen Übertragungskanal 16 gekoppelt.
Mittels eines Splitters 20 wird ein Sprach-Eingangssignal,
das einem Eingang 18 des Senders 12 zugeführt wird,
in ein erstes und ein zweites Frequenzbandsignal (d.h. in Spektralabschnitte)
aufgespaltet. Der Sender 12 umfasst weiterhin einen ersten
und einen zweiten Kodierer 22 und 24 zum Kodieren
des ersten und des zweiten Frequenzbandsignals in ein erstes und
ein zweites kodiertes Frequenzbandsignal. Das erste und das zweite
kodierte Frequenzbandsignal werden von einem Multiplexierer 23 in
ein multiplexiertes Signal multiplexiert, welches (das erste und
das zweite kodierte Frequenzbandsignal befördert und) vom Sender 12 über den Übertragungskanal 16 an
den Empfänger 14 übertragen
wird. Der Empfänger 14 umfasst
einen Sprachdekodierer 60, der einen Demultiplexierer 25 zum
Demultiplexieren des multiplexierten Signals in das erste und das
zweite kodierte Frequenzbandsignal sowie einen ersten und einen
zweiten Dekodierer 26 und 28 zum Dekodieren des
ersten und des zweiten kodierten Frequenzbandsignals in ein erstes
und ein zweites dekodiertes Frequenzbandsignal aufweist. Der Sprachdekodierer 60 umfasst
weiterhin einen Kombinator 30 zum Kombinieren des ersten
und des zweiten dekodierten Frequenzbandsignals zu einem Ausgangssignal,
das einem Ausgang 32 des Empfängers 14 zugeführt wird. Vorzugsweise
sind der erste und der zweite Kodierer 22 und 24 sowie
der erste und der zweite Dekodierer 26 und 28 speziell
für das
Kodieren und Dekodieren des ersten und des zweiten Frequenzbandsignals entworfen.
Zum Beispiel kann es sich bei dem ersten Frequenzbandsignal um ein
so genanntes Schmalband-Sprachsignal mit einem Frequenzbereich von 50–4000 Hz und
bei dem zweiten Frequenzbandsignal um ein so genanntes Hochband-Sprachsignal
mit einem Frequenzbereich von 4000–7000 Hz handeln. Das Schmalband-Sprachsignal
kann von einem speziell hierfür
ausgelegten Schmalband-Sprachkodierer und einem speziell hierfür ausgelegten
Schmalband-Sprachdekodierer kodiert bzw. dekodiert werden. Entsprechend
kann das Hochband-Sprachsignal von einem speziell hierfür ausgelegten
Hochband-Sprachkodierer und einem speziell hierfür ausgelegten Hochband-Sprachdekodierer
kodiert bzw. dekodiert werden. Das dekodierte Schmalband- und das
dekodierte Hochband-Sprachsignal werden von dem Kombinator 30 zu
einem so genannten Breitband-Sprachsignal
mit einem Frequenzbereich von 50–7000 Hz kombiniert.
-
Ein
Vorteil eines solchen Übertragungssystems
besteht darin, dass das Schmalbandsignal unabhängig von dem Hochbandsignal
dekodiert werden kann. Normalerweise werden sowohl das Schmalband-
als auch das Hochband-Signal von dem Empfänger 14 empfangen,
und der Sprachdekodierer 60 ist dazu in der Lage, ein qualitativ
hochwertiges Breitband-Sprachausgabesignal mit einem Frequenzbereich
von 50–7000
Hz zu erzeugen. Wenn jedoch der Übertragungskanal 16 überlastet ist,
könnte
es geschehen, dass Rahmen des Hochbandsignals vom Empfänger 14 nicht
oder nicht korrekt empfangen werden. In einem solchen Falle ist der
Sprachdekodierer 60 immer noch in der Lage, die entsprechenden
Rahmen des Schmalbandsignals zu dekodieren und ein Schmalband-Sprachausgabesignal
von geringerer Qualität
mit einem Frequenzbereich von 50–4000 Hz zu erzeugen.
-
Das
Ereignis, dass ein bestimmter Rahmen nicht oder nicht korrekt empfangen
wird, wird Rahmenlöschung
genannt. Es kann wünschenswert
sein, dass ein Übertragungssystem
solche Rahmenlöschungen
elegant handhabt. Bei dem bekannten Übertragungssystem werden Rahmenlöschungen entweder
durch zeitliches Skalieren (d.h. Kompression oder Expansion in der
Zeitdomäne)
der an den gelöschten
Rahmen angrenzenden Rahmen gehandhabt, oder indem bestimmte Parameter
des zuletzt empfangenen Rahmens extrapoliert werden.
-
Die
Handhabung von Rahmenlöschungen bei
dem bekannten Übertragungssystem
ist mit etlichen Nachteilen behaftet, die die Qualität des rekonstruierten
Sprachsignals negativ beeinflussen. Die Handhabung von Rahmenlöschungen
durch zeitliches Skalieren der angrenzend an die gelöschten Rahmen
empfangenen Rahmen ist vergleichsweise kompliziert und führt, was
wichtiger ist, zusätzliche Verzögerungen
ein, da später
empfangene Rahmen manipuliert werden müssen, um die gelöschten Rahmen
zu korrigie ren. Außerdem
führt die
Handhabung von Rahmenlöschungen
durch Extrapolieren der Parameter des zuletzt empfangenen Rahmens
nicht immer zu dem gewünschten
Ergebnis. Zum Beispiel ist es nicht möglich, für einen gelöschten Rahmen, der dem Anfang
eines neuen Klangs entspricht, einen ähnlichen Rahmen auf Basis der
Parameter des zuletzt empfangenen Rahmens (der einem anderen Klang
entspricht) zu rekonstruieren.
-
Eine
Aufgabe der vorliegenden Erfindung besteht darin, ein im einleitenden
Absatz beschriebenes Übertragungssystem
bereitzustellen, das nicht mit diesen Nachteilen behaftet ist. Diese
Aufgabe wird mit dem erfindungsgemäßen Übertragungssystem gelöst, das
dadurch gekennzeichnet ist, dass die Rekonstruktionsmittel zum Rekonstruieren
des zweiten dekodierten Frequenzbandsignals aus dem ersten dekodierten
Frequenzbandsignal eingerichtet sind. Durch Rekonstruieren des zweiten
dekodierten Frequenzbandsignals aus dem ersten dekodierten Frequenzbandsignal,
d.h. auf Basis des ersten dekodierten Frequenzbandsignals, ist es
möglich,
die Verzögerungen
zu vermeiden, die das Verfahren des zeitlichen Skalierens mit sich
bringt. Weiterhin ist das erfindungsgemäße Übertragungssystem nicht mit dem
Nachteil des Verfahrens behaftet, das Rahmenlöschungen durch Extrapolation
bestimmter Parameter des zuletzt empfangenen Rahmens handhabt und kein
korrektes Ergebnis liefert, wenn der gelöschte Rahmen dem Anfang eines
neuen Klangs entspricht. Dieser Nachteil wird vermieden, indem ein
einem bestimmten Klang entsprechender Rahmen des zweiten dekodierten
Frequenzbandsignals aus einem demselben Klang entsprechenden Rahmen
des ersten dekodierten Frequenzbandsignals rekonstruiert wird.
-
Die
US-Patentschrift 6,137,915 offenbart eine Vorrichtung und ein Verfahren
zum Verschleiern von Fehlern in einem hierarchischen Video-Teilbandkodier-
und -dekodiersystem. Das Problem der Fehlerverschleierung verstümmelter
oder fehlender Koeffizienten wird gelöst, indem ein oder mehrere
nicht verstümmelte
Koeffizienten oder ein Fenster aus Koeffizienten aus anderen Teilbändern benutzt
werden, die demselben räumlichen
Ort entsprechen.
-
Eine
Ausführungsform
des erfindungsgemäßen Übertragungssystems
ist dadurch gekennzeichnet, dass die Rekonstruktionsmittel zum Rekonstruieren
des zweiten dekodierten Frequenzbandsignals aus dem ersten dekodierten
Frequenzbandsignal mittels Erweiterung einer Bandbreite des ersten
dekodierten Frequenzbandsignals eingerichtet sind. Mittels Bandbreitenerweiterung
kann ein Signal mit einem vergleichsweise schmalen Frequenzband
zu einem Signal mit einem vergleichsweise breiten Frequenzband erweitert werden.
Mehrere Methoden zum Erweitern der Bandbreite von Schmalbandsignalen
sind aus dem Fachbeitrag „A
new technique for wideband enhancement of coded narrowband speech" (dt. „Neue Methode
zur Breitbanderweiterung kodierter schmalbandiger Sprache"), IEEE Speech Coding
Workshop 1999, 20.–23.
Juni, 1999, Porvoo, Finnland, bekannt. Diese Methoden werden benutzt,
um die Sprachqualität
in einem Schmalbandnetz zu verbessern. Ein Vorteil der vorliegenden Ausführungsform
des erfindungsgemäßen Übertragungssystems
besteht darin, dass es sich bei der Bandbreitenerweiterung um eine
rechenzeiteffiziente Art und Weise der Rekonstruktion des zweiten
dekodierten Frequenzbandsignals aus dem ersten dekodierten Frequenzbandsignal
handelt. Darüber
hinaus lässt
sich durch die Anwendung von Bandbreitenerweiterung eine sehr gute
Rekonstruktion der gelöschten
Rahmen des zweiten dekodierten Frequenzbandsignals erzielen, und
diese Rekonstruktion ist dem einfachen Stummtasten des zweiten dekodierten
Frequenzbandsignals vorzuziehen.
-
Eine
Ausführungsform
des erfindungsgemäßen Übertragungssystems
ist dadurch gekennzeichnet, dass die Rekonstruktionsmittel zum Rekonstruieren
eines aktuellen Rahmens des zweiten dekodierten Frequenzbandsignals
aus einem aktuellen Rahmen des ersten dekodierten Frequenzbandsignals
und aus einem vorherigen Rahmen des zweiten dekodierten Frequenzbandsignals
eingerichtet sind. Indem ein aktueller Rahmen des zweiten dekodierten Frequenzbandsignals
auf Basis eines aktuellen Rahmens des ersten dekodierten Frequenzbandsignals (zum
Beispiel mittels Bandbreitenerweiterung) und auf Basis (von Parametern)
eines vorherigen Rahmens des zweiten dekodierten Frequenzbandsignals rekonstruiert
wird, kann eine noch bessere Rekonstruktion erzielt werden. In manchen
Fällen
ist es nicht immer möglich,
einen Rahmen des zweiten dekodierten Frequenzbandsignals auf der
Grundlage lediglich des ersten dekodierten Frequenzbandsignals korrekt zu
rekonstruieren. Wenn zum Beispiel Bandbreitenerweiterung angewendet
wird, um ein Hochband-Sprachsignal aus einem Schmalband-Sprachsignal
zu rekonstruieren, dann ist es schwierig, zwischen den Klängen /s/
und /f/ zu unterscheiden. Der Grund hierfür ist, dass diese Klänge /s/
und /f/ Spektren aufweisen, die sich in ihrem Schmalbandanteil ähnlich sind
und sich in ihrem Hochbandanteil voneinander unterscheiden (siehe 3,
wo die Auftragung 70 das Spektrum des /s/-Klanges und die
Auftragung 72 das Spektrum des /f/-Klanges zeigt). Durch
das Einbinden von Informationen aus einem vorherigen Rahmen des
zweiten dekodierten Frequenzbandsignals ist klar, welcher der Klänge /s/ oder
/f/ tatsächlich
vorlag, und es kann eine korrekte Rekonstruktion des zweiten dekodierten
Frequenzbandsignals vorgenommen werden.
-
Eine
weitere Ausführungsform
des erfindungsgemäßen Übertragungssystems
ist dadurch gekennzeichnet, dass das erste Frequenzbandsignal und
das erste dekodierte Frequenzbandsignal Niederfrequenzbandsignale
und das zweite Frequenzbandsignal und das zweite dekodierte Frequenzbandsignal
Hochfrequenzbandsignale sind. Zum Beispiel kann das erfindungsgemäße Übertragungssystem
vorteilhaft dazu benutzt werden, ein Hochband-Sprachsignal aus einem
Schmalband-Sprachsignal zu rekonstruieren.
-
Die
obige Aufgabe und die obigen Merkmale der vorliegenden Erfindung
werden aus der folgenden Beschreibung der bevorzugten Ausführungsformen
unter Bezugnahme auf die Zeichnungen deutlicher. Es zeigen:
-
1 ein
Blockdiagramm eines Übertragungssystems
nach Stand der Technik,
-
2 ein
Blockdiagramm einer Ausführungsform
des erfindungsgemäßen Übertragungssystems,
-
3 Spektren
von /s/- und /f/-Klängen;
diese Figur wird benutzt werden, um die Arbeitsweise des erfindungsgemäßen Übertragungssystems
zu erläutern.
-
In
den Figuren sind identische Teile mit denselben Bezugszeichen versehen.
-
1 zeigt
ein Blockdiagramm des Übertragungssystems
nach Stand der Technik, bei dem es sich um ein so genanntes skalierbares
Breitband-Sprachübertragungssystem
handelt. Dieses Übertragungssystem 10 umfasst
einen Sender 12 und einen Empfänger 14. Der Sender 12 und
der Empfänger 14 sind über einen Übertragungskanal 16 gekoppelt.
Mittels eines Splitters 20 wird ein Sprach-Eingangssignal,
das einem Eingang 18 des Senders 12 zugeführt wird,
in ein erstes und ein zweites Frequenzbandsignal (d.h. in Spektralabschnitte) aufgespaltet.
Der Sender 12 umfasst weiterhin einen ersten und einen
zweiten Kodierer 22 und 24 zum Kodieren des ersten
und des zweiten Frequenzbandsignals in ein erstes und ein zweites
kodiertes Frequenzbandsignal. Das erste und das zweite kodierte Frequenzbandsignal
werden von einem Multiplexierer 23 in ein multiplexiertes
Signal multiplexiert, welches (das erste und das zweite kodierte
Frequenzbandsignal befördert
und) vom Sender 12 über
den Übertragungskanal 16 an
den Empfänger 14 übertragen
wird. Der Empfänger 14 umfasst
einen Sprachdekodierer 60, der einen Demultiplexierer 25 zum Demultiplexieren
des multiplexierten Signals in das erste und das zweite kodierte
Frequenzbandsignal sowie einen ersten und einen zweiten Dekodierer 26 und 28 zum
Dekodieren des ersten und des zweiten kodierten Frequenzbandsignals
in ein erstes und ein zweites dekodiertes Frequenzbandsignal aufweist. Der
Sprachdekodierer 60 umfasst weiterhin einen Kombinator 30 zum
Kombinieren des ersten und des zweiten kodierten Frequenzbandsignals
zu einem Ausgangssignal, das einem Ausgang 32 des Empfängers 14 zugeführt wird.
Vorzugsweise sind der erste und der zweite Kodierer 22 und 24 sowie
der erste und der zweite Dekodierer 26 und 28 speziell für das Kodieren
und Dekodieren des ersten und des zweiten Frequenzbandsignals entworfen.
Zum Beispiel kann es sich bei dem ersten Frequenzbandsignal um ein
so genanntes Schmalband-Sprachsignal mit einem Frequenzbereich von
50–4000
Hz und bei dem zweiten Frequenzbandsignal um ein so genanntes Hochband-Sprachsignal
mit einem Frequenzbereich von 4000–7000 Hz handeln. Das Schmalband-Sprachsignal
kann von einem speziell hierfür ausgelegten
Schmalband-Sprachkodierer
und einem speziell hierfür
ausgelegten Schmalband-Sprachdekodierer kodiert bzw. dekodiert werden.
Entsprechend kann das Hochband-Sprachsignal von einem speziell hierfür ausgelegten
Hochband-Sprachkodierer und einem speziell hierfür ausgelegten Hochband-Sprachdekodierer
kodiert bzw. dekodiert werden. Das dekodierte Schmalband- und das
dekodierte Hochband-Sprachsignal werden von dem Komibinator 30 zu
einem so genanntes Breitband-Sprachsignal mit einem Frequenzbereich
von 50–7000
Hz kombiniert.
-
2 zeigt
ein Blockdiagramm einer Ausführungsform
des erfindungsgemäßen Übertragungssystems 10.
Das Übertragungssystem 10 umfasst
einen Sender 12 zum Übertragen
eines Eingangssignals über
einen Übertragungskanal 16 an einen
Empfänger 14.
Das Eingangssignal wird einem Eingang 18 des Senders 12 zugeführt. Der
Sender 12 umfasst einen Splitter 20 zum Aufteilen
des Eingangssignals in ein Schmalbandsignal (d.h. das erste Frequenzbandsignal)
und ein Hochbandsignal (d.h. das zweite Frequenzbandsignal). Der
Splitter 20 umfasst einen Tiefpassfilter 42, ein
Verzögerungsglied 40 und
einen Subtrahierer 44. Das Eingangssignal wird dem Tiefpassfilter 42 und
dem Verzögerungsglied 40 zugeführt. Das
Schmalbandsignal ist das Ergebnis der Filterung des Eingangssignals
durch den Tiefpassfilter 42. Das Hochbandsignal ist das
Ergebnis des Subtrahierens des verzögerten Eingangssignals von
dem Schmalbandsignal im Subtrahierer 44. Es ist wichtig,
dass der Tiefpassfilter 42 einen linearen Phasengang aufweist.
Dies lässt
sich zum Beispiel durch Verwendung eines Filters erzielen, der eine
endliche Impulsantwort und eine Länge von 81 aufweist,
so dass das gefilterte Signal um 40 Abtastwerte verzögert wird.
Für Sprache
kann der Tiefpassfilter 42 ein Durchlassband zwischen 0
und 3400 Hz und ein Sperrband zwischen 4000 und 8000 Hz aufweisen.
Das Verzögerungsglied 40 wird
benutzt, um die Verzögerung
zu kompensieren, die in dem Tiefpassfilter 42 auftritt, so
dass die Eingangssignale des Subtrahierers 44 eine gewünschte Phasenbeziehung aufweisen.
-
Alternativ
kann das Hochbandsignal von dem Eingangssignal mit Hilfe eines (nicht
gezeigten) Hochpassfilters abgeleitet werden, welcher anstelle des
Verzögerungsglieds 40 und
des Subtrahierers 44 benutzt wird.
-
Die
Abtastrate des Schmalbandsignals wird von einem Abtastratenverringerer 46 verringert,
und das Schmalbandsignal wird an einen Schmalbandkodierer 22 (d.h.
den ersten Kodierer) angelegt. Dieser Schmalbandkodierer 22 ist
ein Kodierer, der auf Signale optimiert ist, die einen schmalbandigen
Frequenzbereich aufweisen, wie z.B. in den ITU-Standards G.729 oder
G.728 oder in MPEG-4 CELP beschrieben. Der "Typ oder die Arbeitsweise dieses Schmalbandkodierers 22 ist
für die
Implementierung der Erfindung nicht von Bedeutung. Der Schmalbandkodierer 22 generiert
ein kodiertes Schmalbandsignal (d.h. das erste kodierte Frequenzbandsignal). Das
Hochbandsignal wird zum Kodieren in ein kodiertes Hochbandsignal
(d.h. das zweite kodierte Frequenzbandsignal) an einen Hochbandkodierer 24 (d.h.
den zweiten Kodierer) geliefert. Dieser Hochbandkodierer 24 ist
ein Kodierer, der auf Signale optimiert ist, die einen hochbandigen
Frequenzbereich aufweisen, wie z.B. aus MPEG-4 CELP bekannt. Der Typ
oder die Arbeitsweise dieses Hochbandkodierers 24 ist für die Implementierung
der Erfindung nicht von Bedeutung. Das kodierte Schmalband- und
das kodierte Hochbandsignal werden in einem Multiplexierer 23 in
ein multiplexiertes Signal multiplexiert, und dieses multiplexierte
Signal (das das kodierte Schmalband- und das kodierte Hochbandsignal
befördert)
wird von Sender 12 über
den Übertragungskanal 16 an
den Empfänger 14 übertragen.
-
Der
Empfänger 14 umfasst
einen Sprachdekodierer 60. Der Sprachdekodierer 60 umfasst
einen Demultiplexierer 25 zum Demultiplexieren des multiplexierten
Signal in das kodierte Schmalband- und das kodierte Hochbandsignal
sowie einen Schmalbanddekodierer 26 (d.h. den ersten Dekodierer)
zum Dekodieren des kodierten Schmalbandsignals und einen Hochbanddekodierer 28 (d.h.
den zweiten Dekodierer) zum Dekodieren des kodierten Hochbandsignals.
Die Abtastrate des dekodierten Schmalbandsignals (d.h. des ersten
dekodierten Frequenzbandsignals) wird von einem Abtastratenerhöher 50 erhöht. Um unerwünschte Hochbandfrequenzkomponenten
herauszufiltern, die von dem Dekodierer 26 und/oder dem
Abtastratenerhöher 50 in
das dekodierte Schmalbandsignal eingebracht werden können, wird
das dekodierte Schmalbandsignal mit erhöhter Abtastrate von einem Tiefpassfilter 52 gefiltert.
Der Frequenzgang dieses Tiefpassfilters 52 ist mit dem
Frequenzgang des Tiefpassfilters 42 im Sender 12 vergleichbar.
-
Normalerweise
wird das dekodierte Hochbandsignal über einen Schalter 49 (der
sich in der unteren Position befindet) und ein Verzögerungsglied 54 an
einen Addierer 30 (d.h. den Kombinator) geliefert, wenn
ein Rahmen des dekodierten Hochbandsignals verfügbar ist. Das dekodierte Schmalbandsignal
(dessen Abtastrate vom Abtastratenerhöher 50 erhöht und das
vom Tiefpassfilter 52 gefiltert wurde) wird ebenfalls an
den Addierer 30 geliefert. Der Addierer 30 kombiniert
das dekodierte Schmalband- und das dekodierte Hochbandsignal zu
einem Ausgangssignal, das einem Ausgang 32 des Empfängers 14 zugeführt wird.
Da während
des Dekodierens des kodierten Schmalband- und des kodierten Hochbandsignals
unterschiedliche Signalverzögerungen auftreten
können,
wird zum Verzögern
des dekodierten Hochbandsignals das Verzögerungsglied 54 bereitgestellt.
Falls das dekodierte Schmalbandsignal eine geringere Verzögerung erfährt als
das dekodierte Hochbandsignal, kann das Verzögerungsglied 54 zwischen
dem Tiefpassfilter 52 und dem Addierer 30 eingefügt werden.
-
Der
Sprachdekodierer 60 umfasst ferner einen Rekonstruierer 48 (d.h.
die Rekonstruktionsmittel) zum Rekonstruieren des dekodierten Hochbandsignals,
wenn es nicht verfügbar
ist (beispielsweise mittels Bandbreitenerweiterung des dekodierten Schmalbandsignals).
Ein Rahmen des dekodierten Hochbandsignals kann zum Beispiel nicht
verfügbar sein,
weil er gar nicht empfangen wurde, weil er nicht korrekt empfangen
wurde oder weil er nicht korrekt dekodiert werden konnte. In einem
solchen Falle rekonstruiert der Rekonstruierer 48 den fehlenden Rahmen
des dekodierten Hochbandsignals und liefert ebendiesen Rahmen über den
Schalter 49 (in der oberen Position) und das Verzögerungsglied 54 an den
Addierer 30. Die Rekonstruktion des fehlenden Rahmens durch
den Rekonstruierer 48 wird basierend auf einem (aktuellen)
Rahmen des dekodierten Schmalbandsignals, das an den Rekonstruierer 48 geliefert
wird, vorgenommen. Außerdem
kann die Rekonstruktion des fehlenden Rahmens (teilweise) auf (gewissen
Parametern von) einem vorherigen Rahmen (oder vorherigen Rahmen)
des dekodierten Hochbandsignals, das ebenfalls an den Rekonstruierer 48 geliefert
wird, basieren.
-
Einer
der hauptsächlichen
Nachteile des Einsatzes von Bandbreitenerweiterung besteht darin, dass
es mehrere Erweiterungen des erweiterten (schmalbandigen) Signals
geben kann. Dies ist bei Klängen
wie /s/ und /f/ offensichtlich, deren Spektren im Schmalbandteil ähnlich,
im Hochbandteil aber verschieden sind. 3 zeigt
zwei Auftra gungen 70 und 72, die die Spektren
dieser Klänge
/s/ und /f/ veranschaulichen. In dieser 3 ist horizontal
die Frequenz (in Hertz) und vertikal die Amplitude (in dB) des Spektrums
aufgetragen. Die Auftragung 70 entspricht dem Spektrum
des Klanges /s/, die Auftragung 72 dagegen entspricht dem
Spektrum des Klanges /f/. Einem System zur Bandbreitenerweiterung steht
nur der Schmalbandteil zur Verfügung;
es kann daher nicht zwischen diesen beiden Klängen unterscheiden. Die Erweiterung
des Schmalbandteils dieser Klänge
kann daher zu hörbaren
Artefakten führen.
-
Angenommen,
in dem Übertragungssystem werde
Bandbreitenerweiterung eingesetzt, um Rahmenlöschungen zu verschleiern, und
angenommen, der vorherige Datenrahmen sei korrekt empfangen worden.
Im aktuellen Rahmen seien nur die den Schmalbandteil des Breitbandsignals
beschreibenden Daten korrekt empfangen worden. Die den Hochbandteil
beschreibenden Daten seien verloren gegangen oder fehlerhaft. Gemäß der Erfindung
kann der Hochbandteil mittels Bandbreitenerweiterung rekonstruiert
werden. Dies kann, wie oben beschrieben, zu Artefakten führen. Falls
jedoch das Hochband des vorherigen Rahmens korrekt empfangen worden
ist, kann dies dazu verwendet werden, einige der Fehler zu korrigieren,
die durch das Erweitern der Bandbreite des Schmalbandsignals entstehen.
Ein wichtiges Attribut bzw. ein wichtiger Parameter ist die Energie
des Hochbandsignals. Statt nur die Energie zu benutzen, die von
dem System zur Bandbreitenerweiterung aus dem Schmalbandsignal extrapoliert wird,
kann auch die Energie des Hochbands der zuvor (korrekt) empfangenen
Rahmen benutzt werden. Das extrapolierte Hochbandsignal wird dann
um einen Mittelwert dieser Energien skaliert. Wenn zum Beispiel
bei einem /s/-Klang ein Übertragungsfehler in
den Hochbanddaten auftritt, unterschätzt das System zur Bandbreitenerweiterung
die Energie im Hochband, und das Ergebnis klingt wie ein /f/. Wenn jedoch
einer oder mehrere der vorherigen Rahmen bereits den /s/-Klang dargestellt
haben, kann die Energie dieser Hochbandsignale benutzt werden, um den
Energiepegel in dem aus dem System zur Bandbreitenerweiterung erhaltenen
Hochbandsignal zu korrigieren. Diese zusätzliche Information kann die Fragestellung
lösen,
welcher der Klänge
vorliegt. Dies ist eine Verbesserung des Systems, in welchem zur
Fehlerverschleierung allein Bandbreitenerweiterung benutzt wird.
Bei dieser Implementierung wird in Kombination mit der Bandbreitenerweiterung
die Energie vorheriger Rahmen benutzt. Es könnten jedoch hierfür auch andere
Parameter benutzt werden, wie z.B. die spektrale Hüllkurve
oder die Tonhöhenperiode.
-
Obwohl
oben nur ein Kodierschema mit zwei Frequenzbändern beschrieben wurde, ist
die Erfindung auch auf Kodierschemata mit mehr als zwei Frequenzbändern anwendbar.
Die Rekonstruktionsmittel 48 (mit dem Schalter 49)
und der Sprachkodierer 60 können mittels digitaler Hardware
oder mittels Software, die von einem digitalen Signalprozessor oder
einem universellen Mikroprozessor ausgeführt wird, implementiert werden.
Darüber
hinaus können die
Rekonstruktionsmittel 48 in der Frequenzdomäne oder
in der Zeitdomäne
implementiert werden.
-
Der
Schutzumfang der Erfindung ist nicht auf die explizit offenbarten
Ausführungsformen
beschränkt.
Jede einzelne neue Eigenschaft und jede Kombination aus Eigenschaften
stellt eine Ausführungsform
der Erfindung dar. Bezugszeichen schränken den Schutzumfang der Ansprüche nicht
ein. Das Wort „umfassen" schließt die Anwesenheit
anderer als der in einem Anspruch aufgelisteten Elemente oder Schritte
nicht aus. Die einem Element vorangestellten Worte „ein", „eine" schließen die
Anwesenheit mehrerer solcher Elemente nicht aus.
-
Fig. 1
- 20
- SPLITTER
- 22
- erster
KODIERER
- 23
- MUX
- 24
- zweiter
KODIERER
- 25
- DEMUX
- 26
- erster
DEKODIERER
- 28
- zweiter
DEKODIERER
- 30
- KOMBINATOR
-
Fig. 2
- 22
- SCHMALBANDKODIERER
- 23
- MUX
- 24
- HOCHBANDKODIERER
- 25
- DEMUX
- 26
- SCHMALBANDDEKODIERER
- 28
- BREITBANDDEKODIERER
- 40
- Verzögerung
- 42
- TIEFPASS
- 48
- REKONSTRUIERER
- 52
- TIEFPASS
- 54
- Verzögerung