-
Die
Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zur
Bit-Raten-Verminderung beim Kodieren und Dekodieren von Informationen, insbesondere
von digitalen Audiosignalen.
-
Hintergrund
-
Die
digitale Darstellung von analogen Audiosignalen hat eine Zeitstruktur,
die ihren Ursprung im Abtastprozess hat. Im PCM-Format dargestellte
digitale Audiosignale bestehen aus einer Sequenz von Werten, bei
denen die Abstände
zwischen den Werten der Abtastfrequenz entsprechen. Dieser Abstand ist
das kürzeste
Element des Signals, durch das das Signal im Zeitbereich definiert
werden kann. Digitale Signale können
eine Länge
haben, die ein ganzzahliges Vielfaches nur dieses Zeitelements ist.
-
WO-A-02/17302
offenbart die Übertragung von
auf Blöcken
beruhenden kodierten Audiodaten in Datenrahmen, die eine feste Größe haben.
In jedem Datenrahmen zeigt eine Nutzdaten-Längeninformation
an, welcher Teil des Abschnitts mit den Dateninformationen fester
Größe mit kodierten
Audioinformationen besetzt ist, wobei der Rest des Dateninformations-Abschnitts mit Füllinformationen
gefüllt
wird.
-
Erfindung
-
Kodierer
und Dekodierer, die die Bit-Rate eines digitalen Audiosignals vermindern
(wie MPEG1/2/4-Audio, Dolby Digital AC-3, mp3, ATRAC, Windows Media
Audio WMA oder Real Audio) arbeiten üblicherweise mit Kurzzeit-Frequenzbereichs-Darstellungen des
Signals. Um das Signal in diesem Bereich umzuwandeln, wird eine
typische Zahl – z.B.
128, 256, 512, 1024 und 1152 – von
Signalelementen zusammengruppiert – als Rahmen oder Blöcke bezeichnet – und danach
in den Frequenzbereich transformiert. Bei Kodieren eines Signals
mit beliebiger Länge
verwirft ein üblicher
Audiokodierer entweder einen gewissen Teil des Audiosignals an seinem
Ende oder füllt
das Audiosignal mit einer Anzahl von nullwertigen Abtastungen (Füll-Bits) auf.
Im Ergebnis kann die Länge – d.h. die
Quantität von
Abtastungen oder Koeffizienten – irgendeines kodierten
oder dekodierten Audiosignals ein Vielfaches nur eines weiteren
Vielfachen des oben erwähnten
Anfangs-Zeitelements sein, d.h. ein Vielfaches der Rahmen- oder Blocklänge, das
von dem Kodierungs- oder Dekodierungsprozess benötigt wird. Daher haben kodierte/dekodierte
digitale Audiosignale kaum dieselbe Länge wie das ursprüngliche
Audiosignal. Dieser Längenunterschied
kann sehr störend
sein, wenn Audiosignale bearbeitet oder mit genauem Timing kombiniert
werden sollen.
-
Eine
von der Erfindung zu lösende
Aufgabe besteht darin, ein auf Blöcken beruhendes kodiertes/dekodiertes
Audiosignal vorzusehen, das die ursprüngliche beliebige Länge oder
Menge von Abtastwerten hat, um ein genaues Schneiden und Kleben (cutting
and splicing) zu ermöglichen.
Diese Aufgabe wird durch die in den Ansprüchen 1 und 4 offenbarten Verfahren
gelöst.
Vorrichtungen, die diese Verfahren verwenden, sind in den Ansprüchen 8 und
9 offenbart. Ein entsprechendes Speichermedium ist im Anspruch 11
offenbart.
-
Gemäß der Erfindung
werden Informationen über
die genaue Länge
des ursprünglichen
Signals zusammen mit der kodierten Audioinformation beim Senden
oder beim Aufzeichnen auf ein oder Wiedergeben von einem Speichermedium übertragen.
Diese Längenwert-Information
ist während
des Kodierungsprozesses verfügbar
und wird in den kodierten Audio-Bitstrom eingefügt. Die Einfügung erfolgt
unter Verwendung von zum Bei spiel des zusätzlichen Datenfeldes, das in
der MPEG Audio Norm ISO/IEC 11172-3 definiert ist. Diese Längeninformation
kann verschiedene Formen haben:
- – absolute
Zahl von Audio-Abtastungen des Programms oder der Spur oder der
Kodiereinheit;
- – Zahl
von Audiorahmen des Programms oder der Spur oder der Kodiereinheit,
und Zahl von Abtastungen in dem letzten Rahmen;
- – Zahl
der beim Beginn und/oder am Ende des Programms oder der Spur oder
der Kodiereinheit abzuschneidenden Abtastungen.
-
Außerdem kann
ein Informationswert übertragen
werden, der die gesamte Kodierer- und/oder Dekodierer-Verzögerung darstellt.
-
Der
Dekodierer kann diese Informationselemente herausziehen und die
Länge und
den Anfang des dekodierten Signals durch Abschneiden von Abtastungen
am Anfang und/oder Ende des Programms oder der Spur oder des Ausgangs
der Dekodiereinheit einstellen.
-
Die
Erfindung erlaubt die Dekodierung eines Audio- oder eines anderen
Informationssignals mit einer Länge,
die genau an die ursprüngliche
Länge des
Audio- oder Informationssignals angepasst ist, wodurch eine exakte
Bearbeitung (cutting and splicing) des Audio- oder Informationssignals
möglich ist.
-
Im
Prinzip wird das erfindungsgemäße Kodierverfahren
bei einem digitalen Informationssignal – z.B. einem Audiosignal – angewendet,
das eine beliebige Zahl von ursprünglichen Abtastwerten für ein spezifisches
Programm oder eine spezifische Spur und somit eine beliebige Länge hat,
wobei die Kodieroperation auf auf die Abtastwerte bezogenen Wertblöcken beruht,
die jeweils mehrere Werte enthalten, wobei das kodierte digitale
Informationssignal als Kode ausgegeben wird, der bei entsprechender
Dekodierung ein dekodiertes digitales Informationssignal darstellt,
das eine Gesamtlänge
von mehreren Einheiten hat, die der Länge oder den Längen der Wertblöcke entspricht,
und wobei Daten, die die Zahl von ursprünglichen Abtastwerten mit beliebiger
Länge darstellen,
wenigstens einen Rahmen des kodierten digitalen Informationssignal-Ausgangs-Kodes, z.B.
den letzten oder vorletzten Rahmen des kodierten digitalen Informationssignals
ergänzen
oder wiederholt in dem kodierten digitalen Ausgangssignal angeordnet
werden.
-
Im
Prinzip wird das erfindungsgemäße Dekodierverfahren
bei einem kodierten digitalen Informationssignal – z.B. einem
Audiosignal – angewendet,
das eine beliebige Zahl von ursprünglichen Abtastwerten für ein spezifisches
Programm oder eine spezifische Spur und damit eine beliebige ursprüngliche
Länge hat,
wobei die Dekodier-Operation auf auf die Abtastwerte bezogenen Wertblöcken beruht,
die jeweils mehrere Werte enthalten, wobei das kodierte digitale
Informationssignal als ein Kode eingegeben wird, der nach der Dekodierung
ein dekodiertes digitales Informationssignal darstellt, das eine
Länge von mehreren
Einheiten hat, die der Länge
oder den Längen
der Wertblöcke
entspricht, und wobei Daten, die die ursprüngliche Zahl von Abtastwerten
mit beliebiger Länge
darstellen und Rahmen des kodierten digitalen Informationssignal-Eingangs-Kodes,
z.B. der letzte oder vorletzte Rahmen des kodierten digitalen Informationssignals
ergänzen
oder die wiederholt in dem kodierten digitalen Informationssignal
angeordnet sind, verwendet werden, um die auf der Blockeinheit beruhende
Gesamtlänge des
dekodierten digitalen Informationssignals auf die beliebige ursprüngliche
Länge zu
begrenzen.
-
Im
Prinzip enthält
die erfindungsgemäße Vorrichtung
zur Kodierung eines digitalen Informationssignals – zum Beispiel
eines Audiosignals – das eine
beliebige Zahl von ursprünglichen
Abtastwerten für
ein spezifisches Programm oder eine spezifische Spur und damit eine
beliebige Länge
hat, wobei die Wertblöcke
jeweils mehrere Werte enthalten:
- – Mittel
zum Kodieren des digitalen Informationssignals, wobei die Kodieroperation
auf auf die Abtastwerte bezogenen Wertblöcken beruht, und die das kodierte
digitale Ausgangssignal als einen Kode ausgeben, der bei entsprechender
Dekodierung ein dekodiertes digitales Informationssignal darstellt,
das eine gesamte Länge
von mehreren Einheiten hat, die der Länge oder den Längen der Wertblöcke entspricht;
- – Mittel
zur Lieferung von Daten, die die Zahl der ursprünglichen Abtastwerte mit beliebiger
Länge darstellen;
- – Mittel
zum Ergänzen
wenigstens eines Rahmens des kodierten digitalen Informationssignal-Ausgangs-Kodes
mit den Daten, die die Zahl der ursprünglichen Abtastwerte mit beliebiger Länge darstellen,
z.B. den letzten oder vorletzten Rahmen des kodierten digitalen
Informationssignals;
- – oder
Mittel, um in dem kodierten digitalen Informationssignal die Daten
wiederholt anzuordnen, die die Zahl der ursprünglichen Abtastwerte mit beliebiger
Länge darstellen.
-
Im
Prinzip enthält
die erfindungsgemäße Vorrichtung
zur Dekodierung eines kodierten digitalen Informationssignals – z.B. eines
Audiosignals – das
eine beliebige Zahl von ur sprünglichen
Abtastwerten für
ein spezifisches Programm oder eine spezifische Spur und somit eine
beliebige ursprüngliche Länge hat:
- – Mittel
zum Dekodieren des kodierten digitalen Informationssignals auf der
Basis von auf die Abtastwerte bezogenen Wertblöcken, die jeweils mehrere Werte
enthalten, wobei das kodierte digitale Informationssignal als Kode
eingegeben wird, der nach Dekodierung ein dekodiertes digitales Informationssignal
darstellt, das eine Länge
von mehreren Einheiten hat, die der Länge oder den Längen der
Wertblöcke
entspricht;
- – Mittel,
um aus Rahmen des kodierten digitalen Informationssignal-Kodes,
z.B. aus dem letzten oder vorletzten Rahmen des kodierten digitalen Informationssignals
Daten herauszuziehen, die die ursprüngliche Zahl von Abtastwerten
mit beliebiger Länge
darstellen;
- – Mittel
zum Versehen der Mittel zum Dekodieren mit Informationen, die von
der Zahl der Daten mit beliebiger Länge abgeleitet sind, um die
auf der Blockeinheit beruhende Gesamtlänge des dekodierten digitalen
Informationssignals auf die beliebige ursprüngliche Länge zu begrenzen.
-
Vorteilhafte
weitere Ausführungsformen
der Erfindung sind in den entsprechenden Unteransprüchen offenbart.
-
Zeichnungen
-
Ausführungsbeispiele
der Erfindung werden nachfolgend unter Bezugnahme auf die beigefügten Zeichnungen
beschrieben. In den Zeichnungen stellen dar:
-
1 ein ursprüngliches Audiosignal mit einer
Länge von
n Abtastwerden;
-
2 das Audiosignal am Ausgang des Dekodierers
einschließlich
der n Abtastwerte, der Kodierer/Dekodierer-Verzögerung und der Füllinformationen;
-
3 einen erfindungsgemäßen Kodierer und Dekodierer.
-
Ausführungsbeispiele
-
Bei
der Studio-Ton- oder Audio-Verarbeitung werden die verfügbaren analogen
Audiosignale (z.B. am Ausgang von Mikrophonverstärkern) in digitale Signale
umgewandelt, wobei die Prinzipien von Abtastung und Quantisierung
angewendet werden. „Abtastung" bedeutet, dass Signalamplituden-Werte
in regelmäßigen Intervallen
genommen werden. Der reziproke Wert der zeitlichen Intervalle ist
die Abtastrate. Gemäß dem Nyquist-
oder Abtast-Theorem kann der ursprüngliche Inhalt der abgetasteten
Signale fehlerfrei wiedergewonnen werden, wenn sie maximale Frequenzen
bis hinauf zu nur der halben Abtastrate enthalten. Übliche Abtastraren,
die bei der Audioverarbeitung verwendet werden, sind zum Beispiel
44,1 kHz oder 48 kHz, die Abtastintervallen oder Takten von 22,67 μs bzw. 20,83 μs entsprechen. „Quantisierung" bedeutet, dass eine
verminderte Quantität
von Amplitudenwerten den grundsätzlichen fein
aufgelösten
Signalabtast-Wert gemäß einer Quantisierungs-Charakteristik
zugeordnet werden. Dabei wird die Auflösung der Amplitudenwerte begrenzt,
und der irreversible Verlust von Informations-Einzelheiten in den
entsprechend inversen quantisierten Werten kann nicht vermieden
werden. Zum Beispiel erstreckt sich ein 16-Bit-Amplituden-Wertbereich von –32768 bis
+32767 und wird auch als 16-Bit-Quantisierung oder 16-Bit-PCM (Impuls-Kode-Modulation)
bezeichnet. Ein Zweikanal-Audiosignal, das mit einer Abtastfrequenz
von 44,1 kHz abgetastet und mit 16 Bits quantisiert wurde, führt dazu,
dass 1411200 Bits pro Sekunde verarbeitet werden müssen. 16
Bits entsprechen 2 Bytes, ein Wert, der leicht in üblichen
Computern oder Mikroprozessoren gehandhabt werden kann. Wegen der
auf Bytes beruhenden Verarbeitung und der relativ hohen Abtastfrequenz
und somit hoher zeitlicher Auflösung,
kann Schneide- und Einfügungs-Verarbeitung bei
der Bearbeitung solcher digitalen Audiosignale ohne Probleme durchgeführt werden.
-
Der
Nachteil der zu verarbeitenden hohen Datenmengen ist ersichtlich,
wenn solche Signale übertragen
und gespeichert werden. Daher werden die oben erwähnten datenvermindernden
Verfahren angewendet, die eine Unterdrückung von redundanten als auch
von irrelevanten Signalkomponenten auf der Basis von psycho-akustischen
Gesetzen ausführen.
Es können
Datenverminderungs-Faktoren von 10 oder mehr erreicht werden.
-
Der
Datenverminderungseffekt wird wirksamer erreicht, wenn die Signale
in dem Frequenzbereich dargestellt und verarbeitet werden, in den
entweder durch Kurzzeit-Frequenz-Transformation
(z.B. schnelle Kurzzeit-Fourier-Transformation
FFT) oder durch Mehrfrequenzband-Filterung, Unterband-Filterung
genannt, eingetreten wird. Das Ergebnis beider Arten von Operationen
ist eine Darstellung des Audiosignals als zeitliche Sequenz kurzer
Zeitspektren. In dem Dekodierer wird eine entsprechende inverse Transformation
bzw. inverse Unterband-Filterung ausgeführt, um in den Zeitbereich
zurückzukehren. Die
Transformation wird wegen rechnerischer Vereinfachung üblicherweise
bei Eingangs-Abtastblöcken ausgeführt, die
Längen
haben, die voll oder teilweise einer integralen Potenz von '2' entsprechen, z.B. den oben erwähnten Werten
128, 256, 512, 1024 oder 1152. Die meisten Datenverminderungs-Kodierer- und
Dekodierertypen arbeiten ferner mit Blöcken, die sich im zeitlichen
Bereich überlappen.
Bei Verwendung von sich überlappenden
Blöcken
sind die gesamt möglichen
Längenwerte
ein integrales Vielfaches eines Abschnitts der Blocklänge, z.B.
ein integrales Vielfaches einer halben Blocklänge.
-
Bei
Sub-Band-Kodierern wird eine Aufspaltung in zum Beispiel 32 Frequenzbänder ausgeführt, und
es werden ebenso Blöcke
von Abtastwerten gebildet. Z.B. verwenden MPWG-Audio-Layer3-(mp3)-Kodecs eine Blocklänge von
1152 Abtastwerten, was einer Zeitdauer von 24 ms bei einer Abtastrate
von 48 kHz entspricht.
-
Die
resultierenden kodierten Signaldarstellungen werden in entsprechenden
Rahmen gemäß den genormten
Regeln angeordnet, wobei die Rahmen stark signalabhängige binäre Signale
enthalten. Diese Rahmen enthalten üblicherweise Abschnitte mit
wichtiger Steuerinformation (z.B. Datenpaket-Header-Informationen mit
Seiteninformationen) und Abschnitte mit weniger wichtigen, jedoch
stark signaladaptiven Frequenzkoeffizienten-Informationen, die als 'Hauptinformationen' bezeichnet werden.
Da die Menge der zu übertragenden
Informationen sich stark in Abhängigkeit
von der Audiosignal-Charakteristik ändert und
praktisch niemals die Kapazität
der Rahmen voll ausfüllt,
können
die Rahmen auch Teile enthalten, die keine standardisierten nützlichen
Informationen darstellen. Diese Teile werden zum Beispiel als 'Zusatzdaten' bezeichnet und können frei
für verschiedene
Zwecke verwendet werden. Eine Aufgabe des Kodierers besteht daher
in der Steuerung der Kodierung, so dass die Menge der kodierten
Daten gerade in die Rahmen passt, d.h. die gegebene maximale Datenrate
nicht überschreitet,
aber von ihr vollen Gebrauch macht. Dies wird hauptsächlich durch
Einstellung der Kodierqualität
erreicht, z.B. der Grobheit der Quantisierung. Der Kodierer kann
so gesteuert werden, dass eine gewünschte Menge der gesamten Datenrate
für Zusatzdaten
gehalten wird. Bei der Dekodierung (nach Speicherung oder Übertragung)
findet die entsprechende inverse Verarbeitung der Rahmen/Blöcke statt.
-
Bei
Anwendung der obigen Kodierungs/Dekodierungsprinzipien ergeben sich
zwei Probleme, die stark insbesondere die Verwendung des dekodierten
Tonsignals für
die Bearbeitung begrenzen:
- a) aufgrund der
auf Blöcken
beruhenden kurzen Zeittransformations-Verarbeitung oder des Gebrauchs
von Filtern zur Aufspaltung des Signals in Frequenzbänder wird
eine Verzögerung
des dekodierten Audiosignals eingeführt. Bei einem Audiosignal,
das aus einem einzigen Abtastwert so zum
zeitlichen Augenblick to besteht, erscheint nach
dem Kodieren und Dekodieren am Dekodiererausgang ein Signal, das
ebenfalls aus einem individuellen Abtastwert so besteht,
jedoch befindet sich dieser Abtastwert nicht mehr beim zeitlichen
Augenblick to, sondern um einige hundert Abtasttakte
verschoben. Solche Kodierverzögerung
ist einerseits abhängig
von dem Typ der verwendeten Sub-Band-Filter- oder Transformationslänge und
hängt andererseits
von dem Aufbau der Kodiererschaltung oder Software ab. Zum Beispiel
erfordern Kodierer eine bestimmte Vorverarbeitungszeit, bevor sie
in der Lage sind, adaptive Prozesse wie die Quantisierungs-Schrittgröße genau
einzustellen.
- b) Neben der Kodierer- und/oder Dekodierer-Verzögerung führt die
auf Blöcken
beruhende Verarbeitung zu Gesamtlängen-Werten der dekodierten
Audiosignale, die ein integrales Vielfaches der verwendeten Blocklänge sind
und somit nicht der ursprünglichen
Gesamtlänge
entsprechen.
-
Wenn
die oben beschriebenen Kodierverfahren in kontinuierlich arbeitenden Übertragungsschaltungen
verwendet werden, z.B. beim Senden oder in Mikrowellenverbindungen
zwischen Sendestudios führen
die Basisverzögerung
und die Blockstruktur zu keinem ernsthaften Problem. Wenn jedoch
die Audiosignale in kodierter Form auf Datenträgern mit bestimmten Datenlängen (als 'Dateien') gespeichert werden,
sind beide Probleme beim Schneiden und Bearbeiten der Audiosignale
besonders ungünstig. Im
Gegensatz zu den bei PCM-Audiosignalen
verfügbaren
kurzen Schneide/Bearbeitungs-Zeiteinheiten von
etwa 20 μs
sind hier nur Zeiteinheiten vorhanden, die etwa 500 oder 1000 mal
länger
sind. Dadurch können
die üblichen
Schneide- und Bearbeitungsprozesse nur in begrenzter Weise ausgeführt werden.
-
Zur
Lösung
dieser Probleme sollte Folgendes bekannt sein:
- – die konstruktionsbedingte
Basisverzögerung der
Kombination von Kodierer und Dekodierer;
- – die
Gesamtlänge
des Audioprogramms oder der Spur beim Eingang des Kosierers, z.B.
die Zahl von Abtastungen in einer PCM-Datei, die das Audiosignal
darstellt.
-
Gemäß der erfindungsgemäßen Lösung werden
der Basisverzögerungswert
und der Gesamtlängenwert
dem Dekodierer signalisiert. Diese Signalisierung kann durch beliebige
Mittel ausgeführt
werden, z.B. in einer getrennten Datei oder einem getrennten Kanal,
vorzugsweise jedoch zusammen mit den kodierten Daten in demselben
Datenstrom oder derselben Datendatei, z.B. als 'Zusatzdaten' oder zusätzliche Header- Daten. Der Dekodierer
ist so ausgelegt, dass er am Anfang der Dekodierung eine bestimmte
Zahl (die dem obigen Basisverzögerungswert
entspricht) von Abtastungen in der üblichen Weise berechnet, aber
diese Abtastungen nicht ausgibt. Ferner ist der Dekodierer so ausgelegt,
dass er zunächst
das Audiosignal am Ende des Programms oder der Spur in der üblichen
Weise berechnet, aber danach das Ausgangs-Audiosignal in seiner Gesamtlänge entsprechend
der übertragenen
Information auf den Gesamtlängenwert
begrenzt wird.
-
Vorteilhafterweise
erfolgt die Übertragung der
zusätzlichen
Informationen, d.h. des Basisverzögerungs-Wertes und des Gesamtlängen-Wertes
innerhalb des zusätzlichen
Datenbereichs. Gegebenenfalls muss der Kodierer so gesteuert werden, dass
er für
die zusätzliche
Information genug Datenkapazität
reserviert.
-
Vorteilhafterweise
wird die Information über die
Basisverzögerung
in dem ersten Rahmen oder in einem der ersten Rahmen übertragen.
Ratsam ist ihre Übertragung
als eine Menge von Abtastungen, die am Anfang entfernt werden müssen. Die
wiederholte Übertragung
dieser Information kann ebenfalls von Vorteil sein.
-
Die
Information über
den Gesamtlängen-Wert
kann in verschiedener Weise und an verschiedenen Orten innerhalb
des Datenstroms oder der Datei gesendet werden, z.B. als eine Menge
von Abtastungen, die aus dem anfänglich
berechneten Ende entfernt werden sollen, oder als eine Menge von
relevanten Abtastungen innerhalb des letzten Datenrahmens, oder
als eine absolute Menge von Abtastungen für die Gesamtlänge. Diese
Information kann in dem ersten Rahmen oder in einem der ersten Rahmen
oder innerhalb eines späteren
Rahmens übertragen
werden, z.B. dem letzten oder zweitletzten Rah men. Die wiederholte Übertragung
dieser Information kann ebenfalls von Vorteil sein.
-
Vorteilhafterweise
geht dem Basisverzögerungs-Wert
und/oder dem Gesamtlängen-Wert
ein Identifikations-Datenschema voraus, oder wird dadurch ausgelöst, und
es erfolgt ein Schutz durch Fehlerschutzdaten, z.B. ein CRC-Check.
-
In 1 ist ein Audiosignal dargestellt, das eine
Länge von
N Abtastungen hat, wobei N eine ganze Zahl ist.
-
In 2 hat der Audiosignal-Ausgang des Dekodierers
eine Länge
von (ENCDECD + N + STI) Abtastungen, wobei ENCDECD die Basis-Kodierer plus
Dekodierer-Verzögerung,
STI die Füllinformation
(z.B. eine Zahl von Null-Amplituden-Abtastungen), und (N + STI) gleich (m·Blocklänge) ist,
wobei m eine ganze Zahl ist, d.h. ein Vielfaches der Block- oder Rahmenlänge, auf
der die Verarbeitung in dem Audiokodierer oder -dekodierer beruht.
Die End-Start- und End-Zeit-Augenblicke
des dekodierten Audiosignals werden von dem Basis-Kodierer- und
-Dekodierer-Verarbeitungs-Verzögerungswert und
von dem Gesamtlängen-Wert
abgeleitet, wobei die Füllabtastungen
oder Bits (entsprechend STI) am Ende des Datenstroms oder der Spur
und die Abtastungen, die der Verarbeitungs-Verzögerung ENCDECD entsprechen,
am Beginn des Datenstroms oder der Spur verworfen werden.
-
Der
linke Teil von 3 zeigt einen erfindungsgemäßen Kodierer,
der ein ursprüngliches
Audiosignal empfängt,
das in einer entsprechenden Kodierer-Fenstertechnik-Stufe EW im
Zeitbereich gefenstert (windowed) oder Sub-Band-gefiltert wird und anschließend unter
Verwendung von Datenverminderung in einer Kodiererstufe ENC kodiert
wird. Von der Stufe ENC oder alternativ von der Stufe EW oder im
Bitstrom- Formatierer
BSF wird eine Gesamtlängen-Information
einem Längen-Informations-Kodierer
LIC zugeführt,
dessen Ausgangssignal mit dem Frequenzbereichs-Ausgangssignal der
Stufe ENC im Bitstrom-Formatierer BSF kombiniert wird. Außerdem kann
ein Basiskodierer-Verzögerungswert
dem Bitstrom in dem Bitstrom-Formatierer BSF hinzugefügt werden.
Der rechte Teil von 3 zeigt einen
erfindungsgemäßen Dekodierer,
der ein kodiertes Audiosignal empfängt, das einen Gesamtlängen-Informationswert
oder zusätzlich
einen Basis-Kodierer-Verzögerungswert
enthält.
Wenn die Basis-Kodierer-Verzögerung fest
und bekannt ist, kann sie zur Abschätzung in den Dekodierer selbst
eingegeben werden. Der Bitstrom Deformatierer BSD extrahiert und
liefert den empfangenen Gesamtlängen-Informationswert
an einen Längen-Informations-Abschätzer LIE,
der die erforderliche Gesamtlängen-Information – wahlweise
zusammen mit der Basis-Kodierer-Verzögerungsinformation
oder zusätzlich
zu der Basis-Dekodierer-Verzägerungsinformation – an eine Dekodierer-Fenstertechnik-Stufe
DW und/oder an eine Dekodierer-Stufe DEC liefert. Alternativ kann
die Basis-Kodierer-Verzögerungsinformation
oder die Basis-Dekodierer-Verzögerungsinformation
von jeder anderen Quelle DW und/oder DEC zugeführt werden. Die Stufe DEC führt die
Haupt-Dekodieroperationen für
den von der Stufe BSD empfangenen Audiosignal-Kode aus. Das Zeitbereichs-Ausgangssignal
der Stufe DEC wird danach entsprechend zu der Kodierer-Fenstertechnik der
Stufe EW gefenstert. Im Falle einer Sub-Band-Kodierung/Dekodierung verwandelt
das Synthesefilter DW das Audiosignal aus dem Frequenzbereich zurück in den
Zeitbereich. Zwischen den Stufen BSF und BSD wird eine Aufzeichnungseinheit
oder ein Sende- oder Kabel-Übertragungskanal
durchlaufen.
-
Anstatt
eines digitalen Audiosignals kann jedes andere Informationssignal
verarbeitet werden, z.B. ein digitales Videosignal.