DE69722973T2

DE69722973T2 - Verfahren und gerät zur phasenschätzung in einem transformationskodierer für hochqualitätsaudio

Info

Publication number: DE69722973T2
Application number: DE69722973T
Authority: DE
Inventors: Javed Mohammed ABSAR; Sapna George; Mario Antonio ALVAREZ-TINOCO
Original assignee: STMicroelectronics Asia Pacific Pte Ltd
Current assignee: STMicroelectronics Asia Pacific Pte Ltd
Priority date: 1997-12-19
Filing date: 1997-12-19
Publication date: 2004-05-19
Anticipated expiration: 2017-12-20
Also published as: US6574602B1; WO1999033194A1; DE69722973D1; EP1046239B1; EP1046239A1

Description

Technisches Gebiet
Die Erfindung betrifft allgemein digitale Signalverarbeitung von Audiosignalen, wie z. B. Musiksignalen. Die Erfindung betrifft insbesondere die Realisierung eines digitalen Hochqualitäts-Zweikanal-Audio-Kodierers zum digitalen Speichern oder Senden, der auf einem psychoakkustischen Modell des menschlichen Gehörs basiert.
Um Audiosignale effizienter zu senden oder aufzuzeichnen, kann die Datenmenge, die die Audiosignale repräsentiert, reduziert werden. Im Fall von digitalen Audiosignalen kann der Umfang an digitalen Daten, die zur korrekten Wiedergabe der PCM-Muster (Puls Code Modulation), durch Anwenden eines digitalen Kompressionsalgorithmus reduziert werden, was zu einer digital komprimierten Darstellung des Originalsignals führt. Das Ziel des digitalen Kompressionsalgorithmus ist das Erzeugen einer digitalen Darstellung eines Audiosignals, die wenn sie dekodiert und wiedergegeben wird, genau wie das Originalsignal klingt, wobei ein Minimum von digitalen Daten für die komprimierte oder kodierte Darstellung benutzt wird.
Die Nutzung von psychoakustischen Modellen beim Entwurf von Audiocodieren hat jüngst zu hohen Kompressionsraten geführt, wobei die hörbare Verschlechterung des komprimierten Signals minimal gehalten wird. Die Beschreibung einer solchen Methode kann in dem Advanced Television Systems Community (ATSC) Standard Dokument „Digital Audio Compression (AC-3) Standard" Document A52, 20. Dezember 1995. In dem grundlegenden Verfahren wird das Signal im Zeitraum zunächst mittels einer Filterbank in den Frequenzraum transformiert. Dann wird die Maskierung des Frequenzraums durch das menschliche Gehör ausgenutzt, um die empfundene Wiedergabetreue des Signals, das bei einer gegebenen Bit-Rate gesendet wurde, zu maximieren.
Durch eine als Kopplung bekannte Technik kann eine weitere sukzessive Komprimierung erreicht werden. Kopplung nutzt die Art und Weise, wie das menschliche Ohr die Richtung von Signalen von besonders hohen Frequenzen bestimmt, um eine Reduzierung der zur Kodierung eines Audiosignals notwendigen Datenmenge zu schaffen. Bei hohen Audiofrequenzen (etwa oberhalb von 2 kHz) ist das Ohr physikalisch nicht in der Lage, einzelne Schwingungen einer Wellenform aufzulösen und spricht anstelle dessen auf die Einhüllende der Wellenform an. Daher kombiniert der Kodierer die Hochfrequenzkoeffizienten der einzelnen Kanäle, um einen gemeinsamen Koppelkanal zu bilden. Die ursprünglichen zu dem genannten Koppelkanal kombinierten Kanäle werden als gekoppelte Kanäle bezeichnet.
Ein grundsätzlicher Kodierer kann die Koppelkanäle auf einfache Weise durch Mittelung aller einzelner Kanalkoeffizienten bilden. Ein weiter entwickelter Kodierer kann die Vorzeichen einzelner Kanäle vor dem Summieren ändern, um so Phasenlöschungen zu verhindern.
Der erzeugte Koppelkanal ist dann in eine Anzahl von Frequenzbändern geteilt. Die Frequenzunterbänder werden zum Ausbilden von Koppelbändern in Gruppen eingeordnet. Für jedes derartige Band und jeden gekoppelten Kanalwird dem Dekodierer ein Koppelkoordinate übergeben. Um für einen speziellen gekoppelten Kanaldie Hochfrequenzkoeffizienten für jedes Frequenzband zu erhalten, multipliziert der Dekodierer die Koppelkoordinaten von dem genannten Koppelkanal in dem Frequenzband mit der Koppelkoordinate des Kanals für das spezielle Frequenzband. Bei einer Zweikanalausführung eines solchen Dekodierers kann für jedes gekoppelte Band des Koppelkanals auch ein Phase-Flag-Bit vorgesehen sein. Im letzten Schritt führt der Dekodierer dann eine Phasenkorrektur durch, bei der die Koeffizienten eines jeden Bandes mit dem Phase-Flag-Bit für dieses Band multipliziert werden.
Der Standard gibt keine spezifische Methode zum Bestimmen der Phase-Flag-Bits an. Es existieren Ad-hoc-Methoden, die aber wegen ihrer besonderen Art weder eine sichergestellte Leistung bieten, noch bieten sie einen verlässlichen minimalen Fehler zwischen den Originalkoeffizienten am Kodierer und den rekonstruierten und phasenkorrigierten Koeffizienten am Dekodierer.
Zusammenfassung der Erfindung
Das Phase-Flag bzw. Phasenkennzeichen für ein Band ist im Wesentlichen eine Funktion der Koeffizienten des Originalkanals und den Koeffizienten des Koppelkanals in diesem Band. Ausführungsformen der Erfindung beabsichtigen eine Minimierung der Differenz zwischen den Originalkoeffizienten am Kodierer und den rekonstruierten Koeffizienten am Dekodierer.
Die vorliegende Erfindung schafft ein Verfahren zum Berechnen eines Phasenrekonstruktionskoeffizienten in einem Zweikanal-Audio-Kodierer, der dem digitalen Audio-Kompressions-Standard AC-3 entspricht, mit einem ersten und zweiten kodierten Kanal und einem Koppelkanal, welches beinhaltet das Berechnen der Transformationskoeffizienten für den genannten ersten und zweiten Kanal, Berechnen der Koppelkoeffizienten aus den Transformationskoeffizienten des ersten und zweiten Kanals und Berechnung eines Phasenrekonstruktionskoeffizienten, welches dadurch gekennzeichnet ist, dass der genannte Schritt der Berechnung eines Phasenrekonstruktionskoeffizienten das Berechnen eines Punkt- bzw. Skalarproduktes der Transformationskoeffizienten für einen des ersten und zweiten Kanals und den ent sprechenden Kopplungskoeffizienten aufweist, und Bestimmen des Vorzeichens des berechneten Skalarprodukts.
Außerdem schafft die vorliegende Erfindung ein Verfahren zum Berechnen eines Phasenrekonstruktionskoeffizienten in einem digitalen Zweikanal-Audio-Kodierer, der dem digitalen Audiokompressionsstandard AC-3 entspricht, mit ersten und zweiten codierten Kanälen und einem Koppelkanal, mit Bestimmen von Transformationskoeffizienten für einen der ersten und zweiten Kanäle, Bestimmen der Koppelkoeffizienten aus den ersten und zweiten Kanälen und Berechnung eines Phasenrekonstruktionskoeffizienten, die dadurch gekennzeichnet ist, dass der genannte Schritt der Berechnung eines Phasenrekonstruktionskoeffizienten das Berechnen des Vorzeichens der Summe von entsprechenden Transformations- und Koppelkoeffizienten über eine vorbestimmten Frequenzbereich der Koeffizienten aufweist.
Vorzugsweise enthält das Verfahren das Berechnen eines Phasenrekonstruktionskoeffizienten für jedes aus einer Anzahl von Koppelfrequenzbändern für jeden der genannten ersten und zweiten Kanäle.
Das Berechnen der Phasenrekonstruktionskoeffizienten ist vorzugsweise unabhängig von einem Verfahren, das zum Berechnen der Koppelkoeffizienten benutzt wird und unabhängig von einem Verfahren, das zum Berechnen der Koppelkoordinaten für die genannten ersten und zweiten Kanäle benutzt wird.
Die vorliegende Erfindung liefert auch einen Zweikanalkodierer, der dem digitalen Audiokompressionsstandard AC-3 entspricht, zum Codieren von Audiodaten, der einen Koppelkanal mit mindestens einem Koppelband erzeugt, mit Einrichtungen zum Berechnen eines Skalarproduktes von Eingangskanaltransformationskoeffizienten und Koppelkanalkoeffizienten in genanntem mindestens einem Koppelband und Einrichtungen zum Bestimmen des Vorzeichens des genannten Skalarproduktes zur Benutzung als Phase-Flag, das dem mindestens einem Koppelband entspricht.
Die vorliegende Erfindung liefert außerdem einen Zweikanalkodierer zum Codieren von Audiodaten, der dem digitalen Audiokompressionsstandard AC-3 entspricht, mit einem Koppelkanal und ein Einrichtungen zum Berechnen von Phasenschätzdaten, so dass eine Differenz zwischen ursprünglichen Koeffizienten von gekoppelten Kanälen, die an dem Kodierer erzeugt wurden, und Kanalkoeffizienten, die an einem kompatiblen Decoder geschätzt wurden, einen kleinsten quadratischen Fehler aufweisen (least square error).
Gemäß der vorliegenden Erfindung ist außerdem geschaffen: ein Kodierer, der dem digitalen Audiokompressionsstandard AC-3 entspricht, zur Transformationskodierung digitaler Audiodaten aus ersten und zweiten Kanälen, wobei der Kodierer einen Koppelkanal erzeugt, der in mindestens einem Frequenzband und mindestens einem Phase-Flag, das dem mindestens einem Frequenzband entspricht, angeordnet ist, wobei das mindestens eine Phase-Flag nach: PhaseFlag = sign (Σ(bi*ci))berechnet wird, wobei
b_i die Transformationskoeffizienten für einen der ersten und zweiten Kanäle darstellt,
c_i die Transformationskoeffizienten für die Koppelkanäle darstellt und
der Index i über den Frequenzbereich des Bandes läuft.
Kurzbeschreibung der Zeichnungen:
Die Erfindung wird nachfolgend detailliert anhand der Beschreibung eines Ausführungsbeispieles und unter Bezugnahme auf die beigelegten Figuren, wobei:
die 1 diagrammatisch ein Audiokodier/-dekodier-Verfahren mit Kanalkopplung und Phasenrekonstruktion zeigt;
die 2a und 2b Vektorraumdiagramme sind; und
die 3 ein Blockschaltbild einer Zwei-Kanal-Audio-Codiereinrichtung gemäß einer Ausführungsform der Erfindung zeigt.
Ausführliche Beschreibung der bevorzugten Ausführungsform:
Wie eingangs bemerkt ist ein Verfahren zur Kompression von digitalen Audiosignalen in dem ATSC-Standard „Digital Audio Compression (AC-3) Standard", (Dokument A/52, 20. Dezember 1995) beschrieben. Die Beschreibung einer bevorzugten Ausführungsform der Erfindung ist im Folgenden in Bezug auf einen Audiokodierer, der mit dem AC-3-Standard kompatibel ist, beschrieben.
Ein AC-3-Kodierer empfängt PCM-Audiodaten und generiert einen kodierten Bit-Stream, der dem AC-3-Standard entspricht. Die Besonderheiten des Audiokodierverfahrens sind keine normativen Anforderungen des Standards, ein kompatibler Kodierer muss jedoch einen Bit-Stream generieren, der der in dem AC-3-Standarddokument ausgelegten Syntax entspricht, der, wenn er wie vorgeschrieben kodiert wurde, Audiodaten von für die gewünschte Anwendung ausreichender Qualität produziert.
Der AC-3-Algorithmus erreicht eine hohe Kodiereffizienz (Verhältnis zwischen Eingangsbitrate und Ausgangsbitrate) durch grobes Quantisieren einer Frequenzraumdarstellung eines Audiosignals. Das grundlegende Kodierverfahren ist wie folgt. Im ersten Schritt des Kodierverfahrens wird die Darstellung von Audiodaten von einer Folge vom PCM-Zeitmustern in einer Folge aus Blöcken von Frequenzkoeffizienten überführt. Dies wird mit einer Analysefilterbank gemacht. 512 überlappende Blöcke von Zeitmustern werden mit einem Zeitfenster multipliziert und in den Frequenzraum transformiert. Wegen der überlappenden Blöcke ist jedes PCM-Eingangsmuster durch zwei sequenziell transformierte Blöcke dargestellt. Die Frequenzraumdarstellung kann dann etwa mit einem Faktor 2 verkleinert werden, so dass jeder Block 256 Frequenzkoeffizienten enthält. Die einzelnen Frequenzkoeffizienten sind in binärer exponentieller Notation als einen Binärexponenten und eine Mantisse dargestellt. Der Satz von Exponenten wird als eine grobe Darstellung des Signalspektrums kodiert, die als spektrale Einhüllende bezeichnet wird. Diese spektrale Einhüllende wird von einer Kern-Bit-Zuordnungsroutine benutzt, die bestimmt, wie viele Bits zum Codieren einer einzelnen Mantisse benutzt werden. Die spektrale Einhüllende und die grob quantisierten Mantissen für sechs Audioblöcke (1536 Audiomuster) werden als AC-3-Rahmen formatiert. Der AC-3-Bit-Stream ist eine Abfolge von AC-3-Rahmen.
Beim Codieren wird die Kanalkopplung durch Mittelung bestimmter Transformationskoeffizienten aus Kanälen, die in dem Koppelkanal enthalten sind, durchgeführt. Jeder Koppelkanal hat einen eindeutigen Satz von Koppelkoordinaten, die zum Wiederherstellen der Hochfrequenzeinhüllenden der ursprünglichen Kanäle benutzt werden. Der Koppelprozess wird für Transformationskoeffizienten durchgeführt, die Frequenzen oberhalb einer Koppelfrequenz entsprechen, die durch einen vorbestimmten Wert definiert ist, cplbegf.
Der Dekodierer konvertiert die Koppelkanäle zurück in einzelne Kanäle, indem er die Werte der Transformationskoeffizienten der gekoppelten Kanäle mit den Koppelkoordinaten für den Kanal und das Frequenzband multipliziert. Es tritt ein zusätzlicher Verfahrensschritt auf, wenn nur zwei Kanäle gekoppelt sind und Phase-Flag-Bits genutzt werden. In diesem Fall ist in dem kodierten Bit-Stream ein gerade benutztes Phase-Flag-Bit bzw. Phase-Flag-In-Use-Bit (phsflginu) gesetzt und es werden durch den Dekodierer in Form von Phase-Flag-Bits Phasenrekonstruktionsbits aus dem Bit-Stream gewonnen. Die Phase-Flag-Bits sind so angeordnet, um die Koppelbänder in aufsteigender Frequenz darzustellen. Falls für ein bestimmtes Band ein Phase-Flag-Bit gesetzt ist, werden alle rechten Kanaltransformationskoeffizienten innerhalb des gekoppelten Bandes negiert (invertiert), nach der Änderung durch den Koppelkoeffizienten, aber vor der inversen Transformation.
Die Transformationskoeffizienten #37 bis #252 sind in 18 Unterbänder bzw. Subbänder von jeweils 12 Koeffizienten gruppiert, wie in Tabelle 1 gezeigt. Der Parameter cplbegf zeigt die Anzahl der Koppel-Unterbänder an, die als erste in den Koppelprozess einzubeziehen sind. Unterhalb der durch cplbegf angezeigten Frequenz (oder Transformationskoeffizientennummer, tc#) werden alle Kanäle unabhängig codiert. Oberhalb der durch cplbegf angezeigten Frequenz teilen sich alle in den Koppelprozess einbezogenen Kanäle den gemeinsamen Koppelkanal bis zur Frequenz (oder tc#), die durch den Parameter cplbegf gegeben ist. Der Koppelkanal ist bis zu der Frequenz (oder tc#), die durch cplbenf angezeigt ist, codiert, was das letzte codierte Koppel-Unterband anzeigt. Der Parameter cplendf wird durch Addieren einer 2 zu seinem Wert ausgewertet, so dass das zuletzt kodierte Koppel-Sub-Band von 2–17 reichen kann.
Die Koppelkanalunterbänder werden in Koppelbänder zusammengefasst, für die für jeden gekoppelten KanalKoppelkoordinaten generiert werden (und in den Bit-Stream eingefügt werden). Die Struktur des Koppelbandes wird durch den Parameter cplbndstrc[sbnd] beschrieben. Jedes Bit dieses cplbndstrc[]-Arrays bzw. -Feld zeigt an, ob das dem Index entsprechende Unterband in das vorherige Koppelband (niedrigere Frequenz) eingefügt wurde. Somit sind die Koppelbänder auf Basis einer ganzen Anzahl von Koppelkanalunterbändern strukturiert.
Die 1 zeigt schematisch den allgemeinen Kopplungsprozess. In dieser Figur zeigen die 1a bis 1j schematisch die verschiedenen Frequenzkoeffizienten, die Koppelkoordinaten und die Phase-Flag-Werte als Funktion der Frequenz über einen Ausschnitt eines Codier- gefolgt von einem Decodierprozess. In einem Zwei-Kanal-Kodierer besteht der Eingangs-Bit-Stream aus verschachtelten interleared digitalen Signalen zweier Kanäle, wobei die zwei einzelnen Kanäle im Folgenden als a (linker Kanal) und b (rechter Kanal) bezeichnet sind. In dem ersten Schritt sind aus dem Eingangs-Stream ein Block aus digitalisierten Mustern für beide Kanäle a und b ausgewählt und unter Benutzung von Filterbänken in den Frequenzraum transformiert, um Frequenzraumkoeffizienten zu generieren. Die allgemeinen Frequenzraumkoeffizienten für die Kanäle a und b werden im Folgenden als Folgen a_i bzw. b_i (siehe 1a und 1b) bezeichnet, wobei der Index i die entsprechende Frequenzfolgenummer des Koeffizienten indentifiziert.
Durch den Dekodierer wird eine Frequenzstelle ⨍_cplbegf (coupling begin frequency = Anfangsfrequenz für Kopplung) auf Grundlage der cplbegf-Parameter wie oben beschrieben ausgewählt. Durch den Kodierer werden die Frequenzkoeffizienten a_i und b_i, für die i kleiner als ⨍_cplbegf ist einzeln in den komprimierten Bit-Stream gesendet (siehe 1c und 1h).
Die Frequenzkoeffizienten a_i und b_i, für die alle i über ⨍_cplbegf liegen, werden mit einem binären Operator miteinander kombiniert, um einen neuen Kanalzu generieren, der als Koppelkanal c bezeichnet wird. Die Kanäle a und b, die zum Erzeugen des Koppelkanals genutzt werden, werden als gekoppelte Kanäle bezeichnet. Es kann jeder Binäroperator ⨁ zur Erzeugung des Koppelkanals benutzt werden, denn sein genauer Aufbau ist durch den AC-3-Standard nicht spezifiziert und unabhängig von dem hier beschriebenen Verfahren zur Bestimmung der Phase. Somit schränkt das hier beschriebene Verfahren und Einrichtung gemäß von Ausführungsformen der vorliegenden Erfindung zur Schätzung von Phasenrekonstruktionsdaten nicht das Verfahren zum Erzeugen von Koppelkanälen ein.
Der Koppelkanal c enthält Frequenzraumkoeffizienten, die als c_i = a_i ⨁ b_i bezeichnet sind. Der Koppelkanal ist in eine Anzahl von aufeinander folgenden Bändern (siehe 1e) eingeteilt, wobei der Kodierer die Struktur des Koppelbandes die Bandweite für jedes gekoppelte Band) steuert wie es oben erläutert und in dem AC-3-Standard beschrieben ist. Für jedes dieser Bänder und jeden gekoppelten Kanalwird durch den Kodierer (siehe 1d und 1f) der Wert von Koppelkoordinaten erzeugt.
Um die ursprünglichen Kanalkoeffizienten a_i oder b_i in einem bestimmten Band wiederherzustellen, muss der Dekodierer jeden Koppelkanalkoeffizienten ci in dem Band mit dem Wert der Koppelkoordinate für das Band und Kanal(siehe 1d und 1e) multiplizieren. Falls beispielsweise ψ die Koppelkoordinate für ein Band in dem gekoppelten Kanalb ist, lautet die Koeffizientenschätzung für b an dem Dekodierer, als b_i bezeichnet
Gleichung 1 b ^i = ψ·ci
Der Kodierer misst die Originalsignalleistung in dem Band für den einzelnen gekoppelten Kanalsowie die Leistung in dem Koppelkanal für dasselbe Band. Das Verhältnis von ursprünglichen Signalleistung innerhalb eines Bandes mit der Koppelkanalleistung in demselben Band wird als die Koppelkoordinate für das Band bezeichnet. Allerdings ist das hier beschriebene Verfahren zur Schätzung der Phase unabhängig von dem Verfahren zum Erzeugen Koppelkoordinaten.
Um Phasenkorrekturen beim Dekodierer zu erlauben (siehe 1g) wird in einem Zweikanalkodierer für den zweiten (rechten) Kanal, das heißt Kanalb, eine Phase-Flag-Information übermittelt. Daher kann Gleichung 1 geschrieben werden wie
Gleichung 2 b ^i = phase_flag*ψci.
Das Bestimmen der Phase-Flags ist schwierig. Ein einfacher Ansatz könnte das Berechnen der Summe der b-Kanal-Koeffizienten in dem Band sein, das heißt Σb_i und auch die Summe der Koeffizienten in dem Band für den Koppelkanal, das heißt Σc_i. Wenn diese beiden Summen dasselbe Vorzeichen aufweisen, wird das Phase-Flag auf +1 gesetzt, sonst, falls sie entgegengesetzte Vorzeichen aufweisen, wird der Phase-Flag zu –1 gesetzt. Das heißt
Gleichung 3 phase_flag = sign [(Σbi)*(Σci)].
Jedoch kann dieser Ansatz zu verfälschten Ergebnissen führen, und um das Funktionieren der Phase-Flags zu verstehen, ist eine detailliertere Analyse notwendig.
Kanalkoeffizienten in einem bestimmten Band können als Vektoren in einem n-dimensionalen Raum, wobei n die Anzahl der Frequenzkoeffizienten in einem Band ist, dargestellt werden. Also: b = (b₁ , b₂ ... b₁₁ und c = (c₁, c₂... c₁₁). Die 2a und 2b zeigen den Vektorraum der von den Kanalkoeffizienten in einem Band gebildet wird. Eine Schätzung des Vektors b am Dekodierer kann sein:
Gleichung 4 b1= ψc oder
Gleichung 5 b2 = –ψc abhängig davon, ob das Phase-Flag als +1 oder –1 gesetzt ist.
In 2a ist xx' als die Hyperebene senkrecht zum Vektor c definiert, die den n-dimensionalen Vektorraum in zwei Teile teilt. Wenn [sic]b auf derselben Seite der Hyperebene liegt wie c , ist b 1 eine bessere Schätzung für [sic]b als b ₂ (wie im Fall von 2a gezeigt), das heißt ||b – b ₁|| < ||b – c ₂||. Genauso ist b z eine bessere Schätzung als b ₁ , wenn b auf der gegenüberliegenden Seite der Hyperebene wie c liegt.
Wendet man diesen Ansatz an, ist es aus den 2a und 2b ersichtlich, dass, wenn das Skalarprodukt (·) bzw. der Kosinus des Winkels zwischen den Vektoren b und c positiv ist, das heißt, der Winkel zwischen ihnen ist kleiner als 90°, dann das Phase-Flag auf +1 gesetzt werden sollte; andererseits sollte es –1 sein. Ein Ergebnis dieses Verfahrens kann wie folgt ausgedrückt werden:
Gleichung 6 phase_flag = sign (b·c ) = sign (Σ(bi*ci)).
Sobald die geometrische Interpretation des Verfahrens zum bestimmen der Phase-Flags erfasst ist, ist es möglich es aus der Sicht der least-square-error Methode zwischen den ur sprünglichen Kanalkoeffizienten b_i am Kodierer und den geschätzten Kanalkoeffizienten b_i am Dekodierer zu erörtern.
Angenommen sign [Σ(b_i*c_i)]= +1. Dann ist es nötig zu zeigen, dass ψ*c_i eine bessere Näherung ist als –ψ*c_i. Das heißt Σ(bi – ψci)2 < Σ(bi + ψci)2 ⇔ [Σb2 – 2ψΣbici + ψ2Σc2 i] < [Σb2 i + 2ψΣbici + ψ2Σc2 i].
Nach Subtrahieren gleicher Terme auf beiden Seiten der Ungleichung erhält man, ⇔ –2ψΣbic < 2ψΣbici ⇔ Σbic > 0,was unter der Annahme wahr ist.
Daher sieht man, dass Gleichung 6 das Phase-Flag mit dem garantiert kleinsten Quadratfehler (least-square-error)zwischen den ursprünglichen Kanalkoeffizienten an dem Kodierer und den geschätzten Kanalkoeffizienten am Dekodierer liefert.
Zusammenzufassend,
wird angenommen, dass die Frequenzkoeffizienten innerhalb eines bestimmten Koppelbandes heißen:
a_i, für den ersten gekoppelten Kanal,
b_i, für den zweiten gekoppelten Kanal,
c_i, für den Koppelkanal,
und die Indizes i laufen über den Frequenzbereich des Bandes.
Dann können die Phase-Flag-Daten für das Koppelband berechnet werden nach:
Gleichung 7 phase_flag = sign (Σ(bi*ci)).
N. b.: Die Signumfunktion (sign ()) wird allgemein interpretiert, das heißt sie liefert +1 falls der Funktionsparameter eine positive Zahl ist und –1 falls er negativ ist. Für den Fall für Null kann sie jeden Wert +1 oder –1 annehmen, und die Signale werden dann als praktisch senkrecht zueinander (unkorreliert) angenommen.
Die 3 zeigt ein Blockschaltbild einer Zweikanalaudiocodiereinrichtung 10 für den Einsatz des Phasenschätzverfahrens. Der Kodierer 10 erhält PCM codierte Audiomuster die linken und rechten Audiokanälen entsprechend, die als Kanal a (12) und Kanal b (14) bezeichnet sind. Die Audiodaten von den Kanälen a und b werden zu entsprechenden Analysefilterbänken 16, 18 herkömmlicher Bauart geleitet, die die Audiodaten in Frequenzraumtransformationskoeffizienten a_i und b_i transformieren. Die Transformationskoeffizienten werden an den Koppelprozessor 20 geleitet der die Koppelkanalkoeffizienten c_i erzeugt.
Der Kodierer 10 weist einen Koppelbandbestimmungsprozessor 22 auf, der bestimmt wie die Bänder in den Koppelkanälen entsprechend vorbestimmter Parameter strukturiert werden (d. h. er bestimmt eine Abbildung zwischen den Koppelkanalkoeffizienten und den Koppelkoordinaten der gekoppelten Kanäle). Der Bandstrukturprozessor 22 steuert die Links- und Rechtskanalkoppelkoordinatenberechnungsprozessoren 24, 26. Die Koppelkoordinatenberechnungsprozessoren erhalten eingangsseitig die Koppelkanalkoeffizienten c_i und die entsprechenden Links- oder Rechtskanaltransformationskoeffizienten a_i, b_i und erzeugen entsprechende Kanalkoppelkoordinaten entsprechend der Struktur der Koppelbänder die von dem Bandstrukturprozessor 22 bestimmt sind.
Außerdem ist ein Phasenschätzprozessor 28 vorgesehen der eingangsseitig die Koppelkanalkoeffizienten c_i und die Rechtskanalkoeffizienten b_i erhält. Der Phasenschätzprozessor 28 ist obenfalls von dem Bandstrukturprozessor 22 gesteuert, sodass die auf diese Weise erzeugten Phase-Flags den vorbestimmten Frequenzbändern der Kanalkoppelkoordinaten entsprechen. Der Phasenschätzprozessor wird berechnet für jedes Koppelkanalfrequenzband ein entsprechendes Phase-Flag entsprechend der Operation, die durch Gl. 7 gegeben ist. Die Phase-Flags werden ausgegeben, damit sie zusammen mit den Koppelkanalkoeffizienten c_i und den Links- und Rechtskanalkoppelkoordinaten in den codierten BIT-STREAM eingefügt werden.
Die Zwei-Kanal-Audio-Codiereinrichtung 10 ist vorzugsweise als Teil eines bestimmten integrierten Schaltkreis ausgelegt, wobei die oben beschriebenen funktionalen Blöcke aus Teilschaltkreisen bestehen können, die unter der Steuerung von Zeit und Steuerschaltkreisen miteinander zusammenwirken können. Allerdings kann die Codiereinrichtung alternativ auch in einem allgemeinen Datenverarbeitungsschaltkreis – wie einem konventionellen Mikroprozessor – eingesetzt sein, wobei in diesem Fall die von den einzelnen funktionalen Blöcken durchgeführten Funktionen, wie oben beschrieben, auch von demselben Mikroprozessorschaltkreis entsprechend Anweisungen, die die Funktionen definieren, die – beispielsweise als Mikrocode – gespeichert sind ausgeführt werden.
Die ausführlich Beschreibung von Ausführungsformen der Erfindung ist nur beispielhaft beschrieben, und diese Beschreibung soll nicht einschränkend auf die Erfindung, wie sie in den beigelegten Ansprüchen definiert ist, wirken.

Claims

Verfahren zum Berechnen eines Phasenrekonstruktionskoeffizienten in einem Zwei-Kanal-Digital-Audio-Codierer, konform mit dem Digital-Audio-Kompressionsstandard AC-3 und welcher erste und zweite codierte Kanäle (12, 14) und einen Koppelkanal (20) besitzt, welches aufweist: Berechnen der Transformationskoeffizienten (a_i, b_i) für die ersten und zweiten Kanäle, Berechnen der Koppelkoeffizienten (c_i) aus den Transformationskoeffizienten der ersten und zweiten Kanäle und Berechnen eines Phasenrekonstruktionskoeffizienten (phase_flag bzw. Phasenkennzeichen), dadurch gekennzeichnet, dass der Schritt des Berechnens eines Phasenrekonstruktionskoeffizienten das Berechnen eines Punktprodukts der Transformationskoeffizienten (a_i, b_i) für einen der ersten und zweiten Kanäle und der entsprechenden Koppelkoeffizienten, und das Bestimmen des Vorzeichens des berechneten Punktproduktes beinhaltet.
Verfahren nach Anspruch 1, welches das Berechnen eines Phasenrekonstruktionskoeffizienten (phase_flag) für jedes aus der Vielzahl von Koppelfrequenzbändern (Band 0, ..., Band 2) für einen der ersten und zweiten Kanäle (12, 14) beinhaltet.
Verfahren nach Anspruch 1 oder 2, welches unabhängig von einem Verfahren ist, welches zum Berechnen der Koppelkoeffizienten (c_i) benutzt wird.
Zwei-Kanal-Codierer (10) konform mit dem Digital-Audio-Kompressionsstandard AC-3 zum Codieren von Audio-Informa tion, welcher einen Koppelkanal (20) mit wenigstens einem Koppelband (Band 0, ..., Band 2) erzeugt, welcher eine Vorrichtung (28) zum Berechnen eines Punktprodukts der Eingangskanal-Transformationskoeffizienten (b_i) und Koppelkanalkoeffizienten (c_i) in dem wenigstens einen Koppelband und eine Vorrichtung (28) zum Bestimmen des Vorzeichens des Punktprodukts zur Benutzung als ein Phase-Flag bzw. Phasenkennzeichen entsprechend zu dem wenigstens einen Koppelband (Band 0, ..., Band 2) aufweist.
Zwei-Kanal-Codierer nach Anspruch 4, welcher eine Vorrichtung (28) zum Berechnen von Phasenschätzdaten in der Art aufweist, dass eine Differenz (b – b₁, b – b₂) zwischen original gekoppelten Kanalkoeffizienten (b_i), welche am Codierer (10) erzeugt werden, und Kanalkoeffizienten (c), welche an einem kompatiblen Decodierer geschätzt werden, mindestens einen quadratischen Fehler besitzt.
Codierer nach Anspruch 4 oder 5, wobei das wenigstens eine Phase-Flag bzw. Phasenkennzeichen berechnet wird nach: Phase-Flag = Vorzeichen (Σ(bi*ci))wobei b_i die Transformationskoeffizienten für einen der ersten und zweiten Kanäle darstellt, c_i die Transformationskoeffizienten für den Koppelkanal darstellt, und Index i sich über den Frequenzbereich des Bandes erstreckt.