[go: up one dir, main page]

DE69722973T2 - Verfahren und gerät zur phasenschätzung in einem transformationskodierer für hochqualitätsaudio - Google Patents

Verfahren und gerät zur phasenschätzung in einem transformationskodierer für hochqualitätsaudio Download PDF

Info

Publication number
DE69722973T2
DE69722973T2 DE69722973T DE69722973T DE69722973T2 DE 69722973 T2 DE69722973 T2 DE 69722973T2 DE 69722973 T DE69722973 T DE 69722973T DE 69722973 T DE69722973 T DE 69722973T DE 69722973 T2 DE69722973 T2 DE 69722973T2
Authority
DE
Germany
Prior art keywords
coupling
channel
coefficients
phase
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69722973T
Other languages
English (en)
Other versions
DE69722973D1 (de
Inventor
Javed Mohammed ABSAR
Sapna George
Mario Antonio ALVAREZ-TINOCO
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
STMicroelectronics Asia Pacific Pte Ltd
Original Assignee
STMicroelectronics Asia Pacific Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by STMicroelectronics Asia Pacific Pte Ltd filed Critical STMicroelectronics Asia Pacific Pte Ltd
Publication of DE69722973D1 publication Critical patent/DE69722973D1/de
Application granted granted Critical
Publication of DE69722973T2 publication Critical patent/DE69722973T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

  • Technisches Gebiet
  • Die Erfindung betrifft allgemein digitale Signalverarbeitung von Audiosignalen, wie z. B. Musiksignalen. Die Erfindung betrifft insbesondere die Realisierung eines digitalen Hochqualitäts-Zweikanal-Audio-Kodierers zum digitalen Speichern oder Senden, der auf einem psychoakkustischen Modell des menschlichen Gehörs basiert.
  • Um Audiosignale effizienter zu senden oder aufzuzeichnen, kann die Datenmenge, die die Audiosignale repräsentiert, reduziert werden. Im Fall von digitalen Audiosignalen kann der Umfang an digitalen Daten, die zur korrekten Wiedergabe der PCM-Muster (Puls Code Modulation), durch Anwenden eines digitalen Kompressionsalgorithmus reduziert werden, was zu einer digital komprimierten Darstellung des Originalsignals führt. Das Ziel des digitalen Kompressionsalgorithmus ist das Erzeugen einer digitalen Darstellung eines Audiosignals, die wenn sie dekodiert und wiedergegeben wird, genau wie das Originalsignal klingt, wobei ein Minimum von digitalen Daten für die komprimierte oder kodierte Darstellung benutzt wird.
  • Die Nutzung von psychoakustischen Modellen beim Entwurf von Audiocodieren hat jüngst zu hohen Kompressionsraten geführt, wobei die hörbare Verschlechterung des komprimierten Signals minimal gehalten wird. Die Beschreibung einer solchen Methode kann in dem Advanced Television Systems Community (ATSC) Standard Dokument „Digital Audio Compression (AC-3) Standard" Document A52, 20. Dezember 1995. In dem grundlegenden Verfahren wird das Signal im Zeitraum zunächst mittels einer Filterbank in den Frequenzraum transformiert. Dann wird die Maskierung des Frequenzraums durch das menschliche Gehör ausgenutzt, um die empfundene Wiedergabetreue des Signals, das bei einer gegebenen Bit-Rate gesendet wurde, zu maximieren.
  • Durch eine als Kopplung bekannte Technik kann eine weitere sukzessive Komprimierung erreicht werden. Kopplung nutzt die Art und Weise, wie das menschliche Ohr die Richtung von Signalen von besonders hohen Frequenzen bestimmt, um eine Reduzierung der zur Kodierung eines Audiosignals notwendigen Datenmenge zu schaffen. Bei hohen Audiofrequenzen (etwa oberhalb von 2 kHz) ist das Ohr physikalisch nicht in der Lage, einzelne Schwingungen einer Wellenform aufzulösen und spricht anstelle dessen auf die Einhüllende der Wellenform an. Daher kombiniert der Kodierer die Hochfrequenzkoeffizienten der einzelnen Kanäle, um einen gemeinsamen Koppelkanal zu bilden. Die ursprünglichen zu dem genannten Koppelkanal kombinierten Kanäle werden als gekoppelte Kanäle bezeichnet.
  • Ein grundsätzlicher Kodierer kann die Koppelkanäle auf einfache Weise durch Mittelung aller einzelner Kanalkoeffizienten bilden. Ein weiter entwickelter Kodierer kann die Vorzeichen einzelner Kanäle vor dem Summieren ändern, um so Phasenlöschungen zu verhindern.
  • Der erzeugte Koppelkanal ist dann in eine Anzahl von Frequenzbändern geteilt. Die Frequenzunterbänder werden zum Ausbilden von Koppelbändern in Gruppen eingeordnet. Für jedes derartige Band und jeden gekoppelten Kanalwird dem Dekodierer ein Koppelkoordinate übergeben. Um für einen speziellen gekoppelten Kanaldie Hochfrequenzkoeffizienten für jedes Frequenzband zu erhalten, multipliziert der Dekodierer die Koppelkoordinaten von dem genannten Koppelkanal in dem Frequenzband mit der Koppelkoordinate des Kanals für das spezielle Frequenzband. Bei einer Zweikanalausführung eines solchen Dekodierers kann für jedes gekoppelte Band des Koppelkanals auch ein Phase-Flag-Bit vorgesehen sein. Im letzten Schritt führt der Dekodierer dann eine Phasenkorrektur durch, bei der die Koeffizienten eines jeden Bandes mit dem Phase-Flag-Bit für dieses Band multipliziert werden.
  • Der Standard gibt keine spezifische Methode zum Bestimmen der Phase-Flag-Bits an. Es existieren Ad-hoc-Methoden, die aber wegen ihrer besonderen Art weder eine sichergestellte Leistung bieten, noch bieten sie einen verlässlichen minimalen Fehler zwischen den Originalkoeffizienten am Kodierer und den rekonstruierten und phasenkorrigierten Koeffizienten am Dekodierer.
  • Zusammenfassung der Erfindung
  • Das Phase-Flag bzw. Phasenkennzeichen für ein Band ist im Wesentlichen eine Funktion der Koeffizienten des Originalkanals und den Koeffizienten des Koppelkanals in diesem Band. Ausführungsformen der Erfindung beabsichtigen eine Minimierung der Differenz zwischen den Originalkoeffizienten am Kodierer und den rekonstruierten Koeffizienten am Dekodierer.
  • Die vorliegende Erfindung schafft ein Verfahren zum Berechnen eines Phasenrekonstruktionskoeffizienten in einem Zweikanal-Audio-Kodierer, der dem digitalen Audio-Kompressions-Standard AC-3 entspricht, mit einem ersten und zweiten kodierten Kanal und einem Koppelkanal, welches beinhaltet das Berechnen der Transformationskoeffizienten für den genannten ersten und zweiten Kanal, Berechnen der Koppelkoeffizienten aus den Transformationskoeffizienten des ersten und zweiten Kanals und Berechnung eines Phasenrekonstruktionskoeffizienten, welches dadurch gekennzeichnet ist, dass der genannte Schritt der Berechnung eines Phasenrekonstruktionskoeffizienten das Berechnen eines Punkt- bzw. Skalarproduktes der Transformationskoeffizienten für einen des ersten und zweiten Kanals und den ent sprechenden Kopplungskoeffizienten aufweist, und Bestimmen des Vorzeichens des berechneten Skalarprodukts.
  • Außerdem schafft die vorliegende Erfindung ein Verfahren zum Berechnen eines Phasenrekonstruktionskoeffizienten in einem digitalen Zweikanal-Audio-Kodierer, der dem digitalen Audiokompressionsstandard AC-3 entspricht, mit ersten und zweiten codierten Kanälen und einem Koppelkanal, mit Bestimmen von Transformationskoeffizienten für einen der ersten und zweiten Kanäle, Bestimmen der Koppelkoeffizienten aus den ersten und zweiten Kanälen und Berechnung eines Phasenrekonstruktionskoeffizienten, die dadurch gekennzeichnet ist, dass der genannte Schritt der Berechnung eines Phasenrekonstruktionskoeffizienten das Berechnen des Vorzeichens der Summe von entsprechenden Transformations- und Koppelkoeffizienten über eine vorbestimmten Frequenzbereich der Koeffizienten aufweist.
  • Vorzugsweise enthält das Verfahren das Berechnen eines Phasenrekonstruktionskoeffizienten für jedes aus einer Anzahl von Koppelfrequenzbändern für jeden der genannten ersten und zweiten Kanäle.
  • Das Berechnen der Phasenrekonstruktionskoeffizienten ist vorzugsweise unabhängig von einem Verfahren, das zum Berechnen der Koppelkoeffizienten benutzt wird und unabhängig von einem Verfahren, das zum Berechnen der Koppelkoordinaten für die genannten ersten und zweiten Kanäle benutzt wird.
  • Die vorliegende Erfindung liefert auch einen Zweikanalkodierer, der dem digitalen Audiokompressionsstandard AC-3 entspricht, zum Codieren von Audiodaten, der einen Koppelkanal mit mindestens einem Koppelband erzeugt, mit Einrichtungen zum Berechnen eines Skalarproduktes von Eingangskanaltransformationskoeffizienten und Koppelkanalkoeffizienten in genanntem mindestens einem Koppelband und Einrichtungen zum Bestimmen des Vorzeichens des genannten Skalarproduktes zur Benutzung als Phase-Flag, das dem mindestens einem Koppelband entspricht.
  • Die vorliegende Erfindung liefert außerdem einen Zweikanalkodierer zum Codieren von Audiodaten, der dem digitalen Audiokompressionsstandard AC-3 entspricht, mit einem Koppelkanal und ein Einrichtungen zum Berechnen von Phasenschätzdaten, so dass eine Differenz zwischen ursprünglichen Koeffizienten von gekoppelten Kanälen, die an dem Kodierer erzeugt wurden, und Kanalkoeffizienten, die an einem kompatiblen Decoder geschätzt wurden, einen kleinsten quadratischen Fehler aufweisen (least square error).
  • Gemäß der vorliegenden Erfindung ist außerdem geschaffen: ein Kodierer, der dem digitalen Audiokompressionsstandard AC-3 entspricht, zur Transformationskodierung digitaler Audiodaten aus ersten und zweiten Kanälen, wobei der Kodierer einen Koppelkanal erzeugt, der in mindestens einem Frequenzband und mindestens einem Phase-Flag, das dem mindestens einem Frequenzband entspricht, angeordnet ist, wobei das mindestens eine Phase-Flag nach: PhaseFlag = sign (Σ(bi*ci))berechnet wird, wobei
    bi die Transformationskoeffizienten für einen der ersten und zweiten Kanäle darstellt,
    ci die Transformationskoeffizienten für die Koppelkanäle darstellt und
    der Index i über den Frequenzbereich des Bandes läuft.
  • Kurzbeschreibung der Zeichnungen:
  • Die Erfindung wird nachfolgend detailliert anhand der Beschreibung eines Ausführungsbeispieles und unter Bezugnahme auf die beigelegten Figuren, wobei:
  • die 1 diagrammatisch ein Audiokodier/-dekodier-Verfahren mit Kanalkopplung und Phasenrekonstruktion zeigt;
  • die 2a und 2b Vektorraumdiagramme sind; und
  • die 3 ein Blockschaltbild einer Zwei-Kanal-Audio-Codiereinrichtung gemäß einer Ausführungsform der Erfindung zeigt.
  • Ausführliche Beschreibung der bevorzugten Ausführungsform:
  • Wie eingangs bemerkt ist ein Verfahren zur Kompression von digitalen Audiosignalen in dem ATSC-Standard „Digital Audio Compression (AC-3) Standard", (Dokument A/52, 20. Dezember 1995) beschrieben. Die Beschreibung einer bevorzugten Ausführungsform der Erfindung ist im Folgenden in Bezug auf einen Audiokodierer, der mit dem AC-3-Standard kompatibel ist, beschrieben.
  • Ein AC-3-Kodierer empfängt PCM-Audiodaten und generiert einen kodierten Bit-Stream, der dem AC-3-Standard entspricht. Die Besonderheiten des Audiokodierverfahrens sind keine normativen Anforderungen des Standards, ein kompatibler Kodierer muss jedoch einen Bit-Stream generieren, der der in dem AC-3-Standarddokument ausgelegten Syntax entspricht, der, wenn er wie vorgeschrieben kodiert wurde, Audiodaten von für die gewünschte Anwendung ausreichender Qualität produziert.
  • Der AC-3-Algorithmus erreicht eine hohe Kodiereffizienz (Verhältnis zwischen Eingangsbitrate und Ausgangsbitrate) durch grobes Quantisieren einer Frequenzraumdarstellung eines Audiosignals. Das grundlegende Kodierverfahren ist wie folgt. Im ersten Schritt des Kodierverfahrens wird die Darstellung von Audiodaten von einer Folge vom PCM-Zeitmustern in einer Folge aus Blöcken von Frequenzkoeffizienten überführt. Dies wird mit einer Analysefilterbank gemacht. 512 überlappende Blöcke von Zeitmustern werden mit einem Zeitfenster multipliziert und in den Frequenzraum transformiert. Wegen der überlappenden Blöcke ist jedes PCM-Eingangsmuster durch zwei sequenziell transformierte Blöcke dargestellt. Die Frequenzraumdarstellung kann dann etwa mit einem Faktor 2 verkleinert werden, so dass jeder Block 256 Frequenzkoeffizienten enthält. Die einzelnen Frequenzkoeffizienten sind in binärer exponentieller Notation als einen Binärexponenten und eine Mantisse dargestellt. Der Satz von Exponenten wird als eine grobe Darstellung des Signalspektrums kodiert, die als spektrale Einhüllende bezeichnet wird. Diese spektrale Einhüllende wird von einer Kern-Bit-Zuordnungsroutine benutzt, die bestimmt, wie viele Bits zum Codieren einer einzelnen Mantisse benutzt werden. Die spektrale Einhüllende und die grob quantisierten Mantissen für sechs Audioblöcke (1536 Audiomuster) werden als AC-3-Rahmen formatiert. Der AC-3-Bit-Stream ist eine Abfolge von AC-3-Rahmen.
  • Beim Codieren wird die Kanalkopplung durch Mittelung bestimmter Transformationskoeffizienten aus Kanälen, die in dem Koppelkanal enthalten sind, durchgeführt. Jeder Koppelkanal hat einen eindeutigen Satz von Koppelkoordinaten, die zum Wiederherstellen der Hochfrequenzeinhüllenden der ursprünglichen Kanäle benutzt werden. Der Koppelprozess wird für Transformationskoeffizienten durchgeführt, die Frequenzen oberhalb einer Koppelfrequenz entsprechen, die durch einen vorbestimmten Wert definiert ist, cplbegf.
  • Der Dekodierer konvertiert die Koppelkanäle zurück in einzelne Kanäle, indem er die Werte der Transformationskoeffizienten der gekoppelten Kanäle mit den Koppelkoordinaten für den Kanal und das Frequenzband multipliziert. Es tritt ein zusätzlicher Verfahrensschritt auf, wenn nur zwei Kanäle gekoppelt sind und Phase-Flag-Bits genutzt werden. In diesem Fall ist in dem kodierten Bit-Stream ein gerade benutztes Phase-Flag-Bit bzw. Phase-Flag-In-Use-Bit (phsflginu) gesetzt und es werden durch den Dekodierer in Form von Phase-Flag-Bits Phasenrekonstruktionsbits aus dem Bit-Stream gewonnen. Die Phase-Flag-Bits sind so angeordnet, um die Koppelbänder in aufsteigender Frequenz darzustellen. Falls für ein bestimmtes Band ein Phase-Flag-Bit gesetzt ist, werden alle rechten Kanaltransformationskoeffizienten innerhalb des gekoppelten Bandes negiert (invertiert), nach der Änderung durch den Koppelkoeffizienten, aber vor der inversen Transformation.
  • Die Transformationskoeffizienten #37 bis #252 sind in 18 Unterbänder bzw. Subbänder von jeweils 12 Koeffizienten gruppiert, wie in Tabelle 1 gezeigt. Der Parameter cplbegf zeigt die Anzahl der Koppel-Unterbänder an, die als erste in den Koppelprozess einzubeziehen sind. Unterhalb der durch cplbegf angezeigten Frequenz (oder Transformationskoeffizientennummer, tc#) werden alle Kanäle unabhängig codiert. Oberhalb der durch cplbegf angezeigten Frequenz teilen sich alle in den Koppelprozess einbezogenen Kanäle den gemeinsamen Koppelkanal bis zur Frequenz (oder tc#), die durch den Parameter cplbegf gegeben ist. Der Koppelkanal ist bis zu der Frequenz (oder tc#), die durch cplbenf angezeigt ist, codiert, was das letzte codierte Koppel-Unterband anzeigt. Der Parameter cplendf wird durch Addieren einer 2 zu seinem Wert ausgewertet, so dass das zuletzt kodierte Koppel-Sub-Band von 2–17 reichen kann.
  • Figure 00090001
  • Die Koppelkanalunterbänder werden in Koppelbänder zusammengefasst, für die für jeden gekoppelten KanalKoppelkoordinaten generiert werden (und in den Bit-Stream eingefügt werden). Die Struktur des Koppelbandes wird durch den Parameter cplbndstrc[sbnd] beschrieben. Jedes Bit dieses cplbndstrc[]-Arrays bzw. -Feld zeigt an, ob das dem Index entsprechende Unterband in das vorherige Koppelband (niedrigere Frequenz) eingefügt wurde. Somit sind die Koppelbänder auf Basis einer ganzen Anzahl von Koppelkanalunterbändern strukturiert.
  • Die 1 zeigt schematisch den allgemeinen Kopplungsprozess. In dieser Figur zeigen die 1a bis 1j schematisch die verschiedenen Frequenzkoeffizienten, die Koppelkoordinaten und die Phase-Flag-Werte als Funktion der Frequenz über einen Ausschnitt eines Codier- gefolgt von einem Decodierprozess. In einem Zwei-Kanal-Kodierer besteht der Eingangs-Bit-Stream aus verschachtelten interleared digitalen Signalen zweier Kanäle, wobei die zwei einzelnen Kanäle im Folgenden als a (linker Kanal) und b (rechter Kanal) bezeichnet sind. In dem ersten Schritt sind aus dem Eingangs-Stream ein Block aus digitalisierten Mustern für beide Kanäle a und b ausgewählt und unter Benutzung von Filterbänken in den Frequenzraum transformiert, um Frequenzraumkoeffizienten zu generieren. Die allgemeinen Frequenzraumkoeffizienten für die Kanäle a und b werden im Folgenden als Folgen ai bzw. bi (siehe 1a und 1b) bezeichnet, wobei der Index i die entsprechende Frequenzfolgenummer des Koeffizienten indentifiziert.
  • Durch den Dekodierer wird eine Frequenzstelle ⨍cplbegf (coupling begin frequency = Anfangsfrequenz für Kopplung) auf Grundlage der cplbegf-Parameter wie oben beschrieben ausgewählt. Durch den Kodierer werden die Frequenzkoeffizienten ai und bi, für die i kleiner als ⨍cplbegf ist einzeln in den komprimierten Bit-Stream gesendet (siehe 1c und 1h).
  • Die Frequenzkoeffizienten ai und bi, für die alle i über ⨍cplbegf liegen, werden mit einem binären Operator miteinander kombiniert, um einen neuen Kanalzu generieren, der als Koppelkanal c bezeichnet wird. Die Kanäle a und b, die zum Erzeugen des Koppelkanals genutzt werden, werden als gekoppelte Kanäle bezeichnet. Es kann jeder Binäroperator ⨁ zur Erzeugung des Koppelkanals benutzt werden, denn sein genauer Aufbau ist durch den AC-3-Standard nicht spezifiziert und unabhängig von dem hier beschriebenen Verfahren zur Bestimmung der Phase. Somit schränkt das hier beschriebene Verfahren und Einrichtung gemäß von Ausführungsformen der vorliegenden Erfindung zur Schätzung von Phasenrekonstruktionsdaten nicht das Verfahren zum Erzeugen von Koppelkanälen ein.
  • Der Koppelkanal c enthält Frequenzraumkoeffizienten, die als ci = ai ⨁ bi bezeichnet sind. Der Koppelkanal ist in eine Anzahl von aufeinander folgenden Bändern (siehe 1e) eingeteilt, wobei der Kodierer die Struktur des Koppelbandes die Bandweite für jedes gekoppelte Band) steuert wie es oben erläutert und in dem AC-3-Standard beschrieben ist. Für jedes dieser Bänder und jeden gekoppelten Kanalwird durch den Kodierer (siehe 1d und 1f) der Wert von Koppelkoordinaten erzeugt.
  • Um die ursprünglichen Kanalkoeffizienten ai oder bi in einem bestimmten Band wiederherzustellen, muss der Dekodierer jeden Koppelkanalkoeffizienten ci in dem Band mit dem Wert der Koppelkoordinate für das Band und Kanal(siehe 1d und 1e) multiplizieren. Falls beispielsweise ψ die Koppelkoordinate für ein Band in dem gekoppelten Kanalb ist, lautet die Koeffizientenschätzung für b an dem Dekodierer, als bi bezeichnet
  • Gleichung 1 b ^i = ψ·ci
  • Der Kodierer misst die Originalsignalleistung in dem Band für den einzelnen gekoppelten Kanalsowie die Leistung in dem Koppelkanal für dasselbe Band. Das Verhältnis von ursprünglichen Signalleistung innerhalb eines Bandes mit der Koppelkanalleistung in demselben Band wird als die Koppelkoordinate für das Band bezeichnet. Allerdings ist das hier beschriebene Verfahren zur Schätzung der Phase unabhängig von dem Verfahren zum Erzeugen Koppelkoordinaten.
  • Um Phasenkorrekturen beim Dekodierer zu erlauben (siehe 1g) wird in einem Zweikanalkodierer für den zweiten (rechten) Kanal, das heißt Kanalb, eine Phase-Flag-Information übermittelt. Daher kann Gleichung 1 geschrieben werden wie
  • Gleichung 2 b ^i = phase_flag*ψci.
  • Das Bestimmen der Phase-Flags ist schwierig. Ein einfacher Ansatz könnte das Berechnen der Summe der b-Kanal-Koeffizienten in dem Band sein, das heißt Σbi und auch die Summe der Koeffizienten in dem Band für den Koppelkanal, das heißt Σci. Wenn diese beiden Summen dasselbe Vorzeichen aufweisen, wird das Phase-Flag auf +1 gesetzt, sonst, falls sie entgegengesetzte Vorzeichen aufweisen, wird der Phase-Flag zu –1 gesetzt. Das heißt
  • Gleichung 3 phase_flag = sign [(Σbi)*(Σci)].
  • Jedoch kann dieser Ansatz zu verfälschten Ergebnissen führen, und um das Funktionieren der Phase-Flags zu verstehen, ist eine detailliertere Analyse notwendig.
  • Kanalkoeffizienten in einem bestimmten Band können als Vektoren in einem n-dimensionalen Raum, wobei n die Anzahl der Frequenzkoeffizienten in einem Band ist, dargestellt werden. Also: b = (b1 , b2 ... b11 und c = (c1, c2 ... c11). Die 2a und 2b zeigen den Vektorraum der von den Kanalkoeffizienten in einem Band gebildet wird. Eine Schätzung des Vektors b am Dekodierer kann sein:
  • Gleichung 4 b1= ψc oder
  • Gleichung 5 b2 = –ψc abhängig davon, ob das Phase-Flag als +1 oder –1 gesetzt ist.
  • In 2a ist xx' als die Hyperebene senkrecht zum Vektor c definiert, die den n-dimensionalen Vektorraum in zwei Teile teilt. Wenn [sic]b auf derselben Seite der Hyperebene liegt wie c , ist b 1 eine bessere Schätzung für [sic]b als b 2 (wie im Fall von 2a gezeigt), das heißt ||b – b 1|| < ||b – c 2||. Genauso ist b z eine bessere Schätzung als b 1 , wenn b auf der gegenüberliegenden Seite der Hyperebene wie c liegt.
  • Wendet man diesen Ansatz an, ist es aus den 2a und 2b ersichtlich, dass, wenn das Skalarprodukt (·) bzw. der Kosinus des Winkels zwischen den Vektoren b und c positiv ist, das heißt, der Winkel zwischen ihnen ist kleiner als 90°, dann das Phase-Flag auf +1 gesetzt werden sollte; andererseits sollte es –1 sein. Ein Ergebnis dieses Verfahrens kann wie folgt ausgedrückt werden:
  • Gleichung 6 phase_flag = sign (b·c ) = sign (Σ(bi*ci)).
  • Sobald die geometrische Interpretation des Verfahrens zum bestimmen der Phase-Flags erfasst ist, ist es möglich es aus der Sicht der least-square-error Methode zwischen den ur sprünglichen Kanalkoeffizienten bi am Kodierer und den geschätzten Kanalkoeffizienten bi am Dekodierer zu erörtern.
  • Angenommen sign [Σ(bi*ci)]= +1. Dann ist es nötig zu zeigen, dass ψ*ci eine bessere Näherung ist als –ψ*ci. Das heißt Σ(bi – ψci)2 < Σ(bi + ψci)2 ⇔ [Σb2 – 2ψΣbici + ψ2Σc2 i] < [Σb2 i + 2ψΣbici + ψ2Σc2 i].
  • Nach Subtrahieren gleicher Terme auf beiden Seiten der Ungleichung erhält man, ⇔ –2ψΣbic < 2ψΣbici ⇔ Σbic > 0,was unter der Annahme wahr ist.
  • Daher sieht man, dass Gleichung 6 das Phase-Flag mit dem garantiert kleinsten Quadratfehler (least-square-error)zwischen den ursprünglichen Kanalkoeffizienten an dem Kodierer und den geschätzten Kanalkoeffizienten am Dekodierer liefert.
  • Zusammenzufassend,
    wird angenommen, dass die Frequenzkoeffizienten innerhalb eines bestimmten Koppelbandes heißen:
    ai, für den ersten gekoppelten Kanal,
    bi, für den zweiten gekoppelten Kanal,
    ci, für den Koppelkanal,
    und die Indizes i laufen über den Frequenzbereich des Bandes.
  • Dann können die Phase-Flag-Daten für das Koppelband berechnet werden nach:
  • Gleichung 7 phase_flag = sign (Σ(bi*ci)).
  • N. b.: Die Signumfunktion (sign ()) wird allgemein interpretiert, das heißt sie liefert +1 falls der Funktionsparameter eine positive Zahl ist und –1 falls er negativ ist. Für den Fall für Null kann sie jeden Wert +1 oder –1 annehmen, und die Signale werden dann als praktisch senkrecht zueinander (unkorreliert) angenommen.
  • Die 3 zeigt ein Blockschaltbild einer Zweikanalaudiocodiereinrichtung 10 für den Einsatz des Phasenschätzverfahrens. Der Kodierer 10 erhält PCM codierte Audiomuster die linken und rechten Audiokanälen entsprechend, die als Kanal a (12) und Kanal b (14) bezeichnet sind. Die Audiodaten von den Kanälen a und b werden zu entsprechenden Analysefilterbänken 16, 18 herkömmlicher Bauart geleitet, die die Audiodaten in Frequenzraumtransformationskoeffizienten ai und bi transformieren. Die Transformationskoeffizienten werden an den Koppelprozessor 20 geleitet der die Koppelkanalkoeffizienten ci erzeugt.
  • Der Kodierer 10 weist einen Koppelbandbestimmungsprozessor 22 auf, der bestimmt wie die Bänder in den Koppelkanälen entsprechend vorbestimmter Parameter strukturiert werden (d. h. er bestimmt eine Abbildung zwischen den Koppelkanalkoeffizienten und den Koppelkoordinaten der gekoppelten Kanäle). Der Bandstrukturprozessor 22 steuert die Links- und Rechtskanalkoppelkoordinatenberechnungsprozessoren 24, 26. Die Koppelkoordinatenberechnungsprozessoren erhalten eingangsseitig die Koppelkanalkoeffizienten ci und die entsprechenden Links- oder Rechtskanaltransformationskoeffizienten ai, bi und erzeugen entsprechende Kanalkoppelkoordinaten entsprechend der Struktur der Koppelbänder die von dem Bandstrukturprozessor 22 bestimmt sind.
  • Außerdem ist ein Phasenschätzprozessor 28 vorgesehen der eingangsseitig die Koppelkanalkoeffizienten ci und die Rechtskanalkoeffizienten bi erhält. Der Phasenschätzprozessor 28 ist obenfalls von dem Bandstrukturprozessor 22 gesteuert, sodass die auf diese Weise erzeugten Phase-Flags den vorbestimmten Frequenzbändern der Kanalkoppelkoordinaten entsprechen. Der Phasenschätzprozessor wird berechnet für jedes Koppelkanalfrequenzband ein entsprechendes Phase-Flag entsprechend der Operation, die durch Gl. 7 gegeben ist. Die Phase-Flags werden ausgegeben, damit sie zusammen mit den Koppelkanalkoeffizienten ci und den Links- und Rechtskanalkoppelkoordinaten in den codierten BIT-STREAM eingefügt werden.
  • Die Zwei-Kanal-Audio-Codiereinrichtung 10 ist vorzugsweise als Teil eines bestimmten integrierten Schaltkreis ausgelegt, wobei die oben beschriebenen funktionalen Blöcke aus Teilschaltkreisen bestehen können, die unter der Steuerung von Zeit und Steuerschaltkreisen miteinander zusammenwirken können. Allerdings kann die Codiereinrichtung alternativ auch in einem allgemeinen Datenverarbeitungsschaltkreis – wie einem konventionellen Mikroprozessor – eingesetzt sein, wobei in diesem Fall die von den einzelnen funktionalen Blöcken durchgeführten Funktionen, wie oben beschrieben, auch von demselben Mikroprozessorschaltkreis entsprechend Anweisungen, die die Funktionen definieren, die – beispielsweise als Mikrocode – gespeichert sind ausgeführt werden.
  • Die ausführlich Beschreibung von Ausführungsformen der Erfindung ist nur beispielhaft beschrieben, und diese Beschreibung soll nicht einschränkend auf die Erfindung, wie sie in den beigelegten Ansprüchen definiert ist, wirken.

Claims (6)

  1. Verfahren zum Berechnen eines Phasenrekonstruktionskoeffizienten in einem Zwei-Kanal-Digital-Audio-Codierer, konform mit dem Digital-Audio-Kompressionsstandard AC-3 und welcher erste und zweite codierte Kanäle (12, 14) und einen Koppelkanal (20) besitzt, welches aufweist: Berechnen der Transformationskoeffizienten (ai, bi) für die ersten und zweiten Kanäle, Berechnen der Koppelkoeffizienten (ci) aus den Transformationskoeffizienten der ersten und zweiten Kanäle und Berechnen eines Phasenrekonstruktionskoeffizienten (phase_flag bzw. Phasenkennzeichen), dadurch gekennzeichnet, dass der Schritt des Berechnens eines Phasenrekonstruktionskoeffizienten das Berechnen eines Punktprodukts der Transformationskoeffizienten (ai, bi) für einen der ersten und zweiten Kanäle und der entsprechenden Koppelkoeffizienten, und das Bestimmen des Vorzeichens des berechneten Punktproduktes beinhaltet.
  2. Verfahren nach Anspruch 1, welches das Berechnen eines Phasenrekonstruktionskoeffizienten (phase_flag) für jedes aus der Vielzahl von Koppelfrequenzbändern (Band 0, ..., Band 2) für einen der ersten und zweiten Kanäle (12, 14) beinhaltet.
  3. Verfahren nach Anspruch 1 oder 2, welches unabhängig von einem Verfahren ist, welches zum Berechnen der Koppelkoeffizienten (ci) benutzt wird.
  4. Zwei-Kanal-Codierer (10) konform mit dem Digital-Audio-Kompressionsstandard AC-3 zum Codieren von Audio-Informa tion, welcher einen Koppelkanal (20) mit wenigstens einem Koppelband (Band 0, ..., Band 2) erzeugt, welcher eine Vorrichtung (28) zum Berechnen eines Punktprodukts der Eingangskanal-Transformationskoeffizienten (bi) und Koppelkanalkoeffizienten (ci) in dem wenigstens einen Koppelband und eine Vorrichtung (28) zum Bestimmen des Vorzeichens des Punktprodukts zur Benutzung als ein Phase-Flag bzw. Phasenkennzeichen entsprechend zu dem wenigstens einen Koppelband (Band 0, ..., Band 2) aufweist.
  5. Zwei-Kanal-Codierer nach Anspruch 4, welcher eine Vorrichtung (28) zum Berechnen von Phasenschätzdaten in der Art aufweist, dass eine Differenz (b – b1, b – b2) zwischen original gekoppelten Kanalkoeffizienten (bi), welche am Codierer (10) erzeugt werden, und Kanalkoeffizienten (c), welche an einem kompatiblen Decodierer geschätzt werden, mindestens einen quadratischen Fehler besitzt.
  6. Codierer nach Anspruch 4 oder 5, wobei das wenigstens eine Phase-Flag bzw. Phasenkennzeichen berechnet wird nach: Phase-Flag = Vorzeichen (Σ(bi*ci))wobei bi die Transformationskoeffizienten für einen der ersten und zweiten Kanäle darstellt, ci die Transformationskoeffizienten für den Koppelkanal darstellt, und Index i sich über den Frequenzbereich des Bandes erstreckt.
DE69722973T 1997-12-19 1997-12-19 Verfahren und gerät zur phasenschätzung in einem transformationskodierer für hochqualitätsaudio Expired - Fee Related DE69722973T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SG1997/000075 WO1999033194A1 (en) 1997-12-19 1997-12-19 Method and apparatus for phase estimation in a transform coder for high quality audio

Publications (2)

Publication Number Publication Date
DE69722973D1 DE69722973D1 (de) 2003-07-24
DE69722973T2 true DE69722973T2 (de) 2004-05-19

Family

ID=20429579

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69722973T Expired - Fee Related DE69722973T2 (de) 1997-12-19 1997-12-19 Verfahren und gerät zur phasenschätzung in einem transformationskodierer für hochqualitätsaudio

Country Status (4)

Country Link
US (1) US6574602B1 (de)
EP (1) EP1046239B1 (de)
DE (1) DE69722973T2 (de)
WO (1) WO1999033194A1 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000025249A1 (en) 1998-10-26 2000-05-04 Stmicroelectronics Asia Pacific Pte Ltd. Multi-precision technique for digital audio encoder
WO2001033726A1 (en) * 1999-10-30 2001-05-10 Stmicroelectronics Asia Pacific Pte Ltd. Channel coupling for an ac-3 encoder
US7618404B2 (en) 2005-06-23 2009-11-17 The Procter & Gamble Company Disposable absorbent article having doubled side flaps and backsheet strips
US7737324B2 (en) 2005-11-23 2010-06-15 The Procter & Gamble Company Disposable absorbent article having deployable chassis ears
US7857801B2 (en) 2007-03-23 2010-12-28 The Procter & Gamble Company Diaper having deployable chassis ears and stretch waistband

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US5539829A (en) * 1989-06-02 1996-07-23 U.S. Philips Corporation Subband coded digital transmission system using some composite signals
CA2077662C (en) * 1991-01-08 2001-04-17 Mark Franklin Davis Encoder/decoder for multidimensional sound fields
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
KR100263599B1 (ko) * 1991-09-02 2000-08-01 요트.게.아. 롤페즈 인코딩 시스템
DE4136825C1 (de) * 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5703999A (en) * 1992-05-25 1997-12-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels
JP3404837B2 (ja) * 1993-12-07 2003-05-12 ソニー株式会社 多層符号化装置
JP3327923B2 (ja) * 1994-05-02 2002-09-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 少なくとも第1及び第2ディジタル信号成分を有するディジタル信号を符号化する符号化システム及び符号化方法
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion

Also Published As

Publication number Publication date
US6574602B1 (en) 2003-06-03
WO1999033194A1 (en) 1999-07-01
DE69722973D1 (de) 2003-07-24
EP1046239B1 (de) 2003-06-18
EP1046239A1 (de) 2000-10-25

Similar Documents

Publication Publication Date Title
DE69210064T2 (de) Teilbandkodierer und Sender unter Verwendung dieses Kodierers
DE69401514T2 (de) Vom rechenaufwand her effiziente adaptive bitzuteilung für kodierverfahren und kodiereinrichtung
DE69331428T2 (de) Kodierung und Dekodierung digitaler Signale
DE69401512T2 (de) Hybride adaptive bitzuteilung für audiokoder und -dekoder
EP0750811B1 (de) Verfahren zum codieren mehrerer audiosignale
DE69518452T2 (de) Verfahren für die Transformationskodierung akustischer Signale
DE69525836T2 (de) Kodierung und dekodierung eines breitbandigen digitalen informationssignals
DE69329414T2 (de) Vorrichtung und Verfahren zur Orthogonaltransformation eines digitalen Informationssignals mit Massstabverkleinerung zur Überlaufsverhinderung
DE69323106T2 (de) Verfahren und Vorrichtung für perceptuelles Kodieren von Audio-Signalen
DE69927505T2 (de) Verfahren zum einfügen von zusatzdaten in einen audiodatenstrom
DE69705642T2 (de) Audio-kodierverfahren mit veränderlicher kodelänge unter verwendung einer mehrzahl von teilband-bitverteilungsmoden
DE69924431T2 (de) Vorrichtung und Verfahren zur dynamischen Bitverteilung für Audiokodierung
DE69428030T2 (de) Digitales signalkodierungsgerät, dazugehöriges dekodiergerät und aufzeichnungsträger
DE602005002833T2 (de) Kompensation von multikanal-audio energieverlusten
DE69210689T2 (de) Kodierer/dekodierer für mehrdimensionale schallfelder
DE69901273T2 (de) Verfahren zur Codierung und Quantisierung von Audiosignalen
DE69227570T2 (de) Verfahren und Anordnung zur Audiodatenkompression
DE69804478T2 (de) Verfahren und vorrichtung zur codierung und decodierung mehrere tonkanäle mit geringer bitrate
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE69320872T2 (de) Kompression und Dehnung von digitalen Signalen
DE69317958T2 (de) Kodierer von Audiosignalen mit niedriger Verzögerung, unter Verwendung von Analyse-durch-Synthese-Techniken
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE69522187T2 (de) Verfahren und vorrichtung zur kodierung, dekodierung und kodierung-dekodierung

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee