[go: up one dir, main page]

DE102005010057A1 - Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms - Google Patents

Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms Download PDF

Info

Publication number
DE102005010057A1
DE102005010057A1 DE102005010057A DE102005010057A DE102005010057A1 DE 102005010057 A1 DE102005010057 A1 DE 102005010057A1 DE 102005010057 A DE102005010057 A DE 102005010057A DE 102005010057 A DE102005010057 A DE 102005010057A DE 102005010057 A1 DE102005010057 A1 DE 102005010057A1
Authority
DE
Germany
Prior art keywords
channel
stereo
uncoded
channels
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102005010057A
Other languages
English (en)
Inventor
Jan Plogsties
Harald Mundt
Harald Popp
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority to DE102005010057A priority Critical patent/DE102005010057A1/de
Priority to KR1020077020085A priority patent/KR100928311B1/ko
Priority to AT06707184T priority patent/ATE461591T1/de
Priority to PCT/EP2006/001622 priority patent/WO2006094635A1/de
Priority to EP09006142.5A priority patent/EP2094031A3/de
Priority to RU2007136792/09A priority patent/RU2376726C2/ru
Priority to CA2599969A priority patent/CA2599969C/en
Priority to CN2006800070351A priority patent/CN101133680B/zh
Priority to ES06707184T priority patent/ES2340796T3/es
Priority to DE502006006444T priority patent/DE502006006444D1/de
Priority to EP06707184A priority patent/EP1854334B1/de
Priority to BRPI0608036-7A priority patent/BRPI0608036B1/pt
Priority to AU2006222285A priority patent/AU2006222285B2/en
Priority to PL06707184T priority patent/PL1854334T3/pl
Priority to MX2007010636A priority patent/MX2007010636A/es
Priority to HK08106174.7A priority patent/HK1111855B/xx
Priority to JP2007557373A priority patent/JP4987736B2/ja
Priority to MYPI20060803A priority patent/MY140741A/en
Priority to TW095106978A priority patent/TWI322630B/zh
Publication of DE102005010057A1 publication Critical patent/DE102005010057A1/de
Priority to US11/840,273 priority patent/US8553895B2/en
Priority to IL185452A priority patent/IL185452A/en
Priority to NO20075004A priority patent/NO339958B1/no
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Catalysts (AREA)

Abstract

Eine Vorrichtung zum Erzeugen eines codierten Stereo-Signals aus einer Multikanal-Darstellung umfasst einen Multikanal-Decodierer, der aus wenigstens einem Basiskanal und Parameterinformationen drei oder mehr Multi-Kanäle erzeugt. Die drei oder mehr Multi-Kanäle werden einer Kopfhörer-Signalverarbeitung unterzogen, um einen uncodierten ersten Stereo-Kanal und einen uncodierten zweiten Stereo-Kanal zu erzeugen, welche dann einem Stereo-Codierer zugeführt werden, um ausgangsseitig eine codierte Stereo-Datei zu erzeugen. Die codierte Stereo-Datei kann jedem geeigneten Wiedergabegerät in Form eines CD-Players oder eines Hardware-Players zugeführt werden, sodass ein Benutzer des Wiedergabegeräts nicht nur einen normalen Stereo-Eindruck erhält, sondern einen Multi-Kanal-Eindruck bekommt.

Description

  • Die vorliegende Erfindung bezieht sich auf die Multikanal-Audiotechnik und insbesondere auf Multikanal-Audioanwendungen in Verbindung mit Kopfhörer-Techniken.
  • Die beiden internationalen Patentanmeldungen WO 99/49574 und WO 99/14983 offenbaren Audiosignalverarbeitungstechniken zum Ansteuern eines Paars von gegenüberliegend angeordneten Kopfhörer-Lautsprechern, damit ein Benutzer über die beiden Kopfhörer eine räumliche Wahrnehmung der Audioszene erhält, die nicht nur eine Stereo-Darstellung sondern eine Multikanal-Darstellung ist. So erhält der Hörer über seine bzw. ihre Kopfhörer eine räumliche Wahrnehmung eines Audiostücks, die im besten Fall gleich seiner räumlichen Wahrnehmung ist, wenn der Benutzer in einem Wiedergaberaum sitzen würde, der beispielsweise mit einer 5.1-Audioanlage ausgestattet ist. Zu diesem Zweck wird für jeden Kopfhörer-Lautsprecher jeder Kanal des Multikanal-Audiostücks oder Multikanal-Audiodatenstroms, wie es in 2 dargestellt ist, einem eigenen Filter zugeführt, wonach dann die jeweils gefilterten zusammengehörenden Kanäle aufaddiert werden, wie es nachfolgend dargestellt wird.
  • Auf einer linken Seite in 2 befinden sich die Multikanal-Eingänge 20, die zusammen eine Multikanal-Darstellung des Audiostücks oder Audiodatenstroms repräsentieren. Ein solches Szenario ist beispielsweise in 10 schematisch gezeigt. 10 zeigt einen Wiedergaberaum 200, in dem eine so genannte 5.1-Audioanlage angeordnet ist. Die 5.1-Audioanlage umfasst einen Mitte-Lautsprecher 201, einen Vorne-Links-Lautsprecher 202, einen Vorne-Rechts-Lautsprecher 203, einen Hinten-Links-Lautsprecher 204 und einen Hinten-Rechts-Lautsprecher 205. Eine 5.1-Audioanlage hat einen zusätzlichen Subwoofer 206, der auch als Low-Frequency-Enhancement-Kanal bezeichnet wird. Im so genannten „Sweet Spot" des Wiedergaberaums 200 befindet sich ein Zuhörer 207, der einen Kopfhörer 208 trägt, welcher einen linken Kopfhörer-Lautsprecher 209 und einen rechten Kopfhörer-Lautsprecher 210 aufweist.
  • Die in 2 gezeigte Verarbeitungseinrichtung ist nunmehr ausgebildet, um jeden Kanal 1, 2, 3 der Multikanal-Eingänge 20 mit einem Filter HiL, der den Schallkanal vom Lautsprecher zum linken Lautsprecher 209 in 10 beschreibt, zu filtern, und um denselben Kanal ferner mit einem Filter HiR zu filtern, der den Schall von einem der fünf Lautsprecher zum rechten Ohr bzw. zum rechten Lautsprecher 210 des Kopfhörers 208 darstellt.
  • Wäre beispielsweise der Kanal 1 in 2 der vordere linke Kanal, der durch den Lautsprecher 202 in 10 ausgestrahlt wird, so würde das Filter HiL den durch eine gestrichelte Linie 212 angedeuteten Kanal darstellen, während das Filter HiR den durch eine gestrichelte Linie 213 dargestellten Kanal wiedergeben würde. Wie es in 10 beispielsweise durch eine gestrichelte Linie 214 angedeutet ist, erhält der linke Kopfhörerlautsprecher 209 nicht nur den Direktschall, sondern auch frühe Reflexionen an einer Rand des Wiedergaberaums und natürlich auch späte Reflexionen, die in einem diffusen Nachhall ausgedrückt werden.
  • Eine solche Filterdarstellung ist in 11 dargestellt. Insbesondere zeigt 11 ein schematisches Beispiel für eine Impulsantwort eines Filters, beispielsweise des Filters HiL von 2 dar. Der Direktschall, der durch die Linie 212 in 11 dargestellt ist, wird durch einen Peak am Anfang des Filters dargestellt, während frühe Reflexionen, wie sie beispielsweise durch 214 in 10 dargestellt sind, durch einen mittleren Bereich mit mehreren (diskreten) kleineren Peaks in 11 wiedergegeben werden. Der diffuse Nachhall ist dann typischerweise nicht mehr nach einzelnen Peaks aufgelöst, da der Schall des Lautsprechers 202 prinzipiell beliebig oft reflektiert wird, wobei die Energie natürlich mit jeder Reflexion und zusätzlicher Ausbreitungsstrecke weiter abnimmt, wie es durch die abnehmende Energie im hinteren Abschnitt, der mit „diffuser Nachhall" in 11 bezeichnet ist, dargestellt ist.
  • Jedes der in 2 gezeigten Filter umfasst daher eine Filter-Impulsantwort, die in etwa einen Verlauf hat, wie er durch die schematische Impulsantwortdarstellung in 11 wiedergegeben ist. Selbstverständlich wird die einzelne Filter-Impulsantwort vom Wiedergaberaum, der Positionierung der Lautsprecher, eventueller Dämpfungseigenschaften im Wiedergaberaum z. B. aufgrund mehrerer anwesender Personen oder im Wiedergaberaum befindlichen Möbeln etc. sowie Idealerweise auch von den Eigenschaften der einzelnen Lautsprecher 201 bis 206 abhängen.
  • Die Tatsache, dass sich die Signale von allen Lautsprechern am Ohr des Zuhörers 207 superponieren, wird durch die Addierer 22 und 23 in 2 dargestellt. Es wird also jeder Kanal mit einem entsprechenden Filter für das linke Ohr gefiltert, um dann die von den Filtern ausgegebenen Signale, die alle für das linke Ohr bestimmt sind, einfach aufzuaddieren, um das Kopfhörer-Ausgangssignal für das linke Ohr L zu erhalten. Analog wird eine Addition durch den Addierer 23 für das rechte Ohr bzw. für den rechten Kopfhörer-Lautsprecher 210 in 10 vorgenommen, um durch überlagerung sämtlicher mit einem entsprechenden Filter für das rechte Ohr gefilterten Lautsprecher-Signale das Kopfhörer-Ausgangssignal für das rechte Ohr zu erhalten.
  • Aufgrund der Tatsache, dass es neben dem Direktschall auch frühe Reflexionen und insbesondere auch einen diffusen Nachhall gibt, welche insbesondere für die Raumwahrnehmung von großer Bedeutung sind, damit der Ton nicht synthetisch oder „hölzern" klingt, sondern dem Hörer das Gefühl vermit telt, er sitzt wirklich in einem Konzertsaal mit seinen akustischen Eigenschaften, werden die Impulsantworten der einzelnen Filter 21 alle eine beträchtliche Länge annehmen. Die Faltung jedes einzelnen Multi-Kanals der Multikanal-Darstellung mit zwei Filtern führt daher bereits zu einer erheblichen Rechenaufgabe. Da für jeden einzelnen Multi-Kanal zwei Filter benötigt werden, nämlich einer für das linke Ohr und ein anderer für das rechte Ohr, werden, wenn der Subwoofer-Kanal ebenfalls eigens behandelt wird, für eine Kopfhörer-Wiedergabe einer 5.1-Multikanal-Darstellung insgesamt 12 voneinander unterschiedliche Filter benötigt. Alle Filter haben, wie es aus 11 ersichtlich ist, eine sehr lange Impulsantwort, um nicht nur den Direktschall sondern auch frühe Reflexionen und den diffusen Nachhall berücksichtigen zu können, der einem Audiostück eigentlich erst die richtige Klangwiedergabe und einen guten Raumeindruck verleiht.
  • Um das bekannte Konzept in die Realität umzusetzen, wird daher, wie es in 10 gezeigt ist, neben einem Multikanalspieler 220 die sehr aufwendige virtuelle Tonverarbeitung 222 benötigt, die die Signale für die beiden Lautsprecher 209 und 210, die durch Leitungen 224 und 226 in 10 dargestellt sind, liefert.
  • Kopfhörer-Anlagen zum Erzeugen eines Multikanal-Kopfhörer-Sounds sind daher aufwendig, sperrig und teuer, was an der hohen Rechenleistung, am hohen Strombedarf für die nötige hohe Rechenleistung und am hohen Arbeitsspeicherbedarf für die durchzuführenden Bewertungen mit der Impulsantwort und am damit verbundenen großen Volumen oder teuren Bausteinen für das Abspielgerät liegt. Solche Anwendungen sind daher an Home-PC-Soundkarten bzw. Laptop-Soundkarten oder auch Heim-Stereo-Anlagen gebunden.
  • Insbesondere ist dem immer größer werdenden Markt an mobilen Abspielgeräten, wie beispielsweise mobilen CD-Playern oder insbesondere den Hardware-Playern bleibt der Multika nal-Kopfhörer-Sound verschlossen, da die Rechenanforderungen zum Filtern der Multi-Kanäle mit z. B. 12 unterschiedlichen Filtern sowohl im Hinblick auf die Prozessorressourcen als auch im Hinblick auf den Stromverbrauch der typischerweise batteriebetriebenen Geräte nicht in dem Preissegment realisierbar sind. Hier geht es um ein Preissegment am unteren (niedrigen) Ende der Skala. Gerade dieses Preissegment ist aber aufgrund der großen Stückzahlen wirtschaftlich sehr interessant.
  • Die Aufgabe der vorliegenden Erfindung besteht darin, ein effizientes Signalverarbeitungskonzept zu liefern, das eine Kopfhörer-Wiedergabe in Multikanal-Qualität auch auf einfachen Wiedergabegeräten ermöglicht.
  • Diese Aufgabe wird durch eine Vorrichtung zum Erzeugen eines codierten Stereo-Signals nach Patentanspruch 1 oder durch ein Verfahren zum Erzeugen eines codierten Stereo-Signals nach Patentanspruch 11 oder ein Computer-Programm nach Patentanspruch 12 gelöst.
  • Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, dass der hoch qualitative und attraktive Multikanal-Kopfhörer-Sound allen verfügbaren Abspielgeräten, wie beispielsweise CD-Playern oder Hardware-Playern, dadurch zur Verfügung gestellt werden kann, dass aus einer Multikanal-Darstellung eines Audiostücks oder Audiodatenstroms, also beispielsweise einer 5.1-Darstellung eines Audiostücks außerhalb eines Hardware-Players, also z. B. in einem rechenstarken Computer eines Providers einer Kopfhörer-Signalverarbeitung unterzogen. Erfindungsgemäß wird das Ergebnis Kopfhörer-Signalverarbeitung jedoch nicht einfach abgespielt, sondern einem typischen Audio-Stereo-Codierer zugeführt, der dann aus dem linken Kopfhörerkanal und dem rechten Kopfhörerkanal ein codiertes Stereosignal erzeugt.
  • Dieses codierte Stereosignal kann dann, wie jedes andere codierte Stereosignal, das keine Multikanaldarstellung auf weist, dem Hardware-Player oder z. B. einem mobilen CD-Player in Form einer CD zugeführt werden. Das Wiedergabegerät wird dann den Benutzer mit einem Kopfhörer-Multikanal-Sound versorgen, ohne dass irgendwelche zusätzlichen Ressourcen bzw. Einrichtungen an bereits bestehenden Geräten hinzugefügt werden müssen. Erfindungsgemäß wird das Ergebnis der Kopfhörer-Signalverarbeitung, also das linke und das rechte Kopfhörersignal nicht, wie im Stand der Technik, in einem Kopfhörer wiedergegeben, sondern codiert und als codierte Stereo-Daten ausgegeben.
  • Eine solche Ausgabe kann eine Speicherung, eine Übertragung oder irgendetwas ähnliches sein. Eine solche Datei mit codierten Stereodaten kann dann ohne weiteres jedem beliebigen für Stereo-Wiedergabe ausgebildeten Wiedergabegerät zugeführt werden, ohne dass der Benutzer irgendwelche Änderungen an seinem Gerät durchführen müsste.
  • Das erfindungsgemäße Konzept, aus dem Ergebnis der Kopfhörer-Signalverarbeitung ein codiertes Stereo-Signal zu erzeugen, ermöglicht es somit, dass die Multikanal-Darstellung, die eine wesentlich bessere und lebensnahere Qualität für einen Benutzer liefert, auch auf allen einfachen und sehr stark verbreiteten und in Zukunft noch stärker verbreiteten Hardware-Playern eingesetzt werden kann.
  • Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird von einer codierten Multikanal-Darstellung ausgegangen, also einer Parameterdarstellung, die einen oder typischerweise zwei Basiskanäle aufweist, und die ferner Parameterdaten aufweist, um auf der Basis der Basiskanäle und der Parameterdaten die Multi-Kanäle der Multikanaldarstellung zu erzeugen. Nachdem ein Frequenzbereichbasiertes Verfahren zur Multikanal-Decodierung bevorzugt wird, wird erfindungsgemäß die Kopfhörer-Signalverarbeitung nicht in dem Zeitbereich durch Faltung des Zeitsignals mit der Impulsantwort durchgeführt, sondern im Frequenzbereich durch Multiplikation mit der Filter-Übertragungsfunktion.
  • Dies ermöglicht die Einsparung von wenigstens einer Rücktransformation vor der Kopfhörer-Signalverarbeitung und ist insbesondere dann vorteilhaft, wenn auch der nachfolgende Stereo-Codierer im Frequenzbereich arbeitet, sodass dann, ohne dass jemals in den Zeitbereich gegangen werden muss, die Stereo-Codierung des Kopfhörer-Stereo-Signals ebenfalls ohne Gang in den Zeitbereich erfolgen kann. Die Verarbeitung von der Multikanal-Darstellung bis zum codierten Stereosignal ohne Einschaltung eines Zeitbereichs oder durch eine wenigstens reduzierte Anzahl von Transformationen ist nicht nur im Hinblick auf die Rechenzeiteffizienz interessant, sondern grenzt Qualitätsverluste ein, da weniger Verarbeitungsstufen auch weniger Artefakte in das Audiosignal einführen.
  • Insbesondere bei Block-basierten Verfahren, die unter Berücksichtigung einer psychoakustischen Maskierungsschwelle quantisieren, wie es für den Stereo-Codierer bevorzugt wird, ist es wichtig, so viel Tandem-Codierungs-Artefakte als möglich zu verhindern.
  • Bei einem besonders bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird als Multikanal-Darstellung eine BCC-Darstellung mit einem oder vorzugsweise zwei Basiskanälen verwendet. Nachdem das BCC-Verfahren im Frequenzbereich arbeitet, werden die Multi-Kanäle nicht, wie beim BCC-Decodierer üblich, nach ihrer Synthese in den Zeitbereich transformiert. Stattdessen wird die blockweise vorliegende Spektraldarstellung der Multikanäle verwendet und der Kopfhörer-Signalverarbeitung unterzogen. Hierzu werden die Übertragungsfunktionen der Filter verwendet, also die Fourier-Transformierten der Impulsantworten, um eine Multiplikation zwischen der Spektraldarstellung der Multi-Kanäle und den Filter-Übertragungsfunktionen durchzuführen. Sofern die Impulsantworten der Filter zeitlich länger als ein Block von Spektralkomponenten am Ausgang des BCC-Decodierers sind, wird eine blockweise Filterverarbeitung bevorzugt, bei der die Impulsantworten der Filter im Zeit bereich getrennt werden und blockweise transformiert werden, um dann entsprechende für solche Maßnahmen nötige Gewichtungen der Spektren durchzuführen, wie sie beispielsweise in der WO 94/01933 offenbart sind.
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:
  • 1 ein Blockschaltbild der erfindungsgemäßen Vorrichtung zum Erzeugen eines codierten Stereo-Signals;
  • 2 eine Detaildarstellung einer Implementierung der Kopfhörer-Signalverarbeitung von 1;
  • 3 einen bekannten Joint-Stereo-Codierer zum Erzeugen von Kanaldaten und parametrischen Multikanal-Informationen;
  • 4 eine Darstellung eines Schemas zum Bestimmen von ICLD-, ICTD- und ICC-Parametern für eine BCC-Codierung/Decodierung;
  • 5 eine Blockdiagrammdarstellung einer BCC-Codierer/Decodierer-Kette;
  • 6 ein Blockdiagramm einer Implementierung des BCC-Synthese-Blocks von 5;
  • 7 eine Kaskadierung zwischen einem Multikanal-Decodierer und der Kopfhörer-Signalverarbeitung ohne Transformation in den Zeitbereich;
  • 8 eine Kaskadierung zwischen der Kopfhörer-Signalverarbeitung und einem Stereo-Codierer ohne Transformation in den Zeitbereich;
  • 9 ein Prinzip-Blockdiagramm eines bevorzugten Stereo-Codierers;
  • 10 eine Prinzipdarstellung eines Wiedergabe-Szenarios zum Bestimmen der Filterfunktionen von 2;
  • 11 eine prinzipielle Darstellung einer zu erwartenden Impulsantwort eines Filters, das gemäß 10 bestimmt ist.
  • 1 zeigt ein Prinzip-Blockschaltbild einer erfindungsgemäßen Vorrichtung zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms. Das Stereo-Signal umfasst in uncodierter Form einen uncodierten ersten Stereokanal 10a sowie eine uncodierten zweiten Stereo-Kanal 10b und wird aus einer Multikanal-Darstellung des Audiostücks oder Audiodatenstroms erzeugt, wobei die Multikanal-Darstellung Informationen über mehr als zwei Multi-Kanäle aufweist. Wie später noch dargestellt wird, kann die Multikanal-Darstellung in einer uncodierten oder codierten Form vorliegen. Ist die Multikanal-Darstellung in uncodierter Form vorhanden, so umfasst sie drei oder mehr Multi-Kanäle. Bei einem bevorzugten Anwendungs-Szenario umfasst die Multikanal-Darstellung fünf Kanäle und einen Subwoofer-Kanal.
  • Ist die Multikanal-Darstellung dagegen in einer codierten Form vorhanden, so umfasst diese codierte Form typischerweise einen oder mehrere Basis-Kanäle sowie Parameter zum Synthetisieren der drei oder mehr Multi-Kanäle aus dem einen oder den beiden Basiskanälen. Ein Multikanal-Decodierer 11 ist daher ein Beispiel für eine Einrichtung zum Bereitstellen der mehr als zwei Multi-Kanäle aus der Multikanal-Darstellung. Liegt die Multikanal-Darstellung dagegen bereits in uncodierter Form vor, also z. B. in Form von 5 + 1 PCM-Kanälen, so entspricht die Einrichtung zum Bereitstellen einem Eingangsanschluss für eine Einrichtung 12 zum Durchführen einer Kopfhörer-Signalverarbeitung, um das uncodierte Stereosignal mit dem uncodierten ersten Stereo-Kanal 10a und dem uncodierten zweiten Stereo-Kanal 10b zu erzeugen.
  • Vorzugsweise ist die Einrichtung 12 zum Durchführen Kopfhörer-Signalverarbeitung ausgebildet, um die Multi-Kanäle der Multikanal-Darstellung jeweils mit einer ersten Filterfunktion für den ersten Stereo-Kanal und mit einer zweiten Filterfunktion für den zweiten Stereo-Kanal zu bewerten und bewertete Multi-Kanäle jeweils aufzuaddieren, um den uncodierten ersten Stereo-Kanal und den uncodierten zweiten Stereo-Kanal zu erhalten, wie es anhand von 2 dargestellt worden ist. Der Einrichtung 12 zum Durchführen der Kopfhörer-Signalverarbeitung ist ein Stereo-Codierer 13 nachgeschaltet, der ausgebildet ist, um den ersten uncodierten Stereo-Kanal 10a und den zweiten uncodierten Stereo-Kanal 10b zu codieren, um das codierte Stereo-Signal an einem Ausgang 14 des Stereo-Codierers 13 zu erhalten. Der Stereo-Codierer führt eine Datenraten-Reduktion durch, sodass eine Datenrate, die zum Übertragen des codierten Stereo-Signals nötig ist, kleiner als eine Datenrate ist, die zum Übertragen des uncodierten Stereo-Signals nötig ist.
  • Erfindungsgemäß wird somit ein Konzept erreicht, das es ermöglicht, Mehrkanalton, der auch als „Surround" bezeichnet wird, über einfache Abspielgeräte, wie beispielsweise Hardware-Player, Stereo-Kopfhörern zuzuführen.
  • Als einfache Kopfhörer-Signalverarbeitung kann z. B. die Summe bestimmter Kanäle gebildet werden, um die Ausgangskanäle für die Stereo-Daten zu erhalten. Verbesserte Verfahren arbeiten mit komplexeren Algorithmen, die wiederum eine bessere Qualität der Wiedergabe erreichen.
  • Es sei darauf hingewiesen, dass es das erfindungsgemäße Konzept ermöglicht, dass die rechenaufwendigen Schritte zum Multikanal-Decodieren und zum Durchführen der Kopfhörer- Signalverarbeitung nicht im Abspielgerät selbst durchgeführt werden, sondern extern durchgeführt werden. Das Ergebnis des erfindungsgemäßen Konzepts ist eine codierte Stereo-Datei, die beispielsweise ein MP3-File, ein AAC-File, ein HE-AAC-File oder irgendein anderes Stereo-File ist.
  • Bei anderen Ausführungsbeispielen können auch die Multikanal-Decodierung, die Kopfhörer-Signalverarbeitung und die Stereo-Codierung auf unterschiedlichen Geräten ausgeführt werden, da die Ausgangsdaten bzw. Eingangsdaten der einzelnen Blöcke leicht portierbar und standardisiert erzeugbar und abspeicherbar sind.
  • Nachfolgend wird Bezug nehmend auf 7 eine bevorzugte Ausführungsform der vorliegenden Erfindung dargestellt, bei der der Multikanal-Decodierer 11 eine Filterbank oder eine FFT-Funktion aufweist, derart, dass die Multikanal-Darstellung im Frequenzbereich geliefert wird. Im Einzelnen werden die einzelnen Multi-Kanäle als Blöcke von Spektralwerten für jeden Kanal separat erzeugt. Erfindungsgemäß wird dann die Kopfhörer-Signalverarbeitung nicht im Zeitbereich durch Faltung der zeitlichen Kanäle mit den Filter-Impulsantworten durchgeführt, sondern es wird eine Multiplikation der Frequenzbereichs-Darstellung der Multikanäle mit einer Spektraldarstellung der Filter-Impulsantwort durchgeführt. Am Ausgang der Kopfhörer-Signalverarbeitung wird dann ein uncodiertes Stereosignal erreicht, das jedoch nicht im Zeitbereich vorliegt, sondern das einen linken und einen rechten Stereo-Kanal umfasst, wobei ein solcher Stereo-Kanal als Folge von Blöcken von Spektralwerten gegeben ist, wobei jeder Block von Spektralwerten ein Kurzzeitspektrum des Stereo-Kanals darstellt.
  • Bei dem in 8 gezeigten Ausführungsbeispiel wird der Kopfhörer-Signalverarbeitungs-Block 12 eingangsseitig entweder mit Zeitbereichs- oder Frequenzbereichsdaten versorgt. Ausgangsseitig werden die uncodierten Stereo-Kanäle im Frequenzbereich, also wieder als Folge von Blöcken von Spektralwerten erzeugt. Als Stereo-Codierer 13 wird in diesem Fall ein Stereo-Codierer bevorzugt, der Transformations-basiert ist, der also Spektralwerte verarbeitet, ohne dass zwischen der Kopfhörer-Signalverarbeitung 12 und dem Stereo-Codierer 13 eine Frequenz/Zeit-Umsetzung und eine anschließende Zeit-Frequenz-Umsetzung erforderlich ist. Ausgangsseitig gibt der Stereo-Codierer 13 dann eine Datei mit dem codierten Stereosignal aus, die neben Seiteninformationen eine codierte Form von Spektralwerten umfasst.
  • Bei einem besonders bevorzugten Ausführungsbeispiel der vorliegenden Erfindung wird auf dem Weg von der Multikanal-Darstellung am Eingang des Blocks 11 von 1 bis zur codierten Stereo-Datei am Ausgang 14 der Einrichtung von 1 eine durchgehende Frequenzbereichs-Verarbeitung durchgeführt, ohne dass eine Umsetzung in den Zeitbereich und gegebenenfalls wieder eine Umsetzung in den Frequenzbereich zu erfolgen hat. Wird als Stereo-Codierer ein MP3-Codierer oder ein AAC-Codierer eingesetzt, so wird bevorzugt, das Fourier-Spektrum am Ausgang des Kopfhörer-Signalverarbeitungs-Blocks in ein MDCT-Spektrum umzusetzen. Damit wird erfindungsgemäß sichergestellt, dass die Phaseninformationen, die für die Faltung/Bewertung der Kanäle im Kopfhörer-Signalverarbeitungs-Block exakt benötigt werden, in die nicht derart phasen-korrekt arbeitende MDCT-Darstellung umgerechnet werden, sodass für den Stereo-Codierer im Gegensatz zu einem normalen MP3-Codierer oder einem normalen AAC-Codierer keine Einrichtung zum Umsetzen von Zeitbereich in den Frequenzbereich, also in das MDCT-Spektrum benötigt wird.
  • 9 zeigt ein allgemeines Blockschaltbild für einen bevorzugten Stereo-Codierer. Der Stereo-Codierer umfasst eingangsseitig ein Joint-Stereo-Modul 15, das vorzugsweise adaptiv bestimmt, ob eine gemeinsame Stereocodierung beispielsweise in Form einer Mitte/Seite-Codierung einen höheren Codiergewinn liefert als eine getrennte Verarbeitung von linkem und rechtem Kanal. Das Joint-Stereo-Modul 15 kann ferner ausgebildet sein, um eine Intensity-Stereo-Codierung durchzuführen, wobei eine Intensity-Stereo-Codierung insbesondere bei höheren Frequenzen einen beträchtlichen Codiergewinn liefert, ohne dass hörbare Artefakte auftreten. Der Ausgang des Joint-Stereo-Moduls 15 wird dann unter Verwendung verschiedener weiterer Redundanz-reduzierender Maßnahmen, wie beispielsweise einer TNS-Filterung, einer Rauschsubstitution etc. weiterverarbeitet, um dann die Ergebnisse einem Quantisierer 16 zuzuführen, der unter Verwendung einer psychoakustischen Maskierungsschwelle eine Quantisierung der Spektralwerte erreicht. Die Quantisierer-Schrittweite ist dabei derart gewählt, dass das durch das Quantisieren eingeführte Rauschen unterhalb der psychoakustischen Markierungsschwelle bleibt, sodass eine Datenratenreduktion erreicht wird, ohne dass die durch die verlustbehaftete Quantisierung eingeführten Verzerrungen hörbar werden. Dem Quantisierer 16 ist schließlich ein Entropie-Codierer 17 nachgeschaltet, der eine verlustlose Entropie-Codierung der quantisierten Spektralwerte durchführt. Am Ausgang des Entropie-Codierers liegt dann das codierte Stereosignal vor, das neben den Entropie-codierten Spektralwerten zur Decodierung nötige Seiteninformationen umfasst.
  • Nachfolgend wird auf bevorzugte Implementierungen des Multikanal-Decodierers bzw. auf bevorzugte Multikanal-Darstellungen anhand der 3 bis 6 eingegangen.
  • So existieren in der Technik viele Techniken zum Reduzieren der Datenmenge, die zur Übertragung eines Multikanal-Audiosignals benötigt wird. Solche Techniken werden Joint-Stereo-Techniken genannt. Zu diesem Zweck wird auf 3 verwiesen, die eine Joint-Stereo-Vorrichtung 60 zeigt. Diese Vorrichtung kann eine Vorrichtung sein, die beispielsweise die Intensity-Stereo- (IS-) Technik oder die Binaural Cue Codiertechnik (BCC) implementiert. Ein solches Gerät empfängt üblicherweise als Eingangssignal zumindest zwei Kanäle CH1, CH2, ... CHn, und gibt einen einzigen Trägerkanal sowie parametrische Multikanalinformationen aus. Die parametrischen Daten sind so definiert, dass in einem Decodierer eine Approximation eines Ursprungskanals (CH1, CH2, ..., CHn) berechnet werden kann.
  • Normalerweise wird der Trägerkanal Subband-Abtastwerte, Spektralkoeffizienten, Zeitbereichsabtastwerte etc. umfassen, die eine relativ feine Darstellung des zugrundeliegenden Signals liefern, während die parametrischen Daten keine solchen Abtastwerte oder Spektralkoeffizienten umfassen, sondern Steuerparameter zum Steuern eines bestimmten Rekonstruktionsalgorithmus, wie beispielsweise Gewichten durch Multiplizieren, durch Zeitverschieben, durch Frequenzverschieben, etc. Die parametrischen Multikanalinformationen umfassen daher eine relativ grobe Darstellung des Signals oder des zugeordneten Kanals. In Zahlen ausgedrückt beträgt die Menge an Daten, die von einem Trägerkanal benötigt wird, eine Menge von etwa 60 bis 70 kBit/s, während die Menge an Daten, die durch parametrische Seiteninformationen für einen Kanal benötigt wird, im Bereich von 1, 5 bis 2, 5 kBit/s ist. Es sei darauf hingewiesen, dass die vorstehenden Zahlen für komprimierte Daten gelten. Selbstverständlich benötigt ein nicht-komprimierter CD-Kanal Datenraten im Bereich von etwa dem Zehnfachen. Ein Beispiel für parametrische Daten sind die bekannten Skalenfaktoren, Intensity-Stereo-Informationen oder BCC-Parameter, wie es nachfolgend dargelegt wird.
  • Die Technik der Intensity-Stereo-Codierung ist in dem RES-Preprint 3799, „Intensity Stereo Coding", J. Herre, K.H. Brandenburg, D. Lederer, Februar 1994, Amsterdam beschrieben. Allgemein basiert das Konzept von Intensity Stereo auf einer Hauptachsentransformation, die auf Daten beider stereophoner Audiokanäle durchzuführen ist. Wenn die meisten Datenpunkte um die erste Hauptachse herum konzentriert sind, kann ein Codiergewinn erreicht werden, indem beide Signale um einen bestimmten Winkel gedreht werden, bevor die Codierung stattfindet. Dies ist jedoch nicht immer für reale stereophone Reproduktionstechniken gegeben. Daher wird diese Technik dahingehend modifiziert, dass die zweite orthogonale Komponente von der Übertragung in dem Bitstrom ausgeschlossen wird. Somit bestehen die rekonstruierten Signale für den linken und den rechten Kanal aus unterschiedlich gewichteten oder skalierten Versionen desselben übertragenen Signals. Dennoch unterscheiden sich die rekonstruierten Signale in ihrer Amplitude, sie sind jedoch identisch im Hinblick auf ihre Phaseninformationen. Die Energie-Zeit-Hüllkurven beider ursprünglicher Audiokanäle werden jedoch durch die selektive Skalierungsoperation beibehalten, die typischerweise auf frequenzselektive Art und Weise arbeitet. Dies entspricht der menschlichen Wahrnehmung des Schalls bei hohen Frequenzen, wo die dominanten räumlichen Informationen durch die Energiehüllkurven bestimmt werden.
  • Zusätzlich wird bei praktischen Implementierungen das übertragene Signal, d. h. der Trägerkanal aus dem Summensignal des linken Kanals und des rechten Kanals anstatt der Rotation beider Komponenten erzeugt. Ferner wird diese Verarbeitung, d. h. das Erzeugen von Intensity-Stereo-Parametern zum Durchführen der Skalierungsoperationen frequenzselektiv durchgeführt, d. h. unabhängig für jedes Skalenfaktorband, d. h. für jede Codiererfrequenzpartition. Vorzugsweise werden beide Kanäle kombiniert, um einen kombinierten oder „Träger"-Kanal und zusätzlich zu dem kombinierten Kanal die Intensity-Stereo-Informationen zu bilden. Die Intensity-Stereo-Informationen hängen von der Energie des ersten Kanals, der Energie des zweiten Kanals oder der Energie des kombinierten Kanals ab.
  • Die BCC-Technik ist in dem AES-Convention-Paper 5574 „Binaural Cue Coding applied to stereo and multichannel audio compression", T. Faller, F. Baumgarte, Mai 2002, München, beschrieben. Bei der BCC-Codierung wird eine Anzahl von Audioeingangskanälen in eine Spektraldarstellung umgewandelt, und zwar unter Verwendung einer DFT-basierten Transformation mit überlappenden Fenstern. Das resultierende Spektrum wird in nicht-überlappende Abschnitte eingeteilt, von denen jeder einen Index hat. Jede Partition hat eine Bandbreite proportional zu der äquivalenten Rechteckbandbreite (ERB). Die Inter-Kanal-Pegelunterschiede (ICLD; ICLD = Inter Channel Level Differences) und die Interkanal-Zeitunterschiede (ICTD; ICTD = Inter Channel Time Differences) werden für jede Partition und für jeden Frame k ermittelt. Die ICLD und ICTD werden quantisiert und codiert, um schließlich als Seiteninformationen in einen BCC-Bitstrom zu kommen. Die Interkanal-Pegelunterschiede und die Interkanal-Zeitunterschiede sind für jeden Kanal relativ zu einem Referenzkanal gegeben. Dann werden die Parameter gemäß vorbestimmter Formeln berechnet, die von den bestimmten Partitionen des zu verarbeitenden Signals abhängen.
  • Auf Decodiererseite empfängt der Decodierer typischerweise ein Monosignal und den BCC-Bitstrom. Das Monosignal wird in den Frequenzbereich transformiert und in einen Raumsyntheseblock (Spatial-Syntheseblock) eingegeben, der auch decodierte ICLD- und ICTD-Werte empfängt. In dem Spatial-Syntheseblock werden die BCC-Parameter (ICLD und ICTD) verwendet, um eine Gewichtungsoperation des Monosignals durchzuführen, um die Multikanalsignale zu synthetisieren, die, nach einer Frequenz-/Zeit-Umwandlung eine Rekonstruktion des ursprünglichen Multikanal-Audiosignals darstellen.
  • Im Fall von BCC ist das Joint-Stereo-Modul 60 wirksam, um die kanalseitigen Informationen so auszugeben, dass die parametrischen Kanaldaten quantisierte und codierte ICLD- oder ICTD-Parameter sind, wobei einer der ursprünglichen Kanäle als Referenzkanal zum Codieren der Kanalseiteninformationen verwendet wird.
  • Normalerweise wird der Trägersignal aus der Summe der teilnehmenden Ursprungskanäle gebildet.
  • Natürlich liefern die obigen Techniken nur eine Monodarstellung für einen Decodierer, der nur den Trägerkanal verarbeiten kann, der jedoch nicht in der Lage ist, die parametrischen Daten zur Erzeugung von einer oder mehreren Approximationen von mehr als einem Eingangskanal zu verarbeiten.
  • Die BCC-Technik ist auch in den US-Patentveröffentlichungen US 2003/0219130 A1, US 2003/0026441 A1 und US 2003/0035553 A1 beschrieben. Zusätzlich wird auf die Fachveröffentlichung „Binaural Cue Coding. Part II: Schemes and Applications", T. Faller und F. Baumgarte, IEEE Trans. On Audio and Speech Proc. Bd. 11, Nr. 6, November 2003 verwiesen.
  • Nachfolgend wird ein typisches BCC-Schema zur Multikanalaudiocodierung detaillierter dargestellt, und zwar Bezug nehmend auf die 4 bis 6.
  • 5 zeigt ein solches BCC-Schema zur Codierung/Übertragung von Multikanalaudiosignalen. Das Multikanalaudioeingangssignal an einem Eingang 110 eines BCC-Codierers 112 wird in einem sogenannten Downmix-Block 114 heruntergemischt. Bei diesem Beispiel ist das ursprüngliche Multikanalsignal an dem Eingang 110 ein 5-Kanal-Surround-Signal mit einem vorderen linken Kanal, einem vorderen rechten Kanal, einem linken Surround-Kanal, einem rechten Surround-Kanal und einem Mittenkanal. Bei dem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung erzeugt der Downmix-Block 114 ein Summensignal durch eine einfache Addition dieser fünf Kanäle in ein Monosignal.
  • Andere Downmixing-Schemen sind in der Technik bekannt, so dass unter Verwendung eines Multikanal-Eingangssignals ein Downmix-Kanal mit einem einzigen Kanal erhalten wird.
  • Dieser einzige Kanal wird an einer Summensignalleitung 115 ausgegeben. Eine Seiteninformation, die von dem BCC- Analyseblock 116 erhalten wird, wird auf einer Seiteninformationsleitung 117 ausgegeben.
  • Bei dem BCC-Analyseblock werden Interkanal-Pegelunterschiede (ICLD) und Interkanal-Zeitunterschiede (ICTD) berechnet, wie es vorstehend dargestellt worden ist. Neuerdings ist der BCC-Analyseblock 116 auch in der Lage, Interkanal-Korrelationswerte (ICC-Werte) zu berechnen. Das Summensignal und die Seiteninformationen werden in einem quantisierten und codierten Format zu einem BCC-Decodierer 120 übertragen. Der BCC-Decodierer zerlegt das übertragene Summensignal in eine Anzahl von Subbändern und führt Skalierungen, Verzögerungen und andere Verarbeitungsschritte aus, um die Subbänder der auszugebenden Multikanal-Audiokanäle zu liefern. Diese Verarbeitung wird so durchgeführt, dass die ICLD-, ICTD- und ICC-Parameter (Cues) eines rekonstruierten Multikanalsignals am Ausgang 121 mit den entsprechenden Cues für das ursprüngliche Multikanalsignal am Eingang 110 in dem BCC-Codierer 112 übereinstimmen. Zu diesem Zweck umfasst der BCC-Decodierer 120 einen BCC-Syntheseblock 122 und einen Seiteninformationenüberarbeitungsblock 123.
  • Nachfolgend wird der interne Aufbau des BCC-Syntheseblocks 122 Bezug nehmend auf 6 dargestellt. Das Summensignal auf der Leitung 115 wird in eine Zeit-/Frequenz-Umwandlungseinheit oder Filterbank FB 125 eingespeist. Am Ausgang des Blocks 125 existiert eine Anzahl N von Subbandsignalen oder, in einem Extremfall, ein Block von Spektralkoeffizienten, wenn die Audio-Filterbank 125 eine 1:1-Transformation durchführt, d. h. eine Transformation, die N Spektralkoeffizienten aus N Zeitbereichsabtastwerten erzeugt.
  • Der BCC-Syntheseblock 122 umfasst ferner eine Verzögerungsstufe 126, eine Pegelmodifikationsstufe 127, eine Korrelationsverarbeitungsstufe 128 und eine Inversfilterbankstufe IFB 129. Am Ausgang der Stufe 129 kann das rekonstruierte Multikanalaudiosignal mit beispielsweise fünf Kanälen im Falle eines 5-Kanal-Surroundsystems zu einem Satz von Lautsprechern 124 ausgegeben werden, wie sie in 5 oder 4 dargestellt sind.
  • Das Eingangssignal sn wird in den Frequenzbereich oder den Filterbankbereich mittels des Elements 125 umgewandelt. Das Signal, das vom Element 125 ausgegeben wird, wird derart kopiert, dass mehrere Versionen desselben Signals erhalten werden, wie es durch den Kopierknoten 130 dargestellt ist. Die Anzahl der Versionen des ursprünglichen Signals ist gleich der Anzahl der Ausgangskanäle in dem Ausgangssignal. Dann wird jede Version des ursprünglichen Signals am Knoten 130 einer bestimmten Verzögerung d1, d2, ..., di, ... dN unterzogen. Die Verzögerungsparameter werden durch den Seiteninformationsverarbeitungsblock 123 in 5 berechnet und von den Interkanal-Zeitunterschieden, wie sie durch den BCC-Analyseblock 116 von 5 berechnet worden sind, abgeleitet.
  • Dasselbe gilt für die Multiplikationsparameter a1, a2, ..., ai, ..., aN, die ebenfalls durch den Seiteninformationsverarbeitungsblock 123 basierend auf den Interkanal-Pegelunterschieden, wie sie durch den BCC-Analyseblock 116 berechnet worden sind, berechnet werden.
  • Die durch den BCC-Analyseblock 116 berechneten ICC-Parameter werden zum Steuern der Funktionalität des Blocks 128 verwendet, so dass bestimmte Korrelationen zwischen den verzögerten und in ihren Pegeln manipulierten Signalen an den Ausgängen des Blocks 128 erhalten werden. Es sei hier darauf hingewiesen, dass die Reihenfolge der Stufen 126, 127, 128 von der in 6 gezeigten Reihenfolge abweichen kann.
  • Es sei darauf hingewiesen, dass bei einer rahmenweisen Verarbeitung des Audiosignals auch die BCC-Analyse rahmenweise durchgeführt wird, also zeitlich variabel, und dass ferner eine frequenzweise BCC-Analyse erhalten wird, wie es durch die Filterbank-Aufteilung aus 6 ersichtlich ist. Dies bedeutet, dass die BCC-Parameter für jedes Spektralband erhalten werden. Dies bedeutet ferner, dass in dem Fall, in dem die Audiofilterbank 125 das Eingangssignal in beispielsweise 32 Bandpasssignale zerlegt, der BCC-Analyseblock einen Satz von BCC-Parametern für jedes der 32 Bänder erhält. Natürlich führt der BCC-Syntheseblock 122 von 5, der detailliert in 6 dargestellt ist, eine Rekonstruktion durch, die auch auf den beispielhaft genannten 32 Bändern basiert.
  • Nachfolgend wird Bezug nehmend auf 4 ein Szenario dargestellt, das dazu verwendet wird, um einzelne BCC-Parameter zu bestimmen. Normalerweise können die ICLD-, ICTD- und ICC-Parameter zwischen Kanalpaaren definiert werden. Es wird jedoch bevorzugt, die ICLD- und ICTD-Parameter zwischen einem Referenzkanal und jedem anderen Kanal zu bestimmen. Dies ist in 4A dargestellt.
  • ICC-Parameter können auf verschiedene Arten und Weisen definiert werden. Allgemein gesagt kann man ICC-Parameter in dem Codierer zwischen allen möglichen Kanalpaaren bestimmen, wie es in 4B dargestellt ist. Es wurde jedoch vorgeschlagen, nur ICC-Parameter zwischen den stärksten zwei Kanälen zu einem Zeitpunkt zu berechnen, wie es in 4C dargestellt ist, wo ein Beispiel gezeigt ist, bei dem zu einem Zeitpunkt ein ICC-Parameter zwischen den Kanälen 1 und 2 berechnet wird, und zu einem anderen Zeitpunkt ein ICC-Parameter zwischen den Kanälen 1 und 5 berechnet wird. Der Decodierer synthetisiert dann die Interkanalkorrelation zwischen den stärksten Kanälen in dem Decoder und verwendet bestimmte heuristische Regeln zum Berechnen und Synthetisieren der Interkanalkohärenz für die restlichen Kanalpaare.
  • Bezüglich der Berechnung beispielsweise der Multiplikationsparameter a1, aN basierend auf den übertragenen ICLD- Parametern wird auf das AES-Convention-Paper Nr. 5574 Bezug genommen. Die ICLD-Parameter stellen eine Energieverteilung eines ursprünglichen Mehrkanalsignals dar. Ohne Verlust der Allgemeinheit wird es bevorzugt, wie es in 4A gezeigt, vier ICLD-Parameter zu nehmen, die die Energiedifferenz zwischen den jeweiligen Kanälen und dem vorderen linken Kanal darstellen. In dem Seiteninformationsverarbeitungsblock 122 werden die Multiplikationsparameter a1, ..., aN von den ICLD-Parametern so abgeleitet, dass die gesamte Energie aller rekonstruierter Ausgangskanäle dieselbe ist (oder proportional zu der Energie des übertragenen Summensignals ist).
  • Bei dem in 7 gezeigten Ausführungsbeispiel wird auf die Frequenz-Zeit-Umsetzung, die durch die inversen Filterbanken IFB 129 von 6 erreicht werden, verzichtet. Es werden stattdessen die Spektraldarstellungen der einzelnen Kanäle am Eingang dieser inversen Filterbanken verwendet und der Kopfhörer-Signalverarbeitungs-Vorrichtung von 7 zugeführt, um ohne eine zusätzliche Frequenz/Zeit-Transformation die Bewertung der einzelnen Multi-Kanäle mit den jeweils zwei Filtern pro Multi-Kanal durchzuführen.
  • Im Hinblick auf eine komplette im Frequenzbereich stattfindende Verarbeitung sei darauf hingewiesen, dass dann der Multikanal-Decodierer, also z. B. die Filterbank 125 von 6 und der Stereo-Codierer dieselbe Zeit/Frequenzauflösung haben sollen. Ferner wird es bevorzugt, ein und dieselbe Filterbank zu verwenden, was insbesondere auch dahingehend vorteilhaft ist, dass für die gesamte Verarbeitung, wie sie in 1 darstellt ist, nur eine einzige Filterbank benötigt wird. In diesem Fall ergibt sich eine besonders effiziente Verarbeitung, da die Transformation im Multikanal-Decodierer und im Stereo-Encodierer nicht berechnet werden müssen.
  • Die Eingangsdaten bzw. Ausgangsdaten beim erfindungsgemäßen Konzept sind daher vorzugsweise im Frequenzbereich codiert mittels Transformation/Filterbank und sind nach psychoakustischen Vorgaben unter Ausnutzung von Verdeckungseffekten codiert, wobei insbesondere im Decodierer eine spektrale Darstellung der Signale vorliegen sollte. Beispiele hierfür sind MP3-Dateien, AAC-Dateien oder AC3-Dateien. Die Eingangsdaten bzw. Ausgangsdaten können jedoch auch durch Summen- und Differenzbildung codiert sein, wie es bei so genannten matrizierten Verfahren der Fall ist. Beispiele hierfür sind Dolby ProLogic, Logic7 oder Circle Surround. Die Daten insbesondere der Multikanaldarstellung können zusätzlich mit parametrischen Verfahren codiert sein, wie es bei MP3 Surround der Fall ist, wobei dieses Verfahren auf der BCC-Technik basiert.
  • Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren zum Erzeugen in Hardware oder in Software implementiert werden. Die Implementierung kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung eines erfindungsgemäßen Verfahrens, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computer-Programm auf einem Computer abläuft.

Claims (12)

  1. Vorrichtung zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms mit einem ersten Stereo-Kanal und einem zweiten Stereo-Kanal aus einer Multikanal-Darstellung des Audiostücks oder Audiodatenstroms, die Informationen über mehr als zwei Multi-Kanäle aufweist, mit folgenden Merkmalen: einer Einrichtung (11) zum Bereitstellen der mehr als zwei Multi-Kanäle aus der Multikanal-Darstellung; einer Einrichtung (12) zum Durchführen einer Kopfhörer-Signalverarbeitung, um ein uncodiertes Stereosignal mit einem uncodierten ersten Stereo-Kanal (10a) und einem uncodierten zweiten Stereo-Kanal (10b) zu erzeugen; und einem Stereo-Codierer (13) zum Codieren des ersten uncodierten Stereo-Kanals (10a) und des uncodierten zweiten Stereo-Kanals (10b), um das codierte Stereo-Signal (14) zu erhalten, wobei der Stereo-Codierer derart ausgebildet ist, dass eine Datenrate, die zum Übertragen des codierten Stereo-Signals nötig ist, kleiner als eine Datenrate ist, die zum Übertragen des uncodierten Stereo-Signals nötig ist.
  2. Vorrichtung nach Anspruch 1, bei der die Einrichtung (12) zum Durchführen ausgebildet ist, um jeden Multi-Kanal mit einer ersten Filterfunktion (HiL) für den ersten Stereo-Kanal und mit einer zweiten Filterfunktion (HiR) für den zweiten Stereo-Kanal zu bewerten, um für jeden Multi-Kanal einen ersten bewerteten Kanal und einen zweiten bewerteten Kanal zu erzeugen, um alle bewerteten ersten Kanäle aufzuaddieren (22), um den ersten uncodierten Stereo-Kanal (10a) zu erhalten, und um alle bewerteten zweiten Kanäle aufzuaddieren (23), um den zweiten uncodierten Stereo-Kanal (10b) zu erhalten.
  3. Vorrichtung nach Anspruch 2, bei der jedem Multi-Kanal ein eigenes Paar aus einer ersten und einer zweiten Filterfunktion zugeordnet ist, wobei die erste Filterfunktion von einer virtuellen Position eines Lautsprechers zum Wiedergeben des Multi-Kanals und einer virtuellen ersten Ohrposition eines Hörers abgeleitet ist, und wobei die zweite Filterfunktion von einer virtuellen Position des Lautsprechers und einer virtuellen zweiten Ohrposition des Hörers abgeleitet ist, wobei die beiden virtuellen Ohrpositionen des Hörers unterschiedlich sind.
  4. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Multikanal-Darstellung einen oder mehrere Basiskanäle sowie Parameterinformationen zum Berechnen der Multi-Kanäle aus einem oder mehreren Basiskanälen aufweist, und bei der die Einrichtung (11) zum Bereitstellen ausgebildet ist, um aus dem einen oder den mehreren Basiskanälen und den Parameterinformationen die wenigstens drei Multi-Kanäle zu berechnen.
  5. Vorrichtung nach Anspruch 4, bei der die Einrichtung (11) zum Bereitstellen ausgebildet ist, um ausgangsseitig eine blockweise Frequenzbereichsdarstellung für jeden Multikanal zu liefern, und bei der die Einrichtung (12) zum Durchführen ausgebildet ist, um die blockweise Frequenzbereichs-Darstellung mit einer Frequenzbereichs-Darstellung der ersten und der zweiten Filterfunktion zu bewerten.
  6. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (12) zum Durchführen ausgebildet ist, um eine blockweise Frequenzbereichs-Darstellung des uncodierten ersten Stereokanals und des uncodierten zweiten Stereo-Kanals zu liefern, und bei der der Stereo-Codierer (13) ein Transformationsbasierter Codierer ist und ferner ausgebildet ist, um die blockweise Frequenzbereichsdarstellung des uncodierten ersten Stereo-Kanals und des uncodierten zweiten Stereo-Kanals ohne eine Umsetzung von der Frequenzbereichs-Darstellung in eine zeitliche Darstellung zu verarbeiten.
  7. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der der Stereo-Codierer (13) ausgebildet ist, um eine gemeinsame Stereo-Codierung (15) des ersten und des zweiten Stereokanals durchzuführen.
  8. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der der Stereo-Codierer (13) ausgebildet ist, um einen Block von Spektralwerten unter Verwendung einer psychoakustischen Maskierungsschwelle zu quantisieren (16) und einer Entropie-Codierung (17) zu unterziehen, um das codierte Stereo-Signal zu erhalten.
  9. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (11) zum Bereitstellen als BCC-Decodierer ausgebildet ist.
  10. Vorrichtung nach einem der vorhergehenden Ansprüche, bei der die Einrichtung (11) zum Bereitstellen als Multikanal-Decodierer ausgebildet ist, der eine Filterbank mit mehreren Ausgängen aufweist, bei der die Einrichtung (12) zum Durchführen ausgebildet ist, um Signale an den Filterbank-Ausgängen mit der ersten und der zweiten Filterfunktion zu bewerten, und bei der der Stereo-Codierer (13) ausgebildet ist, um den im Frequenzbereich vorliegenden uncodierten ersten Stereo-Kanal und den im Frequenzbereich vorliegenden uncodierten zweiten Stereo-Kanal zu quantisieren (16) und einer Entropie-Codierung (17) zu unterziehen, um das codierte Stereo-Signal zu erhalten.
  11. Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms mit einem ersten Stereo-Kanal und einem zweiten Stereo-Kanal aus einer Multikanal-Darstellung des Audiostücks oder Audiodatenstroms, die Informationen über mehr als zwei Multi-Kanäle aufweist, mit folgenden Schritten: Bereitstellen (11) der mehr als zwei Multi-Kanäle aus der Multikanal-Darstellung; Durchführen (12) einer Kopfhörer-Signalverarbeitung, um ein uncodiertes Stereosignal mit einem uncodierten ersten Stereo-Kanal (10a) und einem uncodierten zweiten Stereo-Kanal (10b) zu erzeugen; und Stereo-Codieren (13) des ersten uncodierten Stereo-Kanals (10a) und des uncodierten zweiten Stereo-Kanals (10b), um das codierte Stereo-Signal (14) zu erhalten, wobei der Schritt des Stereo-Codierens derart ausgeführt wird, dass eine Datenrate, die zum Übertragen des codierten Stereo-Signals nötig ist, kleiner als eine Datenrate ist, die zum Übertragen des uncodierten Stereo-Signals nötig ist.
  12. Computer-Programm mit einem Programmcode zum Durchführen des Verfahrens zum Erzeugen eines codierten Stereo-Signals nach Patentanspruch 11, wenn das Computer-Programm auf einem Rechner abläuft.
DE102005010057A 2005-03-04 2005-03-04 Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms Withdrawn DE102005010057A1 (de)

Priority Applications (22)

Application Number Priority Date Filing Date Title
DE102005010057A DE102005010057A1 (de) 2005-03-04 2005-03-04 Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
AU2006222285A AU2006222285B2 (en) 2005-03-04 2006-02-22 Device and method for generating an encoded stereo signal of an audio piece or audio data stream
BRPI0608036-7A BRPI0608036B1 (pt) 2005-03-04 2006-02-22 Dispositivo e método para a geração de um sinal estéreo codificado de uma peça de áudio ou fluxo de dados de áudio
PCT/EP2006/001622 WO2006094635A1 (de) 2005-03-04 2006-02-22 Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
EP09006142.5A EP2094031A3 (de) 2005-03-04 2006-02-22 Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
RU2007136792/09A RU2376726C2 (ru) 2005-03-04 2006-02-22 Устройство и способ для формирования закодированного стереосигнала аудиочасти или потока данных аудио
CA2599969A CA2599969C (en) 2005-03-04 2006-02-22 Device and method for generating an encoded stereo signal of an audio piece or audio data stream
CN2006800070351A CN101133680B (zh) 2005-03-04 2006-02-22 用于产生已编码立体声信号的设备及方法
PL06707184T PL1854334T3 (pl) 2005-03-04 2006-02-22 Urządzenie i sposób do generowania zakodowanego sygnału stereo fragmentu dźwiękowego lub strumienia danych audio
AT06707184T ATE461591T1 (de) 2005-03-04 2006-02-22 Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
EP06707184A EP1854334B1 (de) 2005-03-04 2006-02-22 Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
KR1020077020085A KR100928311B1 (ko) 2005-03-04 2006-02-22 오디오 피스 또는 오디오 데이터스트림의 인코딩된스테레오 신호를 생성하는 장치 및 방법
DE502006006444T DE502006006444D1 (de) 2005-03-04 2006-02-22 Vorrichtung und verfahren zum erzeugen eines codietenstroms
ES06707184T ES2340796T3 (es) 2005-03-04 2006-02-22 Dispositivo y metodo para generar una señal estereofonica codificada de una pieza de audio o flujo de datos de audio.
MX2007010636A MX2007010636A (es) 2005-03-04 2006-02-22 Dispositivo y metodo para generar una senal estereofonica codificada de una pieza de audio o corriente de datos de audio.
HK08106174.7A HK1111855B (en) 2005-03-04 2006-02-22 Device and method for generating an encoded stereo signal
JP2007557373A JP4987736B2 (ja) 2005-03-04 2006-02-22 オーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための装置および方法
MYPI20060803A MY140741A (en) 2005-03-04 2006-02-24 Device and method for generating an encoded stereo signal of an audio piece or audio datastream
TW095106978A TWI322630B (en) 2005-03-04 2006-03-02 Device and method for generating an encoded stereo signal of an audio piece or audio datastream,and a computer program for generation an encoded stereo signal
US11/840,273 US8553895B2 (en) 2005-03-04 2007-08-17 Device and method for generating an encoded stereo signal of an audio piece or audio datastream
IL185452A IL185452A (en) 2005-03-04 2007-08-22 A device and method for producing an encoded stereo signal of an audio creation or a stream of audio information
NO20075004A NO339958B1 (no) 2005-03-04 2007-10-03 Anordning og fremgangsmåte for å generere et kodet stereosignal av et lydstykke eller en lyddatastrøm

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102005010057A DE102005010057A1 (de) 2005-03-04 2005-03-04 Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms

Publications (1)

Publication Number Publication Date
DE102005010057A1 true DE102005010057A1 (de) 2006-09-07

Family

ID=36649539

Family Applications (2)

Application Number Title Priority Date Filing Date
DE102005010057A Withdrawn DE102005010057A1 (de) 2005-03-04 2005-03-04 Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
DE502006006444T Active DE502006006444D1 (de) 2005-03-04 2006-02-22 Vorrichtung und verfahren zum erzeugen eines codietenstroms

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE502006006444T Active DE502006006444D1 (de) 2005-03-04 2006-02-22 Vorrichtung und verfahren zum erzeugen eines codietenstroms

Country Status (19)

Country Link
US (1) US8553895B2 (de)
EP (2) EP1854334B1 (de)
JP (1) JP4987736B2 (de)
KR (1) KR100928311B1 (de)
CN (1) CN101133680B (de)
AT (1) ATE461591T1 (de)
AU (1) AU2006222285B2 (de)
BR (1) BRPI0608036B1 (de)
CA (1) CA2599969C (de)
DE (2) DE102005010057A1 (de)
ES (1) ES2340796T3 (de)
IL (1) IL185452A (de)
MX (1) MX2007010636A (de)
MY (1) MY140741A (de)
NO (1) NO339958B1 (de)
PL (1) PL1854334T3 (de)
RU (1) RU2376726C2 (de)
TW (1) TWI322630B (de)
WO (1) WO2006094635A1 (de)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
KR101499785B1 (ko) 2008-10-23 2015-03-09 삼성전자주식회사 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법
WO2012072798A1 (en) 2010-12-03 2012-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sound acquisition via the extraction of geometrical information from direction of arrival estimates
EP2705516B1 (de) * 2011-05-04 2016-07-06 Nokia Technologies Oy Kodierung von stereophonen signalen
FR2976759B1 (fr) * 2011-06-16 2013-08-09 Jean Luc Haurais Procede de traitement d'un signal audio pour une restitution amelioree.
JP6007474B2 (ja) * 2011-10-07 2016-10-12 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラムおよび記録媒体
CN104041080B (zh) * 2012-01-17 2016-08-24 皇家飞利浦有限公司 多通道音频渲染
US9602927B2 (en) * 2012-02-13 2017-03-21 Conexant Systems, Inc. Speaker and room virtualization using headphones
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
JP6160072B2 (ja) * 2012-12-06 2017-07-12 富士通株式会社 オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
EP2946571B1 (de) 2013-01-15 2018-04-11 Koninklijke Philips N.V. Binaurale audioverarbeitung
WO2014111829A1 (en) * 2013-01-17 2014-07-24 Koninklijke Philips N.V. Binaural audio processing
EP2757559A1 (de) 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Codierung räumlicher Audioobjekte mittels versteckter Objekte zur Signalmixmanipulierung
CN104982042B (zh) 2013-04-19 2018-06-08 韩国电子通信研究院 多信道音频信号处理装置及方法
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
US9412385B2 (en) * 2013-05-28 2016-08-09 Qualcomm Incorporated Performing spatial masking with respect to spherical harmonic coefficients
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
TWI634547B (zh) 2013-09-12 2018-09-01 瑞典商杜比國際公司 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品
EP3061089B1 (de) 2013-10-21 2018-01-17 Dolby International AB Parametrische rekonstruktion von tonsignalen
CN107430861B (zh) * 2015-03-03 2020-10-16 杜比实验室特许公司 用于对音频信号进行处理的方法、装置和设备
EP3067885A1 (de) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur verschlüsselung oder entschlüsselung eines mehrkanalsignals
CN111970629B (zh) 2015-08-25 2022-05-17 杜比实验室特许公司 音频解码器和解码方法
TWI577194B (zh) * 2015-10-22 2017-04-01 山衛科技股份有限公司 環境音源辨識系統及其環境音源辨識之方法
EP3208800A1 (de) * 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur stereoablage bei mehrkanaliger codierung
US10187740B2 (en) * 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
WO2018073759A1 (en) * 2016-10-19 2018-04-26 Audible Reality Inc. System for and method of generating an audio image
CN112261545A (zh) * 2019-07-22 2021-01-22 海信视像科技股份有限公司 显示装置
US11523239B2 (en) 2019-07-22 2022-12-06 Hisense Visual Technology Co., Ltd. Display apparatus and method for processing audio
CN117730367A (zh) * 2023-10-31 2024-03-19 北京小米移动软件有限公司 分组方法、编码器、解码器以及存储介质

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US602349A (en) * 1898-04-12 Abrading mechanism
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
JPH04240896A (ja) * 1991-01-25 1992-08-28 Fujitsu Ten Ltd 音場制御装置
FR2688371B1 (fr) * 1992-03-03 1997-05-23 France Telecom Procede et systeme de spatialisation artificielle de signaux audio-numeriques.
DE4217276C1 (de) * 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
US5703999A (en) 1992-05-25 1997-12-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels
DK0649578T3 (da) 1992-07-07 2003-09-15 Lake Technology Ltd Digitalt filter med høj præcision og effektivitet
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
JPH06269097A (ja) * 1993-03-11 1994-09-22 Sony Corp 音響装置
US5488665A (en) 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JP3404837B2 (ja) 1993-12-07 2003-05-12 ソニー株式会社 多層符号化装置
US5659619A (en) * 1994-05-11 1997-08-19 Aureal Semiconductor, Inc. Three-dimensional virtual audio display employing reduced complexity imaging filters
US5982903A (en) * 1995-09-26 1999-11-09 Nippon Telegraph And Telephone Corporation Method for construction of transfer function table for virtual sound localization, memory with the transfer function table recorded therein, and acoustic signal editing scheme using the transfer function table
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5742689A (en) * 1996-01-04 1998-04-21 Virtual Listening Systems, Inc. Method and device for processing a multichannel signal for use with a headphone
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
WO1997038494A1 (en) * 1996-04-10 1997-10-16 Philips Electronics N.V. Encoding apparatus for encoding a plurality of information signals
DE19721487A1 (de) * 1997-05-23 1998-11-26 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Fehlerverschleierung bei Mehrkanaltonsignalen
KR20010030608A (ko) 1997-09-16 2001-04-16 레이크 테크놀로지 리미티드 청취자 주변의 음원의 공간화를 향상시키기 위한 스테레오헤드폰 디바이스에서의 필터링 효과의 이용
CN100353664C (zh) 1998-03-25 2007-12-05 雷克技术有限公司 音频信号处理方法
AUPP271598A0 (en) * 1998-03-31 1998-04-23 Lake Dsp Pty Limited Headtracked processing for headtracked playback of audio signals
CN1065400C (zh) 1998-09-01 2001-05-02 国家科学技术委员会高技术研究发展中心 兼容ac-3和mpeg-2的音频编解码器
CA2309077A1 (en) * 1998-09-02 2000-03-16 Matsushita Electric Industrial Co., Ltd. Signal processor
DE19932062A1 (de) * 1999-07-12 2001-01-18 Bosch Gmbh Robert Verfahren zur Aufbereitung von quellcodierten Audiodaten sowie Sender und Empfänger hierzu
JP2001100792A (ja) * 1999-09-28 2001-04-13 Sanyo Electric Co Ltd 符号化方法、符号化装置およびそれを備える通信システム
JP3335605B2 (ja) * 2000-03-13 2002-10-21 日本電信電話株式会社 ステレオ信号符号化方法
JP3616307B2 (ja) * 2000-05-22 2005-02-02 日本電信電話株式会社 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体
JP2002191099A (ja) * 2000-09-26 2002-07-05 Matsushita Electric Ind Co Ltd 信号処理装置
JP3228474B2 (ja) * 2001-01-18 2001-11-12 日本ビクター株式会社 音声符号化装置及び音声復号化方法
JP2002262385A (ja) * 2001-02-27 2002-09-13 Victor Co Of Japan Ltd 音像定位信号の生成方法、及び音像定位信号生成装置
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
JP2003009296A (ja) * 2001-06-22 2003-01-10 Matsushita Electric Ind Co Ltd 音響処理装置および音響処理方法
CN1666572A (zh) * 2002-04-05 2005-09-07 皇家飞利浦电子股份有限公司 信号处理
US8498422B2 (en) * 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
KR100522593B1 (ko) 2002-07-08 2005-10-19 삼성전자주식회사 다채널 입체음향 사운드 생성방법 및 장치
ATE377339T1 (de) * 2002-07-12 2007-11-15 Koninkl Philips Electronics Nv Audio-kodierung
KR20040027015A (ko) * 2002-09-27 2004-04-01 (주)엑스파미디어 스트리밍시 오디오의 대역폭을 줄이기 위하여 몰입형오디오를 이용한 새로운 다운믹싱 기법
JP4084990B2 (ja) * 2002-11-19 2008-04-30 株式会社ケンウッド エンコード装置、デコード装置、エンコード方法およびデコード方法
JP4369140B2 (ja) 2003-02-17 2009-11-18 パナソニック株式会社 オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体
FR2851879A1 (fr) * 2003-02-27 2004-09-03 France Telecom Procede de traitement de donnees sonores compressees, pour spatialisation.
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
US7949141B2 (en) * 2003-11-12 2011-05-24 Dolby Laboratories Licensing Corporation Processing audio signals with head related transfer function filters and a reverberator
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20050276430A1 (en) * 2004-05-28 2005-12-15 Microsoft Corporation Fast headphone virtualization
US20050273324A1 (en) * 2004-06-08 2005-12-08 Expamedia, Inc. System for providing audio data and providing method thereof
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms

Also Published As

Publication number Publication date
AU2006222285A1 (en) 2006-09-14
ES2340796T3 (es) 2010-06-09
IL185452A (en) 2011-07-31
EP1854334A1 (de) 2007-11-14
EP2094031A2 (de) 2009-08-26
US8553895B2 (en) 2013-10-08
IL185452A0 (en) 2008-01-06
EP1854334B1 (de) 2010-03-17
HK1111855A1 (en) 2008-08-15
NO20075004L (no) 2007-10-03
BRPI0608036A2 (pt) 2009-11-03
AU2006222285B2 (en) 2009-01-08
NO339958B1 (no) 2017-02-20
BRPI0608036B1 (pt) 2019-05-07
CN101133680B (zh) 2012-08-08
EP2094031A3 (de) 2014-10-01
MY140741A (en) 2010-01-15
JP2008532395A (ja) 2008-08-14
PL1854334T3 (pl) 2010-09-30
CA2599969C (en) 2012-10-02
TWI322630B (en) 2010-03-21
ATE461591T1 (de) 2010-04-15
MX2007010636A (es) 2007-10-10
WO2006094635A1 (de) 2006-09-14
CN101133680A (zh) 2008-02-27
KR20070100838A (ko) 2007-10-11
KR100928311B1 (ko) 2009-11-25
RU2007136792A (ru) 2009-04-10
TW200701823A (en) 2007-01-01
JP4987736B2 (ja) 2012-07-25
RU2376726C2 (ru) 2009-12-20
DE502006006444D1 (de) 2010-04-29
US20070297616A1 (en) 2007-12-27
CA2599969A1 (en) 2006-09-14

Similar Documents

Publication Publication Date Title
EP1854334B1 (de) Vorrichtung und verfahren zum erzeugen eines codierten stereo-signals eines audiostücks oder audiodatenstroms
DE602005006385T2 (de) Vorrichtung und verfahren zum konstruieren eines mehrkanaligen ausgangssignals oder zum erzeugen eines downmix-signals
DE602004004168T2 (de) Kompatible mehrkanal-codierung/-decodierung
DE602006000239T2 (de) Energieabhängige quantisierung für effiziente kodierung räumlicher audioparameter
DE102006050068B4 (de) Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
EP1687809B1 (de) Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür
EP2206113B1 (de) Vorrichtung und verfahren zum erzeugen eines multikanalsignals mit einer sprachsignalverarbeitung
DE602005002942T2 (de) Verfahren zur darstellung von mehrkanal-audiosignalen
DE69933659T2 (de) Verfahren und system zur räumlichen kodierung mit niedriger bitrate
DE602005006424T2 (de) Stereokompatible mehrkanal-audiokodierung
DE69633633T2 (de) Mehrkanaliger prädiktiver subband-kodierer mit adaptiver, psychoakustischer bitzuweisung
EP1763870B1 (de) Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals
EP2005421B1 (de) Vorrichtung und verfahren zum erzeugen eines umgebungssignals
DE102013223201B3 (de) Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
DE102005014477A1 (de) Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
EP2891334B1 (de) Erzeugung von mehrkanalton aus stereo-audiosignalen
EP2917908A1 (de) Nichtlineare inverse kodierung von multikanal-signalen
WO2015128379A1 (de) Kodierung und dekodierung eines niederfrequenten kanals in einem audiomultikanalsignal
EP1719128A1 (de) Vorrichtung und verfahren zum beschreiben einer audio-cd und audio-cd
HK1111855B (en) Device and method for generating an encoded stereo signal

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
R002 Refusal decision in examination/registration proceedings
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20131001