[go: up one dir, main page]

HK1213361B - Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding - Google Patents

Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding Download PDF

Info

Publication number
HK1213361B
HK1213361B HK16101374.6A HK16101374A HK1213361B HK 1213361 B HK1213361 B HK 1213361B HK 16101374 A HK16101374 A HK 16101374A HK 1213361 B HK1213361 B HK 1213361B
Authority
HK
Hong Kong
Prior art keywords
signal
audio object
subband
transformed
downmix
Prior art date
Application number
HK16101374.6A
Other languages
English (en)
French (fr)
Chinese (zh)
Other versions
HK1213361A1 (en
Inventor
Sascha Disch
Jouni PAULUS
Bernd Edler
Oliver Hellmuth
Jürgen HERRE
Thorsten Kastner
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP13167487.1A external-priority patent/EP2717262A1/de
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Publication of HK1213361A1 publication Critical patent/HK1213361A1/en
Publication of HK1213361B publication Critical patent/HK1213361B/en

Links

Claims (13)

  1. Ein Decodierer zum Erzeugen eines Audioausgangssignals, das einen oder mehrere Audioausgangskanäle aufweist, aus einem Abwärtsmischsignal, wobei das Abwärtsmischsignal ein oder mehrere Audioobjektsignale codiert, wobei der Decodierer folgende Merkmale aufweist:
    eine Steuereinheit (181) zum Festlegen einer Aktivierungsanzeige auf einen Aktivierungszustand in Abhängigkeit von einer Signaleigenschaft zumindest eines des einen oder der mehreren Audioobjektsignale,
    ein erstes Analysemodul (182) zum Transformieren des Abwärtsmischsignals, um eine erste transformierte Abwärtsmischung zu erhalten, die eine Mehrzahl von ersten Teilbandkanälen aufweist,
    ein zweites Analysemodul (183) zum Erzeugen, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt ist, einer zweiten transformierten Abwärtsmischung durch Transformieren zumindest eines der ersten Teilbandkanäle, um eine Mehrzahl von zweiten Teilbandkanälen zu erhalten, wobei die zweite transformierte Abwärtsmischung die ersten Teilbandkanäle, die nicht durch das zweite Analysemodul transformiert wurden, und die zweiten Teilbandkanäle aufweist, und
    eine Entmischungseinheit (184), wobei die Entmischungseinheit (184) dazu konfiguriert ist, die zweite transformierte Abwärtsmischung, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt ist, basierend auf parametrischen Seiteninformationen über das eine oder die mehreren Audioobjektsignale zu entmischen, um das Audioausgangssignal zu erhalten, und die erste transformierte Abwärtsmischung, wenn die Aktivierungsanzeige nicht auf den Aktivierungszustand festgelegt ist, basierend auf den parametrischen Seiteninformationen über das eine oder die mehreren Audioobjektsignale zu entmischen, um das Audioausgangssignal zu erhalten,
    wobei die Steuereinheit (181) dazu konfiguriert ist, die Aktivierungsanzeige in Abhängigkeit von einem Vorhandensein einer Transiente in zumindest einem des einen oder der mehreren Audioobjektsignale auf den Aktivierungszustand festzulegen, wobei die Transiente eine Signaländerung des zumindest einen des einen oder der mehreren Audioobjektsignale anzeigt.
  2. Ein Decodierer gemäß Anspruch 1, wobei jedem der ersten Teilbandkanäle eine Teilbandtransformationsanzeige zugewiesen ist, wobei die Steuereinheit (181) dazu konfiguriert ist, die Teilbandtransformationsanzeige jedes der ersten Teilbandkanäle in Abhängigkeit von der Signaleigenschaft zumindest eines des einen oder der mehreren Audioobjektsignale auf einen Teilbandtransformationszustand festzulegen, und wobei das zweite Analysemodul (183) dazu konfiguriert ist, jeden der ersten Teilbandkanäle, dessen Teilbandtransformationsanzeige auf den Teilbandtransformationszustand festgelegt ist, zu transformieren, um die Mehrzahl von zweiten Teilbandkanälen zu erhalten, und jeden der zweiten Teilbandkanäle, dessen Teilbandtransformationsanzeige nicht auf den Teilbandtransformationszustand festgelegt ist, nicht zu transformieren.
  3. Ein Decodierer gemäß einem der vorhergehenden Ansprüche, wobei das erste Analysemodul (182) dazu konfiguriert ist, das Abwärtsmischsignal zu transformieren, um die erste transformierte Abwärtsmischung zu erhalten, die die Mehrzahl von ersten Teilbandkanälen aufweist, indem ein Quadraturspiegelfilter eingesetzt wird.
  4. Ein Decodierer gemäß einem der vorhergehenden Ansprüche, wobei das erste Analysemodul (182) dazu konfiguriert ist, das Abwärtsmischsignal abhängig von einer ersten Analysefensterlänge zu transformieren, wobei die erste Analysefensterlänge von der Signaleigenschaft abhängt, oder wobei das zweite Analysemodul (183) dazu konfiguriert ist, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt ist, die zweite transformierte Abwärtsmischung zu erzeugen, indem der zumindest eine der ersten Teilbandkanäle in Abhängigkeit von einer zweiten Analysefensterlänge transformiert wird, wobei die zweite Analysefensterlänge von der Signaleigenschaft abhängt.
  5. Ein Decodierer gemäß einem der vorhergehenden Ansprüche, wobei der Decodierer dazu konfiguriert ist, das Audioausgangssignal, das einen oder mehrere Audioausgangskanäle aufweist, aus dem Abwärtsmischsignal zu erzeugen, wobei das Abwärtsmischsignal zwei oder mehr Audioobjektsignale codiert, wobei die Steuereinheit (181) dazu konfiguriert ist, die Aktivierungsanzeige in Abhängigkeit von der Signaleigenschaft von zumindest einem der zwei oder mehr Audioobjektsignale auf den Aktivierungszustand festzulegen, und wobei die Entmischungseinheit (184) dazu konfiguriert ist, die zweite transformierte Abwärtsmischung, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt ist, basierend auf parametrischen Seiteninformationen über das eine oder die mehreren Audioobjektsignale zu entmischen, um das Audioausgangssignal zu erhalten, und die erste transformierte Abwärtsmischung, wenn die Aktivierungsanzeige nicht auf den Aktivierungszustand festgelegt ist, basierend auf den parametrischen Seiteninformationen über die zwei oder mehreren Audioobjektsignale zu entmischen, um das Audioausgangssignal zu erhalten.
  6. Ein Codierer zum Codieren eines Eingangsaudioobjektsignals, wobei der Codierer folgende Merkmale aufweist:
    eine Steuereinheit (191) zum Festlegen einer Aktivierungsanzeige auf einen Aktivierungszustand in Abhängigkeit von einer Signaleigenschaft des Eingangsaudioobjektsignals,
    ein erstes Analysemodul (192) zum Transformieren des Eingangsaudioobjektsignals, um ein erstes transformiertes Audioobjektsignal zu erhalten, wobei das erstetransformierte Audioobjektsignal eine Mehrzahl von ersten Teilbandkanälen aufweist,
    ein zweites Analysemodul (193) zum Erzeugen, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt ist, eines zweiten transformierten Audioobjektsignals durch Transformieren zumindest eines der Mehrzahl von ersten Teilbandkanälen, um eine Mehrzahl von zweiten Teilbandkanälen zu erhalten, wobei das zweite transformierte Audioobjektsignal die ersten Teilbandkanäle, die nicht durch das zweite Analysemodul transformiert wurden, und die zweiten Teilbandkanäle aufweist, und
    eine PSI-Schätzeinheit (194), wobei die PSI-Schätzeinheit (194) dazu konfiguriert ist, parametrische Seiteninformationen basierend auf dem zweiten transformierten Audioobjektsignal zu bestimmen, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt ist, und die parametrischen Seiteninformationen basierend auf dem ersten transformierten Audioobjektsignal zu bestimmen, wenn die Aktivierungsanzeige nicht auf den Aktivierungszustand festgelegt ist,
    wobei die Steuereinheit (191) dazu konfiguriert ist, die Aktivierungsanzeige in Abhängigkeit von einem Vorhandensein einer Transiente in dem Eingangsaudioobjektsignal auf den Aktivierungszustand festzulegen, wobei die Transiente eine Signaländerung des Eingangsaudioobjektsignals anzeigt.
  7. Ein Codierer gemäß Anspruch 6, wobei jedem der ersten Teilbandkanäle eine Teilbandtransformationsanzeige zugewiesen ist, wobei die Steuereinheit (191) dazu konfiguriert ist, die Teilbandtransformationsanzeige jedes der ersten Teilbandkanäle in Abhängigkeit von der Signaleigenschaft des Eingangsaudioobjektsignals auf einen Teilbandtransformationszustand festzulegen, und wobei das zweite Analysemodul (193) dazu konfiguriert ist, jeden der ersten Teilbandkanäle, dessen Teilbandtransformationsanzeige auf den Teilbandtransformationszustand festgelegt ist, zu transformieren, um die Mehrzahl von zweiten Teilbandkanälen zu erhalten, und jeden der zweiten Teilbandkanäle, dessen Teilbandtransformationsanzeige nicht auf den Teilbandtransformationszustand festgelegt ist, nicht zu transformieren.
  8. Ein Codierer gemäß Anspruch 6 oder 7, wobei das erste Analysemodul (192) dazu konfiguriert ist, jedes der Eingangsaudioobjektsignale unter Einsatz eines Quadraturspiegelfilters zu transformieren.
  9. Ein Codierer gemäß einem der Ansprüche 6 bis 8, wobei das erste Analysemodul (192) dazu konfiguriert ist, das Eingangsaudioobjektsignal in Abhängigkeit von einer ersten Analysefensterlänge zu transformieren, wobei die erste Analysefensterlänge von der Signaleigenschaft abhängt, oder wobei das zweite Analysemodul (193) dazu konfiguriert ist, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt ist, das zweite transformierte Audioobjektsignal zu erzeugen, indem zumindest einer der Mehrzahl von ersten Teilbandkanälen in Abhängigkeit von einer zweiten Analysefensterlänge transformiert wird, wobei die zweite Analysefensterlänge von der Signaleigenschaft abhängt.
  10. Ein Codierer gemäß einem der Ansprüche 6 bis 9, wobei der Codierer zum Codieren des Eingangsaudioobjektsignals und zumindest eines weiteren Eingangsaudioobjektsignals konfiguriert ist, wobei die Steuereinheit (191) dazu konfiguriert ist, die Aktivierungsanzeige abhängig von der Signaleigenschaft des Eingangsaudioobjektsignals und abhängig von einer Signaleigenschaft des zumindest einen weiteren Eingangsaudioobjektsignals auf den Aktivierungszustand festzulegen, wobei das erste Analysemodul (192) dazu konfiguriert ist, zumindest ein weiteres Eingangsaudioobjektsignal zu transformieren, um zumindest ein weiteres erstes transformiertes Audioobjektsignal zu erhalten, wobei jedes des zumindest einen weiteren ersten transformierten Audioobjektsignals eine Mehrzahl von ersten Teilbandkanälen aufweist, wobei das zweite Analysemodul (193) dazu konfiguriert ist, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt ist, zumindest einen der Mehrzahl von ersten Teilbandkanälen von zumindest einem der zumindest einen weiteren ersten transformierten Audioobjektsignale zu transformieren, um eine Mehrzahl von weiteren zweiten Teilbandkanälen zu erhalten, und wobei die PSI-Schätzeinheit (194) dazu konfiguriert ist, die parametrischen Seiteninformationen basierend auf der Mehrzahl von weiteren zweiten Teilbandkanälen zu bestimmen, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt ist.
  11. Ein Verfahren zum Decodieren durch Erzeugen eines Audioausgangssignals, das einen oder mehrere mehr Audioausgangskanäle aufweist, aus einem Abwärtsmischsignal, wobei das Abwärtsmischsignal zwei oder mehr Audioobjektsignale codiert, wobei das Verfahren folgende Schritte aufweist:
    Festlegen einer Aktivierungsanzeige auf einen Aktivierungszustand in Abhängigkeit von einer Signaleigenschaft von zumindest einem der zwei oder mehr Audioobjektsignale,
    Transformieren des Abwärtsmischsignals, um eine erste transformierte Abwärtsmischung zu erhalten, die eine Mehrzahl von ersten Teilbandkanälen aufweist,
    Erzeugen, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt wird, einer zweiten transformierten Abwärtsmischung durch Transformieren zumindest eines der ersten Teilbandkanäle, um eine Mehrzahl von zweiten Teilbandkanälen zu erhalten, wobei die zweite transformierte Abwärtsmischung die ersten Teilbandkanäle, die nicht durch ein zweites Analysemodul transformiert wurden, und die zweiten Teilbandkanäle aufweist, und
    Entmischen der zweiten transformierten Abwärtsmischung, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt wird, basierend auf parametrischen Seiteninformationen über die zwei oder mehr Audioobjektsignale, um das Audioausgangssignal zu erhalten, und Entmischen der ersten transformierten Abwärtsmischung, wenn die Aktivierungsanzeige nicht auf den Aktivierungszustandfestgelegt wird, basierend auf den parametrischen Seiteninformationen über die zwei oder mehr Audioobjektsignale, um das Audioausgangssignal zu erhalten,
    wobei die Aktivierungsanzeige in Abhängigkeit von einem Vorhandensein einer Transiente in zumindest einem der zwei oder mehr Audioobjektsignale auf den Aktivierungszustand festgelegt wird, wobei die Transiente eine Signaländerung des zumindest einen der zwei oder mehr Audioobjektsignale anzeigt.
  12. Verfahren zum Codieren von zwei oder mehr Eingangsaudioobjektsignalen, wobei das Verfahren folgende Schritte aufweist:
    Festlegen einer Aktivierungsanzeige auf einen Aktivierungszustand in Abhängigkeit von einer Signaleigenschaft von zumindest einem der zwei oder mehr Eingangsaudioobjektsignale,
    Transformieren jedes der Eingangsaudioobjektsignale, um ein erstes transformiertes Audioobjektsignal des Eingangsaudioobjektsignals zu erhalten, wobei das erste transformierte Audioobjektsignal eine Mehrzahl von ersten Teilbandkanälen aufweist,
    Erzeugen, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt wird, eines zweiten transformierten Audioobjektsignals für jedes der Eingangsaudioobjektsignale durch Transformieren zumindest eines der ersten Teilbandkanäle des ersten transformierten Audioobjektsignals des Eingangsaudioobjektsignals, um eine Mehrzahl von zweiten Teilbandkanälen zu erhalten, wobei das zweite transformierte Audioobjektsignal die ersten Teilbandkanäle, die nicht durch ein zweites Analysemodul transformiert wurden, und die zweiten Teilbandkanäle aufweist, und
    Bestimmen von parametrischen Seiteninformationen basierend auf dem zweiten transformierten Audioobjektsignal jedes der Eingangsaudioobjektsignale, wenn die Aktivierungsanzeige auf den Aktivierungszustand festgelegt wird, und Bestimmen der parametrischen Seiteninformationen basierend auf dem ersten transformierten Audioobjektsignal jedes der Eingangsaudioobjektsignale, wenn die Aktivierungsanzeige nicht auf den Aktivierungszustand festgelegt wird,
    wobei die Aktivierungsanzeige in Abhängigkeit von einem Vorhandensein einer Transiente in zumindest einem der zwei oder mehr Audioobjektsignale auf den Aktivierungszustand festgelegt wird, wobei die Transiente eine Signaländerung des zumindest einen der zwei oder mehr Audioobjektsignale anzeigt.
  13. Computerprogramm, das dahin gehend angepasst ist, das Verfahren gemäß Anspruch 11 oder 12 zu implementieren, wenn dasselbe auf einem Computer oder Signalprozessor ausgeführt wird.
HK16101374.6A 2012-10-05 2013-10-02 Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding HK1213361B (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261710133P 2012-10-05 2012-10-05
US61/710,133 2012-10-05
EP13167487.1 2013-05-13
EP13167487.1A EP2717262A1 (de) 2012-10-05 2013-05-13 Codierer, Decodierer und Verfahren für signalabhängige Zoomumwandlung beim Spatial-Audio-Object-Coding
PCT/EP2013/070550 WO2014053547A1 (en) 2012-10-05 2013-10-02 Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding

Publications (2)

Publication Number Publication Date
HK1213361A1 HK1213361A1 (en) 2016-06-30
HK1213361B true HK1213361B (en) 2021-10-08

Family

ID=

Similar Documents

Publication Publication Date Title
EP2904610B1 (de) Codierer, decodierer und verfahren für signalabhängige zoomumwandlung beim spatial-audio-object-coding
CA2887228C (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
HK1213361B (en) Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
HK1213360B (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding