[go: up one dir, main page]

HK1152791B - Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension - Google Patents

Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension Download PDF

Info

Publication number
HK1152791B
HK1152791B HK11106784.4A HK11106784A HK1152791B HK 1152791 B HK1152791 B HK 1152791B HK 11106784 A HK11106784 A HK 11106784A HK 1152791 B HK1152791 B HK 1152791B
Authority
HK
Hong Kong
Prior art keywords
representation
values
domain
patch
spectral
Prior art date
Application number
HK11106784.4A
Other languages
English (en)
French (fr)
Chinese (zh)
Other versions
HK1152791A1 (en
Inventor
Frederik Nagel
Max Neuendorf
Nikolaus Rettelbach
Jérémie Lecomte
Markus Multrus
Bernhard Grill
Sascha Disch
Original Assignee
Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP09181008A external-priority patent/EP2239732A1/de
Application filed by Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. filed Critical Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.
Publication of HK1152791A1 publication Critical patent/HK1152791A1/en
Publication of HK1152791B publication Critical patent/HK1152791B/en

Links

Claims (17)

  1. Eine Vorrichtung (100; 386) zum Erzeugen einer Darstellung (120; 426) eines bandbreitenerweiterten Signals auf der Basis einer Eingangssignaldarstellung (110; 383), wobei die Vorrichtung folgende Merkmale aufweist:
    einen Phasenvocoder (130; 406), der dazu konfiguriert ist, Werte (βζ ... β, 408) einer Spektralbereichsdarstellung eines ersten Abschnitts des bandbreitenerweiterten Signals auf der Basis der Eingangssignaldarstellung zu erhalten; und
    einen Wertekopierer (140; 410, 416), der dazu konfiguriert ist, einen Satz von Werten (βζ ... β, 408) der Spektralbereichsdarstellung des ersten Abschnitts, wobei diese Werte durch den Phasenvocoder bereitgestellt werden, zu kopieren, um einen Satz von Werten (β ... β, 408) einer Spektralbereichsdarstellung eines zweiten Abschnitts zu erhalten, wobei der zweite Abschnitt höheren Frequenzen zugeordnet ist als der erste Abschnitt;
    wobei die Vorrichtung dazu konfiguriert ist, die Darstellung (120; 426) des bandbreitenerweiterten Signals unter Verwendung der Werte der Spektralbereichsdarstellung des ersten Abschnitts und der Werte der Spektralbereichsdarstellung des zweiten Abschnitts zu erhalten.
  2. Die Vorrichtung (100; 386) gemäß Anspruch 1, bei der der Phasenvocoder (130; 406) dazu konfiguriert ist, einen Satz von Betragswerten (αζ/2 ... αζ ), die einer Mehrzahl gegebener Frequenzteilbereiche der Eingangssignaldarstellung (110; 383) zugeordnet sind, zu kopieren, um einen Satz von Betragswerten (αζ ... α ), die entsprechenden Frequenzteilbereichen des ersten Abschnitts zugeordnet sind, zu erhalten, bei der ein Paar eines gegebenen Frequenzteilbereichs der Eingangssignaldarstellung und eines entsprechenden Frequenzteilbereichs des ersten Abschnitts ein Paar einer Grundfrequenz und einer Harmonischen der Grundfrequenz abdeckt, bei der der Phasenvocoder (130; 406) dazu konfiguriert ist, Phasenwerte (ϕζ/2 ... ϕζ), die der Mehrzahl gegebener Frequenzteilbereiche der Eingangssignaldarstellung zugeordnet sind, mit einem vorbestimmten Faktor zu multiplizieren, um einen Satz von Phasenwerten (ϕζ ... ϕ), die den entsprechenden Frequenzteilbereichen des ersten Abschnitts zugeordnet sind, zu erhalten, und bei der der Wertekopierer (140; 410) dazu konfiguriert ist, einen Satz von Werten (βζ ... β), die einer Mehrzahl gegebener Frequenzteilbereiche des ersten Abschnitts zugeordnet sind, zu kopieren, um einen Satz von Werten (β ... β), die entsprechenden Frequenzteilbereichen des zweiten Abschnitts zugeordnet sind, zu erhalten, wobei der Wertekopierer dazu konfiguriert ist, Phasenwerte beim Kopieren unverändert zu belassen.
  3. Die Vorrichtung (100; 386) gemäß Anspruch 2, bei der der Wertekopierer (140; 410) dazu konfiguriert ist, die Werte derart zu kopieren, dass eine gemeinsame spektrale Verschiebung zwischen Werten (βζ ... β) des ersten Abschnitts und entsprechenden Werten (β ... β) des zweiten Abschnitts erhalten wird.
  4. Die Vorrichtung (100; 386) gemäß einem der Ansprüche 1 bis 3, bei der der Phasenvocoder (130; 410) dazu konfiguriert ist, die Werte (βζ ... β) der Spektralbereichsdarstellung (132; 408) des ersten Abschnitts derart zu erhalten, dass die Werte der Spektralbereichsdarstellung des ersten Abschnitts eine harmonisch aufwärtsgemischte Version eines Grundfrequenzbereichs der Eingangssignaldarstellung (110; 383) darstellen; und bei der der Wertekopierer (140; 410) dazu konfiguriert ist, die Werte (β ... β) der Spektralbereichsdarstellung (142; 412) des zweiten Abschnitts derart zu erhalten, dass die Werte der Spektralbereichsdarstellung des zweiten Abschnitts eine frequenzverschobene Version des Audioinhalts des ersten Abschnitts darstellen.
  5. Die Vorrichtung (100; 380, 382, 386) gemäß einem der Ansprüche 1 bis 4, wobei die Vorrichtung dazu konfiguriert ist, Eingangsaudiodaten (322) zu empfangen, die Eingangsaudiodaten (322) abwärts abzutasten (380), um abwärts abgetastete Audiodaten (381) zu erhalten, die abwärts abgetasteten Audiodaten (381) zu fenstern (382), um gefensterte Eingangsdaten (383) zu erhalten, die gefensterten Eingangsdaten (383) in einen Spektralbereich umzuwandeln (400) oder zu transformieren, um die Eingangssignaldarstellung (383) in Form einer Spektralbereichsdarstellung (401) zu erhalten, Betragswerte αk und Phasenwerte ϕk zu berechnen (402, 404), die einen Frequenzintervallbereich mit einem Index k der Eingangssignaldarstellung (383) darstellen, eine Mehrzahl von Betragswerten αk, die Frequenzintervallbereiche mit Frequenzintervallbereichsindizes k der Eingangssignaldarstellung (383) darstellen, zu verwenden (130; 406), um Betragswerte α2k zu erhalten, die Frequenzintervallbereiche mit Frequenzintervallbereichsindizes sk des ersten Abschnitts darstellen, wobei s ein Dehnungsfaktor ist, bei dem s zwischen 1,5 und 2,5 liegt, und Phasenwerte ϕk, die Frequenzintervallbereiche mit Frequenzintervallbereichsindizes k der Eingangssignaldarstellung (383) zugeordnet sind, zu kopieren und zu skalieren (130; 406) , um kopierte und skalierte Phasenwerte ϕ2k=sϕk zu erhalten, die Frequenzintervallbereiche mit Frequenzintervallbereichsindizes 2k des ersten Abschnitts zugeordnet sind, Werte βk-iζ, die Frequenzintervallbereiche mit Frequenzintervallbereichsindizes k-iζ der Spektralbereichsdarstellung (132; 408) des ersten Abschnitts zugeordnet sind, zu kopieren (140; 410), um Werte βk der Spektralbereichsdarstellung (142; 412) des zweiten Abschnitts zu erhalten, die Darstellung (426) des bandbreitenerweiterten Signals in den Zeitbereich umzuwandeln (428), um eine Zeitbereichsdarstellung (430) zu erhalten, und ein Synthesefenster auf die Zeitbereichsdarstellung anzuwenden (432).
  6. Die Vorrichtung (100; 386) gemäß einem der Ansprüche 1 bis 5, wobei die Vorrichtung einen Zeitbereich-zu-Spektralbereich-Wandler (400) aufweist, der dazu konfiguriert ist, als Eingangssignaldarstellung (401) Werte einer Spektralbereichsdarstellung eines Eingangsaudiosignals (322) oder einer vorverarbeiteten Version (383) des Eingangsaudiosignals (322) bereitzustellen; und wobei die Vorrichtung einen Spektralbereich-zu-Zeitbereich-Wandler (428) aufweist, der dazu konfiguriert ist, eine Zeitbereichsdarstellung (430) des bandbreitenerweiterten Signals unter Verwendung von Werten (βζ ... β, 408) der Spektralbereichsdarstellung des ersten Abschnitts und Werte (β ... β, 412) der Spektralbereichsdarstellung des zweiten Abschnitts bereitzustellen; wobei der Spektralbereich-zu-Zeitbereich-Wandler (428) derart konfiguriert ist, dass eine Zahl (N=2048) verschiedener Spektralwerte (426), die seitens des Spektralbereich-zu-Zeitbereich-Wandlers (428) empfangen werden, größer ist als eine Zahl (N=512) verschiedener Spektralwerte (401), die seitens des Zeitbereich-zu-Spektralbereich-Wandlers (400) bereitgestellt werden, so dass der Spektralbereich-zu-Zeitbereich-Wandler (428) dazu konfiguriert ist, eine größere Anzahl von Frequenzintervallbereichen zu verarbeiten als der Zeitbereich-zu-Spektralbereich-Wandler (400).
  7. Die Vorrichtung (100; 382, 386) gemäß einem der Ansprüche 1 bis 6, wobei die Vorrichtung eine Analysefensterungseinrichtung (382) aufweist, die dazu konfiguriert ist, ein Zeitbereichs-Eingangsaudiosignal (322) zu fenstern, um eine gefensterte Version (383) des Zeitbereich-Eingangsaudiosignals zu erhalten, die die Basis zum Erhalten der Eingangssignaldarstellung in Form einer Spektralbereichsdarstellung (401) bildet; und wobei die Vorrichtung eine Synthesefensterungseinrichtung (432) aufweist, die dazu konfiguriert ist, einen Teil einer Zeitbereichsdarstellung (430) des bandbreitenerweiterten Signals zu fenstern, um einen gefensterten Teil (434) der Zeitbereichsdarstellung des bandbreitenerweiterten Signals zu erhalten.
  8. Die Vorrichtung (100; 382, 386) gemäß Anspruch 7, wobei die Vorrichtung dazu konfiguriert ist, eine Mehrzahl von sich zeitlich überlappenden zeitverschobenen Anteilen des Zeitbereich-Eingangsaudiosignals (322) zu verarbeiten, um eine Mehrzahl von sich zeitlich überlappenden zeitverschobenen gefensterten Teilen (434) der Zeitbereichsdarstellung des bandbreitenerweiterten Signals zu erhalten, wobei ein Zeitversatz (Inc=64) zwischen zeitlich benachbarten zeitverschobenen Anteilen des Zeitbereich-Eingangsaudiosignals (322) geringer als oder gleich einem Viertel einer Fensterlänge (512) der Analysefensterungseinrichtung (382) ist.
  9. Die Vorrichtung (100; 382, 386) gemäß einem der Ansprüche 1 bis 8, wobei die Vorrichtung einen Transienteninformationslieferanten (384) aufweist, der dazu konfiguriert ist, Informationen zu liefern, die das Vorliegen einer Transiente in dem Eingangssignal (322) angeben; und wobei die Vorrichtung einen ersten Verarbeitungszweig (386) zum Bereitstellen einer Darstellung (434) eines bandbreitenerweiterten Signalanteils auf der Basis eines Nicht-Transiente-Teils der Eingangssignaldarstellung (383) und einen zweiten Verarbeitungszweig (388) zum Bereitstellen einer Darstellung (478) eines bandbreitenerweiterten Signalanteils auf der Basis eines Transiente-Teils der Eingangssignaldarstellung (383) aufweist; wobei der zweite Verarbeitungszweig (388) dazu konfiguriert ist, eine Spektralbereichsdarstellung (441) des Eingangssignals zu verarbeiten, die eine höhere spektrale Auflösung (N=1024) aufweist als eine Spektralbereichsdarstellung (401) des seitens des ersten Verarbeitungszweigs (386) verarbeiteten Eingangssignals.
  10. Die Vorrichtung (100; 382, 386) gemäß Anspruch 9, bei der der zweite Verarbeitungszweig (388) einen Zeitbereich-Nullenauffüller (438) aufweist, der dazu konfiguriert ist, einen eine Transiente enthaltenden Anteil (383) des Eingangssignals mit Nullen aufzufüllen, um einen eine Transiente enthaltenden zeitlich erweiterten Anteil (439) des Eingangssignals zu erhalten; und bei der der erste Verarbeitungszweig (386) einen Zeitbereich-zu-Frequzenzbereich-Wandler (400) aufweist, der dazu konfiguriert ist, eine erste Anzahl (N=512) von Spektralbereichswerten (401), die dem Nicht-Transiente-Anteil (383) des Eingangssignals zugeordnet sind, bereitzustellen; und bei der der zweite Verarbeitungszweig (388) einen Zeitbereich-zu-Frequzenzbereich-Wandler (440) aufweist, der dazu konfiguriert ist, eine zweite Anzahl (N=1024) von Spektralbereichswerten (441), die dem eine Transiente enthaltenden zeitlich erweiterten Anteil (439) des Eingangssignals zugeordnet sind, bereitzustellen, bei der die zweite Anzahl (N=1024) von Spektralbereichswerten um zumindest einen Faktor von 1,5 größer ist als die erste Anzahl (N=512) von Spektralbereichswerten.
  11. Die Vorrichtung (100; 382, 386) gemäß Anspruch 10, bei der der zweite Verarbeitungszweig einen Nullenentfemer (476) aufweist, der dazu konfiguriert ist, eine Mehrzahl von Nullwerten von einem bandbreitenerweiterten Signalanteil (474), der auf der Basis des eine Transiente enthaltenden zeitlich erweiterten Anteils (439) des Eingangssignals erhalten wurde, zu entfernen.
  12. Die Vorrichtung (100; 380, 382, 386) gemäß einem der Ansprüche 1 bis 11, wobei die Vorrichtung einen Abwärtsabtaster (380) aufweist, der dazu konfiguriert ist, eine Zeitbereichsdarstellung (322) des Eingangssignals abwärts abzutasten.
  13. Ein Audiodecodierer (300), der eine Vorrichtung (100; 386) gemäß einem der Ansprüche 1 bis 12 aufweist.
  14. Ein Verfahren (400) zum Erzeugen einer Darstellung eines bandbreitenerweiterten Signals auf der Basis einer Eingangssignaldarstellung, wobei das Verfahren folgende Schritte aufweist:
    Erhalten (410), unter Verwendung eines Phasenvocodierens, von Werten einer Spektralbereichsdarstellung eines ersten Abschnitts des bandbreitenerweiterten Signals auf der Basis der Eingangssignaldarstellung; und
    Kopieren (420) eines Satzes von Werten der Spektralbereichsdarstellung des ersten Abschnitts, wobei diese Werte durch das Phasenvocodieren bereitgestellt werden, um einen Satz von Werten einer Spektralbereichsdarstellung eines zweiten Abschnitts zu erhalten, wobei der zweite Abschnitt höheren Frequenzen zugeordnet ist als der erste Abschnitt; und
    Erhalten (430) der Darstellung des bandbreitenerweiterten Signals unter Verwendung der Werte der Spektralbereichsdarstellung des ersten Abschnitts und der Werte der Spektralbereichsdarstellung des zweiten Abschnitts.
  15. Eine Vorrichtung (100; 386) zum Erzeugen einer Darstellung (120; 426) eines bandbreitenerweiterten Signals auf der Basis einer Eingangssignaldarstellung (110; 383), wobei die Vorrichtung folgende Merkmale aufweist:
    einen Wertekopierer, der dazu konfiguriert ist, einen Satz von Werten (β1 ... βζ) der Eingangssignaldarstellung zu kopieren, um einen Satz von Werten (βζ ... β) der Spektralbereichsdarstellung eines ersten Abschnitts zu erhalten, wobei der erste Abschnitt höheren Frequenzen zugeordnet ist als die Eingangssignaldarstellung; und einen Phasenvocoder (130; 406), der dazu konfiguriert ist, Werte (β ... β) einer Spektralbereichsdarstellung eines zweiten Abschnitts des bandbreitenerweiterten Signals auf der Basis der Werte (β4/3ζ ... β) der Spektralbereichsdarstellung des ersten Abschnitts zu erhalten, wobei der zweite Abschnitt höheren Frequenzen zugeordnet ist als der erste Abschnitt; und
    wobei die Vorrichtung dazu konfiguriert ist, die Darstellung (120; 426) des bandbreitenerweiterten Signals unter Verwendung der Werte der Spektralbereichsdarstellung des ersten Abschnitts und der Werte der Spektralbereichsdarstellung des zweiten Abschnitts zu erhalten.
  16. Ein Verfahren (400) zum Erzeugen einer Darstellung eines bandbreitenerweiterten Signals auf der Basis einer Eingangssignaldarstellung, wobei das Verfahren folgende Schritte aufweist:
    Kopieren von Werten der Eingangssignaldarstellung, um Werte einer Spektralbereichsdarstellung eines ersten Abschnitts des bandbreitenerweiterten Signals auf der Basis der Eingangssignaldarstellung zu erhalten, wobei der erste Abschnitt höheren Frequenzen zugeordnet ist als die Eingangssignaldarstellung; und
    Erhalten, unter Verwendung eines Phasenvocodierens, eines Satzes von Werten der Spektralbereichsdarstellung des zweiten Abschnitts auf der Basis eines Satzes von Werten der Spektralbereichsdarstellung des ersten Abschnitts, wobei die Werte der Spektralbereichsdarstellung des ersten Abschnitts durch das Kopieren erhalten werden, wobei der zweite Abschnitt höheren Frequenzen zugeordnet ist als der erste Abschnitt; und
    Erhalten (430) der Darstellung des bandbreitenerweiterten Signals unter Verwendung der Werte der Spektralbereichsdarstellung des ersten Abschnitts und der Werte der Spektralbereichsdarstellung des zweiten Abschnitts.
  17. Ein Computerprogramm zum Durchführen des Verfahrens gemäß Anspruch 14 oder Anspruch 16, wenn das Computerprogramm auf einem Computer abläuft.
HK11106784.4A 2009-04-02 2010-04-01 Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension HK1152791B (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US16612509P 2009-04-02 2009-04-02
US61/166,125 2009-04-02
US16806809P 2009-04-09 2009-04-09
US61/168,068 2009-04-09
EP09181008A EP2239732A1 (de) 2009-04-09 2009-12-30 Vorrichtung und Verfahren zur Erzeugung eines synthetischen Audiosignals und zur Kodierung eines Audiosignals
EP09181008.5 2009-12-30
PCT/EP2010/054422 WO2010112587A1 (en) 2009-04-02 2010-04-01 Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension

Publications (2)

Publication Number Publication Date
HK1152791A1 HK1152791A1 (en) 2012-03-09
HK1152791B true HK1152791B (en) 2012-08-31

Family

ID=

Similar Documents

Publication Publication Date Title
US20250225990A1 (en) Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension
US12159636B2 (en) Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension
HK1152791B (en) Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension
BR122021012290B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BRPI1001239B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122021012115B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122021012145B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122021012125B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
BR122021012137B1 (pt) Equipamento, mídia não transitória e método para a geração de uma representação de um sinal de banda larga estendida com base em uma representação do sinal de entrada usando uma combinação de uma extensão de largura de banda harmônica e uma extensão de largura de banda não harmônica
HK1159842B (en) Apparatus and method for generating a synthesis audio signal and for encoding an audio signal