[go: up one dir, main page]

HK1178669B - System and method for non-destructively normalizing loudness of audio signals within portable devices - Google Patents

System and method for non-destructively normalizing loudness of audio signals within portable devices Download PDF

Info

Publication number
HK1178669B
HK1178669B HK13105360.6A HK13105360A HK1178669B HK 1178669 B HK1178669 B HK 1178669B HK 13105360 A HK13105360 A HK 13105360A HK 1178669 B HK1178669 B HK 1178669B
Authority
HK
Hong Kong
Prior art keywords
parameters
encoded
dynamic range
range compression
audio
Prior art date
Application number
HK13105360.6A
Other languages
English (en)
French (fr)
Chinese (zh)
Other versions
HK1178669A (en
Inventor
Jeffrey C. Riedmiller
Harald H. Mundt
Michael Schug
Martin Wolters
Original Assignee
Dolby Laboratories Licensing Corporation
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corporation, Dolby International Ab filed Critical Dolby Laboratories Licensing Corporation
Publication of HK1178669A publication Critical patent/HK1178669A/en
Publication of HK1178669B publication Critical patent/HK1178669B/en

Links

Claims (14)

  1. Verfahren zum Decodieren eines codierten Eingangssignals, um ein Audioausgangssignal zu erzeugen, wobei das Verfahren Folgendes umfasst:
    Empfangen des codierten Eingangssignals, das codierte Audioinformationen und assoziierte Metadaten einschließlich eines oder mehrerer Decodierungssteuerungsparameter und eines oder mehrerer erster Parameter, die eine Dynamikbereich-Komprimierung gemäß einem ersten Dynamikbereich-Komprimierungsprofil spezifizieren, und optional einschließlich eines oder mehrerer zweiter Parameter, die eine Dynamikbereich-Komprimierung gemäß einem zweiten Dynamikbereich-Komprimierungsprofil spezifizieren, beinhaltet, wobei der eine oder die mehreren ersten Parameter Werte aufweisen, die gemäß einem Codierungsprozess festgelegt wurden, der die codierten Audioinformationen erzeugte, um aurale Anregungen mit Amplituden, die einen Abschneidepegel nicht überschreiten, für ein Playback mit einem ersten Referenzwiedergabepegel zu repräsentieren, und
    wobei der eine oder die mehreren zweiten Parameter Werte aufweisen, die gemäß dem Codierungsprozess festgelegt wurden, der die codierten Audioinformationen erzeugte, um die auralen Anregungen mit Amplituden, die den Abschneidepegel nicht überschreiten, für ein Playback mit einem zweiten Referenzwiedergabepegel, der höher ist als der erste Referenzwiedergabepegel, zu repräsentieren;
    Anwenden eines Decodierungsprozesses an den codierten Audioinformationen, um Teilbandsignale zu erhalten, die einen spektralen Inhalt der auralen Anregungen repräsentieren, wobei der Decodierungsprozess als Reaktion auf den einen oder die mehreren Decodierungssteuerungsparameter angepasst wird;
    Modifizieren der Teilbandsignale, um modifizierte Teilbandsignale mit geänderten Dynamikbereich-Charakteristiken zu erhalten, wobei das Modifizieren als Reaktion auf den einen oder die mehreren zweiten Parameter angepasst wird, falls die Metadaten den einen oder die mehreren zweiten Parameter beinhalten, oder als Reaktion auf den einen oder die mehreren ersten Parameter angepasst wird, falls die Metadaten den einen oder die mehreren zweiten Parameter nicht beinhalten;
    Anwenden einer Synthesefilterbank an den modifizierten Teilbandsignalen, um ein Zeitbereich-Audiosignal zu erhalten; und
    falls die Metadaten den einen oder die mehreren zweiten Parameter nicht beinhalten, Anwenden einer Verstärkung und eines Begrenzers an dem Zeitbereich-Audiosignal als Reaktion auf die Metadaten, wobei die Anwendung der Verstärkung das Zeitbereich-Audiosignal modifiziert, um das Audioausgangssignal mit Amplituden für ein Playback mit dem zweiten Referenzwiedergabepegel zu erhalten, und wobei die Anwendung des Begrenzers verhindert, dass die Amplituden des Audioausgangssignals den Abschneidepegel überschreiten.
  2. Verfahren nach Anspruch 1, wobei der eine oder die mehreren zweiten Parameter Differenzen zwischen entsprechenden Parametern für das erste Dynamikbereich-Komprimierungsprofil und das zweite Dynamikbereich-Komprimierungsprofil repräsentieren.
  3. Verfahren nach Anspruch 1 oder 2, wobei das codierte Eingangssignal dem ATSC-Standard, dem MPEG-2-AAC-Standard oder dem MPEG-4-Audiostandard entspricht, der erste Referenzwiedergabepegel einer Amplitude von 20 dB unter dem Abschneidepegel entspricht und der zweite Referenzwiedergabepegel einer Amplitude von 11 dB unter dem Abschneidepegel entspricht.
  4. Verfahren zum Codieren eines Audioeingangssignals, das aurale Anregungen repräsentiert, wobei das Verfahren Folgendes umfasst:
    Empfangen des Audioeingangssignals;
    Anwenden einer ersten Analysefilterbank an dem Audioeingangssignal, um Teilbandsignale zu erzeugen, die einen spektralen Inhalt des Audioeingangssignals repräsentieren;
    Analysieren eines oder mehrerer Signale, die aus dem Audioeingangssignal abgeleitet werden, um Metadaten einschließlich eines oder mehrerer erster Parameter, die eine Dynamikbereich-Komprimierung gemäß einem ersten Dynamikbereich-Komprimierungsprofil spezifizieren, und eines oder mehrerer zweiter Parameter, die eine Dynamikbereich-Komprimierung gemäß einem zweiten Dynamikbereich-Komprimierungsprofil spezifizieren, zu berechnen, wobei der eine oder die mehreren ersten Parameter Werte aufweisen, die festgelegt werden, um die auralen Anregungen mit Amplituden, die einen Abschneidepegel nicht überschreiten, für ein Playback mit einem ersten Referenzwiedergabepegel zu repräsentieren, und
    wobei der eine oder die mehreren zweiten Parameter Werte aufweisen, die festgelegt werden, um die auralen Anregungen mit Amplituden, die den Abschneidepegel nicht überschreiten, für ein Playback mit einem zweiten Referenzwiedergabepegel zu repräsentieren;
    Anwenden eines Codierungsprozesses an den Teilbandsignalen, um codierte Audioinformationen zu erhalten; und
    Zusammenstellen der codierten Audioinformationen und der Metadaten in ein codiertes Ausgangssignal mit einem Format, das sich zur Übertragung oder Speicherung eignet, wobei der eine oder die mehreren zweiten Parameter Differenzen zwischen entsprechenden Parametern für das erste Dynamikbereich-Komprimierungsprofil und das zweite Dynamikbereich-Komprimierungsprofil repräsentieren.
  5. Verfahren nach Anspruch 4, wobei das codierte Ausgangssignal dem ATSC-Standard, dem MPEG-2-AAC-Standard oder dem MPEG-4-Audiostandard entspricht, der erste Referenzwiedergabepegel einer Amplitude von 20 dB unter dem Abschneidepegel entspricht und der zweite Referenzwiedergabepegel einer Amplitude von 11 dB unter dem Abschneidepegel entspricht.
  6. Verfahren zum Transcodieren eines codierten Eingangssignals, um ein codiertes Ausgangssignal zu erzeugen, wobei das Verfahren Folgendes umfasst:
    Empfangen des codierten Eingangssignals, das erste codierte Audioinformationen und assoziierte Metadaten einschließlich eines oder mehrerer Decodierungssteuerungsparameter und eines oder mehrerer erster Parameter, die eine Dynamikbereich-Komprimierung gemäß einem ersten Dynamikbereich-Komprimierungsprofil spezifizieren, beinhaltet, wobei der eine oder die mehreren ersten Parameter Werte aufweisen, die gemäß einem ersten Codierungsprozess festgelegt wurden, der die ersten codierten Audioinformationen erzeugte, um aurale Anregungen mit Amplituden, die einen Abschneidepegel nicht überschreiten, für ein Playback mit einem ersten Referenzwiedergabepegel zu repräsentieren;
    Anwenden eines Decodierungsprozesses an den ersten codierten Audioinformationen, um Teilbandsignale zu erhalten, die einen spektralen Inhalt der auralen Anregungen repräsentieren, wobei der Decodierungsprozess als Reaktion auf den einen oder die mehreren Decodierungssteuerungsparameter angepasst wird;
    Analysieren eines oder mehrerer Signale, die aus den Teilbandsignalen erhalten werden, um einen oder mehrere zweite Parameter zu berechnen, die eine Dynamikbereich-Komprimierung gemäß einem zweiten Dynamikbereich-Komprimierungsprofil spezifizieren, wobei der eine oder die mehreren zweiten Parameter Werte aufweisen, die festgelegt werden, um die auralen Anregungen mit Amplituden, die den Abschneidepegel nicht überschreiten, für ein Playback mit einem zweiten Referenzwiedergabepegel zu repräsentieren; und
    Zusammenstellen von zweiten codierten Audioinformationen, des einen oder der mehreren ersten Parameter und des einen oder der mehreren zweiten Parameter in ein codiertes Ausgangssignal mit einem Format, das sich zur Übertragung oder Speicherung eignet, wobei die zweiten codierten Audioinformationen eine codierte Repräsentation der Teilbandsignale sind.
  7. Verfahren nach Anspruch 6, wobei der eine oder die mehreren zweiten Parameter Differenzen zwischen entsprechenden Parametern für das erste Dynamikbereich-Komprimierungsprofil und das zweite Dynamikbereich-Komprimierungsprofil repräsentieren.
  8. Verfahren nach Anspruch 6 oder 7, das Anwenden einer Synthesefilterbank an den Teilbandsignalen umfasst, um das eine oder die mehreren Signale zu erhalten, die zum Berechnen des einen oder der mehreren zweiten Parameter, die eine Dynamikbereich-Komprimierung spezifizieren, analysiert werden.
  9. Verfahren nach einem der Ansprüche 6 bis 8, das Anwenden eines zweiten Codierungsprozesses an den Teilbandsignalen umfasst, um die zweiten codierten Audioinformationen zu erzeugen.
  10. Verfahren nach einem der Ansprüche 6 bis 8, wobei die zweiten codierten Audioinformationen die ersten codierten Audioinformationen sind.
  11. Verfahren nach einem der Ansprüche 6 bis 10, wobei das codierte Eingangssignal dem ATSC-Standard, dem MPEG-2-AAC-Standard oder dem MPEG-4-Audiostandard entspricht und der erste Referenzwiedergabepegel einer Amplitude von 20 dB unter dem Abschneidepegel entspricht.
  12. Verfahren nach einem der Ansprüche 6 bis 10, wobei das codierte Ausgangssignal dem ATSC-Standard, dem MPEG-2-AAC-Standard oder dem MPEG-4-Audiostandard entspricht und der zweite Referenzwiedergabepegel einer Amplitude von 11 dB unter dem Abschneidepegel entspricht.
  13. Vorrichtung, die Mittel zum Durchführen der Schritte des Verfahrens nach einem der Ansprüche 1 bis 12 umfasst.
  14. Speichermedium, das ein Programm von Anweisungen aufzeichnet, das durch eine Einrichtung zum Durchführen der Schritte des Verfahrens nach einem der Ansprüche 1 bis 12 ausgeführt werden kann.
HK13105360.6A 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices HK1178669B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US61/303,643 2010-02-11

Publications (2)

Publication Number Publication Date
HK1178669A HK1178669A (en) 2013-09-13
HK1178669B true HK1178669B (en) 2019-08-30

Family

ID=

Similar Documents

Publication Publication Date Title
US11948592B2 (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40079884A (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40117711B (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40117711A (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40117710A (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40117710B (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40079884B (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40002961A (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40002961B (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK1178669B (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK1178669A (en) System and method for non-destructively normalizing loudness of audio signals within portable devices