[go: up one dir, main page]

HK1218461B - Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm - Google Patents

Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm Download PDF

Info

Publication number
HK1218461B
HK1218461B HK16106405.8A HK16106405A HK1218461B HK 1218461 B HK1218461 B HK 1218461B HK 16106405 A HK16106405 A HK 16106405A HK 1218461 B HK1218461 B HK 1218461B
Authority
HK
Hong Kong
Prior art keywords
audio signal
estimated
adaptive codebook
weighted
algorithm
Prior art date
Application number
HK16106405.8A
Other languages
English (en)
French (fr)
Chinese (zh)
Other versions
HK1218461A1 (en
Inventor
Emmanuel Ravelli
Stefan DÖHLA
Guillaume Fuchs
Eleni FOTOPOULOU
Christian Helmrich
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority claimed from PCT/EP2014/051557 external-priority patent/WO2014118136A1/en
Publication of HK1218461A1 publication Critical patent/HK1218461A1/en
Publication of HK1218461B publication Critical patent/HK1218461B/en

Links

Claims (23)

  1. Vorrichtung (10) zum Auswählen entweder eines ersten Codieralgorithmus mit einer ersten Charakteristik oder eines zweiten Codieralgorithmus mit einer zweiten Charakteristik zum Codieren eines Abschnitts eines Audiosignals (40), um eine codierte Version des Abschnitts des Audiosignals (40) zu erhalten, die folgende Merkmale aufweist:
    eine erste Schätzeinrichtung (12) zum Schätzen eines ersten Qualitätsmaßes für den Abschnitt des Audiosignals, wobei das erste Qualitätsmaß dem ersten Codieralgorithmus zugeordnet ist, ohne den Abschnitt des Audiosignals tatsächlich unter Verwendung des ersten Codieralgorithmus zu codieren und decodieren;
    eine zweite Schätzeinrichtung (14) zum Schätzen eines zweiten Qualitätsmaßes für den Abschnitt des Audiosignals, wobei das zweite Qualitätsmaß dem zweiten Codieralgorithmus zugeordnet ist, ohne den Abschnitt des Audiosignals tatsächlich unter Verwendung des zweiten Codieralgorithmus zu codieren und decodieren; und
    eine Steuerung (16) zum Auswählen des ersten Codieralgorithmus oder des zweiten Codieralgorithmus auf der Basis eines Vergleichs zwischen dem ersten Qualitätsmaß und dem zweiten Qualitätsmaß,
    wobei das erste und das zweite Qualitätsmaß Signal-Rausch-Verhältnisse, SNRs, oder Segment-SNRs des entsprechenden Abschnitts einer gewichteten Version des Audiosignals sind.
  2. Vorrichtung (10) gemäß Anspruch 1, bei der der erste Codieralgorithmus ein Transformationscodieralgorithmus, ein Codieralgorithmus auf Basis einer modifizierten diskreten Cosinustransformation, MDCT, oder ein Codieralgorithmus einer Transformationscodieranregung, TCX, ist und bei der der zweite Codieralgorithmus ein Codieralgorithmus einer codeangeregten Linearvorhersage, CELP, oder ein Codieralgorithmus einer algebraischen codeangeregten Linearvorhersage, ACELP, ist.
  3. Vorrichtung (10) gemäß einem der Ansprüche 1 oder 2, bei der die erste Schätzeinrichtung (12) konfiguriert ist, eine geschätzte Quantisiererverzerrung zu bestimmen, die ein Quantisierer, der bei dem ersten Codieralgorithmus verwendet wird, beim Quantisieren des Abschnitts des Audiosignals einführen würde, und das erste Qualitätsmaß auf der Basis einer Energie eines Abschnitts einer gewichteten Version des Audiosignals und der geschätzten Quantisiererverzerrung zu schätzen.
  4. Vorrichtung (10) gemäß Anspruch 3, bei der die erste Schätzeinrichtung (12) konfiguriert ist, einen globalen Gewinn für den Abschnitt des Audiosignals derart zu schätzen, dass der Abschnitt des Audiosignals bei Codierung mit einem Quantisierer und einem Entropiecodierer, die bei dem ersten Codieralgorithmus verwendet werden, eine bestimmte Ziel-Bitrate erzeugen würde, wobei die erste Schätzeinrichtung (12) ferner konfiguriert ist, die geschätzte Quantisiererverzerrung auf der Basis einer Leistung des geschätzten globalen Gewinns zu bestimmen, wobei der Quantisierer, der bei dem ersten Codieralgorithmus verwendet wird, ein gleichförmiger Skalar-Quantisierer ist und wobei die erste Schätzeinrichtung (12) konfiguriert ist, die geschätzte Quantisiererverzerrung unter Verwendung der Formel D = G*G/12 zu bestimmen, wobei D die geschätzte Quantisiererverzerrung ist und G der geschätzte globale Gewinn ist.
  5. Vorrichtung (10) gemäß einem der Ansprüche 3 oder 4, bei der das erste Qualitätsmaß ein Segment-SNR eines Abschnitts des gewichteten Audiosignals ist und bei der die erste Schätzeinrichtung (12) konfiguriert ist, das Segment-SNR durch Berechnen eines geschätzten SNR, das jedem einer Mehrzahl von Teilabschnitten des Abschnitts des gewichteten Audiosignals zugeordnet ist, auf der Basis einer Energie der entsprechenden Teilabschnitte des gewichteten Audiosignals und der geschätzten Quantisiererverzerrung und durch Berechnen eines Mittelwerts der SNRs zu schätzen, die den Teilabschnitten des Abschnitts des gewichteten Audiosignals zugeordnet sind, um das geschätzte Segment-SNR für den Abschnitt des gewichteten Audiosignals zu erhalten.
  6. Vorrichtung (10) gemäß einem der Ansprüche 1 bis 5, bei der die zweite Schätzeinrichtung (14) konfiguriert ist, eine geschätzte adaptive Codebuchverzerrung zu bestimmen, die ein adaptives Codebuch, das bei dem zweiten Codieralgorithmus verwendet wird, bei Verwendung des adaptiven Codebuchs zum Codieren des Abschnitts des Audiosignals einführen würde, und bei der die zweite Schätzeinrichtung (14) konfiguriert ist, das zweite Qualitätsmaß auf der Basis einer Energie eines Abschnitts einer gewichteten Version des Audiosignals und der geschätzten adaptiven Codebuchverzerrung zu schätzen, wobei für jeden einer Mehrzahl von Teilabschnitten des Abschnitts des Audiosignals die zweite Schätzeinrichtung (14) konfiguriert ist, das adaptive Codebuch auf der Basis einer Version des Teilabschnitts des gewichteten Audiosignals anzunähern, das durch ein Tonhöhenacheilen, das in einer Vorverarbeitungsstufe bestimmt wird, in die Vergangenheit verschoben ist, einen adaptiven Codebuchgewinn derart zu schätzen, dass ein Fehler zwischen dem Teilabschnitt des Abschnitts des gewichteten Audiosignals und dem angenäherten adaptiven Codebuch minimiert ist, und die geschätzte adaptive Codebuchverzerrung auf der Basis der Energie eines Fehlers zwischen dem Teilabschnitt des Abschnitts des gewichteten Audiosignals und dem angenäherten adaptiven Codebuch zu bestimmen, das durch den adaptiven Codebuchgewinn skaliert ist.
  7. Vorrichtung (10) gemäß Anspruch 6, bei der die zweite Schätzeinrichtung (14) ferner konfiguriert ist, die geschätzte adaptive Codebuchverzerrung, die für jeden Teilabschnitt des Abschnitts des Audiosignals bestimmt wird, um einen konstanten Faktor zu reduzieren.
  8. Vorrichtung (10) gemäß Anspruch 6 oder 7, bei der das zweite Qualitätsmaß ein Segment-SNR des Abschnitts des gewichteten Audiosignals ist und bei der die zweite Schätzeinrichtung (14) konfiguriert ist, das Segment-SNR durch Berechnen eines geschätzten SNR, das jedem Teilabschnitt zugeordnet ist, auf der Basis der Energie des entsprechenden Teilabschnitts des gewichteten Audiosignals und der geschätzten adaptiven Codebuchverzerrung und durch Berechnen eines Mittelwerts der SNRs zu schätzen, die den Teilabschnitten zugeordnet sind, um das geschätzte Segment- SNR für den Abschnitt des gewichteten Audiosignals zu erhalten.
  9. Vorrichtung (10) gemäß Anspruch 6, bei der die zweite Schätzeinrichtung (14) konfiguriert ist, das adaptive Codebuch auf der Basis einer Version des Abschnitts des gewichteten Audiosignals anzunähern, das durch ein Tonhöhenacheilen, das bei einer Vorverarbeitungsstufe bestimmt wird, in die Vergangenheit verschoben ist, den adaptiven Codebuchgewinn derart zu schätzen, dass ein Fehler zwischen dem Abschnitt des gewichteten Audiosignals und dem angenäherten adaptiven Codebuch minimiert ist, und die geschätzte adaptive Codebuchverzerrung auf der Basis der Energie eines Fehlers zwischen dem Abschnitt des gewichteten Audiosignals und dem angenäherten adaptiven Codebuch zu bestimmen, das durch den adaptiven Codebuchgewinn skaliert ist.
  10. Vorrichtung (10) gemäß einem der Ansprüche 1 bis 9, bei der die Steuerung (16) konfiguriert ist, beim Vergleichen der geschätzten Qualitätsmaße eine Hysterese zu nutzen.
  11. Vorrichtung (20) zum Codieren eines Abschnitts eines Audiosignals, die die Vorrichtung (10) gemäß einem der Ansprüche 1 bis 10, eine erste Codiererstufe (26) zum Durchführen des ersten Codieralgorithmus und eine zweite Codiererstufe (28) zum Durchführen des zweiten Codieralgorithmus aufweist, wobei die Vorrichtung zum Codieren (20) konfiguriert ist, den Abschnitt des Audiosignals unter Verwendung des ersten Codieralgorithmus oder des zweiten Codieralgorithmus in Abhängigkeit von der Auswahl durch die Steuerung (16) zu codieren.
  12. System zum Codieren und Decodieren, das eine Vorrichtung (20) zum Codieren gemäß Anspruch 11 und einen Decodierer aufweist, der konfiguriert ist, die codierte Version des Abschnitts des Audiosignals und eine Anzeige des Algorithmus zu empfangen, der zum Codieren des Abschnitts des Audiosignals und zum Decodieren der codierten Version des Abschnitts des Audiosignals unter Verwendung des angezeigten Algorithmus verwendet wird.
  13. Verfahren zum Auswählen entweder eines ersten Codieralgorithmus mit einer ersten Charakteristik oder eines zweiten Codieralgorithmus mit einer zweiten Charakteristik zum Codieren eines Abschnitts eines Audiosignals, um eine codierte Version des Abschnitts des Audiosignals zu erhalten, das folgende Schritte aufweist:
    Schätzen eines ersten Qualitätsmaßes für den Abschnitt des Audiosignals, wobei das erste Qualitätsmaße dem ersten Codieralgorithmus zugeordnet ist, ohne den Abschnitt des Audiosignals tatsächlich unter Verwendung des ersten Codieralgorithmus zu codieren und decodieren;
    Schätzen eines zweiten Qualitätsmaßes für den Abschnitt des Audiosignals, wobei das zweite Qualitätsmaß dem zweiten Codieralgorithmus zugeordnet ist, ohne den Abschnitt des Audiosignals tatsächlich unter Verwendung des zweiten Codieralgorithmus zu codieren und decodieren; und
    Auswählen des ersten Codieralgorithmus oder des zweiten Codieralgorithmus auf der Basis eines Vergleichs zwischen dem ersten Qualitätsmaß und dem zweiten Qualitätsmaß,
    wobei das erste und das zweite Qualitätsmaß Signal-Rausch-Verhältnisse, SNRs, oder Segment-SNRs des entsprechenden Abschnitts einer gewichteten Version des Audiosignals sind.
  14. Verfahren gemäß Anspruch 13, bei dem der erste Codieralgorithmus ein Transformationscodieralgorithmus, ein Codieralgorithmus auf Basis einer modifizierten diskreten Cosinustransformation, MDCT, oder ein Codieralgorithmus einer Transformationscodieranregung, TCX, ist und bei dem der zweite Codieralgorithmus ein Codieralgorithmus einer codeangeregten Linearvorhersage, CELP, oder ein Codieralgorithmus einer algebraischen codeangeregten Linearvorhersage, ACELP, ist.
  15. Verfahren gemäß einem der Ansprüche 13 oder 14, das Schritte eines Bestimmens (108) einer geschätzten Quantisiererverzerrung, die ein Quantisierer, der bei dem ersten Codieralgorithmus verwendet wird, beim Quantisieren des Abschnitts des Audiosignals einführen würde, und eines Bestimmens des Qualitätsmaßes auf der Basis einer Energie eines Abschnitts einer gewichteten Version des Audiosignals und der geschätzten Quantisiererverzerrung aufweist.
  16. Verfahren gemäß Anspruch 15, das Schritte eines Schätzens (106) eines globalen Gewinns für den Abschnitt des Audiosignals auf eine Art, dass der Abschnitt des Audiosignals bei Codierung mit einem Quantisierer und einem Entropiecodierer, die bei dem ersten Codieralgorithmus verwendet werden, eine bestimmte Ziel-Bitrate erzeugen würde, und eines Bestimmens (108) der geschätzten Quantisiererverzerrung auf der Basis einer Leistung des geschätzten globalen Gewinns aufweist, wobei der Quantisierer ein gleichförmiger Skalar-Quantisierer ist, wobei die geschätzte Quantisiererverzerrung unter Verwendung der Formel D = G*G/12 bestimmt wird, wobei D die geschätzte Quantisiererverzerrung und G der geschätzte globale Gewinn ist.
  17. Verfahren gemäß einem der Ansprüche 15 oder 16, bei dem das erste Qualitätsmaß ein Segment-SNR der gefilterten Version mit Linearvorhersagecodierung, LPC, eines Abschnitts des gewichteten Audiosignals ist und das einen Schritt eines Schätzens des ersten Segment-SNR durch Berechnen eines geschätzten SNR, das jedem einer Mehrzahl von Teilabschnitten des Abschnitts des gewichteten Audiosignals zugeordnet ist, auf der Basis einer Energie der entsprechenden Teilabschnitte des gewichteten Audiosignals und der geschätzten Quantisiererverzerrung und durch Berechnen eines Mittelwerts der SNRs aufweist, die den Teilabschnitten des Abschnitts des gewichteten Audiosignals zugeordnet sind, um das geschätzte Segment-SNR für den Abschnitt des gewichteten Audiosignals zu erhalten.
  18. Verfahren gemäß einem der Ansprüche 13 bis 17, das Schritte eines Bestimmens einer geschätzten adaptiven Codebuchverzerrung (116), die ein adaptives Codebuch, das bei dem zweiten Codieralgorithmus verwendet wird, bei Verwendung des adaptiven Codebuchs zum Codieren des Abschnitts des Audiosignals einführen würde, und eines Schätzens des zweiten Qualitätsmaßes auf der Basis einer Energie eines Abschnitts einer gewichteten Version des Audiosignals und der geschätzten adaptiven Codebuchverzerrung aufweist und das für jeden einer Mehrzahl von Teilabschnitten des Abschnitts des Audiosignals Schritte eines Annäherns (112) des adaptiven Codebuchs auf der Basis einer Version des Teilabschnitts des gewichteten Audiosignals, das durch ein Tonhöhenacheilen, das bei einer Vorverarbeitungsstufe bestimmt wird, in die Vergangenheit verschoben ist, eines Schätzens (114) eines adaptiven Codebuchgewinns auf eine Art, dass ein Fehler zwischen dem Teilabschnitt des Abschnitts des gewichteten Audiosignals und dem angenäherten adaptiven Codebuch minimiert ist, und eines Bestimmens (116) der geschätzten adaptiven Codebuchverzerrung auf der Basis der Energie eines Fehlers zwischen dem Teilabschnitt des Abschnitts des gewichteten Audiosignals und dem angenäherten adaptiven Codebuch, das durch den adaptiven Codebuchgewinn skaliert ist, aufweist.
  19. Verfahren gemäß Anspruch 18, das einen Schritt eines Reduzierens (118) der geschätzten adaptiven Codebuchverzerrung, die für jeden Teilabschnitt des Abschnitts des Audiosignals bestimmt wird, um einen konstanten Faktor aufweist.
  20. Verfahren gemäß Anspruch 18 oder 19, bei dem das zweite Qualitätsmaß ein Segment-SNR des Abschnitts des gewichteten Audiosignals ist und das einen Schritt eines Schätzens des Segment-SNR durch Berechnen eines geschätzten SNR, das jedem Teilabschnitt zugeordnet ist, auf der Basis der Energie des entsprechenden Teilabschnitts des gewichteten Audiosignals und der geschätzten adaptiven Codebuchverzerrung und durch Berechnen eines Mittelwerts der SNRs aufweist, die den Teilabschnitten zugeordnet sind, um das geschätzte Segment-SNR für den Abschnitt des gewichteten Audiosignals zu erhalten.
  21. Verfahren gemäß Anspruch 18, das Schritte eines Annäherns des adaptiven Codebuchs auf der Basis einer Version des Abschnitts des gewichteten Audiosignals, das durch ein Tonhöhenacheilen, das in einer Vorverarbeitungsstufe bestimmt wird, in die Vergangenheit verschoben ist, eines Schätzens eines adaptiven Codebuchgewinns auf eine Art, dass ein Fehler zwischen dem Abschnitt des gewichteten Audiosignals und dem angenäherten adaptiven Codebuch minimiert ist, und eines Bestimmens der geschätzten adaptiven Codebuchverzerrung auf der Basis der Energie eines Fehlers zwischen dem Abschnitt des gewichteten Audiosignals und dem angenäherten adaptiven Codebuch aufweist, das durch den adaptiven Codebuchgewinn skaliert ist.
  22. Verfahren gemäß einem der Ansprüche 13 bis 21, das einen Schritt eines Nutzens einer Hysterese beim Vergleichen der geschätzten Qualitätsmaße aufweist.
  23. Computerprogramm mit einem Programmcode zum Durchführen des Verfahrens gemäß einem der Ansprüche 13 bis 22, wenn dasselbe auf einem Computer läuft.
HK16106405.8A 2013-01-29 2014-01-28 Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm HK1218461B (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361758100P 2013-01-29 2013-01-29
US61/758,100 2013-01-29
PCT/EP2014/051557 WO2014118136A1 (en) 2013-01-29 2014-01-28 Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm

Publications (2)

Publication Number Publication Date
HK1218461A1 HK1218461A1 (en) 2017-02-17
HK1218461B true HK1218461B (en) 2018-02-02

Family

ID=

Similar Documents

Publication Publication Date Title
US11908485B2 (en) Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm
US10706865B2 (en) Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
CN103493129B (zh) 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
CA2910878C (en) Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
HK1218461B (en) Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm
HK1222943B (en) Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction