[go: up one dir, main page]

DE112008003153T5 - Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen und dieses Verfahren verwendendes Verfahren zum Formen von transientem Rauschen - Google Patents

Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen und dieses Verfahren verwendendes Verfahren zum Formen von transientem Rauschen Download PDF

Info

Publication number
DE112008003153T5
DE112008003153T5 DE112008003153T DE112008003153T DE112008003153T5 DE 112008003153 T5 DE112008003153 T5 DE 112008003153T5 DE 112008003153 T DE112008003153 T DE 112008003153T DE 112008003153 T DE112008003153 T DE 112008003153T DE 112008003153 T5 DE112008003153 T5 DE 112008003153T5
Authority
DE
Germany
Prior art keywords
frequency band
transient
tns
quantization noise
audio signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE112008003153T
Other languages
English (en)
Other versions
DE112008003153B4 (de
Inventor
Taejin Lee
Minje Kim
Seungkwon Beack
Dae-Young Jang
Kyeongok Kang
Jeong-Il Seo
Jinwoo Hong
Hochong Seongnam Park
Rin-Chul Kim
Jeong-Geun Osan Kim
Youngcheol Wonju Park
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Research Institute for Industry Cooperation of Kwangwoon University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI, Research Institute for Industry Cooperation of Kwangwoon University filed Critical Electronics and Telecommunications Research Institute ETRI
Priority claimed from PCT/KR2008/005918 external-priority patent/WO2009066869A1/en
Publication of DE112008003153T5 publication Critical patent/DE112008003153T5/de
Application granted granted Critical
Publication of DE112008003153B4 publication Critical patent/DE112008003153B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen, das umfasst:
Prüfen, ob Audiosignale, die von einer Tiefpassfilterung erhalten werden, transient sind;
Bestimmen eines vorgegebenen Frequenzbandes, um es als ein Frequenzband anzuwenden, das zum Formen von Quantisierungsrauschen anzuwenden ist, wenn die Audiosignale nicht transient sind; und
Bestimmen eines erweiterten Frequenzbandes, das über das vorgegebene Frequenzband hinaus erweitert ist, um es als ein Frequenzband anzuwenden, das anzuwenden ist, wenn die Audiosignale transient sind.

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung bezieht sich auf ein Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen und auf ein dieses Verfahren verwendendes Verfahren zum Formen von transientem Rauschen. Insbesondere formt das Verfahren das Rauschen unter Verwendung eines langen Blocks und reduziert ein Vorecho und musikalisches Rauschen durch Ausrechnen, ob ein angewendetes Frequenzband ein allgemeines Frequenzband und ein erweitertes Frequenzband ist, anhand der Tatsache, ob Audiosignale transiente Signale sind.
  • Diese Arbeit wurde unterstützt durch das IT R&D-Programm für MIC/IITA [2007-S-005-01, "Development of Richmedia Broadcasting Technologies through Advanced Audio and Video Codec Technologies"].
  • Technischer Hintergrund
  • In einer hocheffizienten fortschrittlichen Audiocodierungstechnologie (High Efficiency Advanced Audio Coding, HE-AAC) wird ein Algorithmus zum Formen temporalen Rauschens (Temporal Noise Shaping, TNS), der einer von Algorithmen zum Formen von Quantisierungsrauschen ist, verwendet, um transiente Signale effektiv darzustellen. Daher verringert der TNS-Algorithmus ein Vorecho.
  • Trotz der Verwendung des TNS-Algorithmus treten jedoch bei niedrigen Bitraten häufig das Vorecho und das musikalische Rauschen auf.
  • Um in der HE-ACC-Audiocodierungstechnologie eine Klangqualität mit wahrnehmbar transparenter Codierung zu erfassen, sollte das Quantisierungsrauschen einen Maskierungsschwellenwert nicht übersteigen. In einer Wahrnehmungs-Codierungstechnologie, die ein Frequenzsignal-Analyseverfahren verwendet, wird jedoch das Quantisierungsrauschen codiert und dann im Zeitbereich weit gespreizt. Daher ist es bei niedrigen Bitraten schwierig, die Bedingung zu erfüllen, dass das Quantisierungsrauschen den Maskierungsschwellenwert im Zeitbereich nicht übersteigt.
  • Beispielsweise ist in der AAC-Audiocodierungstechnologie, die im Allgemeinen 1024 modifizierte diskrete Kosinustransformationskoeffizienten (Modified Discrete Cosine Transform, MDCT) verwendet, ein Quantisierungsrauschen mit einer 48-kMz-Abtastrate über 40 ms verteilt. Diese Verteilung kann hörbare Artefakte hervorrufen, wenn die Signale transiente Signale sind. Zu diesem Zeitpunkt kann das Quantisierungsrauschen wahrnehmbar detektiert werden, bevor die transienten Signale erzeugt werden. Dieses Quantisierungsrauschen wird Vorecho-Phänomen genannt.
  • In dem TNS-Algorithmus, der entwickelt worden ist, um mit dem Vorecho-Phänomen effektiv umzugehen, wird die Form des Quantisierungsrauschens, das im Zeitbereich weit gespreizt ist, eingestellt, um eine Maskierungswirkung zu haben.
  • Der TNS-Algorithmus verwendet eine lineare prädiktive Codierung (Linear Predictive Coding, LPC), die auf einer Dualität zwischen dem Zeitbereich und einem Frequenzbereich basiert. Tabelle 1 erläutert ein optimales Codierungsverfahren für Tonsignale und transiente Signale hinsichtlich der Dualität.
  • Tabelle 1
    Figure 00020001
  • Das heißt, dass im Frequenzbereich das optionale Codierungsverfahren für die Tonsignale mit einer bestimmten Frequenz ein direktes Codierungsverfahren ist, das eine Frequenzkoeffizientencodierung verwendet. Im Zeitbereich ist das optimale Codierungsverfahren für die Tonsignale mit einer bestimmten Frequenz ein prädiktives Codierungsverfahren, das eine LPC-Codierung verwendet.
  • Wenn hingegen die Dualität betrachtet wird, ist im Frequenzbereich das optimale Codierungsverfahren für die transienten Signale das prädiktive Codierungsverfahren, das die Frequenzkoeffizienten-Prädiktionscodierung verwendet. Im Zeitbereich ist das optionale Codierungsverfahren für die transienten Signale das direkte Codierungsverfahren, das die Zeitabtastcodierung verwendet.
  • Der TNS-Algorithmus wird anhand des prädiktiven Codierungsverfahrens im Frequenzbereich angewendet.
  • Tabelle 2 zeigt das Frequenzband, das TNS anwendet. Tabelle 2
    Arten von Blöcken langer Block kurzer Block
    Frequenzband, das TNS anwendet 1275 Hz~ 2750 H~
  • Hierbei ist der TNS-Frequenzbereich (Band) entsprechend der Blocklänge in einen langen Block und einen kurzen Block klassifiziert. Das Frequenzband, das den TNS-Algorithmus anwendet, beträgt mehr als 1275 Hz für den langen Block und mehr als 2750 Hz für den kurzen Block.
  • Das heißt, dass im langen Block der TNS-Algorithmus auf einen Frequenzbereich von einem Frequenzband von 1800 Hz bis zu einer Grenzfrequenz, bei der eine Spektralbandreplizierung (Spectrum Band Replication, SBR) beginnt, angewendet wird. Andererseits wird im kurzen Block der TNS-Algorithmus auf einen Frequenzbereich von einem Frequenzband von 2750 Hz bis zu der Grenzfrequenz, bei der die SBR beginnt, angewendet. In einem Band unterhalb der obigen Frequenzbänder tritt das Vorecho häufig auf.
  • Um das Vorecho weiter zu reduzieren, wird ein Blockschalten ausgeführt. Das Blockschalten bezeichnet das Verfahren des Ersetzens eines langen Fensters mit einer Rahmenlänge durch ein kurzes Fenster mit 1/8 der Rahmenlänge. Das Blockschalten zwischen dem langen Block und dem kurzen Block dient dazu, das Vorecho durch Anwenden des Quantisierungsrauschen-Effekts nur im kurzen Block wahrnehmbar zu verbessern.
  • Wenn jedoch die Signale stabil sind und die Bitrate niedrig ist, kann das kurze Fenster einen gegenteiligen Effekt hervorrufen. Da das Bit in der niedrigen Bitrate unzureichend ist, werden Frequenzkomponenten, die in jedem kurzen Block verloren gegangen sind, als spektrale Löcher gezeigt. Die spektralen Löcher sind auf einer Zeitachse in einem entsprechenden Rahmen diskontinuierlich verbunden, um das musikalische Rauschen hervorzurufen. Das heißt, dass bei der niedrigen Bitrate mit unzureichendem Bit dann, wenn der lange Block statt des kurzen Blocks verwendet wird, das Vorecho auftritt. Außerdem tritt bei niedriger Bitrate mit unzureichendem Bit dann, wenn der kurze Block übermäßig verwendet wird, das musikalische Rauschen auf.
  • Offenbarung der Erfindung
  • Technisches Problem
  • Eine Ausführungsform der vorliegenden Erfindung ist darauf gerichtet, ein Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen und ein dieses Verfahren verwendendes Verfahren zum Formen von transientem Rauschen zu schaffen.
  • In der herkömmlichen Technologie zum Formen von temporalem Rauschen (Temporal Noise Shaping, TNS) kann dann, wenn die Bitrate niedrig ist, ein Vorecho und musikalisches Rauschen in transienten Blöcken nicht verhindert werden. Eine Aufgabe der vorliegenden Erfindung ist es, die obigen Probleme zu lösen.
  • Somit schafft diese Erfindung ein Verfahren zum Bestimmen eines Frequenzbereichs zum Formen von Quantisierungsrauschen unter Verwendung eines langen Blocks in Übereinstimmung mit einem angewendeten Frequenzband, das als ein allgemeines Frequenzband oder als ein Erweiterungsfrequenzband klassifiziert ist, und in Abhängigkeit davon, ob Audiosignale transiente Signale sind, um das Vorecho und das musikalische Rauschen effektiv zu verringern, und ein dieses Verfahren verwendendes Verfahren zum Formen von transientem Rauschen.
  • Die Aufgaben der vorliegenden Erfindung sind nicht auf die oben erwähnten Aufgaben eingeschränkt. Andere Aufgaben und Vorteile der vorliegenden Erfindung können durch die folgende Beschreibung verstanden werden und werden mit Bezugnahme auf die Ausführungsformen der vorliegenden Erfindung deutlich. Außerdem ist für den Fachmann auf dem Gebiet der vorliegenden Erfindung klar, dass Aufgaben und Vorteile der vorliegenden Erfindung durch die Mittel, die beansprucht werden, und durch Kombinationen hiervon verwirklicht werden können.
  • Technische Lösung
  • Gemäß einem Aspekt der vorliegenden Erfindung wird ein Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen geschaffen, das umfasst: Prüfen, ob Audiosignale, die aus einer Tiefpassfilterung erhalten werden, transiente Signale sind, Bestimmen eines vorgegebenen Frequenzbandes, um es als ein Frequenzband anzuwenden, das auf das Formen des Quantisierungsrauschens anzuwenden ist, wenn die Audiosignale nicht transient sind, und Bestimmen eines erweiterten Frequenzbandes, das über das vorgegebene Frequenzband hinaus erweitert ist, um es als ein Frequenzband anzuwenden, das anzuwenden ist, wenn die Audiosignale transient sind.
  • Vorteilhafte Wirkungen
  • Diese Erfindung formt Quantisierungsrauschen von Audiosignalen unter Verwendung eines langen Blocks in Übereinstimmung mit einem Frequenzband für die Anwendung eines Algorithmus zum Formen von temporalem Rauschen (TNS-Algorithmus) und klassifiziert das Frequenzband in ein allgemeines Frequenzband und in ein Erweiterungsfrequenzband in Übereinstimmung damit, ob die Audiosignale transiente Signale sind. Somit können ein Vorecho und musikalisches Rauschen einfach verringert werden.
  • Daher ist in dieser Erfindung die Klangqualität besser als bei einem Verfahren zum Formen von Quantisierungsrauschen, das den herkömmlichen TNS-Algorithmus verwendet. Das Verfahren der vorliegenden Erfindung, das den langen Block verwendet, reduziert das Vorecho effektiver als das typische Verfahren. Ferner ist es möglich, nahezu die gleiche Leistung zu schaffen, die in dem Verfahren, das nur den kurzen Block verwendet, erhalten werden kann.
  • Daher wird in dieser Erfindung der kurze Block nicht übermäßig verwendet, wodurch das musikalische Rauschen reduziert werden kann.
  • Kurzbeschreibung der Zeichnungen
  • 1 ist eine Blockansicht, die eine Vorrichtung zum Verarbeiten des Formens von temporalem Rauschen (TNS-Verarbeitung) gemäß einer Ausführungsform der vorliegenden Erfindung zeigt.
  • 2 und 3 zeigen das Vorecho gemäß dem Transientenindex.
  • 4 ist ein Ablaufplan, der ein Verfahren zum Formen von Quantisierungsrauschen in einem niedrigen Frequenzband unter Verwendung eines langen Blocks gemäß einer Ausführungsform der vorliegenden Erfindung beschreibt.
  • Beste Art zum Ausführen der Erfindung
  • Die Vorteile, Merkmale und Aspekte der Erfindung werden anhand der folgenden Beschreibung der Ausführungsformen, die auf die beigefügten Zeichnungen Bezug nimmt und im Folgenden angegeben wird, deutlich. Daher kann der Fachmann auf dem Gebiet der vorliegenden Erfindung das technologische Konzept und den Umfang der Erfindung einfach ausführen. Falls ferner angenommen wird, dass eine genaue Beschreibung eines verwandten Gebiets einen Punkt der vorliegenden Erfindung verdunkeln könnte, wird die genaue Beschreibung hier nicht gegeben. Die bevorzugten Ausführungsformen der vorliegenden Erfindung werden im Folgenden im Einzelnen mit Bezug auf die beigefügten Zeichnungen beschrieben.
  • 1 ist eine Blockansicht, die eine Vorrichtung zum Verarbeiten des Formens eines temporalen Rauschens (TNS-Verarbeitung) gemäß einer Ausführungsform der vorliegenden Erfindung zeigt.
  • In 1 enthält eine TNS-Verarbeitungsvorrichtung 100 eine TNS-Bestimmungseinrichtung 110 und einen TNS-Codierer 120.
  • Die TNS-Verarbeitungsvorrichtung 100 formt das Quantisierungsrauschen in einem Zeitbereich in einem Filterbankfenster neu, um das Rauschen nicht wahrnehmbar zu machen. Im Folgenden wird die TNS-Verarbeitungsvorrichtung 100 in einer allgemeinen HE-ACC-Codierungsvorrichtung beschrieben.
  • Die TNS-Bestimmungseinrichtung 110 bestimmt, ob ein TNS-Prozess angewendet wird oder nicht.
  • Genauer multipliziert die TNS-Bestimmungseinrichtung 110 ein Gewicht wie in Gl. 1 gezeigt, um eine lineare prädiktive Codierung (LPC) eines im Voraus berechneten modifizierten diskreten Kosinustransformationsspektrums (MDCT-Spektrum) zu berechnen. Xw(k) = X(k)·wfac(k) (Gl. 1)wobei
    Figure 00070001
    wobei k und n eine MDCT-Koeffizienteneinheit bzw. eine Skalenfaktoreinheit darstellen.
  • Das heißt, dass Gl. 1 auf die Energie eines entsprechenden Skalenbandes normiert. Der MDCT-Spektrumsbereich wird auf einen vorgegebenen Bereich angewendet. Daher bestimmt die TNS-Bestimmungseinrichtung 110 einen Frequenzbereich (Band) für die Anwendung des LPC.
  • Die TNS-Bestimmungseinheit 110 wendet ein Glättungsfilter auf das normierte Spektrum an. Dies dient der LPC-Analyse. Die Glättungsfilterung bedeutet eine Abwärtsfilterung in einem Frequenzbandbereich von einer LPC-Unterbrechungsfrequenz zu einer LPC-Betriebsfrequenz durch den in Gl. 2 gezeigten Prozess.
    Figure 00080001
    wobei k und n eine MDCT-Koeffizienteneinheit bzw. eine Skalenfaktoreinheit darstellen.
  • Andererseits führt die TNS-Bestimmungseinrichtung 110 eine Aufwärtsfilterung in einem Frequenzbandbereich von der LPC-Betriebsfrequenz zu einer Kappungsfrequenz aus. Gl. 3 zeigt den Aufwärtsfilterungsprozess.
    Figure 00080002
    wobei k und n eine MDCT-Koeffizienteneinheit bzw. eine Skalenfaktoreinheit repräsentieren.
  • Die TNS-Bestimmungseinrichtung 110 berechnet eine Autokorrelationsfunktion und die LPC unter Verwendung eines Levinson-Durbin-Algorithmus. Die TNS-Bestimmungseinrichtung 110 erfasst einen partialen Autokorrelationskoeffizienten (Partial Autocorrelation Coefficient, PARCOR) und berechnet eine Vorhersageverstärkung auf der Grundlage des Rechenergebnisses unter Verwendung des Levinson-Durbin-Algorithmus.
  • Wenn die berechnete Vorhersageverstärkung einen Schwellenwert übersteigt, bestimmt die TNS-Bestimmungseinrichtung 110, dass die LPC an dem Spektrum ausgeführt werden sollte und dass ein TNS-Algorithmus auf das momentane Fenster angewendet werden sollte.
  • Der TNS-Codierer 120 führt eine Quantisierungssimulation in einer Reihenfolge von hohen zu niedrigen PARCOR-Koeffizienten aus, um die TNS-Reihenfolge und einen ersten Koeffizienten zu bestimmen, der nicht kleiner als der Schwellenwert, z. B. 0,1, ist. Dies dient dazu, nur effektive TNS-PARCOR-Koeffizienten zu verwenden.
  • Der TNS-Codierer 120 läuft durch ein LPC-Filter mit der bestimmten Reihenfolge und dem bestimmten Koeffizienten und wendet den TNS-Algorithmus auf den MDCT-Spektralkoeffizienten an, um die Codierung auszuführen. Die ACC-Codierung wird unter Verwendung des angewendeten MDCT-Spektralkoeffizienten ausgeführt.
  • Diese Erfindung erweitert den TNS-Algorithmus nach unten auf niedrige Frequenzen wie etwa 100 Hz und wendet ihn darauf an. Da hier der TNS-Algorithmus erweitert angewendet wird, wird das Vorecho verringert. Die Tonkomponenten der Frequenz, die den TNS-Algorithmus anwenden, d. h. die niedrigen Frequenzen, können jedoch verzerrt werden.
  • Daher verwendet diese Erfindung gleichzeitig den allgemeinen TNS-Algorithmus und den Erweiterungs-TNS-Algorithmus. Das bedeutet, dass diese Erfindung bestimmt, ob sie den allgemeinen TNS-Algorithmus oder den Erweiterungs-TNS-Algorithmus anwendet, woraufhin sie den TNS-Algorithmus auf der Grundlage des Bestimmungsergebnisses ausführt. Eine Referenz für die Bestimmung ist der Erweiterungsbereich der erweiterten niedrigen Frequenz.
  • Im Folgenden werden Bedingungen für die Bestimmung, ob der TNS-Algorithmus oder der Erweiterungs-TNS-Algorithmus angewendet wird, beschrieben.
  • Erstens bestimmt die TNS-Bestimmungseinrichtung 110, ob der allgemeine TNS-Algorithmus angewendet werden kann oder nicht. Wenn das Blockschaltergebnis nur im niedrigen Frequenzband transient ist, wendet die TNS-Bestimmungseinrichtung 110 den Erweiterungs-TNS-Algorithmus an.
  • Zweitens wendet die TNS-Bestimmungseinrichtung 110 den Erweiterungs-TNS-Algorithmus an, wenn die Vorhersageverstärkung in dem Frequenzband, das den TNS-Algorithmus bis zu 100 Hz erweitert anwendet, den Schwellenwert übersteigt und die transienten Signale mit erhöhter Energie sich zwischen dem vierten und dem siebten Rahmen von acht Rahmen befinden. Andererseits wendet die TNS-Bestimmungseinrichtung 110 den allgemeinen TNS-Algorithmus an, wenn die transienten Signale mit verringerter Energie sich zwischen dem nullten und dem dritten Rahmen von acht Rahmen befinden.
  • Der Transientenindex der transienten Signale 0 bis 7 gibt den Transientenindex an, der durch das Blockschalten zwischen dem kurzen Block und dem langen Block bestimmt wird. Jeder Block gibt die einzelnen Punkte an, an denen der entsprechende Rahmen in acht Rahmen unterteilt wird. Dieser Transientenindex wird für die effektive Codierung für die HE-ACC verwendet und auf ihn wird Bezug genommen, wenn acht kurze Blöcke zu vier Gruppen zusammengebunden werden, um die kurzen Blöcke anzuwenden. Der Referenzwert für den TNS-Algorithmus ist der Transientenindex der Signale, die durch die niedrige Frequenz geschickt und gefiltert werden.
  • Unter der oben beschriebenen zweiten Bedingung wird die Wirkung des Vorechos betrachtet und hat das Ausmaß der Wirkung Einfluss auf die Erweiterungs-TNS-Anwendung. Hierbei ist die Zeit für das Vorecho gleich der entsprechenden Fensterlänge.
  • Das bedeutet, dass, wenn sich der transiente Abschnitt mit erhöhter Energie in einem vorderen Abschnitt des entsprechenden Rahmens befindet, das Vorecho in einem schmaleren Bereich auftritt. Wenn sich andererseits der transiente Abschnitt mit erhöhter Energie in einem Endabschnitt des entsprechenden Rahmens befindet, tritt das Vorecho in einem weiteren Bereich auf.
  • Die 2 und 3 zeigen das Vorecho gemäß dem Transientenindex.
  • In 2 gibt ein erster Transientenindex 101 ein transientes Signal in einem Endabschnitt des Rahmens an. Da sich hier das erste Vorecho 102 im Endabschnitt des Rahmens befindet, tritt das erste Vorecho 102 in einem größeren Bereich auf.
  • In 3 gibt ein zweiter Transientenindex 103 ein transientes Signal in einem vorderen Abschnitt des Rahmens an. Wenn sich hier der zweite Transientenindex 103 in dem Endabschnitt des Rahmens befindet, hat das zweite Vorecho 104 eine größere Wirkung als das erste Vorecho 102, das in 2 gezeigt ist. Daher bestimmt die TNS-Bestimmungseinrichtung 110, dass der Erweiterungs-DNS-Algorithmus angewendet wird.
  • 4 ist ein Ablaufplan, der ein Verfahren zum Formen des Quantisierungsrauschens in einem niedrigen Frequenzband unter Verwendung eines langen Blocks gemäß einer Ausführungsform der vorliegenden Erfindung beschreibt.
  • Eine TNS-Bestimmungseinrichtung 110 berechnet im Schritt S302 eine Vorhersageverstärkung von Audiosignalen unter Verwendung eines langen Blocks. Das heißt, dass die TNS-Bestimmungseinrichtung 110 die Autokorrelationsfunktion und die LPC unter Verwendung eines Levinson-Durbin-Algorithmus berechnet und einen PARCOR anhand des Rechenergebnisses erfasst und eine Vorhersageverstärkung berechnet.
  • Die TNS-Bestimmungseinrichtung 110 bestimmt im Schritt S304, ob die berechnete Vorhersageverstärkung den Schwellenwert übersteigt.
  • Die TNS-Bestimmungseinrichtung 110 führt getrennt hiervon eine Tiefpassfilterung unter Verwendung des Tiefpassfilters aus, um Frequenzkomponenten in einem Erweiterungsband zu bestimmen. Dies dient dazu, nur den langen Block zu verwenden. Ein Beispiel der Tiefpassfilterfunktion ist in Gl. 4 gezeigt.
    Figure 00110001
    wobei H(z) die Tiefpassfilterfunktion angibt. Auf H(z) können verschiedene Tiefpassfilterfunktionen angewendet werden. In der Tiefpassfilterungsfähigkeit der verschiedenen Tiefpassfilterfunktionen besteht kein großer Unterschied. Die TNS-Bestimmungseinrichtung 110 verwendet das Tiefpassfilter, um das Signal in einem niedrigen Frequenzband unter 1 kHz zu erfassen.
  • Auf der Grundlage des Vergleichsergebnisses in Schritt S304 prüft die TNS-Bestimmungseinrichtung 110, wenn die Vorhersageverstärkung den Schwellenwert übersteigt, in Schritt S306, ob die durch die niedrige Frequenz durchgelassenen und gefilterten Signale transient sind. Das heißt, dass die TNS- Bestimmungseinrichtung 110 in Übereinstimmung mit dem Prüfergebnis in Schritt S306 das Frequenzband bestimmt, das zum Formen des Quantisierungsrauschens angewendet wird. Wenn andererseits die Vorhersageverstärkung den Schwellenwert nicht übersteigt, berechnet die TNS-Bestimmungseinrichtung 110 im Schritt S314 die Vorhersageverstärkung des Erweiterungsbandes und prüft, ob die Vorhersageverstärkung des Erweiterungsbandes den Schwellenwert übersteigt. Hier wird geprüft, ob die Signale, die durch den niedrigen Frequenzdurchgang geschickt und gefiltert worden sind, transient sind, indem der Blockschaltalgorithmus in der AAC-Vorrichtung verwendet wird.
  • Anhand des Prüfergebnisses in Schritt S306 führt die TNS-Bestimmungseinrichtung 110 dann, wenn die durch die niedrige Frequenz geschickten und gefilterten Signale transient sind, keine Neueinstellung eines Maskierungsschwellenwertes 308 aus. Wenn andererseits die Signale, die durch die niedrige Frequenz geschickt und gefiltert worden sind, nicht transient sind, bestimmt die TNS-Bestimmungseinrichtung 110, dass der allgemeine TNS-Algorithmus angewendet wird, in Schritt 312.
  • Wenn der Maskierungsschwellenwert nicht neu eingestellt wird, wird im allgemeinen TNS-Algorithmus der Schwellenwert in dem Frequenzband, das den TNS-Algorithmus nicht anwendet, gesenkt, um das Bit effektiv zu nutzen. Andererseits ist in dieser Erfindung, die den Erweiterungs-TNS-Algorithmus verwendet, da hier alle Frequenzbänder den TNS-Algorithmus anwenden, eine Neueinstellung des Maskierungsschwellenwertes nicht erforderlich.
  • Die TNS-Bestimmungseinrichtung 110 stellt den Maskierungsschwellenwert nicht neu ein und erweitert im Schritt S310 das Frequenzband, das den TNS-Algorithmus anwendet, nach unten auf die Frequenz von etwa 100 Hz. Der TNS-Codierer 120 berechnet den Koeffizienten anhand des TNS-Algorithmus, der erweitert auf das niedrige Frequenzband angewendet wird, neu, woraufhin er die TNS-Codierung ausführt.
  • Auf der Grundlage des Prüfergebnisses im Schritt S314 analysiert die TNS-Bestimmungseinrichtung 110 dann, wenn die Vorhersageverstärkung des Erweiterungsbandes den Schwellenwert übersteigt, Art und Index des transienten Signals, das durch die niedrige Frequenz geschickt und gefiltert wird, und prüft im Schritt S316, ob die Wirkung des Vorechos einen Referenzwert übersteigt. Das heißt, dass die TNS-Bestimmungseinrichtung 110 auf der Grundlage des Analyseergebnisses im Schritt 316 bestimmt, ob das Quantisierungsrauschen geformt wird oder nicht. Beispielsweise bestimmt die TNS-Bestimmungseinrichtung 110, dass die Wirkung des Vorechos den Referenzwert übersteigt, und wendet den TNS-Algorithmus an, wenn sich die Art und der Index der Transiente mit erhöhter Energie im Endabschnitt des entsprechenden Rahmens befinden oder wenn sich die Art und der Index der Transiente mit niedriger Energie im vorderen Abschnitt des entsprechenden Rahmens befinden.
  • Wenn andererseits im Schritt S314 die Vorhersageverstärkung des Erweiterungsbandes anhand des Prüfergebnisses den Schwellenwert nicht übersteigt, wendet die TNS-Bestimmungseinrichtung 110 die TNS im Schritt S318 nicht an.
  • Die TNS-Bestimmungseinrichtung 110 stellt den Maskierungsschwellenwert im Schritt S308 nicht neu ein, wenn auf der Grundlage des Prüfergebnisses im Schritt S316 die Wirkung des Vorechos groß ist. Wenn andererseits die Wirkung des Vorechos klein ist, wendet die TNS-Bestimmungseinrichtung 110 den TNS-Algorithmus im Schritt S318 nicht an.
  • Wie oben beschrieben worden ist, kann die Technologie der vorliegenden Erfindung als Programm verwirklicht werden. Von einem Computer-Programmierer des verwandten Gebiets kann einfach auf einen Code und ein Codesegment, die das Programm bilden, geschlossen werden. Außerdem ist das verwirklichte Programm in einem computerlesbaren Aufzeichnungsmedium, d. h. in einem Informationsspeichermedium gespeichert und wird von dem Computer gelesen und ausgeführt, wodurch das Verfahren der vorliegenden Erfindung realisiert wird. Das Aufzeichnungsmedium umfasst alle Typen von Aufzeichnungsmedien, die von dem Computer gelesen werden können.
  • Die vorliegende Anmeldung enthält den Erfindungsgegenstand der koreanischen Patenanmeldungen Nrn. 2007-0119413 und 2008-0048837 , eingereicht beim koreanischen Patentamt am 21. November 2007 bzw. am 26. Mai 2008, wobei die gesamten Inhalte hiervon durch Bezugnahme mit aufgenommen sind.
  • Obwohl die vorliegende Erfindung mit Bezug auf bestimmte bevorzugte Ausführungsformen beschrieben worden ist, ist für den Fachmann auf dem Gebiet klar, dass verschiedene Änderungen und Abwandlungen vorgenommen werden können, ohne vom Schutzbereich der Erfindung, wie er in den folgenden Ansprüchen definiert ist, abzuweichen.
  • Zusammenfassung
  • Ein Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen umfasst das Prüfen, ob Audiosignale, die von einer Tiefpassfilterung erhalten werden, transient sind, das Bestimmen eines vorgegebenen Frequenzbandes, um es als ein Frequenzband anzuwenden, das für das Formen von Quantisierungsrauschen anzuwenden ist, wenn die Audiosignale nicht transient sind, und das Bestimmen eines erweiterten Frequenzbandes, das über das vorgegebene Frequenzband hinaus erweitert ist, um es als ein Frequenzband anzuwenden, das anzuwenden ist, wenn die Audiosignale transient sind.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • - KR 2007-0119413 [0064]
    • - KR 2008-0048837 [0064]
  • Zitierte Nicht-Patentliteratur
    • - 2007-S-005-01, ”Development of Richmedia Broadcasting Technologies through Advanced Audio and Video Codec Technologies” [0002]

Claims (10)

  1. Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen, das umfasst: Prüfen, ob Audiosignale, die von einer Tiefpassfilterung erhalten werden, transient sind; Bestimmen eines vorgegebenen Frequenzbandes, um es als ein Frequenzband anzuwenden, das zum Formen von Quantisierungsrauschen anzuwenden ist, wenn die Audiosignale nicht transient sind; und Bestimmen eines erweiterten Frequenzbandes, das über das vorgegebene Frequenzband hinaus erweitert ist, um es als ein Frequenzband anzuwenden, das anzuwenden ist, wenn die Audiosignale transient sind.
  2. Verfahren nach Anspruch 1, wobei das vorgegebene Frequenzband, das anzuwenden ist, ein bestimmtes TNS-Frequenzband ist, das auf einen allgemeinen TNS-Algorithmus angewendet wird.
  3. Verfahren nach Anspruch 2, wobei das erweiterte Frequenzband nach unten bis zu einem Frequenzband erweitert ist, das niedriger als ein bestimmtes TNS-Frequenzband ist.
  4. Verfahren zum Formen von Quantisierungsrauschen, wobei das Verfahren umfasst: Vergleichen einer Vorhersageverstärkung von Audiosignalen, die unter Verwendung eines langen Blocks berechnet werden, mit einem Schwellenwert; Bestimmen einer Frequenz, die zum Formen von Quantisierungsrauschen anzuwenden ist, durch Prüfen, ob die durch Tiefpassfilterung erhaltenen Audiosignale transient sind, wenn die Vorhersageverstärkung den Schwellenwert übersteigt; und Anwenden des Formens von Quantisierungsrauschen auf die Audiosignale gemäß dem vorgegebenen Frequenzband.
  5. Verfahren nach Anspruch 4, wobei das Bestimmen einer anzuwendenden Frequenz ferner umfasst: Prüfen, ob die von der Tiefpassfilterung erhaltenen Audiosignale transient sind; Bestimmen eines vorgegebenen Frequenzbandes als das Frequenzband, das zum Formen von Quantisierungsrauschen anzuwenden ist, wenn die Audiosignale nicht transient sind; und Bestimmen eines erweiterten Frequenzbandes, das über das vorgegebene Frequenzband hinaus erweitert ist, um es als ein Frequenzband anzuwenden, das anzuwenden ist, wenn die Audiosignale transient sind.
  6. Verfahren nach Anspruch 5, das ferner umfasst: Bestimmen, ob das Formen von Quantisierungsrauschen ausgeführt werden soll, indem geprüft wird, ob eine Vorhersageverstärkung des erweiterten Frequenzbandes einen Schwellenwert übersteigt, wenn die Vorhersageverstärkung den Schwellenwert nicht übersteigt.
  7. Verfahren nach Anspruch 6, wobei die Tatsache, ob das Formen von Quantisierungsrauschen ausgeführt werden soll, durch Prüfen der Transientenart und des Transientenindex der Audiosignale bestimmt wird, wenn die Vorhersageverstärkung der erweiterten Verstärkung des erweiterten Frequenzbandes den Schwellenwert übersteigt.
  8. Verfahren nach Anspruch 7, wobei das Bestimmen des Formens von Quantisierungsrauschen ausgeführt wird, wenn die Transientenart und der Transientenindex der Audiosignale eine erhöhte Energie haben und sich in einem Endabschnitt eines entsprechenden Rahmens befinden.
  9. Verfahren nach Anspruch 7, wobei das Bestimmen des Formens von Quantisierungsrauschen ausgeführt wird, wenn die Transientenart und der Transientenindex der Audiosignale eine verringerte Energie haben und sich im vorderen Abschnitt eines entsprechenden Rahmens befinden.
  10. Verfahren nach Anspruch 7, wobei das Formen von Quantisierungsrauschen in dem erweiterten Frequenzband einen Maskierungsschwellenwert nicht neu einstellt.
DE112008003153.3T 2007-11-21 2008-10-09 Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen Expired - Fee Related DE112008003153B4 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR10-2007-0119413 2007-11-21
KR20070119413 2007-11-21
KR10-2008-0048837 2008-05-26
KR1020080048837A KR100938282B1 (ko) 2007-11-21 2008-05-26 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과,그를 이용한 양자화 잡음 처리 방법
PCT/KR2008/005918 WO2009066869A1 (en) 2007-11-21 2008-10-09 Frequency band determining method for quantization noise shaping and transient noise shaping method using the same

Publications (2)

Publication Number Publication Date
DE112008003153T5 true DE112008003153T5 (de) 2010-12-23
DE112008003153B4 DE112008003153B4 (de) 2017-01-19

Family

ID=40860459

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112008003153.3T Expired - Fee Related DE112008003153B4 (de) 2007-11-21 2008-10-09 Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen

Country Status (2)

Country Link
KR (1) KR100938282B1 (de)
DE (1) DE112008003153B4 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070119413A (ko) 2006-06-15 2007-12-20 (주)리-뉴화학 유동성을 지닌 방수 시트 및 이의 시공방법
KR20080048837A (ko) 2006-11-29 2008-06-03 삼성전자주식회사 촉각 피드백을 출력하는 장치 및 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5886276A (en) 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US6266644B1 (en) 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
WO2006051451A1 (en) * 2004-11-09 2006-05-18 Koninklijke Philips Electronics N.V. Audio coding and decoding
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070119413A (ko) 2006-06-15 2007-12-20 (주)리-뉴화학 유동성을 지닌 방수 시트 및 이의 시공방법
KR20080048837A (ko) 2006-11-29 2008-06-03 삼성전자주식회사 촉각 피드백을 출력하는 장치 및 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
2007-S-005-01, "Development of Richmedia Broadcasting Technologies through Advanced Audio and Video Codec Technologies"

Also Published As

Publication number Publication date
KR20090052790A (ko) 2009-05-26
KR100938282B1 (ko) 2010-01-22
DE112008003153B4 (de) 2017-01-19

Similar Documents

Publication Publication Date Title
DE60024501T2 (de) Verbesserung der perzeptuellen Qualität von SBR (Spektralbandreplikation) UND HFR (Hochfrequenzen-Rekonstruktion) Kodierverfahren mittels adaptivem Addieren von Grundrauschen und Begrenzung der Rauschsubstitution
DE60303689T2 (de) Audiodecodierungsvorrichtung und -verfahren
DE60103424T2 (de) Verbessern der leistung von kodierungssystemen, die hochfrequenz-rekonstruktionsverfahren verwenden
DE19959156C2 (de) Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals
EP1145227B1 (de) Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals
DE602005002256T2 (de) Auf mehrfachparametrisierung basierende mehrkanalrekonstruktion
DE69901273T2 (de) Verfahren zur Codierung und Quantisierung von Audiosignalen
DE69333394T2 (de) Hochwirksames Kodierverfahren und -gerät
DE69013738T2 (de) Einrichtung zur Sprachcodierung.
EP0954909A1 (de) Verfahren zum codieren eines audiosignals
DE60128121T2 (de) Wahrnehmungsbezogen verbesserte aufbesserung kodierter akustischer signale
DE69522187T2 (de) Verfahren und vorrichtung zur kodierung, dekodierung und kodierung-dekodierung
WO2007073949A1 (de) Verfahren und vorrichtung zur künstlichen erweiterung der bandbreite von sprachsignalen
EP1697930A1 (de) Vorrichtung und verfahren zum verarbeiten eines multikanalsignals
EP0076234A1 (de) Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung
DE60303346T2 (de) Encodier- und/oder Decodierverfahren für digitale Audiosignale, basierend auf Zeit-Frequenzkorrelation und Vorrichtung hierzu
EP1953739B1 (de) Verfahren und Vorrichtung zur Geräuschsunterdrückung bei einem decodierten Signal
DE19743662A1 (de) Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
EP2034473B1 (de) Vorrichtung und Verfahren zum Ermitteln eines Schaetzwerts
DE69423803T2 (de) Verfahren zur Bestimmung der Blockgrösse in einem Transformationskodierer
DE112008003153B4 (de) Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen
EP1247275B1 (de) Vorrichtung und verfahren zum bestimmen eines codierungs-blockrasters eines decodierten signals
EP1277346B1 (de) Vorrichtung und Verfahren zum Analysieren der spektralen Darstellung eines decodierten Zeitsignales
DE69527257T2 (de) System zur Sprachkodierung
DE4124493C1 (de)

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8125 Change of the main classification

Ipc: H03M 7/30 AFI20081009BHDE

R082 Change of representative

Representative=s name: PATENTANWAELTE BETTEN & RESCH, DE

R081 Change of applicant/patentee

Owner name: ELECTRONICS AND TELECOMMUNICATIONS RESEARCH IN, KR

Free format text: FORMER OWNERS: ELECTRONICS AND TELECOMMUNICATIONS RESEARCH INSTITUTE, DAEJEON, KR; KWANGWOON UNIVERSITY INDUSTRY-ACADEMIC COLLABORATION FOUNDATION, SEOUL, KR

Effective date: 20131028

Owner name: ELECTRONICS AND TELECOMMUNICATIONS RESEARCH IN, KR

Free format text: FORMER OWNER: ELECTRONICS AND TELECOMMUNICATI, KWANGWOON UNIVERSITY INDUSTRY-A, , KR

Effective date: 20131028

R082 Change of representative

Representative=s name: PATENTANWAELTE BETTEN & RESCH, DE

Effective date: 20131028

Representative=s name: BETTEN & RESCH PATENT- UND RECHTSANWAELTE PART, DE

Effective date: 20131028

R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee