[go: up one dir, main page]

DE19681070C2 - Verfahren und Vorrichtung zum Betreiben eines Kommunikationssystems mit Rauschunterdrückung - Google Patents

Verfahren und Vorrichtung zum Betreiben eines Kommunikationssystems mit Rauschunterdrückung

Info

Publication number
DE19681070C2
DE19681070C2 DE19681070T DE19681070T DE19681070C2 DE 19681070 C2 DE19681070 C2 DE 19681070C2 DE 19681070 T DE19681070 T DE 19681070T DE 19681070 T DE19681070 T DE 19681070T DE 19681070 C2 DE19681070 C2 DE 19681070C2
Authority
DE
Germany
Prior art keywords
noise
channel
estimate
spectra
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE19681070T
Other languages
English (en)
Other versions
DE19681070T1 (de
Inventor
James P Ashley
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Mobility LLC
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of DE19681070T1 publication Critical patent/DE19681070T1/de
Application granted granted Critical
Publication of DE19681070C2 publication Critical patent/DE19681070C2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B15/00Suppression or limitation of noise or interference
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Noise Elimination (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)

Description

Die Erfindung bezieht sich allgemein auf Rauschunterdrückung und insbesondere auf die Rauschunterdrückung in einem Kommunikationssystem.
Rauschunterdrückungstechniken in einem Kommunikationssystem sind wohlbekannt. Das Ziel eines Rauschunterdrückungssystems besteht darin, die Menge des Hintergrundrauschens während der Sprachkodierung zu vermindern, so daß die Gesamtqualität des kodierten Sprachsignals des Benutzers verbessert wird. Kommu­ nikationssysteme, die Sprachkodierung implementieren, umfas­ sen in nicht einschränkender Weise Voicemail-Systeme, zellu­ lare Funktelefonsysteme, leitungsgebundene Kommunikationssy­ steme, Luftlinienkommunikationssysteme etc.
Eine Rauschunterdrückungstechnik, die in zellularen Funktele­ fonsystemen implementiert wurde, ist die spektrale Subtrak­ tion. Bei dieser Lösung wird das Toneingangssignal in einzel­ ne Spektralbänder (Kanäle) durch einen geeigneten Spektral­ teiler aufgeteilt, und die einzelnen Spektralkanäle werden dann gemäß dem Rauschenergiegehalt jedes Kanals gedämpft. Die Lösung der spektralen Subtraktion verwendet eine Schätzung der spektralen Dichte der Hintergrundrauschleistung, um ein Signal-Rausch-Verhältnis (SNR) der Sprache in jedem Kanal zu erzeugen, das wiederum verwendet wird, um einen Verstärkungs­ faktor für jeden einzelnen Kanal zu berechnen. Der Verstär­ kungsfaktor wird dann als Eingangssignal verwendet, um die Kanalverstärkung für jeden einzelnen der Spektralkanäle zu modifizieren. Die Kanäle werden dann wieder kombiniert, um die rauschunterdrückte Ausgangswellenform zu erzeugen. Ein Beispiel der Lösung der spektralen Subtraktion, die in einem analogen zellularen Funktelefonsystem implementiert ist, kann man im US-Patent Nr. 4,811,404 von Vilmur des gleichen Anmel­ der wie bei der vorliegenden Anmeldung finden.
Wie im vorher erwähnten US-Patent ausgeführt ist, funktionie­ ren die Techniken der Rauschunterdrückung des Standes der Technik schlecht, wenn ein plötzliches starkes Ansteigen des Hintergrundrauschens auftritt. Um die Nachteile des Standes der Technik zu überwinden, führt das vorher erwähnte US-Pa­ tent von Vilmur eine erzwungene Aktualisierung der Rausch­ schätzungen unabhängig von der Sprachmaßsumme durch, wenn M Rahmen ohne eine Aktualisierung der Hintergrundrauschschät­ zung vergangen sind, wobei für M bei Vilmur angegeben wird, daß es zwischen 50 und 300 liegen soll. Da ein Rahmen bei Vilmur 10 Millisekunden (ms) lang ist, und M als 100 ange­ nommen wird, so würde eine Aktualisierung mindestens jede Sekunde auftreten, unabhängig von der Sprachmaßsumme VMSUM (d. h., ob eine Aktualisierung nun notwendig ist oder nicht).
Die Erzwingung einer Aktualisierung der Rauschschätzung un­ abhängig vom Sprachmaß kann zu einer Dämpfung des Sprachsig­ nals des Benutzers führen, ungeachtet der Tatsache, daß kein zusätzliches Hintergrundrauschen addiert wird. Dies wiederum führt zu einer Verschlechterung der Sprachqualität, die vom Endnutzer wahrgenommen wird. Darüberhinaus können Eingangs­ signale, die über das Sprachsignal eines Benutzers hinaus­ gehen (beispielsweise "Wartemusik"), Probleme verursachen, dadurch daß die erzwungene Aktualisierung der Rauschschätzung über kontinuierlichen Intervallen auftreten kann. Das kommt daher, daß Musik sich über mehrere Sekunden (oder Minuten) erstrecken kann, ohne genügend große Pausen, die eine normale Aktualisierung der Hintergrundrauschschätzung gestatten würden. Der Stand der Technik würde daher eine erzwungene Aktualisierung alle M Rahmen gestatten, da es keinen Mecha­ nismus gibt, um Hintergrundrauschen von nichtstationären Eingabesignalen zu unterscheiden. Diese ungültige, erzwungene Aktualisierung dämpft nicht nur das Eingangssignal, sondern verursacht auch schwere Störungen, da die spektrale Schätzung aktualisiert wird, basierend auf einer zeitveränderlichen, nicht stationären Eingabe.
Es existiert somit ein Bedürfnis nach einem genaueren und zu­ verlässigeren Rauschunterdrückungssystem für die Verwendung in Kommunikationssystemen.
Die EP 0 628 947 A1 offenbart ein Verfahren und eine Vorrichtung zur digitalen Sprachcodierung mit Sprachsignalhöhenabschätzung und Klassifikation in digitalen Sprachcodierern.
Die EP 0 573 398 A2 offenbart einen C.E.L.P.-Vocoder.
Aus der WO 95/02288 A1 ist eine Vorrichtung zur Reduktion des Hin­ tergrundrauschens in einem Telefonkommunikationskanal bekannt. Eine Rauschschätzeinrichtung verwendet Komponenten des Frequenzspek­ trums, um eine Rauschschätzung vorzunehmen.
Die Erfindung ist in den unabhängigen Patentansprüchen definiert. Bevorzugte Ausgestaltungen sind in den Unteransprüchen angegeben.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
Fig. 1 zeigt allgemein ein Blockdiagramm eines Sprachkodie­ rers für die Verwendung in einem Kommunikationssystem.
Fig. 2 zeigt allgemein ein Blockdiagramm eines Rauschunter­ drückungssystems gemäß der Erfindung.
Fig. 3 zeigt allgemein eine Rahmen-zu-Rahmen-Überlappung, die in einem Rauschunterdrückungssystem gemäß der Erfindung auf­ tritt.
Fig. 4 zeigt allgemein eine trapezförmige Fenstertechnik vor­ verstärkter Abtastungen, die im Rauschunterdrückungssystem der vorliegenden Erfindung auftauchen.
Fig. 5 zeigt allgemein ein Blockdiagramm des spektralen Ab­ weichungsschätzers, der in Fig. 2 dargestellt ist und der im Rauschunterdrückungssystem gemäß der Erfindung verwendet wird.
Fig. 6 zeigt allgemein ein Flußdiagramm der Schritte, die in der Aktualisierungsentscheidungsbestimmungsvorrichtung, die in Fig. 2 dargestellt ist, und bei der Rauschunterdrückung gemäß der Erfindung verwendet wird, durchgeführt werden.
Fig. 7 zeigt ein Blockdiagramm eines Kommunikationssystems, das vorteilhafterweise das Rauschunterdrückungssystem gemäß der Erfindung implementiert.
Fig. 8 zeigt allgemein Variablen, die sich auf die Rauschun­ terdrückung eines Sprachsignals beziehen, wie sie im Stand der Technik implementiert ist.
Fig. 9 zeigt allgemein Variablen, die sich auf die Rauschun­ terdrückung eines Sprachsignals beziehen, wie es durch das Rauschunterdrückungssystem gemäß der vorliegenden Erfindung implementiert ist.
Fig. 10 zeigt allgemein Variablen, die sich auf die Rauschun­ terdrückung eines Musiksignals beziehen, wie es im Stand der Technik implementiert ist.
Fig. 11 zeigt allgemein Variablen, die sich auf die Rauschun­ terdrückung eines Musiksignals beziehen, wie sie durch das Rauschunterdrückungssystem gemäß der Erfindung implementiert ist.
GENAUE BESCHREIBUNG EINER BEVORZUGTEN AUSFÜHRUNGSFORM
Ein Rauschunterdrückungssystem, das in einem Kommunikations­ system implementiert ist, liefert eine verbesserte Aktuali­ sierungsentscheidung während Zeiten, bei denen ein plötzli­ ches Ansteigen des Hintergrundrauschpegels auftritt. Das Rauschunterdrückungssystem erzeugt unter anderem eine Aktua­ lisierung durch kontinuierliches Überwachen der Abweichung einer spektralen Energie und erzwingt eine Aktualisierung, basierend auf einem vorbestimmten Schwellwertkriterium. Die spektrale Energieabweichung wird bestimmt durch Verwendung eines Elements, das die letzten Werte der Leistungsspektral­ komponenten aufweist, die exponentiell gewichtet sind. Die exponentielle Wichtung ist eine Funktion der aktuellen Einga­ beenergie, was bedeutet, je höher die Eingabesignalenergie ist, desto länger ist das exponentielle Fenster. Umgekehrt gilt, je niedriger die Signalenergie ist, desto kürzer das ex­ ponentielle Fenster. Somit verhindert das Rauschunterdrückungssystem eine erzwungene Aktualisierung während Peri­ oden kontinuierlicher, nicht stationärer Eingabsignale (wie beispielsweise bei "Wartemusik").
Um es allgemein zu sagen, so implementiert ein Sprachkodie­ rer ein Rauschunterdrückungssystem in einem Kommunikationssy­ stem. Das Kommunikationssystem transferiert Sprachabtastungen durch Verwendung von Informationsrahmen in Kanälen, wobei die Rahmen mit Information sich in Kanälen befinden, die kein Rauschen aufweisen. Der Sprachkodierer hat als Eingang Sprachabtastungen und eine Vorrichtung für die Unterdrückung des Rauschens, basierend auf einer Abweichung der spektralen Energie zwischen einem aktuellen Rahmen mit Sprachabtastungen und einer mittleren Spektralenergie einer Vielzahl vergange­ ner Rahmen mit Sprachabtastungen, um rauschunterdrückte Sprachabtastungen zu erzeugen, um das Rauschen in den Rahmen der Sprachabtastungen zu unterdrücken. Eine Vorrichtung für das Kodieren der rauschunterdrückten Sprachabtastungen ko­ diert dann die rauschunterdrückte Sprachabtastungen für einen Transfer durch das Kommunikationssystem. In der bevorzugten Ausführungsform befindet sich der Sprachkodierer entweder in einer zentralisierten Basisstationssteuerung (CBSC) oder ei­ ner mobilen Station (MS) eines Kommunikationssystems. In al­ ternativen Ausführungsformen kann sich der Sprachkodierer je­ doch entweder in einem mobilen Vermittlungszentrum (MSC) oder einer Basistransceiverstation (BTS) befinden. In der bevor­ zugten Ausführungsform ist der Sprachkodierer in einem Kommu­ nikationssystem des Vielfachzugriffs durch Kodetrennung (CDMA) implementiert, aber ein Durchschnittsfachmann wird er­ kennen, daß der Sprachkodierer und ein Rauschunterdrückungs­ system gemäß der Erfindung bei vielen unterschiedlichen Arten von Kommunikationssystemen angewandt werden können.
In der bevorzugten Ausführungsform umfaßt die Vorrichtung für die Unterdrückung des Rauschens in einem Rahmen mit Sprachab­ tastungen eine Vorrichtung für das Schätzen einer Gesamtka­ nalenergie in einem aktuellen Rahmen mit Sprachabtastungen, basierend auf der Schätzung der Kanalenergie und einer Vorrichtung für das Schätzen einer Leistung eines Spektrums des aktuellen Rahmens mit Sprachabtastungen, basierend auf der Schätzung der Kanalenergie. Es ist auch eine Vorrichtung für das Schätzen der Leistung von Spektren einer Vielzahl vergan­ gener Rahmen mit Sprachabtastungen eingeschlosssen, basierend auf der Schätzung der Leistung des aktuellen Rahmens. Mit dieser Information bestimmt eine Vorrichtung für das Bestim­ men einer Abweichung zwischen der Schätzung des Spektrums des aktuellen Rahmens und der Schätzung der Leistung der Spektren einer Vielzahl von vergangenen Rahmen eine spektrale Abwei­ chung, wie dies schon gesagt wurde, und eine Vorrichtung für die Aktualisierung der Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtkanalenergie und der bestimmten Abweichung. Basierend auf der Aktualisierung der Rauschschät­ zung modifiziert eine Vorrichtung zur Modifizierung der Ver­ stärkung des Kanals die Verstärkung des Kanals, um die rauschunterdrückten Sprachabtastungen zu erzeugen.
In der bevorzugten Ausführungsform umfaßt die Vorrichtung für die Schätzung einer Leistung von Spektren einer Vielzahl ver­ gangener Rahmen von Information weiter eine Vorrichtung zur Schätzung einer Leistung der Spektren einer Vielzahl von ver­ gangener Rahmen, basierend auf einer exponentiellen Wichtung der vergangenen Rahmen mit Information, wobei die exponen­ tielle Wichtung der vergangenen Rahmen mit Information eine Funktion der Schätzung der gesamten Kanalenergie innerhalb eines aktuellen Rahmens mit Information ist. In der bevorzug­ ten Ausführungsform umfaßt die Vorrichtung für das Aktuali­ sieren der Rauschschätzung des Kanals, basierend auf der Schätzung der gesamten Kanalenergie und der bestimmten Abwei­ chung auch ferner eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basierend auf einem Vergleich der Schätzung der gesamten Kanalenergie innerhalb eines ersten Schwellwerts und einen Vergleich der bestimmten Abweichung innerhalb eines zweiten Schwellwerts. Insbesondere umfaßt die Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basierend auf einem Vergleich der Schätzung der ge­ samten Kanalenergie mit einem ersten Schwellwert und einem Vergleich der bestimmten Abweichung mit einem zweiten Schwellwert, eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, wenn die Schätzung der gesamten Kanalenergie größer ist als der erste Schwellwert für eine erste vorbestimmte Anzahl von Rahmen, ohne daß eine zweite vorbestimmte Anzahl aufeinanderfolgender Rahmen eine Schät­ zung der gesamten Kanalenergie aufweist, die kleiner oder gleich dem ersten Schwellwert ist, und wenn die vorbestimmte Abweichung unerhalb des zweiten Schwellwertes liegt. In der bevorzugten Ausführungsform beträgt die erste bevorzugte Zahl von Rahmen 50 Rahmen, während die zweite bevorzugte Zahl auf­ einanderfolgender Rahmen 6 Rahmen beträgt.
Fig. 1 zeigt allgemein ein Blockdiagram eines Sprachkodierers 100 für die Verwendung in einem Kommunikationssystem. In der bevorzugten Ausführungsform ist der Sprachkodierer 100 ein Sprachkodierer 100 mit variabler Rate, geeignet für die Un­ terdrückung von Rauschen in einem Kommunikationssystem des Vielfachzugriffs durch Kodetrennung (CDMA), kompatibel mit dem Interim-Standard (IS) 95. Für mehr Information bezüglich IS-95, siehe TIA/EIA/IS-95, Mobile Station-Base Station Com­ patibility Standard for dual Mode Wideband Spread Spectrum Cellular System, Juli 1993, das hiermit durch Bezugnahme eingeschlossen wird. In der bevorzugten Ausführungsform un­ terstützt der Sprachkodierer 100 mit variabler Rate auch drei der vier Bitraten, die durch IS-95 gestattet sind: Volle Rate ("Rate 1" - 170 Bits/Rahmen), 1/2 Rate ("Rate 1/2" - 80 Bits/Rahmen) und 1/8 Rate ("Rate 1/8" - 16 Bits/Rahmen). Wie ein Durchschnittsfachmann erkennen wird, stellt die hier be­ schriebene Ausführungsform nur ein Beispiel dar; der Sprach­ kodierer 100 ist mit vielen unterschiedlichen Typen von Kom­ munikationssystemen kompatibel.
Bezieht man sich auf Fig. 1, so basiert die Vorrichtung für die Kodierung rauschunterdrückter Sprachabtastungen 102 auf dem Residual-Code-Excited-Linear-Prediction(RCELP)-Algorith­ mus, der aus dem Stand der Technik wohl bekannt ist. Für mehr Information bezüglich des RCELP-Algorithmus, siehe W. B. Kleijn, P. Kroon, und D. Nahumi, "The RCELP-Speech-Coding-Al­ gorithm", European Transactions on Telecommunications, Band 5, Nummer 5, Sept./Okt. 1994, Seiten 573-582. Für mehr Infor­ mation bezüglich des RCELP-Algorithmus, der passend für ei­ nen Betrieb mit variabler Rate und Robustheit in einer CDMA- Umgebung ist, siehe D. Nahumi und W. B. Kleijn, "An Improved 8 kb/s RCELP coder", Proc. ICASSP 1995. RCELP ist eine Verall­ gemeinerung des Code-Excited-Linear-Prediction(CELP)-Algo­ rithmus. Für mehr Information bezüglich des CELP-Algo­ rithmus, siehe B. S. Atal und M. R. Schroeder, "Stochastic coding of speech at very low bit rates", Proc. Int. Conf. Comm., Amsterdam, 1984, Seiten 1610-1613.
Während die obigen Referenzen ein tiefes Verständnis der CELP/RCELP-Algorithmen liefern, so ist eine kurze Beschrei­ bung des Betriebs des RCELP-Algorithmus lehrreich. Im Ge­ gensatz zu CELP-Kodierern versucht RCELP nicht, das ursprüng­ liche Sprachsignal des Benutzers genau zu treffen. Stattdes­ sen erzielt RCELP eine "zeitverzerrte" Version des ursprüng­ lichen Rückstandes, die mit einer vereinfachten Teilkontur des Sprachsignals des Benutzers übereinstimmt. Die Teilkontur des Sprachsignals des Benutzers erhält man durch Schätzen der Teilverzögerung einmal pro Rahmen und einer linearen Interpo­ lation der Teilung von Rahmen zu Rahmen. Ein Vorteil der Verwendung dieser vereinfachten Teildarstellung besteht darin, daß in jedem Rahmen mehr Bits für eine stochastische Anregung und einen Kanalbeeinträchtigungsschutz verfügbar sind, als dies der Fall wäre, wenn eine traditionelle Lösung mit einer fraktionalen Teilung verwendet wird. Dies ergibt eine verbesserte Rahmenfehlerleistung ohne einen Einfluß auf die wahrnehmbare Sprachqualität bei klaren Kanalbedingungen.
Bezieht man sich auf Fig. 1, so werden in den Sprachkodierer 100 ein Sprachsignalvektor, s(n) 103 und ein externes Raten­ befehlssignal 106 eingegeben. Der Sprachsignalvektor 103 kann aus einer analogen Eingabe durch Abtastung mit einer Rate von 8000 Abtastungen/Sekunde und einer linearen (gleichförmigen) Quantisierung der sich ergebenden Sprachabtastungen mit min­ destens 13 Bits eines dynamischen Bereiches geschaffen wer­ den. Alternativ kann der Sprachsignalvektor 103 aus einem 8 Bit µlaw Eingabe durch Umwandlung in ein gleichmäßiges, puls­ kodemoduliertes (PCM) Format gemäß der Tabelle 2 in den ITU-T- Empfehlungen G.711 geschaffen werden. Das externe Ratenbe­ fehlssignal 106 kann den Kodierer anweisen, ein leeres Paket oder ein Paket, das sich von einem Rate-1-Paket unterschei­ det, zu erzeugen. Wenn ein externes Ratenbefehlssignal 106 empfangen wird, so ersetzt dieses Signal 106 den internen Ra­ tenauswahlmechanismus des Sprachkodierers 100.
Der Eingabesprachvektor 103 wird einer Vorrichtung zur Unter­ drückung von Rauschen 101 präsentiert, bei der es sich in der bevorzugten Ausführungsform um das Rauschunterdrückungssystem 109 handelt. Das Rauschunterdrückungssystem 109 führt eine Rauschunterdrückung gemäß der Erfindung durch. Ein rauschun­ terdrückter Sprachvektor s'(n) 112 wird dann sowohl einem Ratenbestimmungsmodul 115 und einem Modellparameterschätzmo­ dul 118 präsentiert. Das Ratenbestimmungsmodul 115 wendet ei­ nen Sprachaktivitätserkennungs(VAD)-Algorithmus und eine Ra­ tenauswahllogik an, um den Typ des zu erzeugenden Pakets (Rate 1/8, 1/2 oder 1) zu bestimmen. Das Modellparameter­ schätzmodul 118 führt eine lineare Vorhersagekodierungs­ (LPC)-Analyse durch, um die Modellparameter 121 zu erzeugen. Die Modellparameter umfassen einen Satz linearer Vorhersage­ koeffizienten (LPCs) und eine optimale Teilungsverzögerung (t). Das Modellparameterschätzmodul 118 wandelt auch die LPCs in linienspektrale Paare (LSPs) um und berechnet langfristige und kurzfristige Vorhersageverstärkungen.
Die Modellparameter 121 werden in ein Kodiermodul 124 varia­ bler Rate gegeben, das das Anregungssignal kennzeichnet und die Modellparameter 121 in einer für die ausgewählte Rate passenden Art quantisiert. Die Rateninformation erhält man von einem Ratenentscheidungssignal 139, das auch in das va­ riable Ratenkodiermodul 124 gegeben wird. Wenn die Rate 1/8 ausgewählt wird, so wird das variable Ratenkodiermodul 124 nicht versuchen, irgendeine Periodizität im Sprachrest zu kennzeichnen, sondern wird stattdessen einfach seine Energie­ kontur kennzeichnen. Für die Raten 1/2 und 1 wendet das va­ riable Ratenkodiermodul 124 den RCELP-Algorithmus an, um eine Übereinstimmung mit einer zeitverzerrten Version des ur­ sprünglichen Sprachsignalrestes des Benutzers zu erzielen. Nach der Kodierung akzeptiert ein Paketformatiermodul 133 alle Parameter, die im variablen Ratenkodiermodul 124 berech­ net und/oder quantisiert wurden, und formatiert ein Paket 136, passend zur ausgewählten Rate. Das formatierte Paket 136 wird dann einer Multiplexunterschicht für eine weitere Verarbei­ tung präsentiert, wobei dies ebenso für das Ratenentschei­ dungssignal 139 gilt. Wegen weiterer Details bezüglich des gesamten Betriebs des Sprachkodierers 100, siehe IS-127, Dokument "EVRC Draft Standard (IS-127)", Ausgabe 1, Vertei­ lungsnummer TR45.5.1/95.10.17.06, 17. Oktober 1995.
Fig. 2 zeigt allgemein ein Blockdiagramm eines verbesserten Rauschunterdrückungssystems 109 gemäß der Erfindung. In der bevorzugten Ausführungsform wird das Rauschunterdrückungssy­ stem 109 verwendet, um die Signalqualität zu verbessern, die dem Modellparameterschätzmodul 118 und dem Ratenbestimmungs­ modul 115 des Sprachkodierers 100 präsentiert wird. Der Be­ trieb des Rauschunterdrückungssystems ist generisch, da das System mit einem beliebigen Typ eines Sprachkodierers arbeiten kann, den ein Ingenieur in einem speziellen Kommunikationssystem implementieren will. Es sei angemerkt, daß mehrere Blöcke, die in Fig. 2 der vorliegenden Erfindung dargestellt sind, eine gleiche Funktion haben, wie die Blöcke die in Fig. 1 des US-Patents Nr. 4,811,404 von Vilmur dargestellt sind.
Das Rauschunterdrückungssystem 109 umfaßt einen Hochpaßfilter (HPF) 200 und eine übrige Rauschunterdrückungsschaltung. Das Ausgangssignal des HPF 200 shp(n) wird als Eingangssignal für die übrige Rauschunterdrückungsschaltung verwendet. Obwohl die Rahmengröße des Sprachkodierers 20 ms beträgt (wie das durch IS-95 definiert ist), beträgt die Rahmengröße der übri­ gen Rauschunterdrückungsschaltung 10 ms. Somit werden in der bevorzugten Ausführungsform die Schritte, um die Rauschunter­ drückung gemäß der Erfindung durchzuführen, zweimal in einem 20-ms-Sprachrahmen ausgeführt.
Um mit der erfindungsgemäßen Rauschunterdrückung zu beginnen, wird das Eingabesignal s(n) durch ein Hochpaßfilter (HPF) 200 einer Hochpaßfilterung unterzogen, um das Signal shp(n) zu erzeugen. Das HPF 200 ist ein Chebyshev-Filter Typ II vierter Ordnung mit einer Cutoff-Frequenz von 120 Hz, das im Stand der Technik wohl bekannt ist. Die Transferfunktion des HPF 200 ist definiert zu:
wobei die jeweiligen Zähler- und Nennerkoeffizienten defi­ niert sind zu:
Ein Fachmann wird erkennen, daß eine beliebige Zahl von Hoch­ paßfilterkonfigurationen verwendet werden kann. Als nächstes wird im Vorverstärkungsblock 203 das Signal shp(n) einer Fen­ stertechnik unterzogen unter Verwendung eines geglätteten, trapezförmigen Fensters, in welchem die ersten D Abtastungen d(m) des Eingangsrahmens (Rahmen "m") von den letzten D Abta­ stungen der vorhergehenden Rahmen (Rahmen "m - 1") überlappt werden. Diese Überlappung kann man am besten in Fig. 3 sehen. Wenn nicht anders angegeben, so haben alle Variablen Anfangswerte von Null, das heißt d(m) = 0, m ≦ 0. Dies kann beschrieben werden als:
d(m, n) = d(m - 1, L + n); 0 ≦ n < D,
wobei m der aktuelle Rahmen ist, n ein Abtastindex des Puf­ fers |d(m)|, L = 80 ist die Rahmenlänge und D = 24 ist die Überlappung (oder Verzögerung) in den Abtastungen. Die ver­ bleibenden Abtastungen des Eingabepuffers werden dann wie folgt vorverstärkt:
d(m, D + n) = shp(n) + ζpshp(n - 1); 0 ≦ n < L,
wobei ζp = - 0,8 der Vorverstärkungsfaktor ist. Dies führt da­ zu, daß der Eingabepuffer L + D = 104 Abtastungen enthält, in welchen die ersten D Abtastungen die vorverstärkte Überlap­ pung aus dem vorhergehenden Rahmen darstellen und die folgen­ den L Abtastungen vom aktuellen Rahmen eingegeben werden.
Als nächstes wird im Fenstertechnikblock 204 der Fig. 2 ein geglättetes, trapezförmiges Fenster 400 (Fig. 4) auf die Abta­ stungen angewandt, um ein Diskretes Fourier-Transformations­ (DFT)-Eingangssignal g(n) zu erzeugen. In der bevorzugten Ausführungsform ist g(n) definiert zu:
wobei M = 128 die DFT-Sequenzlänge ist und alle anderen Terme vorher definiert wurden.
Im Kanalteiler 206 der Fig. 2 wird die Transformation von g(n) in den Frequenzbereich unter Verwendung der Diskreten Fouriertransformation (DFT) durchgeführt, wobei dies wie folgt definiert ist:
wobei e ein komplexer Zeiger mit Einheitsamplitude mit der radialen Position ω ist. Dies ist eine atypische Definition, aber eine, die die Leistungsfähigkeit der komplexen, Schnellen Fourier-Transformation (FFT) zeigt. Der 2/M-Skalierungsfaktor ergibt sich aus einer Vorkonditionierung der M-Punkt-Realse­ quenz, um eine M/2-Punkt-Komplexsequenz zu bilden, die trans­ formiert wird unter Verwendung einer M/2-Punkt-Komplex-FFT. In der bevorzugten Ausführungsform umfaßt das Signal G(k) 65 einzelne Kanäle. Details dieser Technik kann man finden in Proakis und Manolakis, "Introduction to Digital Signal Proces­ sing", 2. Auflage, New York, Macmillan, 1988, Seiten 721-722.
Das Signal G(k) wird dann in den Kanalenergieschätzer 109 eingegeben, wo die Kanalenergieschätzung Ech(m) des aktuellen Rahmens unter Verwendung der nachfolgenden Gleichung bestimmt wird:
wobei Emin = 0,0625 die minimal gestattete Kanalenergie ist, αch(m) der Kanalenergieglättungsfaktor (unten definiert), Nc = 16 die Zahl der kombinierten Kanäle und fL(i) und fH(i) die i-ten Elemente der jeweiligen niedrigen und hohen Kanalkombi­ niertabellen fL und fH sind. In der bevorzugten Ausführungs­ form sind fL und fH definiert zu:
fL = {2, 4, 6, 8, 10, 12, 14, 17, 20, 23, 27, 31, 36, 42, 49, 56},
fH = {3, 5, 7, 9, 11, 13, 16, 19, 22, 26, 30, 35, 41, 48, 55, 63}.
Der Kanalenergieglättungsfaktor αch(m) kann definiert werden als:
was bedeutet, daß αch(m) einen Wert von Null für den ersten Rahmen (m = 1) und einen Wert von 0,45 für alle nachfolgenden Rahmen annimmt. Dies gestattet es, daß die Kanalenergieschät­ zung auf die ungefilterte Kanalenergie des ersten Rahmens initialisiert werden kann. Zusätzlich sollte die Kanal­ rauschenergieschätzung (wie unten definiert) auf die Kanal­ energie des ersten Rahmens initialisiert werden, das heißt:
En(m, i) = max{Einit, Ech(m, i)}; m = 1, 0 ≦ i < Nc,
wobei Einit = 16 die minimal gestattete Kanalrauschinitiali­ sierungsenergie ist.
Die Kanalenergieschätzung Ech(m) für den aktuellen Rahmen wird als nächstes verwendet, um die quantisierten Kanal-Si­ gnal-zu-Rausch-Verhältnis(SNR)-Indizes zu schätzen. Diese Schätzung wird im Kanal-SNR-Schätzer 218 der Fig. 2 durchge­ führt und ist bestimmt zu:
wobei En(m) die aktuelle Kanalrauschenergieschätzung (wie später definiert) ist, und die Werte von {σq} auf 0 und 89 einschließlich beschränkt sind.
Unter Verwendung der Kanal-SNR-Schätzung {σq} wird die Summe der Sprachmaße im Sprachmaßberechner 215 bestimmt unter Ver­ wendung von:
wobei V(k) der k-te Wert der 90-Element-Sprachmaßtabelle V ist, die so definiert ist:
Die Kanalenergieschätzung Ech(m) für den aktuellen Rahmen wird auch als Eingabe im spektralen Abweichungsschätzer 210 verwendet, der die spektrale Abweichung ΔE(m) schätzt. Unter Bezug auf Fig. 5 wird die Kanalenergieschätzung Ech(m) in einen logarithmischen Leistungsspektralschätzer 500 einge­ geben, wo das logarithmische Leistungsspektrum geschätzt wird zu:
EdB(m, i) = 10log10(Ech(m, i)); 0 ≦ i < Nc.
Die Kanalenergieschätzung Ech(m) für den aktuellen Rahmen wird auch in einen Gesamtkanalenergieschätzer 503 eingegeben, um die Gesamtkanalenergieschätzung Etot(m) für den aktuellen Rahmen m gemäß folgendem zu bestimmen:
Als nächstes wird ein exponentieller Fensterfaktor α(m) (als eine Funktion der Gesamtkanalenergie Etot(m)) im exponentiel­ len Fensterfaktorbestimmer 506 bestimmt unter Verwendung von:
welche zwischen αH und αL beschränkt ist durch:
α(m) = max{αL, min{αH, α{m)}},
wobei EH und EL die Energieendpunkte (in Dezibel oder "db") der linearen Interpolation von Etot(m) sind, das auf α(m) transformiert wird, das die Grenzen αL ≦ α(m) ≦ αH hat. Die Werte dieser Konstanten sind definiert zu: EH = 50, EL = 30, αH = 0,99, αL = 0,50. Wenn dies gegeben ist, so würde ein Signal mit einer relativen Energie von 40 dB einen exponentiellen Fensterfaktor von α(m) = 0,745 unter Ver­ wendung der obigen Berechnung verwenden.
Die spektrale Abweichung ΔE(m) wird dann im spektralen Abwei­ chungsschätzer 509 geschätzt. Die spektrale Abweichung ΔE(m)
ist die Differenz zwischen dem aktuellen Leistungsspek­ trum und einer langfristig gemittelten Leistungsspektrums­ schätzung:
wobei EdB(m) die langfristig gemittelte Leistungsspektrumsschät­ zung ist, die im langfristigen Leistungsspektrumsschätzer 512 geschätzt wird unter Verwendung:
EdB(m + 1, i) = α(m)EdB(m, i) + (1 - α(m))EdB(m, i); 0 ≦ i < Nc,
wobei alle Variablen vorher definiert wurden. Der anfängliche Wert von EdB(m) ist definiert als das geschätzte, logarithmische Leistungsspektrum des Rahmens 1 oder:
EdB(m) = EdB(m); m = 1.
An diesem Punkt werden die Summe der Sprachmaße v(m) der ge­ samten Kanalenergieschätzung für den aktuellen Rahmen Etot(m) und die spektrale Abweichung ΔE(m) in den Aktualisierungsent­ scheidungsbestimmer 212 eingegeben, um die Rauschunterdrückung gemäß der Erfindung zu erleichtern. Die Entschei­ dungslogik, die unten in einem Pseudo-Kode gezeigt und in Flußdiagrammform in Fig. 6 dargestellt ist, zeigt, wie die Rauschschätzungsaktualisierungsentscheidung schließlich ge­ macht wird. Das Verfahren startet bei Schritt 600 und geht zu Schritt 603, wo das Aktualisierungsflag (update_flag) ge­ löscht wird. Dann wird in Schritt 604 die Aktualisierungslo­ gik (nur VMSUM) von Vilmur implementiert durch Prüfung, ob die Summe der Sprachmaße v(m) kleiner als ein Aktualisie­ rungsschwellwert (UPDATE_THLD) ist. Wenn die Summe der Sprachmaße kleiner als der Aktualisierungsschwellwert ist, so wird in Schritt 605 der Aktualisierungszähler (update_cnt) gelöscht und in Schritt 606 das Aktualisierungsflag gesetzt. Der Pseudokode für die Schritte 603-606 ist nachfolgend ge­ zeigt:
Wenn in Schritt 604 die Summe der Sprachmaße größer ist als der Aktualisierungsschwellwert, wird eine Rauschunterdrückung gemäß der Erfindung implementiert. Als erstes wird in Schritt 607 die gesamte Kanalenergieschätzung Etot(m) des aktuellen Rahmens m mit dem Rauschpegel in db(NOISE_FLOOR_DB) vergli­ chen, während die spektrale Abweichung Δ mit dem Abweichungs­ schwellwert (DEV_THLD) verglichen wird. Wenn die gesamte Ka­ nalenergieschätzung größer als der Rauschpegel ist und die spektrale Abweichung kleiner als der Abweichungsschwellwert, so wird in Schritt 608 der Aktualisierungszähler inkremen­ tiert. Nachdem der Aktualisierungszähler inkrementiert wurde, wird in Schritt 609 ein Test durchgeführt, um zu bestimmen, ob der Aktualisierungszähler größer oder gleich ist einem Ak­ tualisierungszählerschwellwert (UPDATE_CNT_THLD). Wenn das Ergebnis des Tests in Schritt 609 wahr ist, dann wird in Schritt 606 das Aktualisierungsflag gesetzt. Der Pseudokode für die Schritte 607-609 und 606 ist unten gezeigt:
Wie man aus Fig. 6 sehen kann, wird, wenn einer der Tests in den Schritten 607 und 609 nicht erfüllt wird, oder nachdem das Aktualisierungsflag in Schritt 606 gesetzt wurde, die Logik zur Verhinderung eines langfristigen "Verschiebens" des Aktualisierungszählers implementiert. Die Hystereselogik wird implementiert, um minimale, spektrale Abweichungen der Akkumu­ lierung über lange Perioden zu verhindern, die eine ungültige, erzwungene Aktualisierung verursachen. Das Verfahren beginnt in Schritt 610, wo ein Test durchgeführt wird, um zu bestim­ men, ob der Aktualisierungszähler gleich dem letzten Aktuali­ sierungszählerwert (last_update_cnt) der letzten sechs Rahmen (HYSTER_CNT_THLD) ist. In der bevorzugten Ausführungsform werden sechs Rahmen als ein Schwellwert verwendet, aber eine beliebige Zahl von Rahmen kann implementiert werden. Wenn der Test in Schritt 610 wahr ist, so wird in Schritt 611 der Ak­ tualisierungszähler gelöscht, und das Verfahren geht in Schritt 612 zum nächsten Rahmen. Wenn der Test in Schritt 610 falsch ist, so geht das Programm direkt zum nächsten Rahmen in Schritt 612. Der Pseudokode für die Schritte 610-612 ist nachfolgend gezeigt:
In der bevorzugten Ausführungsform sind die Werte für die vorher verwendeten Konstanten wie folgt:
Immer, wenn in Schritt 606 das Aktualisierungsflag für einen vorgegebenen Rahmen gesetzt ist, wird die Kanalrauschschät­ zung für den nächsten Rahmen gemäß der Erfindung aktuali­ siert. Die Kanalrauschschätzung wird im Glättungsfilter 224 aktualisiert unter Verwendung von:
En(m + 1, i) = max{Emin, αnEn(m, i) + (1 - αn)Ech(m, i)}; 0 ≦ i < Nc,
wobei Emin = 0,0625 die minimal gestattete Kanalenergie ist und αn = 0,9 der Kanalrauschglättungsfaktor, der lokal im Glättungsfilter 224 gespeichert ist. Die aktualisierte Kanal­ rauschschätzung wird im Energieschätzspeicher 225 gespeichert, und das Ausgangssignal des Energieschätzspeichers 225 ist die aktualisierte Kanalrauschschätzung En(m). Die aktualisierte Kanalrauschschätzung En(m) wird als Eingangssignal für den Kanal-SNR-Schätzer 218 verwendet, wie dies oben beschrieben wurde und auch für den Verstärkungsberechner 233, wie dies nachfolgend beschrieben wird.
Als nächstes bestimmt das Rauschunterdrückungssystem 109, ob eine Kanal-SNR-Modifikation stattfinden soll. Diese Bestim­ mung wird im Kanal-SNR-Modifizierer 227 durchgeführt, der die Zahl der Kanäle zählt, die Kanal-SNR-Indexwerte haben, die einen Indexschwellwert übersteigen. Während des Modifika­ tionsverfahrens selbst vermindert der Kanal-SNR-Modifizierer 227 die SNR dieser speziellen Kanäle, die einen SNR-Index haben, der kleiner als ein Rücksetzschwellwert (SETBACH_THLD) ist, oder vermindert das SNR aller Kanäle, wenn die Summe der Sprachmaße kleiner als ein Maßschwellwert (METRIC_THLD) ist. Eine Pseudokodedarstellung des Kanal-SNR-Modifikationsverfah­ rens, das im Kanal-SNR-Modifizierer 227 stattfindet, stellt sich wie folgt dar:
An diesem Punkt werden Kanal-SNR-Indizes {σq'} auf einen SNR-Schwellwert im SNR-Schwellwertblock 230 begrenzt. Die Konstante σth wird lokal im SNR-Schwellwertblock 230 gespei­ chert. Eine Pseudokodedarstellung des im SNR-Schwellwertblock 230 durchgeführten Verfahrens wird nachfolgend gegeben:
In der bevorzugten Ausführungsform sind die vorherigen Kon­ stanten und Schwellwerte gegeben zu:
An diesem Punkt werden die begrenzten SNR-Indizes {σq"} in den Verstärkungsberechner 233 eingegeben, wo die Kanalver­ stärkungen bestimmt werden. Als erstes wird der Gesamtver­ stärkungsfaktor bestimmt unter Verwendung von:
wobei γmin = -13 die minimale Gesamtverstärkung, Efloor = 1 die Rauschpegelenergie und En(m) das geschätzte Rauschspek­ trum ist, das während des vorhergehenden Rahmens berechnet wurde. In der bevorzugten Ausführungsform werden die Konstan­ ten γmin und Efloor lokal im Verstärkungsberechner 233 ge­ speichert. In der Fortsetzung werden die Kanalverstärkungen (in dB) bestimmt unter Verwendung von:
wobei µg = 0,39 der Verstärkungsabfall ist (der auch lokal im Verstärkungsberechner 233 gespeichert wird). Die linearen Ka­ nalverstärkungen werden dann umgewandelt unter Verwendung von:
An diesem Punkt werden die oben bestimmten Kanalverstärkungen auf das transformierte Eingabesignal G(k) angewandt mit den folgenden Kriterien, um das Ausgangssignal H(k) des Kanalver­ stärkungsmodifizierers 239 zu erzeugen:
Die otherwise-Bedingung in der obigen Gleichung nimmt an, daß das Intervall von k 0 ≦ k ≦ M/2 ist. Es wird ferner angenommen, daß H(k) gleichmäßig symmetrisch ist, so daß die folgende Be­ dingung auch auferlegt wird:
H(M - k) = H(k); 0 < k < M/2.
Das Signal H(k) wird dann in die Zeitebene (zurück) umgewan­ delt im Kanalkombinierer 242 unter Verwendung der inversen DFT:
und der Frequenzbereichfilterprozeß wird beendet, um das Aus­ gangssignal h'(n) zu erzeugen durch Anwenden einer Überlap­ pung und Addition mit den folgenden Kriterien:
Die Signalnachentzerrung wird auf das Signal h'(n) durch den Nachentzerrungsblock 245 angewandt, um das Signal s'(n) zu erzeugen, das gemäß der Erfindung rauschunterdrückt wurde:
s'(n) = h'(n) + ζds'(n - 1); 0 ≦ n < L,
wobei ζd = 0,8 der Nachentzerrungsfaktor ist, der lokal in­ nerhalb des Nachentzerrungsblocks 245 gespeichert ist.
Fig. 7 zeigt allgemein ein Blockdiagramm eines Kommunika­ tionssystems 700, das vorteilhafterweise das erfindungsgemäße Rauschunterdrückungssystem implementieren kann. In der bevor­ zugten Ausführungsform ist das Kommunikationssystem ein zel­ lulares Funktelefonsystem des Mehrfachzugriffs durch Kode­ trennung (CDMA). Wie ein Durchschnittsfachmann jedoch erken­ nen wird, kann das erfindungsgemäße Rauschunterdrückungssy­ stem in einem beliebigen Kommunikationssystem implementiert werden, das einen Vorteil aus dem System zieht. Solche Sy­ steme umfassen in nicht einschränkender Weise Voice-Mail- Systeme, zellulare Funktelefonsysteme, leitungsgebundene Systeme, Luftlinienkommunikationssysteme etc. Es ist wichtig zu beachten, daß das erfindungsgemäße Rauschunterdrückungssy­ stem vorteilhafterweise in Kommunikationssystemen implemen­ tiert werden kann, die keine Sprachkodierung umfassen, bei­ spielsweise in analogen, zellularen Funktelefonsystemen.
Bezieht man sich auf Fig. 7, so werden aus Gründen der Be­ quemlichkeit Akronyme verwendet. Das Folgende ist eine Liste der Definitionen für die in Fig. 7 verwendeten Akronyme:
BTS Basistransceiverstation
CBSC Zentralisierte Basisstationssteuerung
EC Echolöschvorrichtung
VLR Besuchsortsregister
HLR Heimatortsregister
ISDN Dienstintegriertes Digitales Fernmeldenetz
MS Mobile Station
MSC Mobiles Vermittlungszentrum
MM Mobilitätsmanager
OMCR Betriebs- und Wartungszentrum-Funk
OMCS Betriebs- und Wartungszentrum-Vermittlung
PSTN Öffentliches Telefonnetz
TC Transkoder
Wie man aus Fig. 7 sieht, ist eine BTS 701-703 mit einem CBSC 704 verbunden. Jede BTS 701-703 liefert eine Funkfrequenz­ (RF)-Kommunikation zu einer MS 705-706. In der bevorzugten Ausführungsform ist die Sender/Empfänger(Transceiver)-Hard­ ware, die in den BTSs 701-703 implementiert ist und die MSs 705-706, um die RF-Kommunikation zu unterstützen, im Dokument definiert mit dem Titel "TIA/EIA/IS-95 Mobile Station-Base Station Compatibility Standard for Dual Mode Wideband Spread Spectrum Cellular System", July 1993, erhältlich von der Tele­ communication Industry Association (TIA). Die CBSC 704 ist unter anderem verantwortlich für die Gesprächsverarbeitung über den TC 710 und das Mobilitätsmanagement über den MM 709. In der bevorzugten Ausführungsform befindet sich die Funktio­ nalität des Sprachkodierers 100 der Fig. 2 im TC 704. Andere Aufgaben der CBSC 704 umfassen die Merkmalssteuerung und die Sendung/Netzwerk-Schnittstellenbildung. Für mehr Information bezüglich der Funktionalität der CBSC 704 wird Bezug genommen auf die US-Patentanmeldung mit der Seriennummer 07/997, 997 von Bach et al., des gleichen Anmelders wie bei der vorlie­ genden Anmeldung.
In Fig. 7 ist auch ein OMCR 712, das mit dem MM 709 der CBSC 704 verbunden ist, dargestellt. Das OMCR 712 ist verantwort­ lich für die Operationen und die allgemeinen Wartung des Funkteils (CBSC 704 und BTS 701-703 Kombination) des Kommuni­ kationssystems 700. Das CBSC 704 ist mit dem MSC 715 verbun­ den, das Schaltmöglichkeiten zwischen dem PSTN 720/ISDN 722 und dem CBSC 704 liefert. Das OMCS 724 ist verantwortlich für die Operationen und die allgemeine Wartung des Vermittlungs­ teils (MSC 715) des Kommunikationssystems 700. Das HLR 716 und das VLR 717 versorgen das Kommunikationssystem 700 mit Benutzerinformation, die hauptsächlich für Gebührenzwecke verwendet wird. Die ECs 711 und 719 sind implementiert, um die Qualität des Sprachsignals zu verbessern, das durch das Kommunikationssystem 700 übertragen wird.
Die Funktionalität der CBSC 704, des MSC 715, des HLR 716 und des VLR 717 ist in Fig. 7 als verteilt gezeigt, wobei aber ein Durchschnittsfachmann erkennen wird, daß die Funktionali­ tät ebenso in einem einzigen Element zentralisiert werden kann. Bei anderen Konfigurationen kann das TC 710 ebenso ent­ weder im MSC 715 oder eine BTS 701-703 angeordnet sein. Da die Funktionalität des Rauschunterdrückungssystems 109 allge­ mein ist, zieht die vorliegende Erfindung die Durchführung der Rauschunterdrückung gemäß der Erfindung in einem Element (beispielsweise dem MSC 715) in Betracht, während sie die Sprachkodierfunktion in einem anderen Element (beispielsweise dem CBSC 704) durchführt. In dieser Ausführungsform würde das rauschunterdrückte Signal s'(n) (oder Daten, die das rausch­ unterdrückte Signal s'(n) darstellen) vom MSC 715 zum CBSC 704 über die Verbindung 726 transferiert.
In der bevorzugten Ausführungsform führt das TC 710 eine Rauschunterdrückung gemäß der Erfindung durch unter Verwen­ dung des in Fig. 2 gezeigten Rauschunterdrückungssystems 109. Die Verbindung 726, die das MSC 715 mit dem CBSC 704 verbin­ det, ist eine T1/E1-Verbindung, die im Stand der Technik wohl bekannt ist. Durch Plazierung des TC 710 bei der CBXC wird eine 4 : 1-Verbesserung des Verbindungsbudgets erreicht durch die Kompression des Eingangssignals (eingegeben von der T1/E1- Verbindung 726) durch den TC 710. Das komprimierte Signal wird zu einer speziellen BTS 701-703 transferiert für eine Sendung zu einer speziellen MS 705-706. Es ist wichtig anzu­ merken, daß das komprimierte Signal, das zu einer speziellen BTS 701-703 transferiert wird, einer weiteren Bearbeitung im BTS 701-703 unterliegt, bevor es gesendet wird. Um es anders zu sagen, das schließlich an die MS 705-706 gesendete Signal unterscheidet sich in der Form, aber es ist dasselbe wie das komprimierte Signal, das den TC 710 anregt. In jedem Fall wurde das komprimierte Signal, das den TC 710 anregt, einer Rauschunterdrückung gemäß der Erfindung unter Verwendung des Rauschunterdrückungssystems 109 (wie in Fig. 2 gezeigt) un­ terworfen.
Wenn die MS 705-706 das Signal empfängt, das durch eine BTS 701-703 gesendet wurde, wird die MS 705-706 im wesentlichen die ganze Verarbeitung, die von der BTS 701-703 getan wurde, und die Sprachkodierung, die von dem TC 710 vollzogen wurde "aufheben" (allgemein als "dekodieren" bezeichnet). Wenn die MS 705-706 ein Signal zurück zur BTS 701-703 überträgt, so implementiert die MS 705-706 ebenso eine Sprachkodierung. Somit befindet sich der Sprachkodierer 100 der Fig. 1 in der MS 705-706, wobei auch und als solches eine Rauschunter­ drückung gemäß der Erfindung auch durch die MS 705-706 durch­ geführt wird. Nachdem ein Signal, das einer Rauschunter­ drückung unterworfen wurde, von der MS 705-706 (die MS führt auch eine weitere Verarbeitung des Signals durch, um die Form aber nicht die Substanz des Signals zu ändern) zu einer BTS 701-703 gesandt wurde, so wird die BTS 701-703 die Verarbei­ tung "aufheben", die mit dem Signal durchgeführt wurde, und das sich ergebende Signal zum TC 710 für eine Sprachdekodie­ rung übertragen. Nach der Sprachdekodierung durch den TC 710 wird das Signal zu einem Endbenutzer über die T1/E1-Verbin­ dung 726 übertragen. Da sowohl der Endbenutzer als auch der Benutzer in der MS 705-706 schließlich ein Signal empfängt, das einer Rauschunterdrückung gemäß der Erfindung unterworfen wurde, so kann jeder Benutzer die Vorteile erkennen, die durch das Rauschunterdrückungssystem 109 des Sprachkodierers 100 geliefert wird.
Fig. 8 zeigt allgemein Variablen, die sich auf die Rauschun­ terdrückung eines Sprachsignals beziehen, wie es durch den Stand der Technik implementiert ist, während Fig. 9 allgemein Variablen zeigt, die sich auf die Rauschunterdrückung eines Sprachsignals beziehen, wie es durch das Rauschunter­ drückungssystem gemäß der Erfindung implementiert ist. Die verschiedenen Kurven zeigen die Werte verschiedener Zustands­ variablen als eine Funktion der Rahmennummer m, die auf der horizontalen Achse gezeigt ist. Die erste Kurve (Kurve 1) in jeder der Fig. 8 und 9 zeigt die gesamte Kanalenergie Etot(m), gefolgt von der Sprachmaßsumme v(m), dem Aktualisie­ rungszähler (update_cnt oder TIMER bei Vilmur), dem Aktualisierungsflag (update_flag), der Summe der Kanalrauschschät­ zungen (ΣEn(m, i)) und die geschätzte Signaldämpfung, 10log10 (Einput/Eoutput), wobei die Eingabe shp(n) und die Ausgabe s'(n) ist.
Bezieht man sich auf die Fig. 8 und Fig. 9, so kann das An­ steigen des Hintergrundrauschens in Kurve 1 gerade vor dem Rahmen 600 beobachtet werden. Vor dem Rahmen 600 war das Ein­ gangssignal ein "sauberes" Sprachsignal 801 (ein niedriges Hintergrundrauschen). Wenn ein plötzliches Ansteigen des Hin­ tergrundrauschens 803 auftritt, wird die Sprachmaßsumme v(m), die in Kurve 2 gezeigt ist, proportional erhöht, und das Rauschunterdrückungsverfahren des Standes der Technik wirkt nur gering. Die Fähigkeit aus diesem Zustand eine Wiederge­ winnung durchzuführen, ist in Kurve 3 gezeigt, wo der Aktua­ lisierungszähler (update_cnt) sich so lange erhöhen kann, wie keine Aktualisierung durchgeführt wird. Dieses Beispiel zeigt, daß der Aktualisierungszähler den Aktualisierungs­ schwellwert (UPDATE_CNT_THLD) von 300 (für Vilmur) während der aktiven Sprache ungefähr bei Rahmen 900 erreicht. Unge­ fähr bei Rahmen 900 wird das Aktualisierungsflag (update_flag) gesetzt, wie das in Kurve 4 gezeigt ist, was eine Hintergrundrauschschätzungaktualisierung unter Verwen­ dung des aktiven Sprachsignals gibt, wie das in Kurve 5 ge­ zeigt ist. Dies kann als eine Verstärkung der aktiven Sprache beobachtet werden, wie dies in Kurve 6 gezeigt ist. Es ist wichtig zu beachten, daß die Aktualisierung der Rauschschät­ zung während des Sprachsignals (Rahmen 900 der Kurve 1 er­ folgt während der Sprache) erfolgt, mit der Auswirkung eines "Niederknüppelns" des Sprachsignals, wenn eine Aktualisierung nicht notwendig ist. Es ist auch, da das Risiko besteht, daß der Aktualisierungszählerschwellwert während der normalen Sprache abläuft, ein relativ hoher Schwellwert (300) erfor­ derlich, um den Versuch zu machen, eine solche Aktualisierung zu verhindern.
Bezieht man sich auf Fig. 9, so wird der Aktualisierungszäh­ ler nur inkrementiert, während das Hintergrundrauschen zunimmt, aber bevor das Sprachsignal beginnt. Als solches kann der Aktualisierungsschwellwert auf einem Wert von 50 ernied­ rigt werden, während dennoch zuverlässige Aktualisierungen aufrecht erhalten werden. Hier erreicht der Aktualisierungs­ zähler den Aktualisierungszählerschwellwert (UPDATE_CNT_THLD) von 50 im Rahmen 650, was dem Rauschunterdrückungssystem 109 genügend Zeit gibt, auf den neuen Rauschzustand zu konvergie­ ren, vor der Rückkehr des Sprachsignals in Rahmen 800. Wäh­ rend dieser Zeit kann man sehen, daß die Dämpfung nur während Rahmen ohne Sprache stattfindet, so daß kein "Niederknüppeln" des Sprachsignals auftritt. Das Ergebnis ist ein verbessertes Sprachsignal, wie es vom Endnutzer gehört werden kann.
Das verbesserte Sprachsignal ergibt sich aus der Tatsache, daß die Aktualisierungsentscheidung gemacht wird, basierend auf der spektralen Abweichung zwischen der aktuellen Rahmen­ energie und einem Mittelwert der letzten Rahmenenergie, an­ statt es einem Timer einfach zu gestatten, abzulaufen, während des Fehlens normaler Sprachmaßaktualisierungen. Im letzteren Fall (wie bei Vilmur) sieht das System den plötzlichen An­ stieg des Rauschens als Sprachsignal selbst und ist somit nicht fähig, den erhöhten Hintergrundrauschpegel von einem wahren Sprachsignal zu unterscheiden. Durch Verwendung der spektralen Abweichung kann das Hintergrundrauschen vom wahren Sprachsignal unterschieden werden, und es kann somit eine verbesserte Aktualisierungseintscheidung vorgenommen werden.
Fig. 10 zeigt allgemein Variablen, die sich auf die Rauschun­ terdrückung eines Musiksignals beziehen, wie dies im Stand der Technik implementiert ist, während Fig. 11 allgemein Va­ riablen zeigt, die sich auf die Rauschunterdrückung eines Mu­ siksignals beziehen, wie es durch ein Rauschunterdrückungssy­ stem gemäß der Erfindung implementiert ist. Für die Zwecke dieses Beispiels ist das Signal bis zum Rahmen 600 in Fig. 10 und Fig. 11 das gleiche, saubere Signal 800, wie es in Fig. 8 und Fig. 9 gezeigt ist. Bezieht man sich auf Fig. 10, so ver­ hält sich das Verfahren des Standes der Technik überwiegend gleich wie das in Fig. 8 gezeigte Hintergrundrauschbeispiel.
In Rahmen 600 erzeugt das Musiksignal 805 eine virtuelle, kon­ tinuierliche Sprachmaßsumme v(m), wie das in Kurve 2 gezeigt ist, die schließlich durch den Aktualisierungszähler in Rah­ men 900 überdeckt wird (wie man in Kurve 3 sieht). Da die Kennzeichen des Musiksignals 805 sich über der Zeit ändern, so wird die in Kurve 6 gezeigte Verstärkung vermindert, aber der Aktualisierungszähler überdeckt kontinuierlich das Sprachmaß, wie das in Rahmen 1800 gezeigt ist. Im Gegensatz dazu, wie man am besten in Fig. 11 sieht, erreicht der Aktua­ lisierungszähler (wie man in Kurve 3 sieht) nie einen Schwellwert (UPDATE_CNT_THLD) von 50 und so tritt keine Ak­ tualisierung auf. Die Tatsache, daß keine Aktualisierung auf­ tritt, kann am besten unter Bezug auf Kurve 6 der Fig. 11 ge­ sehen werden, wo die Verstärkung des Musiksignals 805 kon­ stant 0 dB beträgt (das heißt, es findet keine Verstärkung statt). Somit wird ein Benutzer, der der Musik zuhört (beispielsweise der "Wartemusik"), die einer Rauschunter­ drückung nach dem Stand der Technik unterworfen ist, eine un­ erwünschte Änderung im Musikpegel hören, während ein Benut­ zer, der der Musik zuhört, die einer Rauschunterdrückung ge­ mäß der Erfindung unterworfen ist, die Musik wie gewünscht mit konstanten Pegeln hört.

Claims (33)

1. Verfahren zum Betreiben eines Kommunikationssystems mit Rauschunterdrückung,
wobei das Kommunikationssystem einen Informationstransfer unter Verwendung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrahmen in den Kanälen ein Rauschen aufweisen, das eine Rauschschätzung des Kanals ergibt,
wo­ bei das Verfahren folgende Schritte umfaßt:
Schätzen einer Kanalenergie (Ech) in einem aktuellen Informationsrahmen;
Schätzen einer Gesamtenergie (Etot) des aktuellen Informationsrahmens, basie­ rend auf der Schätzung der Kanalenergie;
Schätzung einer Leistung (EdB) von Spektren des aktuellen In­ formationsrahmens, basierend auf der Schätzung der Kanalenergie;
Schätzung einer Leistung () von Spektren einer Vielzahl vergangener In­ formationsrahmen, basierend auf der Schätzung der Leistung der Spektren im aktuel­ len Rahmen;
Bestimmen einer Abweichung (ΔE) zwischen dem geschätzten Wert der Lei­ stung der Spektren des aktuellen Rahmens und dem geschätzten Wert der Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
Aktualisieren der Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtenergie des aktuellen Informationsrahmens und der bestimmten Abwei­ chung.
2. Verfahren nach Anspruch 1, wobei es weiter den Schritt einer Modifizierung einer Verstärkung des Kanals, basierend auf der Aktualisierung der Rauschschätzung, um ein rauschunterdrücktes Signal zu erzeugen, umfaßt.
3. Verfahren nach Anspruch 1, wobei der Schritt des Schätzens einer Leistung von Spektren einer Vielzahl von vergangenen Informationsrahmen weiter den Schritt des Schätzens einer Leistung von Spektren einer Vielzahl vergangener Rahmen, ba­ sierend auf einer exponentiellen Wichtung der vergangenen Informationsrahmen, um­ faßt.
4. Verfahren nach Anspruch 3, wobei die exponentielle Wichtung der vergangenen Informationsrahmen eine Funktion der Schätzung der Gesamtenergie des aktuellen Informationsrahmens ist.
5. Verfahren nach Anspruch 1, wobei der Schritt der Aktualisierung der Rauschschät­ zung des Kanals, basierend auf der Schätzung der Gesamtenergie und der bestimm­ ten Abweichung ferner den Schritt der Aktualisierung der Rauschschätzung des Ka­ nals, basierend auf einem Vergleich der Schätzung der Gesamtenergie mit einem er­ sten Schwellwert und einen Vergleich der bestimmten Abweichung mit einem zweiten Schwellwert umfaßt.
6. Verfahren nach Anspruch 5, wobei der Schritt der Aktualisierung der Rausch­ schätzung des Kanals, basierend auf einem Vergleich der Schätzung der Gesamt­ energie mit einem ersten Schwellwert und einem Vergleich der bestimmten Abwei­ chung mit einem zweiten Schwellwert weiter den Schritt der Aktualisierung der Rauschschätzung des Kanals umfaßt, wenn die Schätzung der Gesamtenergie größer als der erste Schwellwert ist und wenn die bestimmte Abweichung unterhalb des zweiten Schwellwerts liegt.
7. Verfahren nach Anspruch 6, wobei der Schritt der Aktualisierung der Rauschschät­ zung des Kanals, wenn die Schätzung der Gesamtenergie größer ist als der erste Schwellwert und wenn die bestimmte Abweichung unterhalb des zweiten Schwell­ wertes liegt, weiter den Schritt der Aktualisierung der Rauschschätzung des Kanals umfaßt, wenn die Schätzung der Gesamtenergie größer als der erste Schwellwert für eine erste vorbestimmte Anzahl von Rahmen ist, ohne daß eine zweite vorbestimmte Anzahl aufeinanderfolgender Rahmen eine Schätzung der Gesamtenergie aufweist, die kleiner oder gleich dem ersten Schwellwert ist.
8. Verfahren nach Anspruch 7, wobei die erste vorbestimmte Zahl von Rahmen weiter 50 Rahmen umfaßt.
9. Verfahren nach Anspruch 7, wobei die zweite vorbestimmte Zahl aufeinanderfol­ gender Rahmen ferner sechs Rahmen umfaßt.
10. Verfahren nach Anspruch 1, wobei das Verfahren entweder in einem mobilen Vermittlungszentrum (MSC), einer zentralisierten Basisstationssteuerung (CBSC), einer Basistransceiverstation (BTS) oder einer mobilen Station (MS) stattfindet.
11. Vorrichtung zum Betreiben eines Kommunikationssystems mit Rauschunterdrü­ ckung,
wobei das Kommunikationssystem einen Informationstransfer unter Verwen­ dung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrah­ men in den Kanälen ein Rauschen aufweisen, das eine Rauschschätzung des Kanals ergibt,
wobei die Vorrichtung folgendes umfaßt:
eine Vorrichtung für das Schätzen einer Kanalenergie (Ech) in einem aktuellen Informationsrahmen;
eine Vorrichtung für das Schätzen einer Gesamtenergie (Etot) des aktuellen Informationsrahmens, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung (EdB) von Spektren des aktu­ ellen Informationsrahmens, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung () von Spektren einer Vielzahl vergangener Informationsrahmen, basierend auf der Schätzung der Leistung der Spektren im aktuellen Rahmen;
eine Vorrichtung zum Bestimmen einer Abweichung (ΔE) zwischen dem ge­ schätzten Wert der Leistung der Spektren des aktuellen Rahmens und dem ge­ schätzten Wert der Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basie­ rend auf der Schätzung der Gesamtenergie und der bestimmten Abweichung.
12. Vorrichtung nach Anspruch 11, wobei sie ferner eine Vorrichtung für das Modifizie­ ren einer Verstärkung des Kanals, basierend auf der Aktualisierung der Rauschschät­ zung umfaßt, um ein rauschunterdrücktes Signal zu erzeugen.
13. Vorrichtung nach Anspruch 11, wobei die Vorrichtung mit einem Sprachkodierer verbunden ist, dem das rauschunterdrückte Signal als Eingangssignal eingegeben wird.
14. Vorrichtung nach Anspruch 11, wobei sich die Vorrichtung entweder in einem mo­ bilen Vermittlungszentrum (MSC), einer zentralisierten Basisstationssteuerung (CBSC), einer Basistransceiverstation (BTS) oder einer mobilen Station (MS) befindet.
15. Vorrichtung nach Anspruch 14, wobei das Kommunikationssystem ferner ein Kommunikationssystem des Vielfachzugriffs durch Kodetrennung (CDMA) umfaßt.
16. Vorrichtung nach Anspruch 11, wobei die Vorrichtung für das Schätzen der Leis­ tung von Spektren einer Vielzahl von vergangener Informationsrahmen ferner eine Vorrichtung für das Schätzen der Leistung von Spektren einer Vielzahl vergangener Rahmen, basierend auf einer exponentiellen Wichtungsfunktion der vergangenen In­ formationsrahmen, umfaßt.
17. Vorrichtung nach Anspruch 16, wobei die exponentielle Wichtung der vergange­ nen Informationsrahmen eine Funktion der Schätzung der Gesamtenergie innerhalb eines aktuellen Informationsrahmens ist.
18. Vorrichtung nach Anspruch 11, wobei die Vorrichtung für die Aktualisierung der Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtenergie und der bestimmten Abweichung ferner eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basierend auf einem Vergleich der Schätzung der Ge­ samtenergie mit einem ersten Schwellwert und einem Vergleich der bestimmten Ab­ weichung mit einem zweiten Schwellwert umfaßt.
19. Vorrichtung nach Anspruch 18, wobei die Vorrichtung für die Aktualisierung der Rauschschätzung des Kanals, basierend auf einem Vergleich der Schätzung der Ge­ samtenergie mit einem ersten Schwellwert und einem Vergleich der bestimmten Ab­ weichung mit einem zweiten Schwellwert weiter eine Vorrichtung für die Aktualisie­ rung der Rauschschätzung des Kanals umfaßt, wenn die Schätzung der Gesamtenergie größer als der erste Schwellwert ist, und wenn die bestimmte Abweichung unter­ halb des zweiten Schwellwerts liegt.
20. Vorrichtung nach Anspruch 19, wobei die Vorrichtung für die Aktualisierung der Rauschschätzung des Kanals, wenn die Schätzung der Gesamtenergie größer ist als der erste Schwellwert und wenn die bestimmte Abweichung unterhalb des zweiten Schwellwertes liegt, ferner eine Vorrichtung für die Aktualisierung der Rauschschät­ zung des Kanals umfaßt, wenn die Schätzung der Gesamtenergie größer als der erste Schwellwert für eine erste vorbestimmte Anzahl von Rahmen ist, ohne daß eine zweite vorbestimmte Anzahl aufeinanderfolgender Rahmen eine Schätzung der ge­ samten Kanalenergie aufweist, die kleiner oder gleich dem ersten Schwellwert ist.
21. Vorrichtung nach Anspruch 20, wobei die erste vorbestimmte Zahl von Rahmen weiter 50 Rahmen umfaßt.
22. Vorrichtung nach Anspruch 20, wobei die zweite vorbestimmte Zahl aufeinander­ folgender Rahmen ferner sechs Rahmen umfaßt.
23. Sprachkodierer für das Kodieren von Sprache in einem Kommunikationssystem,
wobei das Kommunikationssystem Sprachabtastungen durch Verwendung von Infor­ mationsrahmen in Kanälen transferiert,
wobei die Informationsrahmen in den Kanälen Rauschen aufweisen,
wobei der Sprachkodierer als Eingangsgröße die Sprachabtas­ tungen aufweist und
wobei der Sprachkodierer folgendes umfaßt:
eine Vorrichtung für das Unterdrücken des Rauschens in einem Rahmen von Sprachabtastungen, basierend auf einer Abweichung (ΔE) in einer spektralen Energie (EdB) zwischen einem aktuellen Rahmen von Sprachabtastungen und einer mittleren, spektralen Energie () einer Vielzahl vergangener Rahmen mit Sprachabtastungen, um rauschunterdrückte Sprachabtastungen zu erzeugen, und
eine Vorrichtung für das Kodieren der rauschunterdrückten Sprachabtastungen für den Transfer durch das Kommunikationssystem.
24. Sprachkodierer nach Anspruch 23, wobei der Sprachkodierer sich entweder in einem mobilen Vermittlungszentrum (MSC), einer zentralisierten Basisstationssteuerung (CBSC), einer Basistransceiverstation (BTS) oder einer mobilen Station (MS) ei­ nes Kommunikationssystems befindet.
25. Sprachkodierer nach Anspruch 24, wobei das Kommunikationssystem ferner ein Kommunikationssystem des Vielfachzugriffs durch Kodetrennung (CDMA) umfaßt.
26. Sprachkodierer nach Anspruch 23, wobei die Vorrichtung zur Unterdrückung von Rauschen in einem Rahmen von Sprachabtastungen ferner folgendes umfaßt:
eine Vorrichtung für das Schätzen einer Gesamtenergie des aktuellen Rah­ mens von Sprachabtastungen, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren des aktuellen Rahmens von Sprachabtastungen, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren einer Vielzahl vergangener Rahmen mit Sprachabtastungen, basierend auf der Schätzung der Leistung der Spektren im aktuellen Rahmen;
eine Vorrichtung zum Bestimmen einer Abweichung zwischen der Schätzung der Spektren des aktuellen Rahmens und der Schätzung der Leistung der Spektren der Vielzahl von vergangenen Rahmen;
eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basie­ rend auf der Schätzung der Gesamtenergie und der bestimmten Abweichung, und
eine Vorrichtung für das Modifizieren der Verstärkung des Kanals, basierend auf der Aktualisierung der Rauschschätzung, um die rauschunterdrückten Sprachab­ tastungen zu erzeugen.
27. Sprachkodierer für das Kodieren von Sprache in einem Kommunikationssystem,
wobei das Kommunikationssystem Sprachsignale durch Verwendung von Informati­ onsrahmen in Kanälen transferiert,
wobei die Informationsrahmen in den Kanälen Rauschen aufweisen,
wobei der Sprachkodierer als Eingangssignal ein Sprachsignal hat,
wobei der Sprachkodierer folgendes umfaßt:
eine Vorrichtung für das Unterdrücken des Rauschens in einem Rahmen, der das Sprachsignal umfaßt, basierend auf einer Abweichung (ΔE) in der spektralen E­ nergie (EdB) zwischen einem aktuellen Rahmen, der das Sprachsignal umfaßt, und
eine mittlere, spektrale Energie () einer Vielzahl vergangener Rahmen, die Sprachsignale umfassen, um das rauschunterdrückte Sprachsignal zu erzeugen, und
eine Vorrichtung für die Kodierung des rauschunterdrückten Sprachsignals für den Transfer durch das Kommunikationssystem.
28. Sprachkodierer nach Anspruch 27, wobei sich der Sprachkodierer entweder in einem mobilen Vermittlungszentrum (MSC), einer zentralisierten Basisstationssteue­ rung (CBSC), einer Basistransceiverstation (BTS) oder einer mobilen Station (MS) befindet.
29. Sprachkodierer nach Anspruch 28, wobei das Kommunikationssystem ferner ein Kommunikationssystem des Vielfachzugriffs durch Kodetrennung (CDMA) umfaßt.
30. Sprachkodierer nach Anspruch 27, wobei die Vorrichtung zur Unterdrückung von Rauschen in einem Rahmen, der das Sprachsignal umfaßt, ferner folgendes umfaßt:
eine Vorrichtung für das Schätzen einer Gesamtenergie des aktuellen Rah­ mens, der das Sprachsignal umfaßt, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren des aktuellen Rahmens, der das Sprachsignal umfaßt, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren einer Vielzahl vergangener Rahmen, die Sprachsignale umfassen, basierend auf der Schätzung der Leistung der Spektren im aktuellen Rahmen;
eine Vorrichtung zum Bestimmen einer Abweichung zwischen der Schätzung der Spektren des aktuellen Rahmens und der Schätzung der Leistung der Spektren der Vielzahl von vergangenen Rahmen;
eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basie­ rend auf der Schätzung der Gesamtenergie und der bestimmten Abweichung, und
eine Vorrichtung für das Modifizieren der Verstärkung des Kanals, basierend auf der Aktualisierung der Rauschschätzung, um das rauschunterdrückte Sprachsig­ nal zu erzeugen.
31. Sprachkodierer nach Anspruch 30, wobei das Sprachsignal entweder ein analoges Sprachsignal oder ein digitales Sprachsignal ist.
32. Verfahren in einem Kommunikationssystem,
wobei das Kommunikationssystem einen Informationstransfer unter Verwendung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrahmen in den Kanälen ein Rauschen aufwei­ sen, das eine Kanalrauschschätzung ergibt,
wobei das Verfahren folgende Schritte umfaßt:
Schätzen einer Kanalenergie in einem aktuellen Informationsrahmen;
Schätzen einer Gesamtkanalenergie in einem aktuellen Informationsrahmen, basierend auf der Schätzung der Kanalenergie;
Schätzen einer Leistung von Spektren des aktuellen Informationsrahmens, ba­ sierend auf der Schätzung der Kanalenergie;
Schätzen einer Leistung von Spektren einer Vielzahl vergangener Informati­ onsrahmen;
Bestimmen einer Abweichung zwischen dem geschätzten Wert der Spektren des aktuellen Rahmens und dem geschätzten Wert der Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
Aktualisieren der Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtkanalenergie und der bestimmten Abweichung.
33. Verfahren in einem Kommunikationssystem,
wobei das Kommunikationssystem einen Informationstransfer unter Verwendung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrahmen in den Kanälen ein Rauschen aufwei­ sen, das eine Kanalrauschschätzung ergibt,
wobei das Verfahren folgende Schritte umfaßt:
Schätzen einer Kanalenergie in einem aktuellen Informationsrahmen;
Schätzen einer Gesamtkanalenergie in einem aktuellen Informationsrahmen, basierend auf der Schätzung der Kanalenergie;
Schätzen einer Leistung von Spektren des aktuellen Informationsrahmens, ba­ sierend auf der Schätzung der Kanalenergie;
Schätzen einer ersten Leistung von Spektren einer Vielzahl vergangener In­ formationsrahmen, nicht basierend auf der Schätzung der Leistung der Spektren des aktuellen Rahmens;
Schätzen einer zweiten Leistung von Spektren einer Vielzahl vergangener In­ formationsrahmen, basierend auf der Schätzung der Leistung der Spektren des aktu­ ellen Rahmens;
Bestimmen einer Abweichung zwischen dem geschätzten Wert der Spektren des aktuellen Rahmens und dem geschätzten Wert der ersten Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
Aktualisieren der Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtkanalenergie und der bestimmten Abweichung.
DE19681070T 1995-11-13 1996-09-04 Verfahren und Vorrichtung zum Betreiben eines Kommunikationssystems mit Rauschunterdrückung Expired - Lifetime DE19681070C2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/556,358 US5659622A (en) 1995-11-13 1995-11-13 Method and apparatus for suppressing noise in a communication system
PCT/US1996/014270 WO1997018647A1 (en) 1995-11-13 1996-09-04 Method and apparatus for suppressing noise in a communication system

Publications (2)

Publication Number Publication Date
DE19681070T1 DE19681070T1 (de) 1998-02-26
DE19681070C2 true DE19681070C2 (de) 2002-10-24

Family

ID=24221022

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19681070T Expired - Lifetime DE19681070C2 (de) 1995-11-13 1996-09-04 Verfahren und Vorrichtung zum Betreiben eines Kommunikationssystems mit Rauschunterdrückung

Country Status (16)

Country Link
US (1) US5659622A (de)
JP (1) JP3842821B2 (de)
KR (1) KR100286719B1 (de)
CN (1) CN1075692C (de)
AU (1) AU689403B2 (de)
BR (1) BR9607249A (de)
CA (1) CA2203917C (de)
DE (1) DE19681070C2 (de)
FI (1) FI115582B (de)
FR (1) FR2741217B1 (de)
GB (1) GB2313266B (de)
HU (1) HU219255B (de)
IL (1) IL119226A (de)
RU (1) RU2169992C2 (de)
SE (1) SE521679C2 (de)
WO (1) WO1997018647A1 (de)

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IN184794B (de) * 1993-09-14 2000-09-30 British Telecomm
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US5881091A (en) * 1996-02-05 1999-03-09 Hewlett-Packard Company Spread spectrum linearization for digitizing receivers
JPH09326844A (ja) * 1996-06-03 1997-12-16 Mitsubishi Electric Corp 騒音低減通話装置及び騒音低減通話方法
KR100250561B1 (ko) 1996-08-29 2000-04-01 니시무로 타이죠 잡음소거기 및 이 잡음소거기를 사용한 통신장치
US5937377A (en) * 1997-02-19 1999-08-10 Sony Corporation Method and apparatus for utilizing noise reducer to implement voice gain control and equalization
US6104993A (en) * 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法
US5893056A (en) * 1997-04-17 1999-04-06 Northern Telecom Limited Methods and apparatus for generating noise signals from speech signals
FR2765715B1 (fr) * 1997-07-04 1999-09-17 Sextant Avionique Procede de recherche d'un modele de bruit dans des signaux sonores bruites
KR19990020369A (ko) * 1997-08-30 1999-03-25 윤종용 무선 사설교환시스템에서 노이즈 제거 방법
FR2768544B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de detection d'activite vocale
TW333610B (en) * 1997-10-16 1998-06-11 Winbond Electronics Corp The phonetic detecting apparatus and its detecting method
DE19747885B4 (de) * 1997-10-30 2009-04-23 Harman Becker Automotive Systems Gmbh Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
US6070137A (en) * 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
WO1999041737A1 (en) * 1998-02-17 1999-08-19 Motorola Inc. Method and apparatus for high speed determination of an optimum vector in a fixed codebook
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6073152A (en) * 1998-04-03 2000-06-06 Sarnoff Corporation Method and apparatus for filtering signals using a gamma delay line based estimation of power spectrum
US6088668A (en) * 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing
US6122610A (en) * 1998-09-23 2000-09-19 Verance Corporation Noise suppression for low bitrate speech coder
KR100281181B1 (ko) * 1998-10-16 2001-02-01 윤종용 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
TWM253017U (en) 1999-02-03 2004-12-11 Matsushita Electric Industrial Co Ltd Emergency reporting apparatus emergency reporting network system
US6453291B1 (en) * 1999-02-04 2002-09-17 Motorola, Inc. Apparatus and method for voice activity detection in a communication system
US6618701B2 (en) 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
DE19920819C1 (de) * 1999-05-06 2000-10-26 Bosch Gmbh Robert Verfahren und Vorrichtung zur Schätzung von gedächtnisbehafteten Übertragungskanälen
GB9912577D0 (en) * 1999-05-28 1999-07-28 Mitel Corp Method of detecting silence in a packetized voice stream
US6633841B1 (en) * 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
US6157670A (en) * 1999-08-10 2000-12-05 Telogy Networks, Inc. Background energy estimation
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US6366880B1 (en) * 1999-11-30 2002-04-02 Motorola, Inc. Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
BR0016127A (pt) * 1999-12-03 2002-08-06 Motorola Inc Método e aparelho para suprimir o ruìdo acústico de segundo plano em um sistema de comunicação
US6963546B2 (en) * 2000-03-15 2005-11-08 Interdigital Technology Corp. Multi-user detection using an adaptive combination of joint detection and successive interface cancellation
JP2001318694A (ja) * 2000-05-10 2001-11-16 Toshiba Corp 信号処理装置、信号処理方法および記録媒体
JP2002032096A (ja) 2000-07-18 2002-01-31 Matsushita Electric Ind Co Ltd 雑音区間/音声区間判定装置
JP4533517B2 (ja) * 2000-08-31 2010-09-01 株式会社東芝 信号処理方法および信号処理装置
US7277554B2 (en) 2001-08-08 2007-10-02 Gn Resound North America Corporation Dynamic range compression using digital frequency warping
WO2003063160A1 (en) * 2002-01-25 2003-07-31 Koninklijke Philips Electronics N.V. Method and unit for substracting quantization noise from a pcm signal
US7299173B2 (en) * 2002-01-30 2007-11-20 Motorola Inc. Method and apparatus for speech detection using time-frequency variance
RU2206960C1 (ru) * 2002-06-24 2003-06-20 Общество с ограниченной ответственностью "Центр речевых технологий" Способ подавления шума в информационном сигнале и устройство для его осуществления
US7283956B2 (en) * 2002-09-18 2007-10-16 Motorola, Inc. Noise suppression
US7343283B2 (en) * 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
RU2251811C2 (ru) * 2003-01-30 2005-05-10 Казанский государственный технический университет им. А.Н. Туполева Устройство разрешения сигналов на фоне произвольной помехи
US7809150B2 (en) * 2003-05-27 2010-10-05 Starkey Laboratories, Inc. Method and apparatus to reduce entrainment-related artifacts for hearing assistance systems
US20080281589A1 (en) * 2004-06-18 2008-11-13 Matsushita Electric Industrail Co., Ltd. Noise Suppression Device and Noise Suppression Method
RU2269205C1 (ru) * 2004-07-06 2006-01-27 Казанский государственный технический университет им. А.Н. Туполева Устройство разрешения радиоимпульсных сигналов на фоне произвольной помехи
WO2006049052A1 (ja) * 2004-11-02 2006-05-11 Matsushita Electric Industrial Co., Ltd. 雑音抑圧装置
KR20060091970A (ko) * 2005-02-16 2006-08-22 엘지전자 주식회사 이동통신단말기에서의 신호 대 잡음비 개선 방법 및 그 이동통신단말기
US20060184363A1 (en) * 2005-02-17 2006-08-17 Mccree Alan Noise suppression
WO2006097886A1 (en) * 2005-03-16 2006-09-21 Koninklijke Philips Electronics N.V. Noise power estimation
US7983906B2 (en) * 2005-03-24 2011-07-19 Mindspeed Technologies, Inc. Adaptive voice mode extension for a voice activity detector
US7596099B2 (en) * 2005-08-22 2009-09-29 Motorola, Inc. Method and apparatus for managing a communication link
EP1921609B1 (de) 2005-09-02 2014-07-16 NEC Corporation Rauschunterdrückungsverfahren und vorrichtung und computerprogramm
CN101300623B (zh) 2005-09-02 2011-07-27 日本电气株式会社 用于抑制噪声的方法、设备和计算机程序
US8116473B2 (en) 2006-03-13 2012-02-14 Starkey Laboratories, Inc. Output phase modulation entrainment containment for digital filters
US7555075B2 (en) * 2006-04-07 2009-06-30 Freescale Semiconductor, Inc. Adjustable noise suppression system
KR100883652B1 (ko) * 2006-08-03 2009-02-18 삼성전자주식회사 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템
US8060363B2 (en) * 2007-02-13 2011-11-15 Nokia Corporation Audio signal encoding
US7873114B2 (en) * 2007-03-29 2011-01-18 Motorola Mobility, Inc. Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate
US7809129B2 (en) * 2007-08-31 2010-10-05 Motorola, Inc. Acoustic echo cancellation based on noise environment
CN100556162C (zh) * 2007-09-13 2009-10-28 中兴通讯股份有限公司 一种实现明密话切换后媒体流的无损传输方法及系统
JP5461421B2 (ja) * 2007-12-07 2014-04-02 アギア システムズ インコーポレーテッド 保留音楽のエンドユーザ制御
RU2416876C2 (ru) * 2008-02-04 2011-04-20 Владимир Алексеевич Гарбузов Способ обработки аддитивной смеси сигнала и белого шума
CN100550133C (zh) * 2008-03-20 2009-10-14 华为技术有限公司 一种语音信号处理方法及装置
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
PT2410522T (pt) 2008-07-11 2018-01-09 Fraunhofer Ges Forschung Codificador de sinal de áudio, método para codificar um sinal de áudio e programa de computador
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
CN102044241B (zh) * 2009-10-15 2012-04-04 华为技术有限公司 一种实现通信系统中背景噪声的跟踪的方法和装置
EP2490214A4 (de) * 2009-10-15 2012-10-24 Huawei Tech Co Ltd Verfahren, vorrichtung und system zur signalverarbeitung
PT2491559E (pt) * 2009-10-19 2015-05-07 Ericsson Telefon Ab L M Método e estimador de fundo para a detecção de actividade de voz
US9729976B2 (en) * 2009-12-22 2017-08-08 Starkey Laboratories, Inc. Acoustic feedback event monitoring system for hearing assistance devices
US8917891B2 (en) 2010-04-13 2014-12-23 Starkey Laboratories, Inc. Methods and apparatus for allocating feedback cancellation resources for hearing assistance devices
US9654885B2 (en) 2010-04-13 2017-05-16 Starkey Laboratories, Inc. Methods and apparatus for allocating feedback cancellation resources for hearing assistance devices
CN102376303B (zh) * 2010-08-13 2014-03-12 国基电子(上海)有限公司 录音设备及利用该录音设备进行声音处理与录入的方法
PT3493205T (pt) 2010-12-24 2021-02-03 Huawei Tech Co Ltd Método e aparelho para detetar de forma adaptativa uma atividade de voz num sinal de áudio de entrada
MX2013009344A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral.
WO2012110448A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
CA2827277C (en) 2011-02-14 2016-08-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
EP3239978B1 (de) 2011-02-14 2018-12-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung und dekodierung von pulspositionen von spuren eines audiosignals
WO2012110447A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
CA2903681C (en) * 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
JP5480226B2 (ja) * 2011-11-29 2014-04-23 株式会社東芝 信号処理装置および信号処理方法
US8712769B2 (en) 2011-12-19 2014-04-29 Continental Automotive Systems, Inc. Apparatus and method for noise removal by spectral smoothing
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
EP3152756B1 (de) * 2014-06-09 2019-10-23 Dolby Laboratories Licensing Corporation Geräuschpegelschätzung
JP6208377B2 (ja) * 2014-07-29 2017-10-04 テレフオンアクチーボラゲット エルエム エリクソン(パブル) オーディオ信号における背景雑音の推定
GB201617016D0 (en) * 2016-09-09 2016-11-23 Continental automotive systems inc Robust noise estimation for speech enhancement in variable noise conditions
US10681458B2 (en) 2018-06-11 2020-06-09 Cirrus Logic, Inc. Techniques for howling detection
KR102242457B1 (ko) * 2019-08-08 2021-04-19 주식회사 에스원 Uwb 모듈레이션을 통한 노이즈 추정방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4654884A (en) * 1984-05-10 1987-03-31 Alps Electric Co., Ltd. Radio receiver with switching circuit for elimination of intermodulation interference
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
IT1216224B (it) * 1986-03-28 1990-02-22 Giuliani Marcello Complesso pneumatico per la pulitura e l'allontanamento di polveri, fibrille e cascami vari dalle carde laniere e cotoniere dell'industria tessile
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
SU1660188A1 (ru) * 1988-09-08 1991-06-30 Предприятие П/Я Р-6510 Адаптивное устройство компенсации помех в речевом сигнале
US5267322A (en) * 1991-12-13 1993-11-30 Digital Sound Corporation Digital automatic gain control with lookahead, adaptive noise floor sensing, and decay boost initialization
US5475686A (en) * 1992-12-28 1995-12-12 Motorola, Inc. Method and apparatus for transferring data in a communication system
DE69428119T2 (de) * 1993-07-07 2002-03-21 Picturetel Corp., Peabody Verringerung des hintergrundrauschens zur sprachverbesserung

Also Published As

Publication number Publication date
FI115582B (fi) 2005-05-31
CN1075692C (zh) 2001-11-28
FI972852A0 (fi) 1997-07-03
RU2169992C2 (ru) 2001-06-27
JPH10513030A (ja) 1998-12-08
IL119226A0 (en) 1996-12-05
FR2741217B1 (fr) 2004-08-20
US5659622A (en) 1997-08-19
SE9701659D0 (sv) 1997-05-02
CN1168204A (zh) 1997-12-17
FR2741217A1 (fr) 1997-05-16
WO1997018647A1 (en) 1997-05-22
GB2313266A (en) 1997-11-19
HK1005112A1 (en) 1998-12-24
HUP9800843A2 (hu) 1998-07-28
SE9701659L (sv) 1997-09-12
HU219255B (en) 2001-03-28
GB9713727D0 (en) 1997-09-03
BR9607249A (pt) 1997-12-30
GB2313266B (en) 2000-01-26
CA2203917A1 (en) 1997-05-14
KR19980701399A (ko) 1998-05-15
JP3842821B2 (ja) 2006-11-08
AU689403B2 (en) 1998-03-26
KR100286719B1 (ko) 2001-04-16
SE521679C2 (sv) 2003-11-25
IL119226A (en) 2000-10-31
AU1758497A (en) 1997-06-05
HUP9800843A3 (en) 1999-03-29
DE19681070T1 (de) 1998-02-26
CA2203917C (en) 2000-06-27
FI972852A7 (fi) 1997-07-03

Similar Documents

Publication Publication Date Title
DE19681070C2 (de) Verfahren und Vorrichtung zum Betreiben eines Kommunikationssystems mit Rauschunterdrückung
DE69830721T2 (de) Verfahren und vorrichtung zur bestimmung der übertragungsrate in einem kommunikationssystem
DE69917677T2 (de) SPRACHKODIERUNG MIT VERäNDERBAREM KOMFORT-RAUSCHEN FüR VERBESSERTER WIEDERGABEQUALITäT
DE60032797T2 (de) Geräuschunterdrückung
DE60029147T2 (de) Qualitätsverbesserung eines audiosignals in einem digitalen netzwerk
DE69910239T2 (de) Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale
DE69615302T2 (de) Maskierung des wahrnehmbaren Rauschens auf der Basis der Frequenzantwort eines Synthesefilters
DE60122203T2 (de) Verfahren und system zur erzeugung von behaglichkeitsrauschen bei der sprachkommunikation
DE69721349T2 (de) Sprachkodierung
DE60029990T2 (de) Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer
DE69621393T2 (de) Quantisierung von Sprachsignalen in prädiktiven Kodiersystemen unter Verwendung von Modellen menschlichen Hörens
DE60220485T2 (de) Verfahren und Vorrichtung zur Verschleierung von Rahmenausfall von prädiktionskodierter Sprache unter Verwendung von Extrapolation der Wellenform
DE19935808A1 (de) Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
DE69529393T2 (de) Verfahren zur gewichteten Geräuschfilterung
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
DE60034026T2 (de) Sprachverbesserung mit durch sprachaktivität gesteuerte begrenzungen des gewinnfaktors
DE602005000539T2 (de) Verstärkungsgesteuerte Geräuschunterdrückung
DE60125219T2 (de) Spektralmerkmal ersatz für die verschleierung von rahmenfehlern in einem sprachdekoder
DE69620967T2 (de) Synthese von Sprachsignalen in Abwesenheit kodierter Parameter
EP1453194B1 (de) Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
DE69534285T2 (de) Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit variabler Rate
DE60132321T2 (de) Verfahren und vorrichtung zur verteilten geräuschunterdrückung
DE60017763T2 (de) Verfahren und vorrichtung zur erhaltung einer ziel-bitrate in einem sprachkodierer
DE10041512A1 (de) Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE69627359T2 (de) Verbesserter echokompensator mit anwendung in der digitalen telefonie

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8607 Notification of search results after publication
8607 Notification of search results after publication
D2 Grant after examination
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: MOTOROLA MOBILITY, INC. ( N.D. GES. D. STAATES, US

R081 Change of applicant/patentee

Owner name: MOTOROLA MOBILITY, INC. ( N.D. GES. D. STAATES, US

Free format text: FORMER OWNER: MOTOROLA, INC., SCHAUMBURG, ILL., US

Effective date: 20110324

R071 Expiry of right