DE19681070C2 - Verfahren und Vorrichtung zum Betreiben eines Kommunikationssystems mit Rauschunterdrückung - Google Patents
Verfahren und Vorrichtung zum Betreiben eines Kommunikationssystems mit RauschunterdrückungInfo
- Publication number
- DE19681070C2 DE19681070C2 DE19681070T DE19681070T DE19681070C2 DE 19681070 C2 DE19681070 C2 DE 19681070C2 DE 19681070 T DE19681070 T DE 19681070T DE 19681070 T DE19681070 T DE 19681070T DE 19681070 C2 DE19681070 C2 DE 19681070C2
- Authority
- DE
- Germany
- Prior art keywords
- noise
- channel
- estimate
- spectra
- frames
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000004891 communication Methods 0.000 title claims description 52
- 238000000034 method Methods 0.000 title claims description 35
- 230000001629 suppression Effects 0.000 title claims description 24
- 238000001228 spectrum Methods 0.000 claims description 51
- 230000003595 spectral effect Effects 0.000 claims description 31
- 238000012546 transfer Methods 0.000 claims description 11
- 238000000926 separation method Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 210000000941 bile Anatomy 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 claims 1
- 230000009467 reduction Effects 0.000 description 42
- 238000010586 diagram Methods 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 5
- 230000007774 longterm Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 239000003607 modifier Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 208000003813 Oliver-McFarlane syndrome Diseases 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000035987 intoxication Effects 0.000 description 1
- 231100000566 intoxication Toxicity 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 210000004916 vomit Anatomy 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B15/00—Suppression or limitation of noise or interference
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mobile Radio Communication Systems (AREA)
- Noise Elimination (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
Description
Die Erfindung bezieht sich allgemein auf Rauschunterdrückung
und insbesondere auf die Rauschunterdrückung in einem
Kommunikationssystem.
Rauschunterdrückungstechniken in einem Kommunikationssystem
sind wohlbekannt. Das Ziel eines Rauschunterdrückungssystems
besteht darin, die Menge des Hintergrundrauschens während der
Sprachkodierung zu vermindern, so daß die Gesamtqualität des
kodierten Sprachsignals des Benutzers verbessert wird. Kommu
nikationssysteme, die Sprachkodierung implementieren, umfas
sen in nicht einschränkender Weise Voicemail-Systeme, zellu
lare Funktelefonsysteme, leitungsgebundene Kommunikationssy
steme, Luftlinienkommunikationssysteme etc.
Eine Rauschunterdrückungstechnik, die in zellularen Funktele
fonsystemen implementiert wurde, ist die spektrale Subtrak
tion. Bei dieser Lösung wird das Toneingangssignal in einzel
ne Spektralbänder (Kanäle) durch einen geeigneten Spektral
teiler aufgeteilt, und die einzelnen Spektralkanäle werden
dann gemäß dem Rauschenergiegehalt jedes Kanals gedämpft. Die
Lösung der spektralen Subtraktion verwendet eine Schätzung
der spektralen Dichte der Hintergrundrauschleistung, um ein
Signal-Rausch-Verhältnis (SNR) der Sprache in jedem Kanal zu
erzeugen, das wiederum verwendet wird, um einen Verstärkungs
faktor für jeden einzelnen Kanal zu berechnen. Der Verstär
kungsfaktor wird dann als Eingangssignal verwendet, um die
Kanalverstärkung für jeden einzelnen der Spektralkanäle zu
modifizieren. Die Kanäle werden dann wieder kombiniert, um
die rauschunterdrückte Ausgangswellenform zu erzeugen. Ein
Beispiel der Lösung der spektralen Subtraktion, die in einem
analogen zellularen Funktelefonsystem implementiert ist, kann
man im US-Patent Nr. 4,811,404 von Vilmur des gleichen Anmel
der wie bei der vorliegenden Anmeldung finden.
Wie im vorher erwähnten US-Patent ausgeführt ist, funktionie
ren die Techniken der Rauschunterdrückung des Standes der
Technik schlecht, wenn ein plötzliches starkes Ansteigen des
Hintergrundrauschens auftritt. Um die Nachteile des Standes
der Technik zu überwinden, führt das vorher erwähnte US-Pa
tent von Vilmur eine erzwungene Aktualisierung der Rausch
schätzungen unabhängig von der Sprachmaßsumme durch, wenn M
Rahmen ohne eine Aktualisierung der Hintergrundrauschschät
zung vergangen sind, wobei für M bei Vilmur angegeben wird,
daß es zwischen 50 und 300 liegen soll. Da ein Rahmen bei
Vilmur 10 Millisekunden (ms) lang ist, und M als 100 ange
nommen wird, so würde eine Aktualisierung mindestens jede
Sekunde auftreten, unabhängig von der Sprachmaßsumme VMSUM
(d. h., ob eine Aktualisierung nun notwendig ist oder nicht).
Die Erzwingung einer Aktualisierung der Rauschschätzung un
abhängig vom Sprachmaß kann zu einer Dämpfung des Sprachsig
nals des Benutzers führen, ungeachtet der Tatsache, daß kein
zusätzliches Hintergrundrauschen addiert wird. Dies wiederum
führt zu einer Verschlechterung der Sprachqualität, die vom
Endnutzer wahrgenommen wird. Darüberhinaus können Eingangs
signale, die über das Sprachsignal eines Benutzers hinaus
gehen (beispielsweise "Wartemusik"), Probleme verursachen,
dadurch daß die erzwungene Aktualisierung der Rauschschätzung
über kontinuierlichen Intervallen auftreten kann. Das kommt
daher, daß Musik sich über mehrere Sekunden (oder Minuten)
erstrecken kann, ohne genügend große Pausen, die eine normale
Aktualisierung der Hintergrundrauschschätzung gestatten
würden. Der Stand der Technik würde daher eine erzwungene
Aktualisierung alle M Rahmen gestatten, da es keinen Mecha
nismus gibt, um Hintergrundrauschen von nichtstationären
Eingabesignalen zu unterscheiden. Diese ungültige, erzwungene
Aktualisierung dämpft nicht nur das Eingangssignal, sondern
verursacht auch schwere Störungen, da die spektrale Schätzung
aktualisiert wird, basierend auf einer zeitveränderlichen,
nicht stationären Eingabe.
Es existiert somit ein Bedürfnis nach einem genaueren und zu
verlässigeren Rauschunterdrückungssystem für die Verwendung
in Kommunikationssystemen.
Die EP 0 628 947 A1 offenbart ein Verfahren und eine Vorrichtung
zur digitalen Sprachcodierung mit Sprachsignalhöhenabschätzung und
Klassifikation in digitalen Sprachcodierern.
Die EP 0 573 398 A2 offenbart einen C.E.L.P.-Vocoder.
Aus der WO 95/02288 A1 ist eine Vorrichtung zur Reduktion des Hin
tergrundrauschens in einem Telefonkommunikationskanal bekannt. Eine
Rauschschätzeinrichtung verwendet Komponenten des Frequenzspek
trums, um eine Rauschschätzung vorzunehmen.
Die Erfindung ist in den unabhängigen Patentansprüchen definiert.
Bevorzugte Ausgestaltungen sind in den Unteransprüchen angegeben.
Fig. 1 zeigt allgemein ein Blockdiagramm eines Sprachkodie
rers für die Verwendung in einem Kommunikationssystem.
Fig. 2 zeigt allgemein ein Blockdiagramm eines Rauschunter
drückungssystems gemäß der Erfindung.
Fig. 3 zeigt allgemein eine Rahmen-zu-Rahmen-Überlappung, die
in einem Rauschunterdrückungssystem gemäß der Erfindung auf
tritt.
Fig. 4 zeigt allgemein eine trapezförmige Fenstertechnik vor
verstärkter Abtastungen, die im Rauschunterdrückungssystem
der vorliegenden Erfindung auftauchen.
Fig. 5 zeigt allgemein ein Blockdiagramm des spektralen Ab
weichungsschätzers, der in Fig. 2 dargestellt ist und der im
Rauschunterdrückungssystem gemäß der Erfindung verwendet
wird.
Fig. 6 zeigt allgemein ein Flußdiagramm der Schritte, die in
der Aktualisierungsentscheidungsbestimmungsvorrichtung, die
in Fig. 2 dargestellt ist, und bei der Rauschunterdrückung
gemäß der Erfindung verwendet wird, durchgeführt werden.
Fig. 7 zeigt ein Blockdiagramm eines Kommunikationssystems,
das vorteilhafterweise das Rauschunterdrückungssystem gemäß
der Erfindung implementiert.
Fig. 8 zeigt allgemein Variablen, die sich auf die Rauschun
terdrückung eines Sprachsignals beziehen, wie sie im Stand
der Technik implementiert ist.
Fig. 9 zeigt allgemein Variablen, die sich auf die Rauschun
terdrückung eines Sprachsignals beziehen, wie es durch das
Rauschunterdrückungssystem gemäß der vorliegenden Erfindung
implementiert ist.
Fig. 10 zeigt allgemein Variablen, die sich auf die Rauschun
terdrückung eines Musiksignals beziehen, wie es im Stand der
Technik implementiert ist.
Fig. 11 zeigt allgemein Variablen, die sich auf die Rauschun
terdrückung eines Musiksignals beziehen, wie sie durch das
Rauschunterdrückungssystem gemäß der Erfindung implementiert
ist.
Ein Rauschunterdrückungssystem, das in einem Kommunikations
system implementiert ist, liefert eine verbesserte Aktuali
sierungsentscheidung während Zeiten, bei denen ein plötzli
ches Ansteigen des Hintergrundrauschpegels auftritt. Das
Rauschunterdrückungssystem erzeugt unter anderem eine Aktua
lisierung durch kontinuierliches Überwachen der Abweichung
einer spektralen Energie und erzwingt eine Aktualisierung,
basierend auf einem vorbestimmten Schwellwertkriterium. Die
spektrale Energieabweichung wird bestimmt durch Verwendung
eines Elements, das die letzten Werte der Leistungsspektral
komponenten aufweist, die exponentiell gewichtet sind. Die
exponentielle Wichtung ist eine Funktion der aktuellen Einga
beenergie, was bedeutet, je höher die Eingabesignalenergie
ist, desto länger ist das exponentielle Fenster. Umgekehrt gilt,
je niedriger die Signalenergie ist, desto kürzer das ex
ponentielle Fenster. Somit verhindert das Rauschunterdrückungssystem
eine erzwungene Aktualisierung während Peri
oden kontinuierlicher, nicht stationärer Eingabsignale (wie
beispielsweise bei "Wartemusik").
Um es allgemein zu sagen, so implementiert ein Sprachkodie
rer ein Rauschunterdrückungssystem in einem Kommunikationssy
stem. Das Kommunikationssystem transferiert Sprachabtastungen
durch Verwendung von Informationsrahmen in Kanälen, wobei die
Rahmen mit Information sich in Kanälen befinden, die kein
Rauschen aufweisen. Der Sprachkodierer hat als Eingang
Sprachabtastungen und eine Vorrichtung für die Unterdrückung
des Rauschens, basierend auf einer Abweichung der spektralen
Energie zwischen einem aktuellen Rahmen mit Sprachabtastungen
und einer mittleren Spektralenergie einer Vielzahl vergange
ner Rahmen mit Sprachabtastungen, um rauschunterdrückte
Sprachabtastungen zu erzeugen, um das Rauschen in den Rahmen
der Sprachabtastungen zu unterdrücken. Eine Vorrichtung für
das Kodieren der rauschunterdrückten Sprachabtastungen ko
diert dann die rauschunterdrückte Sprachabtastungen für einen
Transfer durch das Kommunikationssystem. In der bevorzugten
Ausführungsform befindet sich der Sprachkodierer entweder in
einer zentralisierten Basisstationssteuerung (CBSC) oder ei
ner mobilen Station (MS) eines Kommunikationssystems. In al
ternativen Ausführungsformen kann sich der Sprachkodierer je
doch entweder in einem mobilen Vermittlungszentrum (MSC) oder
einer Basistransceiverstation (BTS) befinden. In der bevor
zugten Ausführungsform ist der Sprachkodierer in einem Kommu
nikationssystem des Vielfachzugriffs durch Kodetrennung
(CDMA) implementiert, aber ein Durchschnittsfachmann wird er
kennen, daß der Sprachkodierer und ein Rauschunterdrückungs
system gemäß der Erfindung bei vielen unterschiedlichen Arten
von Kommunikationssystemen angewandt werden können.
In der bevorzugten Ausführungsform umfaßt die Vorrichtung für
die Unterdrückung des Rauschens in einem Rahmen mit Sprachab
tastungen eine Vorrichtung für das Schätzen einer Gesamtka
nalenergie in einem aktuellen Rahmen mit Sprachabtastungen,
basierend auf der Schätzung der Kanalenergie und einer Vorrichtung
für das Schätzen einer Leistung eines Spektrums des
aktuellen Rahmens mit Sprachabtastungen, basierend auf der
Schätzung der Kanalenergie. Es ist auch eine Vorrichtung für
das Schätzen der Leistung von Spektren einer Vielzahl vergan
gener Rahmen mit Sprachabtastungen eingeschlosssen, basierend
auf der Schätzung der Leistung des aktuellen Rahmens. Mit
dieser Information bestimmt eine Vorrichtung für das Bestim
men einer Abweichung zwischen der Schätzung des Spektrums des
aktuellen Rahmens und der Schätzung der Leistung der Spektren
einer Vielzahl von vergangenen Rahmen eine spektrale Abwei
chung, wie dies schon gesagt wurde, und eine Vorrichtung für
die Aktualisierung der Rauschschätzung des Kanals, basierend
auf der Schätzung der Gesamtkanalenergie und der bestimmten
Abweichung. Basierend auf der Aktualisierung der Rauschschät
zung modifiziert eine Vorrichtung zur Modifizierung der Ver
stärkung des Kanals die Verstärkung des Kanals, um die
rauschunterdrückten Sprachabtastungen zu erzeugen.
In der bevorzugten Ausführungsform umfaßt die Vorrichtung für
die Schätzung einer Leistung von Spektren einer Vielzahl ver
gangener Rahmen von Information weiter eine Vorrichtung zur
Schätzung einer Leistung der Spektren einer Vielzahl von ver
gangener Rahmen, basierend auf einer exponentiellen Wichtung
der vergangenen Rahmen mit Information, wobei die exponen
tielle Wichtung der vergangenen Rahmen mit Information eine
Funktion der Schätzung der gesamten Kanalenergie innerhalb
eines aktuellen Rahmens mit Information ist. In der bevorzug
ten Ausführungsform umfaßt die Vorrichtung für das Aktuali
sieren der Rauschschätzung des Kanals, basierend auf der
Schätzung der gesamten Kanalenergie und der bestimmten Abwei
chung auch ferner eine Vorrichtung für das Aktualisieren der
Rauschschätzung des Kanals, basierend auf einem Vergleich der
Schätzung der gesamten Kanalenergie innerhalb eines ersten
Schwellwerts und einen Vergleich der bestimmten Abweichung
innerhalb eines zweiten Schwellwerts. Insbesondere umfaßt die
Vorrichtung für das Aktualisieren der Rauschschätzung des
Kanals, basierend auf einem Vergleich der Schätzung der ge
samten Kanalenergie mit einem ersten Schwellwert und einem
Vergleich der bestimmten Abweichung mit einem zweiten
Schwellwert, eine Vorrichtung für das Aktualisieren der
Rauschschätzung des Kanals, wenn die Schätzung der gesamten
Kanalenergie größer ist als der erste Schwellwert für eine
erste vorbestimmte Anzahl von Rahmen, ohne daß eine zweite
vorbestimmte Anzahl aufeinanderfolgender Rahmen eine Schät
zung der gesamten Kanalenergie aufweist, die kleiner oder
gleich dem ersten Schwellwert ist, und wenn die vorbestimmte
Abweichung unerhalb des zweiten Schwellwertes liegt. In der
bevorzugten Ausführungsform beträgt die erste bevorzugte Zahl
von Rahmen 50 Rahmen, während die zweite bevorzugte Zahl auf
einanderfolgender Rahmen 6 Rahmen beträgt.
Fig. 1 zeigt allgemein ein Blockdiagram eines Sprachkodierers
100 für die Verwendung in einem Kommunikationssystem. In der
bevorzugten Ausführungsform ist der Sprachkodierer 100 ein
Sprachkodierer 100 mit variabler Rate, geeignet für die Un
terdrückung von Rauschen in einem Kommunikationssystem des
Vielfachzugriffs durch Kodetrennung (CDMA), kompatibel mit
dem Interim-Standard (IS) 95. Für mehr Information bezüglich
IS-95, siehe TIA/EIA/IS-95, Mobile Station-Base Station Com
patibility Standard for dual Mode Wideband Spread Spectrum
Cellular System, Juli 1993, das hiermit durch Bezugnahme
eingeschlossen wird. In der bevorzugten Ausführungsform un
terstützt der Sprachkodierer 100 mit variabler Rate auch drei
der vier Bitraten, die durch IS-95 gestattet sind: Volle Rate
("Rate 1" - 170 Bits/Rahmen), 1/2 Rate ("Rate 1/2" - 80 Bits/Rahmen)
und 1/8 Rate ("Rate 1/8" - 16 Bits/Rahmen). Wie
ein Durchschnittsfachmann erkennen wird, stellt die hier be
schriebene Ausführungsform nur ein Beispiel dar; der Sprach
kodierer 100 ist mit vielen unterschiedlichen Typen von Kom
munikationssystemen kompatibel.
Bezieht man sich auf Fig. 1, so basiert die Vorrichtung für
die Kodierung rauschunterdrückter Sprachabtastungen 102 auf
dem Residual-Code-Excited-Linear-Prediction(RCELP)-Algorith
mus, der aus dem Stand der Technik wohl bekannt ist. Für mehr
Information bezüglich des RCELP-Algorithmus, siehe W. B.
Kleijn, P. Kroon, und D. Nahumi, "The RCELP-Speech-Coding-Al
gorithm", European Transactions on Telecommunications, Band
5, Nummer 5, Sept./Okt. 1994, Seiten 573-582. Für mehr Infor
mation bezüglich des RCELP-Algorithmus, der passend für ei
nen Betrieb mit variabler Rate und Robustheit in einer CDMA-
Umgebung ist, siehe D. Nahumi und W. B. Kleijn, "An Improved 8 kb/s
RCELP coder", Proc. ICASSP 1995. RCELP ist eine Verall
gemeinerung des Code-Excited-Linear-Prediction(CELP)-Algo
rithmus. Für mehr Information bezüglich des CELP-Algo
rithmus, siehe B. S. Atal und M. R. Schroeder, "Stochastic
coding of speech at very low bit rates", Proc. Int. Conf.
Comm., Amsterdam, 1984, Seiten 1610-1613.
Während die obigen Referenzen ein tiefes Verständnis der
CELP/RCELP-Algorithmen liefern, so ist eine kurze Beschrei
bung des Betriebs des RCELP-Algorithmus lehrreich. Im Ge
gensatz zu CELP-Kodierern versucht RCELP nicht, das ursprüng
liche Sprachsignal des Benutzers genau zu treffen. Stattdes
sen erzielt RCELP eine "zeitverzerrte" Version des ursprüng
lichen Rückstandes, die mit einer vereinfachten Teilkontur
des Sprachsignals des Benutzers übereinstimmt. Die Teilkontur
des Sprachsignals des Benutzers erhält man durch Schätzen der
Teilverzögerung einmal pro Rahmen und einer linearen Interpo
lation der Teilung von Rahmen zu Rahmen. Ein Vorteil der
Verwendung dieser vereinfachten Teildarstellung besteht
darin, daß in jedem Rahmen mehr Bits für eine stochastische
Anregung und einen Kanalbeeinträchtigungsschutz verfügbar
sind, als dies der Fall wäre, wenn eine traditionelle Lösung
mit einer fraktionalen Teilung verwendet wird. Dies ergibt
eine verbesserte Rahmenfehlerleistung ohne einen Einfluß auf
die wahrnehmbare Sprachqualität bei klaren Kanalbedingungen.
Bezieht man sich auf Fig. 1, so werden in den Sprachkodierer
100 ein Sprachsignalvektor, s(n) 103 und ein externes Raten
befehlssignal 106 eingegeben. Der Sprachsignalvektor 103 kann
aus einer analogen Eingabe durch Abtastung mit einer Rate von
8000 Abtastungen/Sekunde und einer linearen (gleichförmigen)
Quantisierung der sich ergebenden Sprachabtastungen mit min
destens 13 Bits eines dynamischen Bereiches geschaffen wer
den. Alternativ kann der Sprachsignalvektor 103 aus einem
8 Bit µlaw Eingabe durch Umwandlung in ein gleichmäßiges, puls
kodemoduliertes (PCM) Format gemäß der Tabelle 2 in den ITU-T-
Empfehlungen G.711 geschaffen werden. Das externe Ratenbe
fehlssignal 106 kann den Kodierer anweisen, ein leeres Paket
oder ein Paket, das sich von einem Rate-1-Paket unterschei
det, zu erzeugen. Wenn ein externes Ratenbefehlssignal 106
empfangen wird, so ersetzt dieses Signal 106 den internen Ra
tenauswahlmechanismus des Sprachkodierers 100.
Der Eingabesprachvektor 103 wird einer Vorrichtung zur Unter
drückung von Rauschen 101 präsentiert, bei der es sich in der
bevorzugten Ausführungsform um das Rauschunterdrückungssystem
109 handelt. Das Rauschunterdrückungssystem 109 führt eine
Rauschunterdrückung gemäß der Erfindung durch. Ein rauschun
terdrückter Sprachvektor s'(n) 112 wird dann sowohl einem
Ratenbestimmungsmodul 115 und einem Modellparameterschätzmo
dul 118 präsentiert. Das Ratenbestimmungsmodul 115 wendet ei
nen Sprachaktivitätserkennungs(VAD)-Algorithmus und eine Ra
tenauswahllogik an, um den Typ des zu erzeugenden Pakets
(Rate 1/8, 1/2 oder 1) zu bestimmen. Das Modellparameter
schätzmodul 118 führt eine lineare Vorhersagekodierungs
(LPC)-Analyse durch, um die Modellparameter 121 zu erzeugen.
Die Modellparameter umfassen einen Satz linearer Vorhersage
koeffizienten (LPCs) und eine optimale Teilungsverzögerung
(t). Das Modellparameterschätzmodul 118 wandelt auch die LPCs
in linienspektrale Paare (LSPs) um und berechnet langfristige
und kurzfristige Vorhersageverstärkungen.
Die Modellparameter 121 werden in ein Kodiermodul 124 varia
bler Rate gegeben, das das Anregungssignal kennzeichnet und
die Modellparameter 121 in einer für die ausgewählte Rate
passenden Art quantisiert. Die Rateninformation erhält man
von einem Ratenentscheidungssignal 139, das auch in das va
riable Ratenkodiermodul 124 gegeben wird. Wenn die Rate 1/8
ausgewählt wird, so wird das variable Ratenkodiermodul 124
nicht versuchen, irgendeine Periodizität im Sprachrest zu
kennzeichnen, sondern wird stattdessen einfach seine Energie
kontur kennzeichnen. Für die Raten 1/2 und 1 wendet das va
riable Ratenkodiermodul 124 den RCELP-Algorithmus an, um eine
Übereinstimmung mit einer zeitverzerrten Version des ur
sprünglichen Sprachsignalrestes des Benutzers zu erzielen.
Nach der Kodierung akzeptiert ein Paketformatiermodul 133
alle Parameter, die im variablen Ratenkodiermodul 124 berech
net und/oder quantisiert wurden, und formatiert ein Paket 136,
passend zur ausgewählten Rate. Das formatierte Paket 136 wird
dann einer Multiplexunterschicht für eine weitere Verarbei
tung präsentiert, wobei dies ebenso für das Ratenentschei
dungssignal 139 gilt. Wegen weiterer Details bezüglich des
gesamten Betriebs des Sprachkodierers 100, siehe IS-127,
Dokument "EVRC Draft Standard (IS-127)", Ausgabe 1, Vertei
lungsnummer TR45.5.1/95.10.17.06, 17. Oktober 1995.
Fig. 2 zeigt allgemein ein Blockdiagramm eines verbesserten
Rauschunterdrückungssystems 109 gemäß der Erfindung. In der
bevorzugten Ausführungsform wird das Rauschunterdrückungssy
stem 109 verwendet, um die Signalqualität zu verbessern, die
dem Modellparameterschätzmodul 118 und dem Ratenbestimmungs
modul 115 des Sprachkodierers 100 präsentiert wird. Der Be
trieb des Rauschunterdrückungssystems ist generisch, da das
System mit einem beliebigen Typ eines Sprachkodierers
arbeiten kann, den ein Ingenieur in einem speziellen
Kommunikationssystem implementieren will. Es sei angemerkt,
daß mehrere Blöcke, die in Fig. 2 der vorliegenden Erfindung
dargestellt sind, eine gleiche Funktion haben, wie die Blöcke
die in Fig. 1 des US-Patents Nr. 4,811,404 von Vilmur
dargestellt sind.
Das Rauschunterdrückungssystem 109 umfaßt einen Hochpaßfilter
(HPF) 200 und eine übrige Rauschunterdrückungsschaltung. Das
Ausgangssignal des HPF 200 shp(n) wird als Eingangssignal für
die übrige Rauschunterdrückungsschaltung verwendet. Obwohl
die Rahmengröße des Sprachkodierers 20 ms beträgt (wie das
durch IS-95 definiert ist), beträgt die Rahmengröße der übri
gen Rauschunterdrückungsschaltung 10 ms. Somit werden in der
bevorzugten Ausführungsform die Schritte, um die Rauschunter
drückung gemäß der Erfindung durchzuführen, zweimal in einem
20-ms-Sprachrahmen ausgeführt.
Um mit der erfindungsgemäßen Rauschunterdrückung zu beginnen,
wird das Eingabesignal s(n) durch ein Hochpaßfilter (HPF) 200
einer Hochpaßfilterung unterzogen, um das Signal shp(n) zu
erzeugen. Das HPF 200 ist ein Chebyshev-Filter Typ II vierter
Ordnung mit einer Cutoff-Frequenz von 120 Hz, das im Stand
der Technik wohl bekannt ist. Die Transferfunktion des HPF
200 ist definiert zu:
wobei die jeweiligen Zähler- und Nennerkoeffizienten defi
niert sind zu:
Ein Fachmann wird erkennen, daß eine beliebige Zahl von Hoch
paßfilterkonfigurationen verwendet werden kann. Als nächstes
wird im Vorverstärkungsblock 203 das Signal shp(n) einer Fen
stertechnik unterzogen unter Verwendung eines geglätteten,
trapezförmigen Fensters, in welchem die ersten D Abtastungen
d(m) des Eingangsrahmens (Rahmen "m") von den letzten D Abta
stungen der vorhergehenden Rahmen (Rahmen "m - 1") überlappt
werden. Diese Überlappung kann man am besten in Fig. 3 sehen.
Wenn nicht anders angegeben, so haben alle Variablen Anfangswerte
von Null, das heißt d(m) = 0, m ≦ 0. Dies kann beschrieben
werden als:
d(m, n) = d(m - 1, L + n); 0 ≦ n < D,
wobei m der aktuelle Rahmen ist, n ein Abtastindex des Puf
fers |d(m)|, L = 80 ist die Rahmenlänge und D = 24 ist die
Überlappung (oder Verzögerung) in den Abtastungen. Die ver
bleibenden Abtastungen des Eingabepuffers werden dann wie
folgt vorverstärkt:
d(m, D + n) = shp(n) + ζpshp(n - 1); 0 ≦ n < L,
wobei ζp = - 0,8 der Vorverstärkungsfaktor ist. Dies führt da
zu, daß der Eingabepuffer L + D = 104 Abtastungen enthält, in
welchen die ersten D Abtastungen die vorverstärkte Überlap
pung aus dem vorhergehenden Rahmen darstellen und die folgen
den L Abtastungen vom aktuellen Rahmen eingegeben werden.
Als nächstes wird im Fenstertechnikblock 204 der Fig. 2 ein
geglättetes, trapezförmiges Fenster 400 (Fig. 4) auf die Abta
stungen angewandt, um ein Diskretes Fourier-Transformations
(DFT)-Eingangssignal g(n) zu erzeugen. In der bevorzugten
Ausführungsform ist g(n) definiert zu:
wobei M = 128 die DFT-Sequenzlänge ist und alle anderen Terme
vorher definiert wurden.
Im Kanalteiler 206 der Fig. 2 wird die Transformation von
g(n) in den Frequenzbereich unter Verwendung der Diskreten
Fouriertransformation (DFT) durchgeführt, wobei dies wie
folgt definiert ist:
wobei ejω ein komplexer Zeiger mit Einheitsamplitude mit der
radialen Position ω ist. Dies ist eine atypische Definition,
aber eine, die die Leistungsfähigkeit der komplexen, Schnellen
Fourier-Transformation (FFT) zeigt. Der 2/M-Skalierungsfaktor
ergibt sich aus einer Vorkonditionierung der M-Punkt-Realse
quenz, um eine M/2-Punkt-Komplexsequenz zu bilden, die trans
formiert wird unter Verwendung einer M/2-Punkt-Komplex-FFT.
In der bevorzugten Ausführungsform umfaßt das Signal G(k)
65 einzelne Kanäle. Details dieser Technik kann man finden in
Proakis und Manolakis, "Introduction to Digital Signal Proces
sing", 2. Auflage, New York, Macmillan, 1988, Seiten 721-722.
Das Signal G(k) wird dann in den Kanalenergieschätzer 109
eingegeben, wo die Kanalenergieschätzung Ech(m) des aktuellen
Rahmens unter Verwendung der nachfolgenden Gleichung bestimmt
wird:
wobei Emin = 0,0625 die minimal gestattete Kanalenergie ist,
αch(m) der Kanalenergieglättungsfaktor (unten definiert), Nc
= 16 die Zahl der kombinierten Kanäle und fL(i) und fH(i) die
i-ten Elemente der jeweiligen niedrigen und hohen Kanalkombi
niertabellen fL und fH sind. In der bevorzugten Ausführungs
form sind fL und fH definiert zu:
fL = {2, 4, 6, 8, 10, 12, 14, 17, 20, 23, 27, 31, 36, 42, 49, 56},
fH = {3, 5, 7, 9, 11, 13, 16, 19, 22, 26, 30, 35, 41, 48, 55, 63}.
Der Kanalenergieglättungsfaktor αch(m) kann definiert werden
als:
was bedeutet, daß αch(m) einen Wert von Null für den ersten
Rahmen (m = 1) und einen Wert von 0,45 für alle nachfolgenden
Rahmen annimmt. Dies gestattet es, daß die Kanalenergieschät
zung auf die ungefilterte Kanalenergie des ersten Rahmens
initialisiert werden kann. Zusätzlich sollte die Kanal
rauschenergieschätzung (wie unten definiert) auf die Kanal
energie des ersten Rahmens initialisiert werden, das heißt:
En(m, i) = max{Einit, Ech(m, i)}; m = 1, 0 ≦ i < Nc,
wobei Einit = 16 die minimal gestattete Kanalrauschinitiali
sierungsenergie ist.
Die Kanalenergieschätzung Ech(m) für den aktuellen Rahmen
wird als nächstes verwendet, um die quantisierten Kanal-Si
gnal-zu-Rausch-Verhältnis(SNR)-Indizes zu schätzen. Diese
Schätzung wird im Kanal-SNR-Schätzer 218 der Fig. 2 durchge
führt und ist bestimmt zu:
wobei En(m) die aktuelle Kanalrauschenergieschätzung (wie
später definiert) ist, und die Werte von {σq} auf 0 und 89
einschließlich beschränkt sind.
Unter Verwendung der Kanal-SNR-Schätzung {σq} wird die Summe
der Sprachmaße im Sprachmaßberechner 215 bestimmt unter Ver
wendung von:
wobei V(k) der k-te Wert der 90-Element-Sprachmaßtabelle V
ist, die so definiert ist:
Die Kanalenergieschätzung Ech(m) für den aktuellen Rahmen
wird auch als Eingabe im spektralen Abweichungsschätzer 210
verwendet, der die spektrale Abweichung ΔE(m) schätzt. Unter
Bezug auf Fig. 5 wird die Kanalenergieschätzung Ech(m) in
einen logarithmischen Leistungsspektralschätzer 500 einge
geben, wo das logarithmische Leistungsspektrum geschätzt wird
zu:
EdB(m, i) = 10log10(Ech(m, i)); 0 ≦ i < Nc.
Die Kanalenergieschätzung Ech(m) für den aktuellen Rahmen
wird auch in einen Gesamtkanalenergieschätzer 503 eingegeben,
um die Gesamtkanalenergieschätzung Etot(m) für den aktuellen
Rahmen m gemäß folgendem zu bestimmen:
Als nächstes wird ein exponentieller Fensterfaktor α(m) (als
eine Funktion der Gesamtkanalenergie Etot(m)) im exponentiel
len Fensterfaktorbestimmer 506 bestimmt unter Verwendung von:
welche zwischen αH und αL beschränkt ist durch:
α(m) = max{αL, min{αH, α{m)}},
wobei EH und EL die Energieendpunkte (in Dezibel oder "db")
der linearen Interpolation von Etot(m) sind, das auf α(m)
transformiert wird, das die Grenzen αL ≦ α(m) ≦ αH hat. Die
Werte dieser Konstanten sind definiert zu: EH = 50, EL = 30,
αH = 0,99, αL = 0,50. Wenn dies gegeben ist, so würde ein
Signal mit einer relativen Energie von 40 dB
einen exponentiellen Fensterfaktor von α(m) = 0,745 unter Ver
wendung der obigen Berechnung verwenden.
Die spektrale Abweichung ΔE(m) wird dann im spektralen Abwei
chungsschätzer 509 geschätzt. Die spektrale Abweichung ΔE(m)
ist die Differenz zwischen dem aktuellen Leistungsspek trum und einer langfristig gemittelten Leistungsspektrums schätzung:
ist die Differenz zwischen dem aktuellen Leistungsspek trum und einer langfristig gemittelten Leistungsspektrums schätzung:
wobei EdB(m) die langfristig gemittelte Leistungsspektrumsschät
zung ist, die im langfristigen Leistungsspektrumsschätzer 512
geschätzt wird unter Verwendung:
EdB(m + 1, i) = α(m)EdB(m, i) + (1 - α(m))EdB(m, i); 0 ≦ i < Nc,
wobei alle Variablen vorher definiert wurden. Der anfängliche
Wert von EdB(m) ist definiert als das geschätzte, logarithmische
Leistungsspektrum des Rahmens 1 oder:
EdB(m) = EdB(m); m = 1.
An diesem Punkt werden die Summe der Sprachmaße v(m) der ge
samten Kanalenergieschätzung für den aktuellen Rahmen Etot(m)
und die spektrale Abweichung ΔE(m) in den Aktualisierungsent
scheidungsbestimmer 212 eingegeben, um die Rauschunterdrückung
gemäß der Erfindung zu erleichtern. Die Entschei
dungslogik, die unten in einem Pseudo-Kode gezeigt und in
Flußdiagrammform in Fig. 6 dargestellt ist, zeigt, wie die
Rauschschätzungsaktualisierungsentscheidung schließlich ge
macht wird. Das Verfahren startet bei Schritt 600 und geht zu
Schritt 603, wo das Aktualisierungsflag (update_flag) ge
löscht wird. Dann wird in Schritt 604 die Aktualisierungslo
gik (nur VMSUM) von Vilmur implementiert durch Prüfung, ob
die Summe der Sprachmaße v(m) kleiner als ein Aktualisie
rungsschwellwert (UPDATE_THLD) ist. Wenn die Summe der
Sprachmaße kleiner als der Aktualisierungsschwellwert ist, so
wird in Schritt 605 der Aktualisierungszähler (update_cnt)
gelöscht und in Schritt 606 das Aktualisierungsflag gesetzt.
Der Pseudokode für die Schritte 603-606 ist nachfolgend ge
zeigt:
Wenn in Schritt 604 die Summe der Sprachmaße größer ist als
der Aktualisierungsschwellwert, wird eine Rauschunterdrückung
gemäß der Erfindung implementiert. Als erstes wird in Schritt
607 die gesamte Kanalenergieschätzung Etot(m) des aktuellen
Rahmens m mit dem Rauschpegel in db(NOISE_FLOOR_DB) vergli
chen, während die spektrale Abweichung Δ mit dem Abweichungs
schwellwert (DEV_THLD) verglichen wird. Wenn die gesamte Ka
nalenergieschätzung größer als der Rauschpegel ist und die
spektrale Abweichung kleiner als der Abweichungsschwellwert,
so wird in Schritt 608 der Aktualisierungszähler inkremen
tiert. Nachdem der Aktualisierungszähler inkrementiert wurde,
wird in Schritt 609 ein Test durchgeführt, um zu bestimmen,
ob der Aktualisierungszähler größer oder gleich ist einem Ak
tualisierungszählerschwellwert (UPDATE_CNT_THLD). Wenn das
Ergebnis des Tests in Schritt 609 wahr ist, dann wird in
Schritt 606 das Aktualisierungsflag gesetzt. Der Pseudokode
für die Schritte 607-609 und 606 ist unten gezeigt:
Wie man aus Fig. 6 sehen kann, wird, wenn einer der Tests in
den Schritten 607 und 609 nicht erfüllt wird, oder nachdem
das Aktualisierungsflag in Schritt 606 gesetzt wurde, die
Logik zur Verhinderung eines langfristigen "Verschiebens" des
Aktualisierungszählers implementiert. Die Hystereselogik wird
implementiert, um minimale, spektrale Abweichungen der Akkumu
lierung über lange Perioden zu verhindern, die eine ungültige,
erzwungene Aktualisierung verursachen. Das Verfahren beginnt
in Schritt 610, wo ein Test durchgeführt wird, um zu bestim
men, ob der Aktualisierungszähler gleich dem letzten Aktuali
sierungszählerwert (last_update_cnt) der letzten sechs Rahmen
(HYSTER_CNT_THLD) ist. In der bevorzugten Ausführungsform
werden sechs Rahmen als ein Schwellwert verwendet, aber eine
beliebige Zahl von Rahmen kann implementiert werden. Wenn der
Test in Schritt 610 wahr ist, so wird in Schritt 611 der Ak
tualisierungszähler gelöscht, und das Verfahren geht in
Schritt 612 zum nächsten Rahmen. Wenn der Test in Schritt 610
falsch ist, so geht das Programm direkt zum nächsten Rahmen
in Schritt 612. Der Pseudokode für die Schritte 610-612 ist
nachfolgend gezeigt:
In der bevorzugten Ausführungsform sind die Werte für die
vorher verwendeten Konstanten wie folgt:
Immer, wenn in Schritt 606 das Aktualisierungsflag für einen
vorgegebenen Rahmen gesetzt ist, wird die Kanalrauschschät
zung für den nächsten Rahmen gemäß der Erfindung aktuali
siert. Die Kanalrauschschätzung wird im Glättungsfilter 224
aktualisiert unter Verwendung von:
En(m + 1, i) = max{Emin, αnEn(m, i) + (1 - αn)Ech(m, i)}; 0 ≦ i < Nc,
wobei Emin = 0,0625 die minimal gestattete Kanalenergie ist
und αn = 0,9 der Kanalrauschglättungsfaktor, der lokal im
Glättungsfilter 224 gespeichert ist. Die aktualisierte Kanal
rauschschätzung wird im Energieschätzspeicher 225 gespeichert,
und das Ausgangssignal des Energieschätzspeichers 225 ist die
aktualisierte Kanalrauschschätzung En(m). Die aktualisierte
Kanalrauschschätzung En(m) wird als Eingangssignal für den
Kanal-SNR-Schätzer 218 verwendet, wie dies oben beschrieben
wurde und auch für den Verstärkungsberechner 233, wie dies
nachfolgend beschrieben wird.
Als nächstes bestimmt das Rauschunterdrückungssystem 109, ob
eine Kanal-SNR-Modifikation stattfinden soll. Diese Bestim
mung wird im Kanal-SNR-Modifizierer 227 durchgeführt, der die
Zahl der Kanäle zählt, die Kanal-SNR-Indexwerte haben, die
einen Indexschwellwert übersteigen. Während des Modifika
tionsverfahrens selbst vermindert der Kanal-SNR-Modifizierer
227 die SNR dieser speziellen Kanäle, die einen SNR-Index haben,
der kleiner als ein Rücksetzschwellwert (SETBACH_THLD)
ist, oder vermindert das SNR aller Kanäle, wenn die Summe der
Sprachmaße kleiner als ein Maßschwellwert (METRIC_THLD) ist.
Eine Pseudokodedarstellung des Kanal-SNR-Modifikationsverfah
rens, das im Kanal-SNR-Modifizierer 227 stattfindet, stellt
sich wie folgt dar:
An diesem Punkt werden Kanal-SNR-Indizes {σq'} auf einen
SNR-Schwellwert im SNR-Schwellwertblock 230 begrenzt. Die
Konstante σth wird lokal im SNR-Schwellwertblock 230 gespei
chert. Eine Pseudokodedarstellung des im SNR-Schwellwertblock
230 durchgeführten Verfahrens wird nachfolgend gegeben:
In der bevorzugten Ausführungsform sind die vorherigen Kon
stanten und Schwellwerte gegeben zu:
An diesem Punkt werden die begrenzten SNR-Indizes {σq"} in
den Verstärkungsberechner 233 eingegeben, wo die Kanalver
stärkungen bestimmt werden. Als erstes wird der Gesamtver
stärkungsfaktor bestimmt unter Verwendung von:
wobei γmin = -13 die minimale Gesamtverstärkung, Efloor = 1
die Rauschpegelenergie und En(m) das geschätzte Rauschspek
trum ist, das während des vorhergehenden Rahmens berechnet
wurde. In der bevorzugten Ausführungsform werden die Konstan
ten γmin und Efloor lokal im Verstärkungsberechner 233 ge
speichert. In der Fortsetzung werden die Kanalverstärkungen
(in dB) bestimmt unter Verwendung von:
wobei µg = 0,39 der Verstärkungsabfall ist (der auch lokal im
Verstärkungsberechner 233 gespeichert wird). Die linearen Ka
nalverstärkungen werden dann umgewandelt unter Verwendung
von:
An diesem Punkt werden die oben bestimmten Kanalverstärkungen
auf das transformierte Eingabesignal G(k) angewandt mit den
folgenden Kriterien, um das Ausgangssignal H(k) des Kanalver
stärkungsmodifizierers 239 zu erzeugen:
Die otherwise-Bedingung in der obigen Gleichung nimmt an, daß
das Intervall von k 0 ≦ k ≦ M/2 ist. Es wird ferner angenommen,
daß H(k) gleichmäßig symmetrisch ist, so daß die folgende Be
dingung auch auferlegt wird:
H(M - k) = H(k); 0 < k < M/2.
Das Signal H(k) wird dann in die Zeitebene (zurück) umgewan
delt im Kanalkombinierer 242 unter Verwendung der inversen
DFT:
und der Frequenzbereichfilterprozeß wird beendet, um das Aus
gangssignal h'(n) zu erzeugen durch Anwenden einer Überlap
pung und Addition mit den folgenden Kriterien:
Die Signalnachentzerrung wird auf das Signal h'(n) durch den
Nachentzerrungsblock 245 angewandt, um das Signal s'(n) zu
erzeugen, das gemäß der Erfindung rauschunterdrückt wurde:
s'(n) = h'(n) + ζds'(n - 1); 0 ≦ n < L,
wobei ζd = 0,8 der Nachentzerrungsfaktor ist, der lokal in
nerhalb des Nachentzerrungsblocks 245 gespeichert ist.
Fig. 7 zeigt allgemein ein Blockdiagramm eines Kommunika
tionssystems 700, das vorteilhafterweise das erfindungsgemäße
Rauschunterdrückungssystem implementieren kann. In der bevor
zugten Ausführungsform ist das Kommunikationssystem ein zel
lulares Funktelefonsystem des Mehrfachzugriffs durch Kode
trennung (CDMA). Wie ein Durchschnittsfachmann jedoch erken
nen wird, kann das erfindungsgemäße Rauschunterdrückungssy
stem in einem beliebigen Kommunikationssystem implementiert
werden, das einen Vorteil aus dem System zieht. Solche Sy
steme umfassen in nicht einschränkender Weise Voice-Mail-
Systeme, zellulare Funktelefonsysteme, leitungsgebundene
Systeme, Luftlinienkommunikationssysteme etc. Es ist wichtig
zu beachten, daß das erfindungsgemäße Rauschunterdrückungssy
stem vorteilhafterweise in Kommunikationssystemen implemen
tiert werden kann, die keine Sprachkodierung umfassen, bei
spielsweise in analogen, zellularen Funktelefonsystemen.
Bezieht man sich auf Fig. 7, so werden aus Gründen der Be
quemlichkeit Akronyme verwendet. Das Folgende ist eine Liste
der Definitionen für die in Fig. 7 verwendeten Akronyme:
BTS Basistransceiverstation
CBSC Zentralisierte Basisstationssteuerung
EC Echolöschvorrichtung
VLR Besuchsortsregister
HLR Heimatortsregister
ISDN Dienstintegriertes Digitales Fernmeldenetz
MS Mobile Station
MSC Mobiles Vermittlungszentrum
MM Mobilitätsmanager
OMCR Betriebs- und Wartungszentrum-Funk
OMCS Betriebs- und Wartungszentrum-Vermittlung
PSTN Öffentliches Telefonnetz
TC Transkoder
CBSC Zentralisierte Basisstationssteuerung
EC Echolöschvorrichtung
VLR Besuchsortsregister
HLR Heimatortsregister
ISDN Dienstintegriertes Digitales Fernmeldenetz
MS Mobile Station
MSC Mobiles Vermittlungszentrum
MM Mobilitätsmanager
OMCR Betriebs- und Wartungszentrum-Funk
OMCS Betriebs- und Wartungszentrum-Vermittlung
PSTN Öffentliches Telefonnetz
TC Transkoder
Wie man aus Fig. 7 sieht, ist eine BTS 701-703 mit einem CBSC
704 verbunden. Jede BTS 701-703 liefert eine Funkfrequenz
(RF)-Kommunikation zu einer MS 705-706. In der bevorzugten
Ausführungsform ist die Sender/Empfänger(Transceiver)-Hard
ware, die in den BTSs 701-703 implementiert ist und die MSs
705-706, um die RF-Kommunikation zu unterstützen, im Dokument
definiert mit dem Titel "TIA/EIA/IS-95 Mobile Station-Base
Station Compatibility Standard for Dual Mode Wideband Spread
Spectrum Cellular System", July 1993, erhältlich von der Tele
communication Industry Association (TIA). Die CBSC 704 ist
unter anderem verantwortlich für die Gesprächsverarbeitung
über den TC 710 und das Mobilitätsmanagement über den MM 709.
In der bevorzugten Ausführungsform befindet sich die Funktio
nalität des Sprachkodierers 100 der Fig. 2 im TC 704. Andere
Aufgaben der CBSC 704 umfassen die Merkmalssteuerung und die
Sendung/Netzwerk-Schnittstellenbildung. Für mehr Information
bezüglich der Funktionalität der CBSC 704 wird Bezug genommen
auf die US-Patentanmeldung mit der Seriennummer 07/997, 997
von Bach et al., des gleichen Anmelders wie bei der vorlie
genden Anmeldung.
In Fig. 7 ist auch ein OMCR 712, das mit dem MM 709 der CBSC
704 verbunden ist, dargestellt. Das OMCR 712 ist verantwort
lich für die Operationen und die allgemeinen Wartung des
Funkteils (CBSC 704 und BTS 701-703 Kombination) des Kommuni
kationssystems 700. Das CBSC 704 ist mit dem MSC 715 verbun
den, das Schaltmöglichkeiten zwischen dem PSTN 720/ISDN 722
und dem CBSC 704 liefert. Das OMCS 724 ist verantwortlich für
die Operationen und die allgemeine Wartung des Vermittlungs
teils (MSC 715) des Kommunikationssystems 700. Das HLR 716
und das VLR 717 versorgen das Kommunikationssystem 700 mit
Benutzerinformation, die hauptsächlich für Gebührenzwecke
verwendet wird. Die ECs 711 und 719 sind implementiert, um
die Qualität des Sprachsignals zu verbessern, das durch das
Kommunikationssystem 700 übertragen wird.
Die Funktionalität der CBSC 704, des MSC 715, des HLR 716 und
des VLR 717 ist in Fig. 7 als verteilt gezeigt, wobei aber
ein Durchschnittsfachmann erkennen wird, daß die Funktionali
tät ebenso in einem einzigen Element zentralisiert werden
kann. Bei anderen Konfigurationen kann das TC 710 ebenso ent
weder im MSC 715 oder eine BTS 701-703 angeordnet sein. Da
die Funktionalität des Rauschunterdrückungssystems 109 allge
mein ist, zieht die vorliegende Erfindung die Durchführung
der Rauschunterdrückung gemäß der Erfindung in einem Element
(beispielsweise dem MSC 715) in Betracht, während sie die
Sprachkodierfunktion in einem anderen Element (beispielsweise
dem CBSC 704) durchführt. In dieser Ausführungsform würde das
rauschunterdrückte Signal s'(n) (oder Daten, die das rausch
unterdrückte Signal s'(n) darstellen) vom MSC 715 zum CBSC
704 über die Verbindung 726 transferiert.
In der bevorzugten Ausführungsform führt das TC 710 eine
Rauschunterdrückung gemäß der Erfindung durch unter Verwen
dung des in Fig. 2 gezeigten Rauschunterdrückungssystems 109.
Die Verbindung 726, die das MSC 715 mit dem CBSC 704 verbin
det, ist eine T1/E1-Verbindung, die im Stand der Technik wohl
bekannt ist. Durch Plazierung des TC 710 bei der CBXC wird
eine 4 : 1-Verbesserung des Verbindungsbudgets erreicht durch
die Kompression des Eingangssignals (eingegeben von der T1/E1-
Verbindung 726) durch den TC 710. Das komprimierte Signal
wird zu einer speziellen BTS 701-703 transferiert für eine
Sendung zu einer speziellen MS 705-706. Es ist wichtig anzu
merken, daß das komprimierte Signal, das zu einer speziellen
BTS 701-703 transferiert wird, einer weiteren Bearbeitung im
BTS 701-703 unterliegt, bevor es gesendet wird. Um es anders
zu sagen, das schließlich an die MS 705-706 gesendete Signal
unterscheidet sich in der Form, aber es ist dasselbe wie das
komprimierte Signal, das den TC 710 anregt. In jedem Fall
wurde das komprimierte Signal, das den TC 710 anregt, einer
Rauschunterdrückung gemäß der Erfindung unter Verwendung des
Rauschunterdrückungssystems 109 (wie in Fig. 2 gezeigt) un
terworfen.
Wenn die MS 705-706 das Signal empfängt, das durch eine BTS
701-703 gesendet wurde, wird die MS 705-706 im wesentlichen
die ganze Verarbeitung, die von der BTS 701-703 getan wurde,
und die Sprachkodierung, die von dem TC 710 vollzogen wurde
"aufheben" (allgemein als "dekodieren" bezeichnet). Wenn die
MS 705-706 ein Signal zurück zur BTS 701-703 überträgt, so
implementiert die MS 705-706 ebenso eine Sprachkodierung.
Somit befindet sich der Sprachkodierer 100 der Fig. 1 in der
MS 705-706, wobei auch und als solches eine Rauschunter
drückung gemäß der Erfindung auch durch die MS 705-706 durch
geführt wird. Nachdem ein Signal, das einer Rauschunter
drückung unterworfen wurde, von der MS 705-706 (die MS führt
auch eine weitere Verarbeitung des Signals durch, um die Form
aber nicht die Substanz des Signals zu ändern) zu einer BTS
701-703 gesandt wurde, so wird die BTS 701-703 die Verarbei
tung "aufheben", die mit dem Signal durchgeführt wurde, und
das sich ergebende Signal zum TC 710 für eine Sprachdekodie
rung übertragen. Nach der Sprachdekodierung durch den TC 710
wird das Signal zu einem Endbenutzer über die T1/E1-Verbin
dung 726 übertragen. Da sowohl der Endbenutzer als auch der
Benutzer in der MS 705-706 schließlich ein Signal empfängt,
das einer Rauschunterdrückung gemäß der Erfindung unterworfen
wurde, so kann jeder Benutzer die Vorteile erkennen, die
durch das Rauschunterdrückungssystem 109 des Sprachkodierers
100 geliefert wird.
Fig. 8 zeigt allgemein Variablen, die sich auf die Rauschun
terdrückung eines Sprachsignals beziehen, wie es durch den
Stand der Technik implementiert ist, während Fig. 9 allgemein
Variablen zeigt, die sich auf die Rauschunterdrückung eines
Sprachsignals beziehen, wie es durch das Rauschunter
drückungssystem gemäß der Erfindung implementiert ist. Die
verschiedenen Kurven zeigen die Werte verschiedener Zustands
variablen als eine Funktion der Rahmennummer m, die auf der
horizontalen Achse gezeigt ist. Die erste Kurve (Kurve 1) in
jeder der Fig. 8 und 9 zeigt die gesamte Kanalenergie
Etot(m), gefolgt von der Sprachmaßsumme v(m), dem Aktualisie
rungszähler (update_cnt oder TIMER bei Vilmur), dem Aktualisierungsflag
(update_flag), der Summe der Kanalrauschschät
zungen (ΣEn(m, i)) und die geschätzte Signaldämpfung,
10log10 (Einput/Eoutput), wobei die Eingabe shp(n) und die
Ausgabe s'(n) ist.
Bezieht man sich auf die Fig. 8 und Fig. 9, so kann das An
steigen des Hintergrundrauschens in Kurve 1 gerade vor dem
Rahmen 600 beobachtet werden. Vor dem Rahmen 600 war das Ein
gangssignal ein "sauberes" Sprachsignal 801 (ein niedriges
Hintergrundrauschen). Wenn ein plötzliches Ansteigen des Hin
tergrundrauschens 803 auftritt, wird die Sprachmaßsumme v(m),
die in Kurve 2 gezeigt ist, proportional erhöht, und das
Rauschunterdrückungsverfahren des Standes der Technik wirkt
nur gering. Die Fähigkeit aus diesem Zustand eine Wiederge
winnung durchzuführen, ist in Kurve 3 gezeigt, wo der Aktua
lisierungszähler (update_cnt) sich so lange erhöhen kann, wie
keine Aktualisierung durchgeführt wird. Dieses Beispiel
zeigt, daß der Aktualisierungszähler den Aktualisierungs
schwellwert (UPDATE_CNT_THLD) von 300 (für Vilmur) während
der aktiven Sprache ungefähr bei Rahmen 900 erreicht. Unge
fähr bei Rahmen 900 wird das Aktualisierungsflag
(update_flag) gesetzt, wie das in Kurve 4 gezeigt ist, was
eine Hintergrundrauschschätzungaktualisierung unter Verwen
dung des aktiven Sprachsignals gibt, wie das in Kurve 5 ge
zeigt ist. Dies kann als eine Verstärkung der aktiven Sprache
beobachtet werden, wie dies in Kurve 6 gezeigt ist. Es ist
wichtig zu beachten, daß die Aktualisierung der Rauschschät
zung während des Sprachsignals (Rahmen 900 der Kurve 1 er
folgt während der Sprache) erfolgt, mit der Auswirkung eines
"Niederknüppelns" des Sprachsignals, wenn eine Aktualisierung
nicht notwendig ist. Es ist auch, da das Risiko besteht, daß
der Aktualisierungszählerschwellwert während der normalen
Sprache abläuft, ein relativ hoher Schwellwert (300) erfor
derlich, um den Versuch zu machen, eine solche Aktualisierung
zu verhindern.
Bezieht man sich auf Fig. 9, so wird der Aktualisierungszäh
ler nur inkrementiert, während das Hintergrundrauschen zunimmt,
aber bevor das Sprachsignal beginnt. Als solches kann
der Aktualisierungsschwellwert auf einem Wert von 50 ernied
rigt werden, während dennoch zuverlässige Aktualisierungen
aufrecht erhalten werden. Hier erreicht der Aktualisierungs
zähler den Aktualisierungszählerschwellwert (UPDATE_CNT_THLD)
von 50 im Rahmen 650, was dem Rauschunterdrückungssystem 109
genügend Zeit gibt, auf den neuen Rauschzustand zu konvergie
ren, vor der Rückkehr des Sprachsignals in Rahmen 800. Wäh
rend dieser Zeit kann man sehen, daß die Dämpfung nur während
Rahmen ohne Sprache stattfindet, so daß kein "Niederknüppeln"
des Sprachsignals auftritt. Das Ergebnis ist ein verbessertes
Sprachsignal, wie es vom Endnutzer gehört werden kann.
Das verbesserte Sprachsignal ergibt sich aus der Tatsache,
daß die Aktualisierungsentscheidung gemacht wird, basierend
auf der spektralen Abweichung zwischen der aktuellen Rahmen
energie und einem Mittelwert der letzten Rahmenenergie, an
statt es einem Timer einfach zu gestatten, abzulaufen, während
des Fehlens normaler Sprachmaßaktualisierungen. Im letzteren
Fall (wie bei Vilmur) sieht das System den plötzlichen An
stieg des Rauschens als Sprachsignal selbst und ist somit
nicht fähig, den erhöhten Hintergrundrauschpegel von einem
wahren Sprachsignal zu unterscheiden. Durch Verwendung der
spektralen Abweichung kann das Hintergrundrauschen vom wahren
Sprachsignal unterschieden werden, und es kann somit eine
verbesserte Aktualisierungseintscheidung vorgenommen werden.
Fig. 10 zeigt allgemein Variablen, die sich auf die Rauschun
terdrückung eines Musiksignals beziehen, wie dies im Stand
der Technik implementiert ist, während Fig. 11 allgemein Va
riablen zeigt, die sich auf die Rauschunterdrückung eines Mu
siksignals beziehen, wie es durch ein Rauschunterdrückungssy
stem gemäß der Erfindung implementiert ist. Für die Zwecke
dieses Beispiels ist das Signal bis zum Rahmen 600 in Fig. 10
und Fig. 11 das gleiche, saubere Signal 800, wie es in Fig. 8
und Fig. 9 gezeigt ist. Bezieht man sich auf Fig. 10, so ver
hält sich das Verfahren des Standes der Technik überwiegend
gleich wie das in Fig. 8 gezeigte Hintergrundrauschbeispiel.
In Rahmen 600 erzeugt das Musiksignal 805 eine virtuelle, kon
tinuierliche Sprachmaßsumme v(m), wie das in Kurve 2 gezeigt
ist, die schließlich durch den Aktualisierungszähler in Rah
men 900 überdeckt wird (wie man in Kurve 3 sieht). Da die
Kennzeichen des Musiksignals 805 sich über der Zeit ändern,
so wird die in Kurve 6 gezeigte Verstärkung vermindert, aber
der Aktualisierungszähler überdeckt kontinuierlich das
Sprachmaß, wie das in Rahmen 1800 gezeigt ist. Im Gegensatz
dazu, wie man am besten in Fig. 11 sieht, erreicht der Aktua
lisierungszähler (wie man in Kurve 3 sieht) nie einen
Schwellwert (UPDATE_CNT_THLD) von 50 und so tritt keine Ak
tualisierung auf. Die Tatsache, daß keine Aktualisierung auf
tritt, kann am besten unter Bezug auf Kurve 6 der Fig. 11 ge
sehen werden, wo die Verstärkung des Musiksignals 805 kon
stant 0 dB beträgt (das heißt, es findet keine Verstärkung
statt). Somit wird ein Benutzer, der der Musik zuhört
(beispielsweise der "Wartemusik"), die einer Rauschunter
drückung nach dem Stand der Technik unterworfen ist, eine un
erwünschte Änderung im Musikpegel hören, während ein Benut
zer, der der Musik zuhört, die einer Rauschunterdrückung ge
mäß der Erfindung unterworfen ist, die Musik wie gewünscht
mit konstanten Pegeln hört.
Claims (33)
1. Verfahren zum Betreiben eines Kommunikationssystems mit Rauschunterdrückung,
wobei das Kommunikationssystem einen Informationstransfer unter Verwendung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrahmen in den Kanälen ein Rauschen aufweisen, das eine Rauschschätzung des Kanals ergibt,
wo bei das Verfahren folgende Schritte umfaßt:
Schätzen einer Kanalenergie (Ech) in einem aktuellen Informationsrahmen;
Schätzen einer Gesamtenergie (Etot) des aktuellen Informationsrahmens, basie rend auf der Schätzung der Kanalenergie;
Schätzung einer Leistung (EdB) von Spektren des aktuellen In formationsrahmens, basierend auf der Schätzung der Kanalenergie;
Schätzung einer Leistung () von Spektren einer Vielzahl vergangener In formationsrahmen, basierend auf der Schätzung der Leistung der Spektren im aktuel len Rahmen;
Bestimmen einer Abweichung (ΔE) zwischen dem geschätzten Wert der Lei stung der Spektren des aktuellen Rahmens und dem geschätzten Wert der Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
Aktualisieren der Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtenergie des aktuellen Informationsrahmens und der bestimmten Abwei chung.
wobei das Kommunikationssystem einen Informationstransfer unter Verwendung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrahmen in den Kanälen ein Rauschen aufweisen, das eine Rauschschätzung des Kanals ergibt,
wo bei das Verfahren folgende Schritte umfaßt:
Schätzen einer Kanalenergie (Ech) in einem aktuellen Informationsrahmen;
Schätzen einer Gesamtenergie (Etot) des aktuellen Informationsrahmens, basie rend auf der Schätzung der Kanalenergie;
Schätzung einer Leistung (EdB) von Spektren des aktuellen In formationsrahmens, basierend auf der Schätzung der Kanalenergie;
Schätzung einer Leistung () von Spektren einer Vielzahl vergangener In formationsrahmen, basierend auf der Schätzung der Leistung der Spektren im aktuel len Rahmen;
Bestimmen einer Abweichung (ΔE) zwischen dem geschätzten Wert der Lei stung der Spektren des aktuellen Rahmens und dem geschätzten Wert der Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
Aktualisieren der Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtenergie des aktuellen Informationsrahmens und der bestimmten Abwei chung.
2. Verfahren nach Anspruch 1, wobei es weiter den Schritt einer Modifizierung einer
Verstärkung des Kanals, basierend auf der Aktualisierung der Rauschschätzung, um
ein rauschunterdrücktes Signal zu erzeugen, umfaßt.
3. Verfahren nach Anspruch 1, wobei der Schritt des Schätzens einer Leistung von
Spektren einer Vielzahl von vergangenen Informationsrahmen weiter den Schritt des
Schätzens einer Leistung von Spektren einer Vielzahl vergangener Rahmen, ba
sierend auf einer exponentiellen Wichtung der vergangenen Informationsrahmen, um
faßt.
4. Verfahren nach Anspruch 3, wobei die exponentielle Wichtung der vergangenen
Informationsrahmen eine Funktion der Schätzung der Gesamtenergie des aktuellen
Informationsrahmens ist.
5. Verfahren nach Anspruch 1, wobei der Schritt der Aktualisierung der Rauschschät
zung des Kanals, basierend auf der Schätzung der Gesamtenergie und der bestimm
ten Abweichung ferner den Schritt der Aktualisierung der Rauschschätzung des Ka
nals, basierend auf einem Vergleich der Schätzung der Gesamtenergie mit einem er
sten Schwellwert und einen Vergleich der bestimmten Abweichung mit einem zweiten
Schwellwert umfaßt.
6. Verfahren nach Anspruch 5, wobei der Schritt der Aktualisierung der Rausch
schätzung des Kanals, basierend auf einem Vergleich der Schätzung der Gesamt
energie mit einem ersten Schwellwert und einem Vergleich der bestimmten Abwei
chung mit einem zweiten Schwellwert weiter den Schritt der Aktualisierung der
Rauschschätzung des Kanals umfaßt, wenn die Schätzung der Gesamtenergie größer
als der erste Schwellwert ist und wenn die bestimmte Abweichung unterhalb des
zweiten Schwellwerts liegt.
7. Verfahren nach Anspruch 6, wobei der Schritt der Aktualisierung der Rauschschät
zung des Kanals, wenn die Schätzung der Gesamtenergie größer ist als der erste
Schwellwert und wenn die bestimmte Abweichung unterhalb des zweiten Schwell
wertes liegt, weiter den Schritt der Aktualisierung der Rauschschätzung des Kanals
umfaßt, wenn die Schätzung der Gesamtenergie größer als der erste Schwellwert für
eine erste vorbestimmte Anzahl von Rahmen ist, ohne daß eine zweite vorbestimmte
Anzahl aufeinanderfolgender Rahmen eine Schätzung der Gesamtenergie aufweist,
die kleiner oder gleich dem ersten Schwellwert ist.
8. Verfahren nach Anspruch 7, wobei die erste vorbestimmte Zahl von Rahmen weiter
50 Rahmen umfaßt.
9. Verfahren nach Anspruch 7, wobei die zweite vorbestimmte Zahl aufeinanderfol
gender Rahmen ferner sechs Rahmen umfaßt.
10. Verfahren nach Anspruch 1, wobei das Verfahren entweder in einem mobilen
Vermittlungszentrum (MSC), einer zentralisierten Basisstationssteuerung (CBSC),
einer Basistransceiverstation (BTS) oder einer mobilen Station (MS) stattfindet.
11. Vorrichtung zum Betreiben eines Kommunikationssystems mit Rauschunterdrü
ckung,
wobei das Kommunikationssystem einen Informationstransfer unter Verwen dung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrah men in den Kanälen ein Rauschen aufweisen, das eine Rauschschätzung des Kanals ergibt,
wobei die Vorrichtung folgendes umfaßt:
eine Vorrichtung für das Schätzen einer Kanalenergie (Ech) in einem aktuellen Informationsrahmen;
eine Vorrichtung für das Schätzen einer Gesamtenergie (Etot) des aktuellen Informationsrahmens, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung (EdB) von Spektren des aktu ellen Informationsrahmens, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung () von Spektren einer Vielzahl vergangener Informationsrahmen, basierend auf der Schätzung der Leistung der Spektren im aktuellen Rahmen;
eine Vorrichtung zum Bestimmen einer Abweichung (ΔE) zwischen dem ge schätzten Wert der Leistung der Spektren des aktuellen Rahmens und dem ge schätzten Wert der Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basie rend auf der Schätzung der Gesamtenergie und der bestimmten Abweichung.
wobei das Kommunikationssystem einen Informationstransfer unter Verwen dung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrah men in den Kanälen ein Rauschen aufweisen, das eine Rauschschätzung des Kanals ergibt,
wobei die Vorrichtung folgendes umfaßt:
eine Vorrichtung für das Schätzen einer Kanalenergie (Ech) in einem aktuellen Informationsrahmen;
eine Vorrichtung für das Schätzen einer Gesamtenergie (Etot) des aktuellen Informationsrahmens, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung (EdB) von Spektren des aktu ellen Informationsrahmens, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung () von Spektren einer Vielzahl vergangener Informationsrahmen, basierend auf der Schätzung der Leistung der Spektren im aktuellen Rahmen;
eine Vorrichtung zum Bestimmen einer Abweichung (ΔE) zwischen dem ge schätzten Wert der Leistung der Spektren des aktuellen Rahmens und dem ge schätzten Wert der Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basie rend auf der Schätzung der Gesamtenergie und der bestimmten Abweichung.
12. Vorrichtung nach Anspruch 11, wobei sie ferner eine Vorrichtung für das Modifizie
ren einer Verstärkung des Kanals, basierend auf der Aktualisierung der Rauschschät
zung umfaßt, um ein rauschunterdrücktes Signal zu erzeugen.
13. Vorrichtung nach Anspruch 11, wobei die Vorrichtung mit einem Sprachkodierer
verbunden ist, dem das rauschunterdrückte Signal als Eingangssignal eingegeben
wird.
14. Vorrichtung nach Anspruch 11, wobei sich die Vorrichtung entweder in einem mo
bilen Vermittlungszentrum (MSC), einer zentralisierten Basisstationssteuerung
(CBSC), einer Basistransceiverstation (BTS) oder einer mobilen Station (MS) befindet.
15. Vorrichtung nach Anspruch 14, wobei das Kommunikationssystem ferner ein
Kommunikationssystem des Vielfachzugriffs durch Kodetrennung (CDMA) umfaßt.
16. Vorrichtung nach Anspruch 11, wobei die Vorrichtung für das Schätzen der Leis
tung von Spektren einer Vielzahl von vergangener Informationsrahmen ferner eine
Vorrichtung für das Schätzen der Leistung von Spektren einer Vielzahl vergangener
Rahmen, basierend auf einer exponentiellen Wichtungsfunktion der vergangenen In
formationsrahmen, umfaßt.
17. Vorrichtung nach Anspruch 16, wobei die exponentielle Wichtung der vergange
nen Informationsrahmen eine Funktion der Schätzung der Gesamtenergie innerhalb
eines aktuellen Informationsrahmens ist.
18. Vorrichtung nach Anspruch 11, wobei die Vorrichtung für die Aktualisierung der
Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtenergie und
der bestimmten Abweichung ferner eine Vorrichtung für das Aktualisieren der
Rauschschätzung des Kanals, basierend auf einem Vergleich der Schätzung der Ge
samtenergie mit einem ersten Schwellwert und einem Vergleich der bestimmten Ab
weichung mit einem zweiten Schwellwert umfaßt.
19. Vorrichtung nach Anspruch 18, wobei die Vorrichtung für die Aktualisierung der
Rauschschätzung des Kanals, basierend auf einem Vergleich der Schätzung der Ge
samtenergie mit einem ersten Schwellwert und einem Vergleich der bestimmten Ab
weichung mit einem zweiten Schwellwert weiter eine Vorrichtung für die Aktualisie
rung der Rauschschätzung des Kanals umfaßt, wenn die Schätzung der Gesamtenergie
größer als der erste Schwellwert ist, und wenn die bestimmte Abweichung unter
halb des zweiten Schwellwerts liegt.
20. Vorrichtung nach Anspruch 19, wobei die Vorrichtung für die Aktualisierung der
Rauschschätzung des Kanals, wenn die Schätzung der Gesamtenergie größer ist als
der erste Schwellwert und wenn die bestimmte Abweichung unterhalb des zweiten
Schwellwertes liegt, ferner eine Vorrichtung für die Aktualisierung der Rauschschät
zung des Kanals umfaßt, wenn die Schätzung der Gesamtenergie größer als der erste
Schwellwert für eine erste vorbestimmte Anzahl von Rahmen ist, ohne daß eine
zweite vorbestimmte Anzahl aufeinanderfolgender Rahmen eine Schätzung der ge
samten Kanalenergie aufweist, die kleiner oder gleich dem ersten Schwellwert ist.
21. Vorrichtung nach Anspruch 20, wobei die erste vorbestimmte Zahl von Rahmen
weiter 50 Rahmen umfaßt.
22. Vorrichtung nach Anspruch 20, wobei die zweite vorbestimmte Zahl aufeinander
folgender Rahmen ferner sechs Rahmen umfaßt.
23. Sprachkodierer für das Kodieren von Sprache in einem Kommunikationssystem,
wobei das Kommunikationssystem Sprachabtastungen durch Verwendung von Infor mationsrahmen in Kanälen transferiert,
wobei die Informationsrahmen in den Kanälen Rauschen aufweisen,
wobei der Sprachkodierer als Eingangsgröße die Sprachabtas tungen aufweist und
wobei der Sprachkodierer folgendes umfaßt:
eine Vorrichtung für das Unterdrücken des Rauschens in einem Rahmen von Sprachabtastungen, basierend auf einer Abweichung (ΔE) in einer spektralen Energie (EdB) zwischen einem aktuellen Rahmen von Sprachabtastungen und einer mittleren, spektralen Energie () einer Vielzahl vergangener Rahmen mit Sprachabtastungen, um rauschunterdrückte Sprachabtastungen zu erzeugen, und
eine Vorrichtung für das Kodieren der rauschunterdrückten Sprachabtastungen für den Transfer durch das Kommunikationssystem.
wobei das Kommunikationssystem Sprachabtastungen durch Verwendung von Infor mationsrahmen in Kanälen transferiert,
wobei die Informationsrahmen in den Kanälen Rauschen aufweisen,
wobei der Sprachkodierer als Eingangsgröße die Sprachabtas tungen aufweist und
wobei der Sprachkodierer folgendes umfaßt:
eine Vorrichtung für das Unterdrücken des Rauschens in einem Rahmen von Sprachabtastungen, basierend auf einer Abweichung (ΔE) in einer spektralen Energie (EdB) zwischen einem aktuellen Rahmen von Sprachabtastungen und einer mittleren, spektralen Energie () einer Vielzahl vergangener Rahmen mit Sprachabtastungen, um rauschunterdrückte Sprachabtastungen zu erzeugen, und
eine Vorrichtung für das Kodieren der rauschunterdrückten Sprachabtastungen für den Transfer durch das Kommunikationssystem.
24. Sprachkodierer nach Anspruch 23, wobei der Sprachkodierer sich entweder in
einem mobilen Vermittlungszentrum (MSC), einer zentralisierten Basisstationssteuerung
(CBSC), einer Basistransceiverstation (BTS) oder einer mobilen Station (MS) ei
nes Kommunikationssystems befindet.
25. Sprachkodierer nach Anspruch 24, wobei das Kommunikationssystem ferner ein
Kommunikationssystem des Vielfachzugriffs durch Kodetrennung (CDMA) umfaßt.
26. Sprachkodierer nach Anspruch 23, wobei die Vorrichtung zur Unterdrückung von
Rauschen in einem Rahmen von Sprachabtastungen ferner folgendes umfaßt:
eine Vorrichtung für das Schätzen einer Gesamtenergie des aktuellen Rah mens von Sprachabtastungen, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren des aktuellen Rahmens von Sprachabtastungen, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren einer Vielzahl vergangener Rahmen mit Sprachabtastungen, basierend auf der Schätzung der Leistung der Spektren im aktuellen Rahmen;
eine Vorrichtung zum Bestimmen einer Abweichung zwischen der Schätzung der Spektren des aktuellen Rahmens und der Schätzung der Leistung der Spektren der Vielzahl von vergangenen Rahmen;
eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basie rend auf der Schätzung der Gesamtenergie und der bestimmten Abweichung, und
eine Vorrichtung für das Modifizieren der Verstärkung des Kanals, basierend auf der Aktualisierung der Rauschschätzung, um die rauschunterdrückten Sprachab tastungen zu erzeugen.
eine Vorrichtung für das Schätzen einer Gesamtenergie des aktuellen Rah mens von Sprachabtastungen, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren des aktuellen Rahmens von Sprachabtastungen, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren einer Vielzahl vergangener Rahmen mit Sprachabtastungen, basierend auf der Schätzung der Leistung der Spektren im aktuellen Rahmen;
eine Vorrichtung zum Bestimmen einer Abweichung zwischen der Schätzung der Spektren des aktuellen Rahmens und der Schätzung der Leistung der Spektren der Vielzahl von vergangenen Rahmen;
eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basie rend auf der Schätzung der Gesamtenergie und der bestimmten Abweichung, und
eine Vorrichtung für das Modifizieren der Verstärkung des Kanals, basierend auf der Aktualisierung der Rauschschätzung, um die rauschunterdrückten Sprachab tastungen zu erzeugen.
27. Sprachkodierer für das Kodieren von Sprache in einem Kommunikationssystem,
wobei das Kommunikationssystem Sprachsignale durch Verwendung von Informati onsrahmen in Kanälen transferiert,
wobei die Informationsrahmen in den Kanälen Rauschen aufweisen,
wobei der Sprachkodierer als Eingangssignal ein Sprachsignal hat,
wobei der Sprachkodierer folgendes umfaßt:
eine Vorrichtung für das Unterdrücken des Rauschens in einem Rahmen, der das Sprachsignal umfaßt, basierend auf einer Abweichung (ΔE) in der spektralen E nergie (EdB) zwischen einem aktuellen Rahmen, der das Sprachsignal umfaßt, und
eine mittlere, spektrale Energie () einer Vielzahl vergangener Rahmen, die Sprachsignale umfassen, um das rauschunterdrückte Sprachsignal zu erzeugen, und
eine Vorrichtung für die Kodierung des rauschunterdrückten Sprachsignals für den Transfer durch das Kommunikationssystem.
wobei das Kommunikationssystem Sprachsignale durch Verwendung von Informati onsrahmen in Kanälen transferiert,
wobei die Informationsrahmen in den Kanälen Rauschen aufweisen,
wobei der Sprachkodierer als Eingangssignal ein Sprachsignal hat,
wobei der Sprachkodierer folgendes umfaßt:
eine Vorrichtung für das Unterdrücken des Rauschens in einem Rahmen, der das Sprachsignal umfaßt, basierend auf einer Abweichung (ΔE) in der spektralen E nergie (EdB) zwischen einem aktuellen Rahmen, der das Sprachsignal umfaßt, und
eine mittlere, spektrale Energie () einer Vielzahl vergangener Rahmen, die Sprachsignale umfassen, um das rauschunterdrückte Sprachsignal zu erzeugen, und
eine Vorrichtung für die Kodierung des rauschunterdrückten Sprachsignals für den Transfer durch das Kommunikationssystem.
28. Sprachkodierer nach Anspruch 27, wobei sich der Sprachkodierer entweder in
einem mobilen Vermittlungszentrum (MSC), einer zentralisierten Basisstationssteue
rung (CBSC), einer Basistransceiverstation (BTS) oder einer mobilen Station (MS)
befindet.
29. Sprachkodierer nach Anspruch 28, wobei das Kommunikationssystem ferner ein
Kommunikationssystem des Vielfachzugriffs durch Kodetrennung (CDMA) umfaßt.
30. Sprachkodierer nach Anspruch 27, wobei die Vorrichtung zur Unterdrückung von
Rauschen in einem Rahmen, der das Sprachsignal umfaßt, ferner folgendes umfaßt:
eine Vorrichtung für das Schätzen einer Gesamtenergie des aktuellen Rah mens, der das Sprachsignal umfaßt, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren des aktuellen Rahmens, der das Sprachsignal umfaßt, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren einer Vielzahl vergangener Rahmen, die Sprachsignale umfassen, basierend auf der Schätzung der Leistung der Spektren im aktuellen Rahmen;
eine Vorrichtung zum Bestimmen einer Abweichung zwischen der Schätzung der Spektren des aktuellen Rahmens und der Schätzung der Leistung der Spektren der Vielzahl von vergangenen Rahmen;
eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basie rend auf der Schätzung der Gesamtenergie und der bestimmten Abweichung, und
eine Vorrichtung für das Modifizieren der Verstärkung des Kanals, basierend auf der Aktualisierung der Rauschschätzung, um das rauschunterdrückte Sprachsig nal zu erzeugen.
eine Vorrichtung für das Schätzen einer Gesamtenergie des aktuellen Rah mens, der das Sprachsignal umfaßt, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren des aktuellen Rahmens, der das Sprachsignal umfaßt, basierend auf der Schätzung der Kanalenergie;
eine Vorrichtung für das Schätzen einer Leistung von Spektren einer Vielzahl vergangener Rahmen, die Sprachsignale umfassen, basierend auf der Schätzung der Leistung der Spektren im aktuellen Rahmen;
eine Vorrichtung zum Bestimmen einer Abweichung zwischen der Schätzung der Spektren des aktuellen Rahmens und der Schätzung der Leistung der Spektren der Vielzahl von vergangenen Rahmen;
eine Vorrichtung für das Aktualisieren der Rauschschätzung des Kanals, basie rend auf der Schätzung der Gesamtenergie und der bestimmten Abweichung, und
eine Vorrichtung für das Modifizieren der Verstärkung des Kanals, basierend auf der Aktualisierung der Rauschschätzung, um das rauschunterdrückte Sprachsig nal zu erzeugen.
31. Sprachkodierer nach Anspruch 30, wobei das Sprachsignal entweder ein analoges
Sprachsignal oder ein digitales Sprachsignal ist.
32. Verfahren in einem Kommunikationssystem,
wobei das Kommunikationssystem einen Informationstransfer unter Verwendung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrahmen in den Kanälen ein Rauschen aufwei sen, das eine Kanalrauschschätzung ergibt,
wobei das Verfahren folgende Schritte umfaßt:
Schätzen einer Kanalenergie in einem aktuellen Informationsrahmen;
Schätzen einer Gesamtkanalenergie in einem aktuellen Informationsrahmen, basierend auf der Schätzung der Kanalenergie;
Schätzen einer Leistung von Spektren des aktuellen Informationsrahmens, ba sierend auf der Schätzung der Kanalenergie;
Schätzen einer Leistung von Spektren einer Vielzahl vergangener Informati onsrahmen;
Bestimmen einer Abweichung zwischen dem geschätzten Wert der Spektren des aktuellen Rahmens und dem geschätzten Wert der Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
Aktualisieren der Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtkanalenergie und der bestimmten Abweichung.
wobei das Kommunikationssystem einen Informationstransfer unter Verwendung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrahmen in den Kanälen ein Rauschen aufwei sen, das eine Kanalrauschschätzung ergibt,
wobei das Verfahren folgende Schritte umfaßt:
Schätzen einer Kanalenergie in einem aktuellen Informationsrahmen;
Schätzen einer Gesamtkanalenergie in einem aktuellen Informationsrahmen, basierend auf der Schätzung der Kanalenergie;
Schätzen einer Leistung von Spektren des aktuellen Informationsrahmens, ba sierend auf der Schätzung der Kanalenergie;
Schätzen einer Leistung von Spektren einer Vielzahl vergangener Informati onsrahmen;
Bestimmen einer Abweichung zwischen dem geschätzten Wert der Spektren des aktuellen Rahmens und dem geschätzten Wert der Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
Aktualisieren der Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtkanalenergie und der bestimmten Abweichung.
33. Verfahren in einem Kommunikationssystem,
wobei das Kommunikationssystem einen Informationstransfer unter Verwendung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrahmen in den Kanälen ein Rauschen aufwei sen, das eine Kanalrauschschätzung ergibt,
wobei das Verfahren folgende Schritte umfaßt:
Schätzen einer Kanalenergie in einem aktuellen Informationsrahmen;
Schätzen einer Gesamtkanalenergie in einem aktuellen Informationsrahmen, basierend auf der Schätzung der Kanalenergie;
Schätzen einer Leistung von Spektren des aktuellen Informationsrahmens, ba sierend auf der Schätzung der Kanalenergie;
Schätzen einer ersten Leistung von Spektren einer Vielzahl vergangener In formationsrahmen, nicht basierend auf der Schätzung der Leistung der Spektren des aktuellen Rahmens;
Schätzen einer zweiten Leistung von Spektren einer Vielzahl vergangener In formationsrahmen, basierend auf der Schätzung der Leistung der Spektren des aktu ellen Rahmens;
Bestimmen einer Abweichung zwischen dem geschätzten Wert der Spektren des aktuellen Rahmens und dem geschätzten Wert der ersten Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
Aktualisieren der Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtkanalenergie und der bestimmten Abweichung.
wobei das Kommunikationssystem einen Informationstransfer unter Verwendung von Informationsrahmen in Kanälen implementiert,
wobei die Informationsrahmen in den Kanälen ein Rauschen aufwei sen, das eine Kanalrauschschätzung ergibt,
wobei das Verfahren folgende Schritte umfaßt:
Schätzen einer Kanalenergie in einem aktuellen Informationsrahmen;
Schätzen einer Gesamtkanalenergie in einem aktuellen Informationsrahmen, basierend auf der Schätzung der Kanalenergie;
Schätzen einer Leistung von Spektren des aktuellen Informationsrahmens, ba sierend auf der Schätzung der Kanalenergie;
Schätzen einer ersten Leistung von Spektren einer Vielzahl vergangener In formationsrahmen, nicht basierend auf der Schätzung der Leistung der Spektren des aktuellen Rahmens;
Schätzen einer zweiten Leistung von Spektren einer Vielzahl vergangener In formationsrahmen, basierend auf der Schätzung der Leistung der Spektren des aktu ellen Rahmens;
Bestimmen einer Abweichung zwischen dem geschätzten Wert der Spektren des aktuellen Rahmens und dem geschätzten Wert der ersten Leistung der Spektren der Vielzahl von vergangenen Rahmen, und
Aktualisieren der Rauschschätzung des Kanals, basierend auf der Schätzung der Gesamtkanalenergie und der bestimmten Abweichung.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US08/556,358 US5659622A (en) | 1995-11-13 | 1995-11-13 | Method and apparatus for suppressing noise in a communication system |
| PCT/US1996/014270 WO1997018647A1 (en) | 1995-11-13 | 1996-09-04 | Method and apparatus for suppressing noise in a communication system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE19681070T1 DE19681070T1 (de) | 1998-02-26 |
| DE19681070C2 true DE19681070C2 (de) | 2002-10-24 |
Family
ID=24221022
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE19681070T Expired - Lifetime DE19681070C2 (de) | 1995-11-13 | 1996-09-04 | Verfahren und Vorrichtung zum Betreiben eines Kommunikationssystems mit Rauschunterdrückung |
Country Status (16)
| Country | Link |
|---|---|
| US (1) | US5659622A (de) |
| JP (1) | JP3842821B2 (de) |
| KR (1) | KR100286719B1 (de) |
| CN (1) | CN1075692C (de) |
| AU (1) | AU689403B2 (de) |
| BR (1) | BR9607249A (de) |
| CA (1) | CA2203917C (de) |
| DE (1) | DE19681070C2 (de) |
| FI (1) | FI115582B (de) |
| FR (1) | FR2741217B1 (de) |
| GB (1) | GB2313266B (de) |
| HU (1) | HU219255B (de) |
| IL (1) | IL119226A (de) |
| RU (1) | RU2169992C2 (de) |
| SE (1) | SE521679C2 (de) |
| WO (1) | WO1997018647A1 (de) |
Families Citing this family (92)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| IN184794B (de) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
| SE505156C2 (sv) * | 1995-01-30 | 1997-07-07 | Ericsson Telefon Ab L M | Förfarande för bullerundertryckning genom spektral subtraktion |
| FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
| US5881091A (en) * | 1996-02-05 | 1999-03-09 | Hewlett-Packard Company | Spread spectrum linearization for digitizing receivers |
| JPH09326844A (ja) * | 1996-06-03 | 1997-12-16 | Mitsubishi Electric Corp | 騒音低減通話装置及び騒音低減通話方法 |
| KR100250561B1 (ko) | 1996-08-29 | 2000-04-01 | 니시무로 타이죠 | 잡음소거기 및 이 잡음소거기를 사용한 통신장치 |
| US5937377A (en) * | 1997-02-19 | 1999-08-10 | Sony Corporation | Method and apparatus for utilizing noise reducer to implement voice gain control and equalization |
| US6104993A (en) * | 1997-02-26 | 2000-08-15 | Motorola, Inc. | Apparatus and method for rate determination in a communication system |
| JPH10247098A (ja) * | 1997-03-04 | 1998-09-14 | Mitsubishi Electric Corp | 可変レート音声符号化方法、可変レート音声復号化方法 |
| US5893056A (en) * | 1997-04-17 | 1999-04-06 | Northern Telecom Limited | Methods and apparatus for generating noise signals from speech signals |
| FR2765715B1 (fr) * | 1997-07-04 | 1999-09-17 | Sextant Avionique | Procede de recherche d'un modele de bruit dans des signaux sonores bruites |
| KR19990020369A (ko) * | 1997-08-30 | 1999-03-25 | 윤종용 | 무선 사설교환시스템에서 노이즈 제거 방법 |
| FR2768544B1 (fr) * | 1997-09-18 | 1999-11-19 | Matra Communication | Procede de detection d'activite vocale |
| TW333610B (en) * | 1997-10-16 | 1998-06-11 | Winbond Electronics Corp | The phonetic detecting apparatus and its detecting method |
| DE19747885B4 (de) * | 1997-10-30 | 2009-04-23 | Harman Becker Automotive Systems Gmbh | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion |
| US6070137A (en) * | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
| WO1999041737A1 (en) * | 1998-02-17 | 1999-08-19 | Motorola Inc. | Method and apparatus for high speed determination of an optimum vector in a fixed codebook |
| US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
| US6073152A (en) * | 1998-04-03 | 2000-06-06 | Sarnoff Corporation | Method and apparatus for filtering signals using a gamma delay line based estimation of power spectrum |
| US6088668A (en) * | 1998-06-22 | 2000-07-11 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
| US6122610A (en) * | 1998-09-23 | 2000-09-19 | Verance Corporation | Noise suppression for low bitrate speech coder |
| KR100281181B1 (ko) * | 1998-10-16 | 2001-02-01 | 윤종용 | 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법 |
| US6424938B1 (en) * | 1998-11-23 | 2002-07-23 | Telefonaktiebolaget L M Ericsson | Complex signal activity detection for improved speech/noise classification of an audio signal |
| TWM253017U (en) | 1999-02-03 | 2004-12-11 | Matsushita Electric Industrial Co Ltd | Emergency reporting apparatus emergency reporting network system |
| US6453291B1 (en) * | 1999-02-04 | 2002-09-17 | Motorola, Inc. | Apparatus and method for voice activity detection in a communication system |
| US6618701B2 (en) | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
| DE19920819C1 (de) * | 1999-05-06 | 2000-10-26 | Bosch Gmbh Robert | Verfahren und Vorrichtung zur Schätzung von gedächtnisbehafteten Übertragungskanälen |
| GB9912577D0 (en) * | 1999-05-28 | 1999-07-28 | Mitel Corp | Method of detecting silence in a packetized voice stream |
| US6633841B1 (en) * | 1999-07-29 | 2003-10-14 | Mindspeed Technologies, Inc. | Voice activity detection speech coding to accommodate music signals |
| US6157670A (en) * | 1999-08-10 | 2000-12-05 | Telogy Networks, Inc. | Background energy estimation |
| US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
| US6366880B1 (en) * | 1999-11-30 | 2002-04-02 | Motorola, Inc. | Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies |
| BR0016127A (pt) * | 1999-12-03 | 2002-08-06 | Motorola Inc | Método e aparelho para suprimir o ruìdo acústico de segundo plano em um sistema de comunicação |
| US6963546B2 (en) * | 2000-03-15 | 2005-11-08 | Interdigital Technology Corp. | Multi-user detection using an adaptive combination of joint detection and successive interface cancellation |
| JP2001318694A (ja) * | 2000-05-10 | 2001-11-16 | Toshiba Corp | 信号処理装置、信号処理方法および記録媒体 |
| JP2002032096A (ja) | 2000-07-18 | 2002-01-31 | Matsushita Electric Ind Co Ltd | 雑音区間/音声区間判定装置 |
| JP4533517B2 (ja) * | 2000-08-31 | 2010-09-01 | 株式会社東芝 | 信号処理方法および信号処理装置 |
| US7277554B2 (en) | 2001-08-08 | 2007-10-02 | Gn Resound North America Corporation | Dynamic range compression using digital frequency warping |
| WO2003063160A1 (en) * | 2002-01-25 | 2003-07-31 | Koninklijke Philips Electronics N.V. | Method and unit for substracting quantization noise from a pcm signal |
| US7299173B2 (en) * | 2002-01-30 | 2007-11-20 | Motorola Inc. | Method and apparatus for speech detection using time-frequency variance |
| RU2206960C1 (ru) * | 2002-06-24 | 2003-06-20 | Общество с ограниченной ответственностью "Центр речевых технологий" | Способ подавления шума в информационном сигнале и устройство для его осуществления |
| US7283956B2 (en) * | 2002-09-18 | 2007-10-16 | Motorola, Inc. | Noise suppression |
| US7343283B2 (en) * | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
| RU2251811C2 (ru) * | 2003-01-30 | 2005-05-10 | Казанский государственный технический университет им. А.Н. Туполева | Устройство разрешения сигналов на фоне произвольной помехи |
| US7809150B2 (en) * | 2003-05-27 | 2010-10-05 | Starkey Laboratories, Inc. | Method and apparatus to reduce entrainment-related artifacts for hearing assistance systems |
| US20080281589A1 (en) * | 2004-06-18 | 2008-11-13 | Matsushita Electric Industrail Co., Ltd. | Noise Suppression Device and Noise Suppression Method |
| RU2269205C1 (ru) * | 2004-07-06 | 2006-01-27 | Казанский государственный технический университет им. А.Н. Туполева | Устройство разрешения радиоимпульсных сигналов на фоне произвольной помехи |
| WO2006049052A1 (ja) * | 2004-11-02 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | 雑音抑圧装置 |
| KR20060091970A (ko) * | 2005-02-16 | 2006-08-22 | 엘지전자 주식회사 | 이동통신단말기에서의 신호 대 잡음비 개선 방법 및 그 이동통신단말기 |
| US20060184363A1 (en) * | 2005-02-17 | 2006-08-17 | Mccree Alan | Noise suppression |
| WO2006097886A1 (en) * | 2005-03-16 | 2006-09-21 | Koninklijke Philips Electronics N.V. | Noise power estimation |
| US7983906B2 (en) * | 2005-03-24 | 2011-07-19 | Mindspeed Technologies, Inc. | Adaptive voice mode extension for a voice activity detector |
| US7596099B2 (en) * | 2005-08-22 | 2009-09-29 | Motorola, Inc. | Method and apparatus for managing a communication link |
| EP1921609B1 (de) | 2005-09-02 | 2014-07-16 | NEC Corporation | Rauschunterdrückungsverfahren und vorrichtung und computerprogramm |
| CN101300623B (zh) | 2005-09-02 | 2011-07-27 | 日本电气株式会社 | 用于抑制噪声的方法、设备和计算机程序 |
| US8116473B2 (en) | 2006-03-13 | 2012-02-14 | Starkey Laboratories, Inc. | Output phase modulation entrainment containment for digital filters |
| US7555075B2 (en) * | 2006-04-07 | 2009-06-30 | Freescale Semiconductor, Inc. | Adjustable noise suppression system |
| KR100883652B1 (ko) * | 2006-08-03 | 2009-02-18 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템 |
| US8060363B2 (en) * | 2007-02-13 | 2011-11-15 | Nokia Corporation | Audio signal encoding |
| US7873114B2 (en) * | 2007-03-29 | 2011-01-18 | Motorola Mobility, Inc. | Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate |
| US7809129B2 (en) * | 2007-08-31 | 2010-10-05 | Motorola, Inc. | Acoustic echo cancellation based on noise environment |
| CN100556162C (zh) * | 2007-09-13 | 2009-10-28 | 中兴通讯股份有限公司 | 一种实现明密话切换后媒体流的无损传输方法及系统 |
| JP5461421B2 (ja) * | 2007-12-07 | 2014-04-02 | アギア システムズ インコーポレーテッド | 保留音楽のエンドユーザ制御 |
| RU2416876C2 (ru) * | 2008-02-04 | 2011-04-20 | Владимир Алексеевич Гарбузов | Способ обработки аддитивной смеси сигнала и белого шума |
| CN100550133C (zh) * | 2008-03-20 | 2009-10-14 | 华为技术有限公司 | 一种语音信号处理方法及装置 |
| MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
| PT2410522T (pt) | 2008-07-11 | 2018-01-09 | Fraunhofer Ges Forschung | Codificador de sinal de áudio, método para codificar um sinal de áudio e programa de computador |
| CN101770776B (zh) | 2008-12-29 | 2011-06-08 | 华为技术有限公司 | 瞬态信号的编码方法和装置、解码方法和装置及处理系统 |
| CN102044241B (zh) * | 2009-10-15 | 2012-04-04 | 华为技术有限公司 | 一种实现通信系统中背景噪声的跟踪的方法和装置 |
| EP2490214A4 (de) * | 2009-10-15 | 2012-10-24 | Huawei Tech Co Ltd | Verfahren, vorrichtung und system zur signalverarbeitung |
| PT2491559E (pt) * | 2009-10-19 | 2015-05-07 | Ericsson Telefon Ab L M | Método e estimador de fundo para a detecção de actividade de voz |
| US9729976B2 (en) * | 2009-12-22 | 2017-08-08 | Starkey Laboratories, Inc. | Acoustic feedback event monitoring system for hearing assistance devices |
| US8917891B2 (en) | 2010-04-13 | 2014-12-23 | Starkey Laboratories, Inc. | Methods and apparatus for allocating feedback cancellation resources for hearing assistance devices |
| US9654885B2 (en) | 2010-04-13 | 2017-05-16 | Starkey Laboratories, Inc. | Methods and apparatus for allocating feedback cancellation resources for hearing assistance devices |
| CN102376303B (zh) * | 2010-08-13 | 2014-03-12 | 国基电子(上海)有限公司 | 录音设备及利用该录音设备进行声音处理与录入的方法 |
| PT3493205T (pt) | 2010-12-24 | 2021-02-03 | Huawei Tech Co Ltd | Método e aparelho para detetar de forma adaptativa uma atividade de voz num sinal de áudio de entrada |
| MX2013009344A (es) | 2011-02-14 | 2013-10-01 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral. |
| WO2012110448A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
| CA2827277C (en) | 2011-02-14 | 2016-08-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Linear prediction based coding scheme using spectral domain noise shaping |
| EP3239978B1 (de) | 2011-02-14 | 2018-12-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung und dekodierung von pulspositionen von spuren eines audiosignals |
| WO2012110447A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
| BR112012029132B1 (pt) | 2011-02-14 | 2021-10-05 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Representação de sinal de informações utilizando transformada sobreposta |
| CA2903681C (en) * | 2011-02-14 | 2017-03-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
| JP5480226B2 (ja) * | 2011-11-29 | 2014-04-23 | 株式会社東芝 | 信号処理装置および信号処理方法 |
| US8712769B2 (en) | 2011-12-19 | 2014-04-29 | Continental Automotive Systems, Inc. | Apparatus and method for noise removal by spectral smoothing |
| US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
| US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
| EP3152756B1 (de) * | 2014-06-09 | 2019-10-23 | Dolby Laboratories Licensing Corporation | Geräuschpegelschätzung |
| JP6208377B2 (ja) * | 2014-07-29 | 2017-10-04 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | オーディオ信号における背景雑音の推定 |
| GB201617016D0 (en) * | 2016-09-09 | 2016-11-23 | Continental automotive systems inc | Robust noise estimation for speech enhancement in variable noise conditions |
| US10681458B2 (en) | 2018-06-11 | 2020-06-09 | Cirrus Logic, Inc. | Techniques for howling detection |
| KR102242457B1 (ko) * | 2019-08-08 | 2021-04-19 | 주식회사 에스원 | Uwb 모듈레이션을 통한 노이즈 추정방법 |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4654884A (en) * | 1984-05-10 | 1987-03-31 | Alps Electric Co., Ltd. | Radio receiver with switching circuit for elimination of intermodulation interference |
| US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
| IT1216224B (it) * | 1986-03-28 | 1990-02-22 | Giuliani Marcello | Complesso pneumatico per la pulitura e l'allontanamento di polveri, fibrille e cascami vari dalle carde laniere e cotoniere dell'industria tessile |
| US4811404A (en) * | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
| SU1660188A1 (ru) * | 1988-09-08 | 1991-06-30 | Предприятие П/Я Р-6510 | Адаптивное устройство компенсации помех в речевом сигнале |
| US5267322A (en) * | 1991-12-13 | 1993-11-30 | Digital Sound Corporation | Digital automatic gain control with lookahead, adaptive noise floor sensing, and decay boost initialization |
| US5475686A (en) * | 1992-12-28 | 1995-12-12 | Motorola, Inc. | Method and apparatus for transferring data in a communication system |
| DE69428119T2 (de) * | 1993-07-07 | 2002-03-21 | Picturetel Corp., Peabody | Verringerung des hintergrundrauschens zur sprachverbesserung |
-
1995
- 1995-11-13 US US08/556,358 patent/US5659622A/en not_active Expired - Lifetime
-
1996
- 1996-09-04 DE DE19681070T patent/DE19681070C2/de not_active Expired - Lifetime
- 1996-09-04 CA CA002203917A patent/CA2203917C/en not_active Expired - Lifetime
- 1996-09-04 KR KR1019970704788A patent/KR100286719B1/ko not_active Expired - Lifetime
- 1996-09-04 RU RU97113483/09A patent/RU2169992C2/ru active
- 1996-09-04 WO PCT/US1996/014270 patent/WO1997018647A1/en not_active Ceased
- 1996-09-04 AU AU17584/97A patent/AU689403B2/en not_active Expired
- 1996-09-04 JP JP51882097A patent/JP3842821B2/ja not_active Expired - Fee Related
- 1996-09-04 BR BR9607249A patent/BR9607249A/pt not_active IP Right Cessation
- 1996-09-04 CN CN96191426A patent/CN1075692C/zh not_active Expired - Lifetime
- 1996-09-04 GB GB9713727A patent/GB2313266B/en not_active Expired - Lifetime
- 1996-09-04 HU HU9800843A patent/HU219255B/hu unknown
- 1996-09-09 IL IL11922696A patent/IL119226A/xx not_active IP Right Cessation
- 1996-10-10 FR FR9612357A patent/FR2741217B1/fr not_active Expired - Lifetime
-
1997
- 1997-05-02 SE SE9701659A patent/SE521679C2/sv not_active IP Right Cessation
- 1997-07-03 FI FI972852A patent/FI115582B/fi not_active IP Right Cessation
Also Published As
| Publication number | Publication date |
|---|---|
| FI115582B (fi) | 2005-05-31 |
| CN1075692C (zh) | 2001-11-28 |
| FI972852A0 (fi) | 1997-07-03 |
| RU2169992C2 (ru) | 2001-06-27 |
| JPH10513030A (ja) | 1998-12-08 |
| IL119226A0 (en) | 1996-12-05 |
| FR2741217B1 (fr) | 2004-08-20 |
| US5659622A (en) | 1997-08-19 |
| SE9701659D0 (sv) | 1997-05-02 |
| CN1168204A (zh) | 1997-12-17 |
| FR2741217A1 (fr) | 1997-05-16 |
| WO1997018647A1 (en) | 1997-05-22 |
| GB2313266A (en) | 1997-11-19 |
| HK1005112A1 (en) | 1998-12-24 |
| HUP9800843A2 (hu) | 1998-07-28 |
| SE9701659L (sv) | 1997-09-12 |
| HU219255B (en) | 2001-03-28 |
| GB9713727D0 (en) | 1997-09-03 |
| BR9607249A (pt) | 1997-12-30 |
| GB2313266B (en) | 2000-01-26 |
| CA2203917A1 (en) | 1997-05-14 |
| KR19980701399A (ko) | 1998-05-15 |
| JP3842821B2 (ja) | 2006-11-08 |
| AU689403B2 (en) | 1998-03-26 |
| KR100286719B1 (ko) | 2001-04-16 |
| SE521679C2 (sv) | 2003-11-25 |
| IL119226A (en) | 2000-10-31 |
| AU1758497A (en) | 1997-06-05 |
| HUP9800843A3 (en) | 1999-03-29 |
| DE19681070T1 (de) | 1998-02-26 |
| CA2203917C (en) | 2000-06-27 |
| FI972852A7 (fi) | 1997-07-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE19681070C2 (de) | Verfahren und Vorrichtung zum Betreiben eines Kommunikationssystems mit Rauschunterdrückung | |
| DE69830721T2 (de) | Verfahren und vorrichtung zur bestimmung der übertragungsrate in einem kommunikationssystem | |
| DE69917677T2 (de) | SPRACHKODIERUNG MIT VERäNDERBAREM KOMFORT-RAUSCHEN FüR VERBESSERTER WIEDERGABEQUALITäT | |
| DE60032797T2 (de) | Geräuschunterdrückung | |
| DE60029147T2 (de) | Qualitätsverbesserung eines audiosignals in einem digitalen netzwerk | |
| DE69910239T2 (de) | Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale | |
| DE69615302T2 (de) | Maskierung des wahrnehmbaren Rauschens auf der Basis der Frequenzantwort eines Synthesefilters | |
| DE60122203T2 (de) | Verfahren und system zur erzeugung von behaglichkeitsrauschen bei der sprachkommunikation | |
| DE69721349T2 (de) | Sprachkodierung | |
| DE60029990T2 (de) | Glättung des verstärkungsfaktors in breitbandsprach- und audio-signal dekodierer | |
| DE69621393T2 (de) | Quantisierung von Sprachsignalen in prädiktiven Kodiersystemen unter Verwendung von Modellen menschlichen Hörens | |
| DE60220485T2 (de) | Verfahren und Vorrichtung zur Verschleierung von Rahmenausfall von prädiktionskodierter Sprache unter Verwendung von Extrapolation der Wellenform | |
| DE19935808A1 (de) | Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit | |
| DE69529393T2 (de) | Verfahren zur gewichteten Geräuschfilterung | |
| DE69730721T2 (de) | Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form | |
| DE60034026T2 (de) | Sprachverbesserung mit durch sprachaktivität gesteuerte begrenzungen des gewinnfaktors | |
| DE602005000539T2 (de) | Verstärkungsgesteuerte Geräuschunterdrückung | |
| DE60125219T2 (de) | Spektralmerkmal ersatz für die verschleierung von rahmenfehlern in einem sprachdekoder | |
| DE69620967T2 (de) | Synthese von Sprachsignalen in Abwesenheit kodierter Parameter | |
| EP1453194B1 (de) | Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät | |
| DE69534285T2 (de) | Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit variabler Rate | |
| DE60132321T2 (de) | Verfahren und vorrichtung zur verteilten geräuschunterdrückung | |
| DE60017763T2 (de) | Verfahren und vorrichtung zur erhaltung einer ziel-bitrate in einem sprachkodierer | |
| DE10041512A1 (de) | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen | |
| DE69627359T2 (de) | Verbesserter echokompensator mit anwendung in der digitalen telefonie |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OP8 | Request for examination as to paragraph 44 patent law | ||
| 8607 | Notification of search results after publication | ||
| 8607 | Notification of search results after publication | ||
| D2 | Grant after examination | ||
| 8364 | No opposition during term of opposition | ||
| 8327 | Change in the person/name/address of the patent owner |
Owner name: MOTOROLA MOBILITY, INC. ( N.D. GES. D. STAATES, US |
|
| R081 | Change of applicant/patentee |
Owner name: MOTOROLA MOBILITY, INC. ( N.D. GES. D. STAATES, US Free format text: FORMER OWNER: MOTOROLA, INC., SCHAUMBURG, ILL., US Effective date: 20110324 |
|
| R071 | Expiry of right |