-
HINTERGRUND
-
1.
Gebiet der Erfindung
-
Die
vorliegende Erfindung betrifft das Gebiet von Mehrpunkt-Audio/Video-Konferenzen
und insbesondere die Verbesserung der Qualität der Konferenz durch Verringern
von Störsignalen.
-
2. Beschreibung des Standes
der Technik
-
Mehrpunkt-Konferenzen
von Audio und/oder Video und/oder Multimedia sind eine Kommunikation zwischen
mehr als zwei Teilnehmern. Üblicherweise können Konferenzanrufe über ein
Kommunikationsnetzwerk, wie z.B. das öffentliche Fernsprechwählnetz ("PSTN"), das dienstintegrierende
digitale Fernmeldenetz (ISDN), das Internetprotokoll-(IP) Netzwerk
usw., aufgebaut werden. Das Netzwerk enthält Mehrpunkt-Steuereinheiten
(MCU) und/oder Audiobrücken,
die die Kommunikationen der Teilnehmer am Anruf leiten und bilden.
Der Betrieb von MCUs und Audiobrücken
ist Fachleuten gut bekannt. Eine beispielhafte Audiobrücke ist
in der US-Patentanmeldung Nummer 10/072 081 oder in der US- Patentanmeldung Nummer
10/144 561 dargestellt. Es sollte beachtet werden, dass die Begriffe
MCU und Audiobrücke
hierin austauschbar verwendet werden können.
-
Eine übliche MCU
kann Audiosignale von einer Vielzahl von Konferenzteilnehmern empfangen, die
Signale analysieren und eine Steuerinformation, wie z.B., jedoch
nicht begrenzt auf VAD-(Sprachaktivitätserfassung), Signalenergie-
und Signalqualitätsmaße, erzeugen.
Auf der Basis dieser Steuerinformation können Entscheidungen hinsichtlich
dessen getroffen werden, wessen Signale gemischt und unter den anderen
Konferenzteilnehmern verteilt werden oder wessen Signal aufgrund
einer Schlussfolgerung, dass das Signal unter der annehmbaren Qualität liegt,
stumm geschaltet wird. Ein unannehmbares Signal (UAS) ist ein objektives
Kriterium und kann von der Art der Konferenz abhängen. Beispielhafte Kriterien
können
Nicht-Sprach-Signale sein, wie z.B. Musik, MFV, Hintergrundrauschen
usw. Die Begriffe verrauschtes Signal, Störung und UAS können austauschbar
verwendet werden und der Begriff Störung kann diese Begriffe darstellen.
-
Es
sind Verfahren zum Erzeugen einer Information hinsichtlich der Signalenergie,
VAD und Qualität
bekannt. Beispielhafte Algorithmen zum Erzeugen dieser Information
sind in G723.1 (im Anhang A für
denselben Standard verwendet); G729.1 Anhang B; und GSM AMR (GSM
06.71) unter Verwendung des VAD-Algorithmus GSM 06.94 dargestellt.
Ein einfacher Algorithmus für
den Störungsdetektor
(ND) kann eine Störung
definieren, wenn die Signalenergie (SE) über einem bestimmten Pegel
liegt, während die
VAD angibt, dass das Signal nicht Sprache ist, ND=SE und (nicht
VAD).
-
Die
Qualität
einer Konferenz hängt
von den automatischen Entscheidungen dieser Verfahren ab. Ein empfindlicher
ND-Algorithmus kann
beispielsweise einen gültigen
Teilnehmer abtrennen, während
ein weniger empfindlicher Algorithmus Audio einer verrauschten Verbindung
zum Konferenzgemisch hinzufügen
kann. Das Konferenzgemisch ist das zusammengesetzte Audiosignal
der ausgewählten
Konferenzteilnehmer. Die Auswahl basiert auf den Konferenzeinrichtungsparametern
und auf automatischen Entscheidungen auf der Basis der Analyse der
Signale der aktuellen Sprecher. Es gibt Fälle, bei denen eine automatische
Entscheidung häufig
misslingen kann. In den Fällen,
in denen ein Konferenzteilnehmer beispielsweise den Konferenzanruf
auf Halten schaltet und einen weiteren Anruf annimmt, kann während der
Halteperiode eine Nebenstellenanlage (PBX), über die der Konferenzteilnehmer
verbunden ist, über
die Verbindung mit der Konferenz einen "Beruhigungston" abspielen, was den Rest der Teilnehmer
stört.
Der "Beruhigungston" kann Musik, Rundfunk,
Werbung oder andere Signale für
einen Teilnehmer, der auf Halten wartet, sein. Im Allgemeinen kann der "Beruhigungston" dieselben Eigenschaften
wie Sprache besitzen, und daher kann er die Kriterien von üblichen
VAD- und/oder ND-Algorithmen
erfüllen und
kann zu den anderen Teilnehmern an der Konferenz übertragen
werden. Andererseits kann ein empfindlicher ND, der nicht auf die
Verbindungsqualität eines
bestimmten Konferenzteilnehmers abgestimmt ist, einem gültigen Konferenzteilnehmer
schaden/diesen abtrennen. Daher ist es schwierig, den ND-Algorithmus
auf die Bedingungen von verschiedenen Konferenzteilnehmern im Voraus
abzustimmen.
-
EP 0 982 920 A2 offenbart
ein Verfahren, um zu verhindern, dass Beruhigungstonsignale, die
von einem Anstoß erregenden
Konferenzteilnehmer ausgehen, über
eine Audiokonferenzbrücke
zu den anderen Konferenzteilnehmern weitergeleitet werden. Dies
wird erreicht, indem ein Misch-/Summieruntersystem der Audiokonferenzbrücke angewiesen
wird, die Kombination von Audio, das vom Anstoß erregenden Konferenzteilnehmer
ausgeht, vorübergehend davon
abzuhalten, mit Audiokanälen
kombiniert oder gemischt zu werden, über die die Konferenzteilnehmer
an der Audiokonferenz teilnehmen. Sobald der Beruhigungston beendet
ist, kann sich der Anstoß erregende
Konferenzteilnehmer wieder dem Konferenzanruf anschließen, indem
er ein Signal sendet, das das Misch-/Summieruntersystem anweist,
die Kombination der Audiosignale, die vom Anstoß erregenden Konferenzteilnehmer
ausgehen, mit den Audiokanälen
der anderen Konferenzteilnehmer wieder aufzunehmen. Dieses Verfahren
offenbart jedoch nicht, einen Störerfassungspegel
zu erhöhen
und dadurch dem angeblich störenden
Konferenzteilnehmer die Chance zu geben, sich wieder der Konferenz
anzuschließen.
-
Folglich
ist es offensichtlich, dass derzeitige Technologien der automatischen
Störungserfassung in
einer Audio/Video-Konferenz die falschen Entscheidungen treffen
können,
die die Qualität
der Konferenz verringern. Daher besteht auf dem Fachgebiet ein Bedarf
für ein
neues Störungserfassungsverfahren,
das diese Mängel
beseitigen kann.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Systeme
gemäß der vorliegenden
Erfindung lösen
das vorstehend beschriebene Problem durch Vorsehen eines Pfades
zu einem Konferenzteilnehmer, der durch eine automatische Entscheidung
der MCU als Störquelle
definiert wurde, um auf diese automatische Entscheidung zu antworten
und den ND gemäß seinem
Audiosignal zu korrigieren oder einzustellen/abzustimmen. Die Erfindung
ist in dem unabhängigen
Anspruch 1 bzw. 10 definiert. Spezielle Ausführungsbeispiele der Erfindung
sind in den abhängigen
Ansprüchen
dargelegt.
-
In
einer Telefonkonferenz, in der mindestens ein Konferenzteilnehmer
mit der Konferenz über
eine PBX verbunden sein kann, kann der Konferenzteilnehmer beispielsweise
die Konferenz auf "HALTEN" schalten, was ein
Störsignal über die
Verbindung an die Konferenz anlegt. Dann kann der ND diese Verbindung
als störende
Verbindung identifizieren und diese Angabe zu einer beispielhaften
Steuereinheit in der MCU senden. Die Steuereinheit kann nach dem Empfangen
eines Hinweises, dass der Konferenzteilnehmerkanal eine Störung aufweist,
das von diesem Konferenzteilnehmer stammende Signal stumm schalten.
Dann kann die beispielhafte Steuereinheit eine Meldung einer interaktiven
Sprachantwort (IVR) über
das Audiosignal in Richtung des Konferenzteilnehmers legen. Eine
beispielhafte Meldung kann den Konferenzteilnehmer informieren,
dass er stumm geschaltet wurde, und den Konferenzteilnehmer auffordern,
eine der Berührungstontasten,
beispielsweise "1", zu drücken, wenn
er gerade von "HALTEN" zurückkehrt, "3" zu drücken, wenn der Konferenzteilnehmer
eine verrauschte Leitung/Umgebung verwendet, oder "5" zu drücken, um den ND-Algorithmus zu
deaktivieren, usw.
-
Wenn
keine Antwort empfangen wird, kann die Meldung für einen gewissen Zeitraum oder
für den
Rest der Konferenz andauern. Wenn eine dieser Tasten gedrückt wurde,
kann das erfindungsgemäße System
folgendermaßen
handeln. Wenn die Taste "1" ist, hebt ein beispielhaftes
Ausführungsbeispiel der
vorliegenden Erfindung die Stummschaltsituation auf und ermöglicht,
dass der Konferenzteilnehmer gehört
wird. Wenn die Taste "3" ist, kann das beispielhafte
Ausführungsbeispiel
der vorliegenden Erfindung die Empfindlichkeit des ND-Algorithmus
verringern. Dann ermöglicht
die Steuereinheit, dass der Konferenzteilnehmer in der Konferenz
gehört
wird, während
ein Datensatz dieser Einstellung beibehalten wird. Wenn der neue
Pegel über
dieser Toleranz liegt, kann die beispielhafte Steuereinheit den
Konferenzteilnehmer unterrichten, dass er zu verrauscht ist, und
lehnt es ab, das Audio des Konferenzteilnehmers zur Konferenz hinzuzufügen. Wenn
die Taste "5" ist, kann das beispielhafte
Ausführungsbeispiel der
vorliegenden Erfindung den ND-Algorithmus deaktivieren und verbindet
den störenden
Konferenzteilnehmer ohne Bedingung.
-
Weitere
beispielhafte Ausführungsbeispiele können unter
Verwendung einer IVR-Meldung von einem anderen Konferenzteilnehmer,
beispielsweise dem Vorsitzenden der Konferenz, anfordern, zu entscheiden,
ob der verrauschte Konferenzteilnehmer stumm geschaltet werden soll
oder nicht.
-
Weitere
beispielhafte Ausführungsbeispiele können einen
verrauschten Konferenzteilnehmer in eine Sprechaufforderungs-(PTT)
Operation setzen, den verrauschten Konferenzteilnehmer unter Verwendung
einer IVR-Meldung anweisen, vorübergehend
irgendeine der Tasten jedes Mal, wenn er sprechen will, zu drücken und
beim Beenden seinerseits wieder zu drücken.
-
Im
Allgemeinen können
erfindungsgemäße Systeme
andere als MFV-Rückmeldungsmittel
verwenden, um zu antworten, wie z.B., jedoch nicht begrenzt auf:
Spracherkennung, Netzwerksteuersignale, wie z.B. ISDN-"D"-Kanal, Steuerpakete über IP-Kommunikation
usw.
-
Folglich
bieten erfindungsgemäße Systeme vorteilhafterweise
einen verbesserten Algorithmus, der Störungen in Konferenzen durch
Anfordern einer Rückmeldung
von den störenden
Konferenzteilnehmern behandelt. Die Rückmeldung vom verrauschten
Konferenzteilnehmer kann die automatische Entscheidung korrigieren
und daher die Qualität
der Konferenz verbessern.
-
Weitere
Merkmale und Vorteile der vorliegenden Erfindung werden beim Lesen
der folgenden ausführlichen
Beschreibung der Ausführungsbeispiele
mit den zugehörigen
Zeichnungen und beigefügten Ansprüchen ersichtlich.
-
KURZBESCHREIBUNG
DER ZEICHNUNGEN
-
1A ist
ein Blockdiagramm, das eine beispielhafte Konferenzumgebung zeigt;
-
1B ist
ein Blockdiagramm eines Ausführungsbeispiels
gemäß der Erfindung
mit einer allgemeinen Beschreibung einer Audioeinheit in einer MCU;
-
2A ist
ein Blockdiagramm eines ND, der gemäß einem beispielhaften Ausführungsbeispiel der
vorliegenden Erfindung arbeitet; und
-
2B ist
ein Ablaufdiagramm, das die Schritte eines beispielhaften Verfahrens
zum Behandeln eines störenden
Teilnehmers zeigt.
-
AUSFÜHRLICHE
BESCHREIBUNG DES BEVORZUGTEN AUSFÜHRUNGSBEISPIELS
-
Unter
Bezugnahme auf die Figuren, in denen gleiche Ziffern in den ganzen
verschiedenen Ansichten gleiche Elemente darstellen, werden beispielhafte
Ausführungsbeispiele
der vorliegenden Erfindung beschrieben. Der Bequemlichkeit halber
können
nur einige Elemente derselben Gruppe mit Ziffern bezeichnet sein.
Die Zeichnungen dienen der Beschreibung beispielhafter Ausführungsbeispiele,
und nicht der Herstellung. Daher sind die in den Figuren gezeigten
Merkmale nur der Zweckmäßigkeit
und Deutlichkeit der Darstellung halber gewählt.
-
1A ist
ein beispielhaftes Blockdiagramm, das eine allgemeine Beschreibung
einer Konferenzumgebung 100 darstellt. Die Konferenzumgebung
kann Endpunkte 1110aa-nk, einen Operator 1115,
Multimedia-Kommunikationen 1120aa-nk & 1122a-k, Netzwerke 1130a-k und
eine Multimedia-Konferenzsteuereinheit
(MCCU) 1140 aufweisen. Bei einem beispielhaften Ausführungsbeispiel
kann die MCCU 1140 mindestens eine Netzwerkschnittstelle
(NI) 1142, eine gemeinsame Schnittstelle für komprimiertes
Audio (CACI) 110, eine Audioeinheit 1160, ein
Verwaltungs- und Steuersystem (MCS) 1170, Steuersignale 1174,
einen Hauptrechner 1200 und eine Videoeinheit 1300 umfassen.
Weitere beispielhafte Ausführungsbeispiele
können
keinen Videoabschnitt aufweisen und können nur für Audiokonferenzen verwendet
werden. Die MCCU 1140 kann mit einem störenden Konferenzteilnehmer
unter Verwendung von erfindungsgemäßen Ausführungsbeispielen umgehen.
-
Die
Vielzahl von Endpunkten 1110aa-nk sind über die Vielzahl von Netzwerken 1130a-k mit
der MCCU 1140 verbunden. Die MCCU 1140 kann beispielsweise
eine MCU oder eine Nur-Audio-Mehrpunkt-Steuereinheit (eine Audiobrücke) sein.
Die MCCU 1140 und/oder einige oder alle ihrer Komponenten
sind logische Einheiten, die durch Hardware und/oder Software implementiert
werden können. Das
MCS 1170 kann ein Steuermodul sein und kann eine logische
Einheit sein, die den Betrieb der MCCU 1140 steuert.
-
Ein
Endpunkt ist ein Endgerät
in einem Netzwerk, das in der Lage ist, eine Ein-Weg- oder Zwei-Weg-Audio-
und/oder visuelle Kommunikation mit anderen Endgeräten oder
mit der MCCU 1440 bereitzustellen. Die zwischen den Endgeräten und/oder
der MCCU 1440 übertragene
Information kann Steuersignale, Indikatoren, eine Audioinformation,
eine Videoinformation und Daten umfassen. Ein Endgerät kann eine
beliebige Kombination von mehreren verschiedenen Arten von Eingangssignalen und/oder
Ausgangssignalen, wie z.B. nur Sprache, Sprache und Daten, eine
Kombination von Sprache und Video oder eine Kombination von Sprache,
Daten und Video bereitstellen. Im Fall einer Audiokonferenz kann
der Endpunkt ein übliches
Telefon, ein Mobiltelefon usw. sein.
-
Die
NI 1142 empfängt
Multimedia-Kommunikationen 1122a-k über eine Vielzahl von Netzwerken 1130a-k und
Multimedia-Kommunikationen 1120aa-nk von
der Vielzahl der Endpunkte 1110aa-nk und verarbeitet die
Medienkommunikation gemäß Kommunikationsstandards,
die von jeder Art von Netzwerk verwendet werden, wie z.B., jedoch nicht
begrenzt auf H.323, H.321, H.324, H.324M, SIP und/oder H.320 ISDN,
PSTN usw.. Die NI 1142 liefert dann komprimiertes Audio,
komprimiertes Video, komprimierte Daten und Steuerströme zu geeigneten logischen
Modulen in der MCCU 1140. Einige Kommunikationsstandards
erfordern, dass der Prozess der NI 1142 das Demultiplexieren
der eingehenden Multimedia-Kommunikation
in komprimiertes Audio, komprimiertes Video, komprimierte Daten
und Steuerströme
umfasst. In der entgegengesetzten Richtung empfängt die NI 1142 die
separaten Ströme
von den verschiedenen Einheiten (z.B. dem MCS 1170, der
Audioeinheit 1160 und/oder der Videoeinheit 1300)
und verarbeitet die Ströme
gemäß dem geeigneten
Kommunikationsstandard. Die NI 1142 überträgt dann die Ströme zum geeigneten
Netzwerk 1130a-k.
-
Die
Audioeinheit 1160 empfängt
die komprimierten Audioströme
der Vielzahl von Endpunkten 1110aa-nk über die NI 1142 und
CACI 110, verarbeitet die Audioströme, mischt die relevanten Audioströme und sendet
das komprimierte gemischte Signal über die gemeinsame Schnittstelle
für komprimiertes Audio
(CACI) 110 und die NI 1142 zu den Endpunkten 1110aa-nk.
Die Audioeinheit 1160 kann eine logische Einheit sein und
wird nachstehend in Verbindung mit 1B beschrieben.
-
Die
Videoeinheit
1300 kann eine logische Einheit sein, die
komprimierte Videoströme
empfängt und
sendet. Die Videoeinheit
1300 umfasst mindestens ein Videoeingabemodul, das
einen Eingabeteil eines Videostroms
1302 von einem teilnehmenden Endpunkt
bearbeitet, und mindestens ein Videoausgabemodul, das einen zusammengesetzten
komprimierten Videoausgangsstrom erzeugt, der über die gemeinsame Schnittstelle
für komprimiertes
Video (CVCI)
1302 zur NI
1142 und von dort zu
den festgelegten Endpunkten
1110aa-nk gesandt wird. Eine beispielhafte
Operation einer solchen Videoeinheit ist im US-Patent Nummer
US 6 300 973 beschrieben, das
durch den Hinweis hierin aufgenommen wird. Die Videoeinheit ist
für die
Funktion der vorliegenden Erfindung nicht obligatorisch. Die vorliegende
Erfindung kann von einer MCCU verwendet werden, die keine Videoeinheit
aufweist, wie z.B. eine Audiobrücke.
-
Vorzugsweise
kommuniziert der Hauptrechner 1200 mit dem Operator 1115 der
MCCU 1140, wobei der Operator 1115 eine Operatorstation
zum Kommunizieren mit dem Hauptrechner 1200 besitzen kann.
Der Hauptrechner 1200 steuert die MCCU 1140 über das
MCS 1170 gemäß Befehlen
vom Operator 1115. Der Operator 1115 ist jedoch
nicht obligatorisch. Die MCCU kann ohne Operator automatisch arbeiten.
-
1B ist
ein beispielhaftes Blockdiagramm eines Ausführungsbeispiels einer allgemeinen
Audioeinheit 1160 unter Verwendung eines Ausführungsbeispiels
der vorliegenden Erfindung. Das Ausführungsbeispiel von 1B umfasst
eine gemeinsame Schnittstelle für
komprimiertes Audio (CACI) 110, einen Steuerbus 135,
ein MCS 1170 und eine Audioeinheit 1160 mit komprimierten
Signalen 115 und 117, einem Codec 120,
decodierten Informationen 126, einem gemischten Ausgangssignal 128,
einer gemeinsamen Schnittstelle für decodiertes Audio (DACI) 140 und
einer Brücke 150.
Der Codec 120 umfasst einen Decodierer 122 und
einen Codierer 124, während
die Brücke 150 Analyse-
und Verstärkungs-
(A&E) Einheiten 152,
Informationssignale 153, eine Steuereinheit 154,
eine IVR-Einheit 154a, eine Vermittlungsstelle 156,
Steuersignale 157, ausgewählte Signale 159,
einen Mischer 160 und gemischte Signale 161 umfasst.
-
1B beschreibt
den Fluss von Audioströmen
bei einem Beispiel der vorliegenden Erfindung. Komprimierte Audioströme von allen
Endpunkten, die mit einer MCCU verbunden sind, werden über die gemeinsame
Schnittstelle für
komprimiertes Audio (CACI) 110 übertragen. Das MCS 1170 kann
jedem der Endpunkte 1110aa-nk (1A) einen
Codec 120 zuordnen.
-
Ferner überträgt die CACI 110 Signale
zu und von den Endpunkten 1110aa-nk. Das komprimierte Signal 115 von
einem der Endpunkte 1110aa-nk wird beispielsweise über die
CACI 110 zum Decodierer 122 im Codec 120 geleitet,
der vorher durch das MCS 1170 über den Steuerbus 135 diesem
Endpunkt zugeordnet wurde. Der Decodierer 122 kann eine
logische Einheit, Software oder Hardware oder eine Kombination von
diesen sein und kann einen komprimierten Audiostrom auf der Basis der
Kommunikationsstandards, wie z.B., jedoch nicht begrenzt auf G.711,
G.723.1, G.728, G.729, MPEG decodieren oder unkomprimiertes Audio
weiterleiten. Der Decodierer 122 decodiert dann den komprimierten
Audiostrom, wie z.B. das komprimierte Signal 115, und sendet
das decodierte Signal 126 über die gemeinsame Schnittstelle
für decodiertes
Audio (DACI) 140. Die DACI 140 stellt einen Bus
dar, der Rundruffähigkeiten
aufweisen kann. Die DACI 140 kann beispielsweise durch
irgendeines von oder irgendeine Kombination von Zeitmultiplexverfahren
(TDM), Asynchronübertragungsmodus
(ATM), lokalem Netz (LAN), drahtloser Technologie oder gemeinsam
genutztem Speicher implementiert werden. Eine geeignete Brücke 150 kann
dann das decodierte Signal von der DACI 140 erfassen und
kann das decodierte Signal analysieren, verstärken und/oder mischen und das
Ausgangssignal 161 zur DACI 140 zurückführen.
-
Der
Codierer 124 kann eine logische Einheit sein. Der Codierer 124 kann
das Ausgangssignal 128 der geeigneten Brücke 150 komprimieren,
wodurch ein komprimierter Audiostrom, wie z.B. das komprimierte
Signal 117, auf der Basis des Kommunikationsstandards,
wie z.B., jedoch nicht begrenzt auf G.711, G.723.1, G.728, G.729
und/oder Motion Picture Expert Group (MPEG), gebildet wird, der
als decodiertes Audio zu einem Endpunkt übertragen wird, der decodiertes
Audio empfängt.
-
Das
MCS 1170 kann eine Datenbank verwenden, die die Verbindungsparameter
(z.B. Codecs und Brücken
usw.) und den Verbindungszustand (z.B. normal, stumm geschaltet
usw.) jedes Endpunkts (Teilnehmers), der gerade mit der MCCU verbunden
ist, in jeder Konferenz, die gerade von der MCCU verwaltet wird,
hält. Der
stumm geschaltete (M) Verbindungszustand kann bedeuten, dass der Teilnehmer
in der Konferenz nicht gehört
werden kann. Der normale (N) Verbindungszustand kann bedeuten, dass
der Teilnehmer gehört
werden kann und der Konferenz zuhören kann usw. Gemäß der Datenbank
programmiert das MCS 1170 eine oder mehrere Brücken 150,
um von der DACI 140 die decodierten Signale aller Teilnehmer
zu erfassen, die zu einer Konferenz gehören, die diesen Brücken 150 zugeordnet
ist.
-
Das
decodierte Ausgangssignal 126 von irgendeinem Codec 120 kann
durch mehr als eine Brücke 150 erfasst
werden, was ermöglicht,
dass die Teilnehmer mehr als einer Konferenz zugeordnet werden.
Die decodierten Ströme
von den Decodierern 122 an der DACI 140 können durch
die Brücke 150 erfasst
werden und dann durch die Analyse- und Verstärkungseinheit 152 analysiert
und verstärkt
werden. Die Analyse- und Verstärkungseinheit 152 kann eine
logische Einheit sein und kann einen Satz von Algorithmen zum Analysieren
eines Audiostroms eines Teilnehmers und/oder Verstärken seiner
Qualität sein,
wie z.B., jedoch nicht begrenzt auf International Telecommunications
Union (ITU) G.165 (Echokompensation), Mehrfrequenz-(MFV) Erfassung,
MFV-Unterdrückung
und/oder Sprachaktivitätsdetektor (VAD),
Signalenergie- und Störungsanalyse.
-
Die
Brücke 150 kann
eine oder mehrere Analyse- und Verstärkungseinheiten 152 aufweisen. Jede
Analyse- und Verstärkungseinheit 152 wird
einem einzelnen Teilnehmer zugeordnet und wird gemäß dem Verbindungszustand
dieses Teilnehmers in der Konferenz programmiert. Die Steuereinheit 154 steuert
eine Konferenz, die alle Signale von der Analyse- und Verstärkungseinheit 152 empfängt, und wählt die
Teilnehmer aus, die über
die Vermittlungsstelle 156 zum Mischer 160 geleitet
werden. Die Steuereinheit 154 kann ein beispielhaftes Verfahren der
vorliegenden Erfindung zur Bearbeitung unter Verwendung der Analysesignale 153,
die von den Analyse- und Verstärkungseinheiten 152 stammen, und
zum Steuern des 2VR-Moduls 154a und
der Vermittlungsstelle 156 implementieren. Das beispielhafte
Verfahren wird nachstehend in Verbindung mit 2A & 2B beschrieben.
Eine einzelne Brücke 150 kann
einer Konferenz, einer Gruppe von Konferenzteilnehmern oder einem
einzelnen Konferenzteilnehmer dienen. In den letzten beiden Fällen kann mehr
als eine Brücke 150 an
der Konferenz beteiligt sein.
-
Der
Mischer 160 empfängt
die verstärkten Ströme von allen
ausgewählten
Teilnehmern und/oder das Signal von der IVR 154a und beliefert jeden
Teilnehmer mit einem unkomprimierten gemischten Audiostrom der ausgewählten Teilnehmer und/oder
der Signal-IVR 154a. Der Mischer 160 kann mehr
als einen Strom 161 liefern, wobei jeder Strom eine andere
Mischung aufweist.
-
Signale 153 von
der Analyse- und Verstärkungseinheit 152 werden
zur Steuereinheit 154 gesandt und die verstärkten decodierten
Audiosignale 155 werden von den Analyse- und Verstärkungseinheiten 152 zur
Vermittlungseinheit 156 gesandt. Die Vermittlungseinheit 156 ist
ein Selektor, der die decodierten Ströme von allen Teilnehmern in
einer Konferenz sowie der IVR-Einheit 154a empfängt und
die ausgewählten
Ströme
zum Mischer 160 überträgt. Die
Auswahl basiert auf den Entscheidungen der Steuereinheit 154.
Die Entscheidungen der Steuereinheit 154 basieren auf empfangenen
Befehlen vom MCS 1170, die den Verbindungszustand der Teilnehmer
an der Konferenz definieren, die der Brücke 150 zugeordnet
ist, und auf dem Informationssignal 153 von der Analyse-
und Verstärkungseinheit 152.
Die Steuereinheit 154 steuert über die Steuersignale 157 die
Vermittlungsstelle 156 und den Mischer 160. In
einem Fall, in dem beispielsweise der Verbindungszustand eines Teilnehmers
normal (N) ist, kann die Analyse- und Verstärkungseinheit 152,
die diesem Teilnehmer zugeordnet ist, angeben, dass das Sprachsignal
bestimmte Kriterien erfüllt,
wie z.B. durch VAD dargelegt (wie z.B. der Energiepegel, der über einem bestimmten
Wert liegt). Dann wählt
die Steuereinheit 154 über
die Vermittlungsstelle 156 das Ausgangssignal 155 der
Analyse- und Verstärkungseinheit 152, die
dem Teilnehmer zugewiesen ist, als eines der Eingangssignale in
den Mischer 160 aus.
-
Bei
einem anderen Fall kann die Analyse- und Verstärkungseinheit 152,
die einem Teilnehmer zugeordnet ist, der Steuereinheit 154 angeben,
dass das Teilnehmersignal stört.
Die Steuereinheit 154 kann ein beispielhaftes Ausführungsbeispiel
der vorliegenden Erfindung einleiten, wie in 2A & 2B dargestellt.
Sie kann die Vermittlungsstelle 156 anweisen, das Audiosignal 155,
das zu diesem störenden
Konferenzteilnehmer gehört,
vom Mischer 160 aller anderen Teilnehmer zu entfernen,
was den störenden
Konferenzteilnehmer in den stumm geschalteten Zustand setzt. Parallel
kann die Steuereinheit 154 die Vermittlungsstelle 156 anweisen,
das Ausgangssignal der 2VR 154a als Eingangssignal in den
Mischer des störenden
Teilnehmers auszuwählen.
-
Bei
einem alternativen Ausführungsbeispiel (in
den Zeichnungen nicht gezeigt) kann das Ausgangssignal der 2VR-Einheit direkt zur
DACI geliefert werden, wobei der Codierer des störenden Konferenzteilnehmers
angewiesen wurde, das Signal der IVR von der DACI anstelle des Ausgangssignals
des entsprechenden Mischers zu erfassen.
-
Der
Mischer 160 mischt die ausgewählten Audiosignale, um die
gemischten Signale 161 zu bilden, und sendet die gemischten
Signale 161 über
die DACI 140. Einige Ausführungsbeispiele der Brücke 150 weisen
die Fähigkeit
auf, die Stimme eines Sprechers vom gemischten Signal zu beseitigen,
das auf den Endpunkt dieses Sprechers zielt. Die Steuereinheit 154 kann
das MCS 1170 mit der neuen Situation des störenden Konferenzteilnehmers
aktualisieren.
-
Das
MCS 1170 befiehlt auf der Basis des in der Datenbank gespeicherten
Verbindungszustandes einem oder mehreren Codecs 120, das
gemischte Ausgangssignal 128 von der DACI 140 zu
erfassen, um der Konferenz zuzuhören.
Nach dem Erfassen des gemischten Ausgangssignals 128 von
der DACI 140 codiert der Codierer 124 das decodierte
Signal von der entsprechenden Brücke 150 und
sendet das komprimierte Signal 117 über die CACI 110 zum entsprechenden
Teilnehmer.
-
Die
Codecs 120 und die Brücken 150 können durch
Digitalsignalprozessoren (DSPs), wie z.B., jedoch nicht begrenzt
auf den DSP von Texas Instruments, TMS320C31, implementiert werden.
Ein DSP kann mehr als eine Einheit (z.B. mehr als einen Codec und/oder
mehr als eine Brücke)
umfassen. Bei dem obigen Beispiel bearbeitet der Codec 120 das Audiosignal
eines einzelnen Teilnehmers und die Brücke 150 bearbeitet
eine Konferenz oder einen Teil einer Konferenz.
-
Nimmt
man nun auf 2A Bezug, die ein Blockdiagramm
eines beispielhaften Ausführungsbeispiels
darstellt, so ist der ND 2020 ein einstellbarer ND, der
ein Teil der Analyse- und
Verstärkungseinheit 152 in 1B sein
kann. Bei dem beispielhaften Ausführungsbeispiel ist jede ND-Einheit 2020 einem
einzelnen Konferenzteilnehmer zugeordnet. Der ND 2020 verwendet
einen Störungsalgorithmus
mit einer aktuellen Einrichtung und einem aktuellen Parametersatz.
Der ND 2020 sendet Angaben zur Steuereinheit 154 (1B).
Die Steuereinheit 154 erreicht auf der Basis dieser Angaben
und der existierenden Steuerinformation die Entscheidungen 2025. Gemäß diesen
Entscheidungen sendet die Steuereinheit 154 den Audiostrom
beeinflussende Steuerbefehle zum entsprechenden Konferenzteilnehmer. Die
Steuerbefehle können
zum Mischer 160 oder zur Vermittlungsstelle 156 (1B)
gesandt werden. Parallel kann eine IVR-Meldung 2040 zum
störenden Konferenzteilnehmer
gesandt werden, die eine Rückmeldung
anfordert. Beim Empfangen der Rückmeldung
vom Konferenzteilnehmer stimmt die Steuereinheit den ND durch Aktualisieren
seiner Parameter ab/stellt diesen ein.
-
2B ist
ein Ablaufplan, der ein beispielhaftes Verfahren 200 gemäß der vorliegenden
Erfindung zum Behandeln eines störenden
Konferenzteilnehmers durch die beispielhafte Steuereinheit 154 (1B)
darstellt. Beim Empfangen einer ND-Angabe von einer bestimmten A&E-Einheit 152 startet
bei Schritt 210 die Steuereinheit 154 die Störungsbehandlungsaufgabe.
Um die Störung
vom Rest der Teilnehmer zu beseitigen, setzt bei Schritt 215 die Steuereinheit 154 den
störenden
Teilnehmer zuerst in den stumm geschalteten Zustand. Die Steuereinheit 154 weist
die Vermittlungsstelle 156 an, die Audiosignale 155,
die zu diesem störenden
Konferenzteilnehmer gehören,
vom entsprechenden Mischer 160 abzuhalten.
-
Dann
weist bei Schritt 224 die Steuereinheit den IVR 154a an,
eine "Stummschalt"-Meldung zum störenden Konferenzteilnehmer
zu senden. Solange die IVR-Meldung aktiv ist, wird die Vermittlungsstelle 156 parallel
angewiesen, das Eingangssignal der IVR-Einheit 154a als
einziges Eingangssignal in einen Mischer 160 auszuwählen, der
dem störenden Konferenzteilnehmer
zugeordnet ist. Eine beispielhafte "Stummschalt"-Meldung kann sein "Nehmen Sie bitte zur Kenntnis, dass
Sie stumm geschaltet wurden. Bitte drücken Sie "1" beim
Zurückkehren
von 'Halten". Bitte drücken Sie "3", wenn Sie nicht auf Halten waren".
-
Weitere
beispielhafte Ausführungsbeispiele können andere
oder zusätzliche
Optionen bieten. Eine zusätzliche
Option, die hinzugefügt
werden kann, ist beispielsweise eine, wie z.B., jedoch nicht begrenzt
auf "Bitte drücken Sie "5", um den ND-Algorithmus zu deaktivieren", usw.
-
Am
Ende der Meldung kann die Steuereinheit bei Schritt 226 für einen
Zeitraum "T1" warten. Der Zeitraum "T1" kann im Bereich
von einigen hundert Millisekunden bis zu mehreren Sekunden liegen. Beispielhafte
Werte von "T1" können 800
Millisekunden, 2 Sekunden usw. sein. Am Ende des Wartezeitraums überprüft die Steuereinheit
bei Schritt 230, ob ein MFV-Signal durch die A&E-Einheit 152,
die dem störenden
Konferenzteilnehmer zugeordnet ist, identifiziert wurde. Wenn kein
MFV-Signal empfangen wurde, das widerspiegeln kann, dass der störende Konferenzteilnehmer
nicht der Konferenz zuhört, dann
kehrt die Steuereinheit zu Schritt 224 zurück und fährt mit
der Stummschaltentscheidung fort. Ein solcher Fall kann passieren,
wenn der störende
Konferenzteilnehmer den Konferenzanruf auf Halten gesetzt hat oder
abgetrennt wurde. In irgendeinem dieser Fälle wird dem störenden Konferenzteilnehmer oder
dem Rest der Teilnehmer kein Schaden zugefügt. Die Schleife mit den Schritten 224, 226 und 230 kann
fortfahren, bis ein MFV-Signal empfangen wird.
-
Wenn
kein MFV-Signal empfangen wird oder ein anderes MFV-Signal als "1" oder "3" oder "5" empfangen wurde, kann die Schleife
bis zum Ende der Konferenz fortfahren. Andere Ausführungsbeispiele
können
einen Zähler
hinzufügen,
der die Anzahl von Zyklen zählt,
und können
den störenden Konferenzteilnehmer
nach einer gewissen Anzahl von Zyklen abtrennen.
-
Falls
ein MFV-Signal empfangen wurde und als "1" identifiziert
wurde, was angibt, dass der störende
Konferenzteilnehmer zur Konferenz zurückgekehrt ist und die entsprechende
Taste gedrückt
hat, dann weist bei Schritt 234 die Steuereinheit 154 (1B)
die entsprechende Vermittlungsstelle 156 an, das Audiosignal 155 zu
aktivieren, das dem störenden
Konferenzteilnehmer zugeordnet ist, und die IVR-Einheit 154a vom
entsprechenden Mischer zu trennen. Dann wird die Aufgabe bei Schritt 236 beendet.
-
Falls
ein MFV-Signal empfangen wurde und als Zahl identifiziert wurde,
die angibt, dass der störende
Konferenzteilnehmer der Konferenz zuhört, kann die empfangene ND-Angabe
an einer verrauschten Verbindung oder einer verrauschten Umgebung
liegen. Beim aktuellen Beispiel ist die Zahl "3".
Dann wird bei Schritt 238 der Pegel der Schwelle des ND 2020 erhöht. Das
Erhöhen
der Schwelle verringert die Empfindlichkeit gegen Rauschen. Die
vorliegende Erfindung kann den anfänglichen Schwellenpegel auf
einen niedrigen Pegel setzen. Auf der Basis der Rückmeldung
von einem störenden
Konferenzteilnehmer stellen Ausführungsbeispiele
gemäß der vorliegenden
Erfindung die Einrichtung gemäß der aktuellen
Verbindung ein.
-
Verschiedene
Ausführungsbeispiele
der vorliegenden Erfindung können
verschiedene Verfahren zum Erhöhen
des Schwellenpegels verwenden. Ein beispielhaftes Verfahren kann
den Pegel um einen gewissen Prozentsatz vom aktuellen Pegel jedes
Mal erhöhen,
beispielsweise 10%, 30% und 50%. Andere Verfahren können jedes
Mal einen festen Wert verwenden; andere Verfahren können die
Werte gemäß dem Wert
eines Zählers
(Cnt.) ändern,
usw. Der Cnt. wird während
der Einleitung der Konferenz zurückgesetzt
und der Wert des Cnt. wird jedes Mal, wenn der Konferenzteilnehmer
als Störung
identifiziert wurde, bei Schritt 238 um Eins erhöht.
-
Bei
Schritt 240 wird eine Entscheidung getroffen, ob der störende Konferenzteilnehmer
stört. Wenn
der störende
Konferenzteilnehmer als Störkonferenzteilnehmer
definiert wird, wird der stumm geschaltete Zustand des Konferenzteilnehmers
für den Rest
der Konferenz beibehalten. Wenn nicht, kann der stumm geschaltete
Zustand aufgehoben werden. Ein beispielhaftes Ausführungsbeispiel
kann den neuen ND-Pegel mit einem vordefinierten maximalen Pegel
usw. Max bei Schritt 240 vergleichen. Der Max-Wert ist
ein Parameter, der während
der Einrichtung der Konferenz festgelegt werden kann, oder kann
ein Standardwert sein, über
dem das Rauschen stört
und es besser ist, den störenden
Konferenzteilnehmer dauerhaft stumm zu schalten. Andere Ausführungsbeispiele
können
eine Entscheidung auf der Basis des Werts des Cnt. treffen. wenn
der Wert über einer
bestimmten Anzahl von wechselseitigen Handlungen liegt, gibt er
an, dass die Verbindung eine störende
Verbindung ist, und der Konferenzteilnehmer kann als störender Konferenzteilnehmer
definiert werden.
-
Wenn
bei Schritt 240 die Verbindung keine störende Verbindung ist, beispielsweise
der ND-Pegel unterhalb Max liegt, dann wird der stumm geschaltete
Zustand bei Schritt 234 aufgehoben und die Aufgabe wird
bei Schritt 236 beendet. Die Aufgabe kann erneut gestartet
werden, wenn eine neue ND-Angabe empfangen wird. Dann startet die
Aufgabe bei Schritt 210, aber diesmal ist der Wert des
Cnt. von Null verschieden.
-
Wenn
die Verbindung bei Schritt 240 eine störende Verbindung ist, beispielsweise
der ND-Pegel oberhalb Max liegt, dann kann das beispielhafte Ausführungsbeispiel
der vorliegenden Erfindung den stumm geschalteten Zustand des störenden Konferenzteilnehmers
beibehalten und ermöglichen,
dass der störende
Konferenzteilnehmer nur der Konferenz zuhört. Bei Schritt 242 wird
das IVR-Modul 154a (1B) angewiesen,
eine "Störungs"-Meldung zu senden.
Ein Beispiel für
die "Störungs"-Meldung kann sein: "Bitte nehmen Sie
zur Kenntnis, dass Sie stumm geschaltet wurden. Falls Sie sprechen
wollen, wählen
Sie sich bitte wieder ein".
-
Andere
Ausführungsbeispiele
können
dem Konferenzteilnehmer die Option bieten, die aktuelle Verbindung
zu trennen und es erneut zu versuchen. Andere Ausführungsbeispiele
können
menschliche Unterstützung
anfordern, um zu entscheiden, wie mit dem störenden Konferenzteilnehmer
zu verfahren ist.
-
Falls
ein MFV-Signal empfangen wurde und als "5" identifiziert
wurde, gibt dies an, dass der störende
Konferenzteilnehmer angefordert hat, den ND 2020 zu deaktivieren.
Eine solche Anforderung kann durchgeführt werden, wenn die Beteiligung
dieses Konferenzteilnehmers bei dieser Konferenz entscheidend ist
und er gehört
werden muss, selbst wenn die Verbindung verrauscht ist. Dann deaktiviert
die Steuereinheit bei Schritt 232 den ND 2020 und
hebt den stumm geschalteten Zustand des störenden Konferenzteilnehmers
auf.
-
Alternative
Ausführungsbeispiele
der vorliegenden Erfindung können
andere als MFV-Rückmeldungsmittel
zum Antworten verwenden, wie z.B., jedoch nicht begrenzt auf: Spracherkennung,
Netzwerksteuersignale, wie z.B. ISDN-"D"-Kanal, Steuerpakete über 2P-Kommunikation
usw.
-
Die
vorliegende Erfindung kann mit mehr als einem störenden Konferenzteilnehmer
umgehen. Für jeden
störenden
Konferenzteilnehmer kann eine zweckgebundene Aufgabe eingeleitet
werden.
-
In
dieser Anmeldung werden die Worte "Einheit" und "Modul" austauschbar verwendet. Irgendetwas,
das als Einheit oder Modul bezeichnet wird, kann eine eigenständige Einheit
oder ein spezialisiertes Modul sein. Eine Einheit oder ein Modul
kann modular sein oder modulare Aspekte aufweisen, was ermöglicht,
dass es leicht entfernt oder gegen eine andere ähnliche Einheit oder ein anderes ähnliches
Modul ausgetauscht werden kann. Jede Einheit oder jedes Moduls kann
ein beliebiges von oder eine beliebige Kombination von Software,
Hardware und/oder Firmware sein.
-
Insgesamt
verbessern die Ausführungsbeispiele
gemäß dieser
Erfindung die Qualität
einer Konferenz durch automatisches Behandeln eines störenden Konferenzteilnehmers
mit einer Rückmeldung
vom störenden
Konferenzteilnehmer, die die automatische Entscheidung verbessert.
Der Prozess ist für
den Rest der Konferenzteilnehmer transparent.
-
In
der Beschreibung und den Ansprüchen der
vorliegenden Anmeldung wird jedes der Verben "umfassen", "einschließen" und "aufweisen" und Konjugierte
davon" verwendet,
um anzugeben, dass das Objekt oder die Objekte des Verbs nicht notwendigerweise
eine vollständige
Auflistung von Mitgliedern, Komponenten, Elementen oder Teilen des
Subjekts oder der Subjekte des Verbs sind.
-
Die
vorliegende Erfindung wurde unter Verwendung von detaillierten Beschreibungen
von Ausführungsbeispielen
derselben beschrieben, die als Beispiel vorgesehen sind und den
Schutzbereich der Erfindung nicht begrenzen sollen. Die beschriebenen Ausführungsbeispiele
umfassen verschiedene Merkmale, die nicht alle in allen Ausführungsbeispielen der Erfindung
erforderlich sind. Einige Ausführungsbeispiele
der vorliegenden Erfindung verwenden nur einige der Merkmale oder
mögliche
Kombinationen der Merkmale. Variationen von Ausführungsbeispielen der vorliegenden
Erfindung, die beschrieben sind, und Ausführungsbeispiele der vorliegenden
Erfindung mit verschiedenen Kombinationen von Merkmalen, die in
den beschriebenen Ausführungsbeispielen
angegeben sind, kommen Fachleuten in den Sinn. Der Schutzbereich
der Erfindung ist nur durch die folgenden Ansprüche begrenzt.