[go: up one dir, main page]

DE602004001637T2 - Verfahren und Gerät zur Verbesserung von störenden Signalen in einer Audio/Videokonferenz - Google Patents

Verfahren und Gerät zur Verbesserung von störenden Signalen in einer Audio/Videokonferenz Download PDF

Info

Publication number
DE602004001637T2
DE602004001637T2 DE602004001637T DE602004001637T DE602004001637T2 DE 602004001637 T2 DE602004001637 T2 DE 602004001637T2 DE 602004001637 T DE602004001637 T DE 602004001637T DE 602004001637 T DE602004001637 T DE 602004001637T DE 602004001637 T2 DE602004001637 T2 DE 602004001637T2
Authority
DE
Germany
Prior art keywords
conference
control unit
conference participant
disturbing
interfering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE602004001637T
Other languages
English (en)
Other versions
DE602004001637T8 (de
DE602004001637D1 (de
Inventor
Knaz Eran
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Polycom LLC
Original Assignee
Polycom LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Polycom LLC filed Critical Polycom LLC
Publication of DE602004001637D1 publication Critical patent/DE602004001637D1/de
Publication of DE602004001637T2 publication Critical patent/DE602004001637T2/de
Application granted granted Critical
Publication of DE602004001637T8 publication Critical patent/DE602004001637T8/de
Active legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/428Arrangements for placing incoming calls on hold
    • H04M3/4285Notifying, informing or entertaining a held party while on hold, e.g. Music On Hold
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/18Automatic or semi-automatic exchanges with means for reducing interference or noise; with means for reducing effects due to line faults with means for protecting lines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/567Multimedia conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/14Delay circuits; Timers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/20Aspects of automatic or semi-automatic exchanges related to features of supplementary services
    • H04M2203/2088Call or conference reconnect, e.g. resulting from isdn terminal portability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/50Aspects of automatic or semi-automatic exchanges related to audio conference
    • H04M2203/5027Dropping a party from a conference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/20Automatic or semi-automatic exchanges with means for interrupting existing connections; with means for breaking-in on conversations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2281Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/40Applications of speech amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/30Signalling arrangements; Manipulation of signalling currents
    • H04Q1/44Signalling arrangements; Manipulation of signalling currents using alternate current
    • H04Q1/444Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
    • H04Q1/45Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies using multi-frequency signalling

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Description

  • HINTERGRUND
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft das Gebiet von Mehrpunkt-Audio/Video-Konferenzen und insbesondere die Verbesserung der Qualität der Konferenz durch Verringern von Störsignalen.
  • 2. Beschreibung des Standes der Technik
  • Mehrpunkt-Konferenzen von Audio und/oder Video und/oder Multimedia sind eine Kommunikation zwischen mehr als zwei Teilnehmern. Üblicherweise können Konferenzanrufe über ein Kommunikationsnetzwerk, wie z.B. das öffentliche Fernsprechwählnetz ("PSTN"), das dienstintegrierende digitale Fernmeldenetz (ISDN), das Internetprotokoll-(IP) Netzwerk usw., aufgebaut werden. Das Netzwerk enthält Mehrpunkt-Steuereinheiten (MCU) und/oder Audiobrücken, die die Kommunikationen der Teilnehmer am Anruf leiten und bilden. Der Betrieb von MCUs und Audiobrücken ist Fachleuten gut bekannt. Eine beispielhafte Audiobrücke ist in der US-Patentanmeldung Nummer 10/072 081 oder in der US- Patentanmeldung Nummer 10/144 561 dargestellt. Es sollte beachtet werden, dass die Begriffe MCU und Audiobrücke hierin austauschbar verwendet werden können.
  • Eine übliche MCU kann Audiosignale von einer Vielzahl von Konferenzteilnehmern empfangen, die Signale analysieren und eine Steuerinformation, wie z.B., jedoch nicht begrenzt auf VAD-(Sprachaktivitätserfassung), Signalenergie- und Signalqualitätsmaße, erzeugen. Auf der Basis dieser Steuerinformation können Entscheidungen hinsichtlich dessen getroffen werden, wessen Signale gemischt und unter den anderen Konferenzteilnehmern verteilt werden oder wessen Signal aufgrund einer Schlussfolgerung, dass das Signal unter der annehmbaren Qualität liegt, stumm geschaltet wird. Ein unannehmbares Signal (UAS) ist ein objektives Kriterium und kann von der Art der Konferenz abhängen. Beispielhafte Kriterien können Nicht-Sprach-Signale sein, wie z.B. Musik, MFV, Hintergrundrauschen usw. Die Begriffe verrauschtes Signal, Störung und UAS können austauschbar verwendet werden und der Begriff Störung kann diese Begriffe darstellen.
  • Es sind Verfahren zum Erzeugen einer Information hinsichtlich der Signalenergie, VAD und Qualität bekannt. Beispielhafte Algorithmen zum Erzeugen dieser Information sind in G723.1 (im Anhang A für denselben Standard verwendet); G729.1 Anhang B; und GSM AMR (GSM 06.71) unter Verwendung des VAD-Algorithmus GSM 06.94 dargestellt. Ein einfacher Algorithmus für den Störungsdetektor (ND) kann eine Störung definieren, wenn die Signalenergie (SE) über einem bestimmten Pegel liegt, während die VAD angibt, dass das Signal nicht Sprache ist, ND=SE und (nicht VAD).
  • Die Qualität einer Konferenz hängt von den automatischen Entscheidungen dieser Verfahren ab. Ein empfindlicher ND-Algorithmus kann beispielsweise einen gültigen Teilnehmer abtrennen, während ein weniger empfindlicher Algorithmus Audio einer verrauschten Verbindung zum Konferenzgemisch hinzufügen kann. Das Konferenzgemisch ist das zusammengesetzte Audiosignal der ausgewählten Konferenzteilnehmer. Die Auswahl basiert auf den Konferenzeinrichtungsparametern und auf automatischen Entscheidungen auf der Basis der Analyse der Signale der aktuellen Sprecher. Es gibt Fälle, bei denen eine automatische Entscheidung häufig misslingen kann. In den Fällen, in denen ein Konferenzteilnehmer beispielsweise den Konferenzanruf auf Halten schaltet und einen weiteren Anruf annimmt, kann während der Halteperiode eine Nebenstellenanlage (PBX), über die der Konferenzteilnehmer verbunden ist, über die Verbindung mit der Konferenz einen "Beruhigungston" abspielen, was den Rest der Teilnehmer stört. Der "Beruhigungston" kann Musik, Rundfunk, Werbung oder andere Signale für einen Teilnehmer, der auf Halten wartet, sein. Im Allgemeinen kann der "Beruhigungston" dieselben Eigenschaften wie Sprache besitzen, und daher kann er die Kriterien von üblichen VAD- und/oder ND-Algorithmen erfüllen und kann zu den anderen Teilnehmern an der Konferenz übertragen werden. Andererseits kann ein empfindlicher ND, der nicht auf die Verbindungsqualität eines bestimmten Konferenzteilnehmers abgestimmt ist, einem gültigen Konferenzteilnehmer schaden/diesen abtrennen. Daher ist es schwierig, den ND-Algorithmus auf die Bedingungen von verschiedenen Konferenzteilnehmern im Voraus abzustimmen.
  • EP 0 982 920 A2 offenbart ein Verfahren, um zu verhindern, dass Beruhigungstonsignale, die von einem Anstoß erregenden Konferenzteilnehmer ausgehen, über eine Audiokonferenzbrücke zu den anderen Konferenzteilnehmern weitergeleitet werden. Dies wird erreicht, indem ein Misch-/Summieruntersystem der Audiokonferenzbrücke angewiesen wird, die Kombination von Audio, das vom Anstoß erregenden Konferenzteilnehmer ausgeht, vorübergehend davon abzuhalten, mit Audiokanälen kombiniert oder gemischt zu werden, über die die Konferenzteilnehmer an der Audiokonferenz teilnehmen. Sobald der Beruhigungston beendet ist, kann sich der Anstoß erregende Konferenzteilnehmer wieder dem Konferenzanruf anschließen, indem er ein Signal sendet, das das Misch-/Summieruntersystem anweist, die Kombination der Audiosignale, die vom Anstoß erregenden Konferenzteilnehmer ausgehen, mit den Audiokanälen der anderen Konferenzteilnehmer wieder aufzunehmen. Dieses Verfahren offenbart jedoch nicht, einen Störerfassungspegel zu erhöhen und dadurch dem angeblich störenden Konferenzteilnehmer die Chance zu geben, sich wieder der Konferenz anzuschließen.
  • Folglich ist es offensichtlich, dass derzeitige Technologien der automatischen Störungserfassung in einer Audio/Video-Konferenz die falschen Entscheidungen treffen können, die die Qualität der Konferenz verringern. Daher besteht auf dem Fachgebiet ein Bedarf für ein neues Störungserfassungsverfahren, das diese Mängel beseitigen kann.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Systeme gemäß der vorliegenden Erfindung lösen das vorstehend beschriebene Problem durch Vorsehen eines Pfades zu einem Konferenzteilnehmer, der durch eine automatische Entscheidung der MCU als Störquelle definiert wurde, um auf diese automatische Entscheidung zu antworten und den ND gemäß seinem Audiosignal zu korrigieren oder einzustellen/abzustimmen. Die Erfindung ist in dem unabhängigen Anspruch 1 bzw. 10 definiert. Spezielle Ausführungsbeispiele der Erfindung sind in den abhängigen Ansprüchen dargelegt.
  • In einer Telefonkonferenz, in der mindestens ein Konferenzteilnehmer mit der Konferenz über eine PBX verbunden sein kann, kann der Konferenzteilnehmer beispielsweise die Konferenz auf "HALTEN" schalten, was ein Störsignal über die Verbindung an die Konferenz anlegt. Dann kann der ND diese Verbindung als störende Verbindung identifizieren und diese Angabe zu einer beispielhaften Steuereinheit in der MCU senden. Die Steuereinheit kann nach dem Empfangen eines Hinweises, dass der Konferenzteilnehmerkanal eine Störung aufweist, das von diesem Konferenzteilnehmer stammende Signal stumm schalten. Dann kann die beispielhafte Steuereinheit eine Meldung einer interaktiven Sprachantwort (IVR) über das Audiosignal in Richtung des Konferenzteilnehmers legen. Eine beispielhafte Meldung kann den Konferenzteilnehmer informieren, dass er stumm geschaltet wurde, und den Konferenzteilnehmer auffordern, eine der Berührungstontasten, beispielsweise "1", zu drücken, wenn er gerade von "HALTEN" zurückkehrt, "3" zu drücken, wenn der Konferenzteilnehmer eine verrauschte Leitung/Umgebung verwendet, oder "5" zu drücken, um den ND-Algorithmus zu deaktivieren, usw.
  • Wenn keine Antwort empfangen wird, kann die Meldung für einen gewissen Zeitraum oder für den Rest der Konferenz andauern. Wenn eine dieser Tasten gedrückt wurde, kann das erfindungsgemäße System folgendermaßen handeln. Wenn die Taste "1" ist, hebt ein beispielhaftes Ausführungsbeispiel der vorliegenden Erfindung die Stummschaltsituation auf und ermöglicht, dass der Konferenzteilnehmer gehört wird. Wenn die Taste "3" ist, kann das beispielhafte Ausführungsbeispiel der vorliegenden Erfindung die Empfindlichkeit des ND-Algorithmus verringern. Dann ermöglicht die Steuereinheit, dass der Konferenzteilnehmer in der Konferenz gehört wird, während ein Datensatz dieser Einstellung beibehalten wird. Wenn der neue Pegel über dieser Toleranz liegt, kann die beispielhafte Steuereinheit den Konferenzteilnehmer unterrichten, dass er zu verrauscht ist, und lehnt es ab, das Audio des Konferenzteilnehmers zur Konferenz hinzuzufügen. Wenn die Taste "5" ist, kann das beispielhafte Ausführungsbeispiel der vorliegenden Erfindung den ND-Algorithmus deaktivieren und verbindet den störenden Konferenzteilnehmer ohne Bedingung.
  • Weitere beispielhafte Ausführungsbeispiele können unter Verwendung einer IVR-Meldung von einem anderen Konferenzteilnehmer, beispielsweise dem Vorsitzenden der Konferenz, anfordern, zu entscheiden, ob der verrauschte Konferenzteilnehmer stumm geschaltet werden soll oder nicht.
  • Weitere beispielhafte Ausführungsbeispiele können einen verrauschten Konferenzteilnehmer in eine Sprechaufforderungs-(PTT) Operation setzen, den verrauschten Konferenzteilnehmer unter Verwendung einer IVR-Meldung anweisen, vorübergehend irgendeine der Tasten jedes Mal, wenn er sprechen will, zu drücken und beim Beenden seinerseits wieder zu drücken.
  • Im Allgemeinen können erfindungsgemäße Systeme andere als MFV-Rückmeldungsmittel verwenden, um zu antworten, wie z.B., jedoch nicht begrenzt auf: Spracherkennung, Netzwerksteuersignale, wie z.B. ISDN-"D"-Kanal, Steuerpakete über IP-Kommunikation usw.
  • Folglich bieten erfindungsgemäße Systeme vorteilhafterweise einen verbesserten Algorithmus, der Störungen in Konferenzen durch Anfordern einer Rückmeldung von den störenden Konferenzteilnehmern behandelt. Die Rückmeldung vom verrauschten Konferenzteilnehmer kann die automatische Entscheidung korrigieren und daher die Qualität der Konferenz verbessern.
  • Weitere Merkmale und Vorteile der vorliegenden Erfindung werden beim Lesen der folgenden ausführlichen Beschreibung der Ausführungsbeispiele mit den zugehörigen Zeichnungen und beigefügten Ansprüchen ersichtlich.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • 1A ist ein Blockdiagramm, das eine beispielhafte Konferenzumgebung zeigt;
  • 1B ist ein Blockdiagramm eines Ausführungsbeispiels gemäß der Erfindung mit einer allgemeinen Beschreibung einer Audioeinheit in einer MCU;
  • 2A ist ein Blockdiagramm eines ND, der gemäß einem beispielhaften Ausführungsbeispiel der vorliegenden Erfindung arbeitet; und
  • 2B ist ein Ablaufdiagramm, das die Schritte eines beispielhaften Verfahrens zum Behandeln eines störenden Teilnehmers zeigt.
  • AUSFÜHRLICHE BESCHREIBUNG DES BEVORZUGTEN AUSFÜHRUNGSBEISPIELS
  • Unter Bezugnahme auf die Figuren, in denen gleiche Ziffern in den ganzen verschiedenen Ansichten gleiche Elemente darstellen, werden beispielhafte Ausführungsbeispiele der vorliegenden Erfindung beschrieben. Der Bequemlichkeit halber können nur einige Elemente derselben Gruppe mit Ziffern bezeichnet sein. Die Zeichnungen dienen der Beschreibung beispielhafter Ausführungsbeispiele, und nicht der Herstellung. Daher sind die in den Figuren gezeigten Merkmale nur der Zweckmäßigkeit und Deutlichkeit der Darstellung halber gewählt.
  • 1A ist ein beispielhaftes Blockdiagramm, das eine allgemeine Beschreibung einer Konferenzumgebung 100 darstellt. Die Konferenzumgebung kann Endpunkte 1110aa-nk, einen Operator 1115, Multimedia-Kommunikationen 1120aa-nk & 1122a-k, Netzwerke 1130a-k und eine Multimedia-Konferenzsteuereinheit (MCCU) 1140 aufweisen. Bei einem beispielhaften Ausführungsbeispiel kann die MCCU 1140 mindestens eine Netzwerkschnittstelle (NI) 1142, eine gemeinsame Schnittstelle für komprimiertes Audio (CACI) 110, eine Audioeinheit 1160, ein Verwaltungs- und Steuersystem (MCS) 1170, Steuersignale 1174, einen Hauptrechner 1200 und eine Videoeinheit 1300 umfassen. Weitere beispielhafte Ausführungsbeispiele können keinen Videoabschnitt aufweisen und können nur für Audiokonferenzen verwendet werden. Die MCCU 1140 kann mit einem störenden Konferenzteilnehmer unter Verwendung von erfindungsgemäßen Ausführungsbeispielen umgehen.
  • Die Vielzahl von Endpunkten 1110aa-nk sind über die Vielzahl von Netzwerken 1130a-k mit der MCCU 1140 verbunden. Die MCCU 1140 kann beispielsweise eine MCU oder eine Nur-Audio-Mehrpunkt-Steuereinheit (eine Audiobrücke) sein. Die MCCU 1140 und/oder einige oder alle ihrer Komponenten sind logische Einheiten, die durch Hardware und/oder Software implementiert werden können. Das MCS 1170 kann ein Steuermodul sein und kann eine logische Einheit sein, die den Betrieb der MCCU 1140 steuert.
  • Ein Endpunkt ist ein Endgerät in einem Netzwerk, das in der Lage ist, eine Ein-Weg- oder Zwei-Weg-Audio- und/oder visuelle Kommunikation mit anderen Endgeräten oder mit der MCCU 1440 bereitzustellen. Die zwischen den Endgeräten und/oder der MCCU 1440 übertragene Information kann Steuersignale, Indikatoren, eine Audioinformation, eine Videoinformation und Daten umfassen. Ein Endgerät kann eine beliebige Kombination von mehreren verschiedenen Arten von Eingangssignalen und/oder Ausgangssignalen, wie z.B. nur Sprache, Sprache und Daten, eine Kombination von Sprache und Video oder eine Kombination von Sprache, Daten und Video bereitstellen. Im Fall einer Audiokonferenz kann der Endpunkt ein übliches Telefon, ein Mobiltelefon usw. sein.
  • Die NI 1142 empfängt Multimedia-Kommunikationen 1122a-k über eine Vielzahl von Netzwerken 1130a-k und Multimedia-Kommunikationen 1120aa-nk von der Vielzahl der Endpunkte 1110aa-nk und verarbeitet die Medienkommunikation gemäß Kommunikationsstandards, die von jeder Art von Netzwerk verwendet werden, wie z.B., jedoch nicht begrenzt auf H.323, H.321, H.324, H.324M, SIP und/oder H.320 ISDN, PSTN usw.. Die NI 1142 liefert dann komprimiertes Audio, komprimiertes Video, komprimierte Daten und Steuerströme zu geeigneten logischen Modulen in der MCCU 1140. Einige Kommunikationsstandards erfordern, dass der Prozess der NI 1142 das Demultiplexieren der eingehenden Multimedia-Kommunikation in komprimiertes Audio, komprimiertes Video, komprimierte Daten und Steuerströme umfasst. In der entgegengesetzten Richtung empfängt die NI 1142 die separaten Ströme von den verschiedenen Einheiten (z.B. dem MCS 1170, der Audioeinheit 1160 und/oder der Videoeinheit 1300) und verarbeitet die Ströme gemäß dem geeigneten Kommunikationsstandard. Die NI 1142 überträgt dann die Ströme zum geeigneten Netzwerk 1130a-k.
  • Die Audioeinheit 1160 empfängt die komprimierten Audioströme der Vielzahl von Endpunkten 1110aa-nk über die NI 1142 und CACI 110, verarbeitet die Audioströme, mischt die relevanten Audioströme und sendet das komprimierte gemischte Signal über die gemeinsame Schnittstelle für komprimiertes Audio (CACI) 110 und die NI 1142 zu den Endpunkten 1110aa-nk. Die Audioeinheit 1160 kann eine logische Einheit sein und wird nachstehend in Verbindung mit 1B beschrieben.
  • Die Videoeinheit 1300 kann eine logische Einheit sein, die komprimierte Videoströme empfängt und sendet. Die Videoeinheit 1300 umfasst mindestens ein Videoeingabemodul, das einen Eingabeteil eines Videostroms 1302 von einem teilnehmenden Endpunkt bearbeitet, und mindestens ein Videoausgabemodul, das einen zusammengesetzten komprimierten Videoausgangsstrom erzeugt, der über die gemeinsame Schnittstelle für komprimiertes Video (CVCI) 1302 zur NI 1142 und von dort zu den festgelegten Endpunkten 1110aa-nk gesandt wird. Eine beispielhafte Operation einer solchen Videoeinheit ist im US-Patent Nummer US 6 300 973 beschrieben, das durch den Hinweis hierin aufgenommen wird. Die Videoeinheit ist für die Funktion der vorliegenden Erfindung nicht obligatorisch. Die vorliegende Erfindung kann von einer MCCU verwendet werden, die keine Videoeinheit aufweist, wie z.B. eine Audiobrücke.
  • Vorzugsweise kommuniziert der Hauptrechner 1200 mit dem Operator 1115 der MCCU 1140, wobei der Operator 1115 eine Operatorstation zum Kommunizieren mit dem Hauptrechner 1200 besitzen kann. Der Hauptrechner 1200 steuert die MCCU 1140 über das MCS 1170 gemäß Befehlen vom Operator 1115. Der Operator 1115 ist jedoch nicht obligatorisch. Die MCCU kann ohne Operator automatisch arbeiten.
  • 1B ist ein beispielhaftes Blockdiagramm eines Ausführungsbeispiels einer allgemeinen Audioeinheit 1160 unter Verwendung eines Ausführungsbeispiels der vorliegenden Erfindung. Das Ausführungsbeispiel von 1B umfasst eine gemeinsame Schnittstelle für komprimiertes Audio (CACI) 110, einen Steuerbus 135, ein MCS 1170 und eine Audioeinheit 1160 mit komprimierten Signalen 115 und 117, einem Codec 120, decodierten Informationen 126, einem gemischten Ausgangssignal 128, einer gemeinsamen Schnittstelle für decodiertes Audio (DACI) 140 und einer Brücke 150. Der Codec 120 umfasst einen Decodierer 122 und einen Codierer 124, während die Brücke 150 Analyse- und Verstärkungs- (A&E) Einheiten 152, Informationssignale 153, eine Steuereinheit 154, eine IVR-Einheit 154a, eine Vermittlungsstelle 156, Steuersignale 157, ausgewählte Signale 159, einen Mischer 160 und gemischte Signale 161 umfasst.
  • 1B beschreibt den Fluss von Audioströmen bei einem Beispiel der vorliegenden Erfindung. Komprimierte Audioströme von allen Endpunkten, die mit einer MCCU verbunden sind, werden über die gemeinsame Schnittstelle für komprimiertes Audio (CACI) 110 übertragen. Das MCS 1170 kann jedem der Endpunkte 1110aa-nk (1A) einen Codec 120 zuordnen.
  • Ferner überträgt die CACI 110 Signale zu und von den Endpunkten 1110aa-nk. Das komprimierte Signal 115 von einem der Endpunkte 1110aa-nk wird beispielsweise über die CACI 110 zum Decodierer 122 im Codec 120 geleitet, der vorher durch das MCS 1170 über den Steuerbus 135 diesem Endpunkt zugeordnet wurde. Der Decodierer 122 kann eine logische Einheit, Software oder Hardware oder eine Kombination von diesen sein und kann einen komprimierten Audiostrom auf der Basis der Kommunikationsstandards, wie z.B., jedoch nicht begrenzt auf G.711, G.723.1, G.728, G.729, MPEG decodieren oder unkomprimiertes Audio weiterleiten. Der Decodierer 122 decodiert dann den komprimierten Audiostrom, wie z.B. das komprimierte Signal 115, und sendet das decodierte Signal 126 über die gemeinsame Schnittstelle für decodiertes Audio (DACI) 140. Die DACI 140 stellt einen Bus dar, der Rundruffähigkeiten aufweisen kann. Die DACI 140 kann beispielsweise durch irgendeines von oder irgendeine Kombination von Zeitmultiplexverfahren (TDM), Asynchronübertragungsmodus (ATM), lokalem Netz (LAN), drahtloser Technologie oder gemeinsam genutztem Speicher implementiert werden. Eine geeignete Brücke 150 kann dann das decodierte Signal von der DACI 140 erfassen und kann das decodierte Signal analysieren, verstärken und/oder mischen und das Ausgangssignal 161 zur DACI 140 zurückführen.
  • Der Codierer 124 kann eine logische Einheit sein. Der Codierer 124 kann das Ausgangssignal 128 der geeigneten Brücke 150 komprimieren, wodurch ein komprimierter Audiostrom, wie z.B. das komprimierte Signal 117, auf der Basis des Kommunikationsstandards, wie z.B., jedoch nicht begrenzt auf G.711, G.723.1, G.728, G.729 und/oder Motion Picture Expert Group (MPEG), gebildet wird, der als decodiertes Audio zu einem Endpunkt übertragen wird, der decodiertes Audio empfängt.
  • Das MCS 1170 kann eine Datenbank verwenden, die die Verbindungsparameter (z.B. Codecs und Brücken usw.) und den Verbindungszustand (z.B. normal, stumm geschaltet usw.) jedes Endpunkts (Teilnehmers), der gerade mit der MCCU verbunden ist, in jeder Konferenz, die gerade von der MCCU verwaltet wird, hält. Der stumm geschaltete (M) Verbindungszustand kann bedeuten, dass der Teilnehmer in der Konferenz nicht gehört werden kann. Der normale (N) Verbindungszustand kann bedeuten, dass der Teilnehmer gehört werden kann und der Konferenz zuhören kann usw. Gemäß der Datenbank programmiert das MCS 1170 eine oder mehrere Brücken 150, um von der DACI 140 die decodierten Signale aller Teilnehmer zu erfassen, die zu einer Konferenz gehören, die diesen Brücken 150 zugeordnet ist.
  • Das decodierte Ausgangssignal 126 von irgendeinem Codec 120 kann durch mehr als eine Brücke 150 erfasst werden, was ermöglicht, dass die Teilnehmer mehr als einer Konferenz zugeordnet werden. Die decodierten Ströme von den Decodierern 122 an der DACI 140 können durch die Brücke 150 erfasst werden und dann durch die Analyse- und Verstärkungseinheit 152 analysiert und verstärkt werden. Die Analyse- und Verstärkungseinheit 152 kann eine logische Einheit sein und kann einen Satz von Algorithmen zum Analysieren eines Audiostroms eines Teilnehmers und/oder Verstärken seiner Qualität sein, wie z.B., jedoch nicht begrenzt auf International Telecommunications Union (ITU) G.165 (Echokompensation), Mehrfrequenz-(MFV) Erfassung, MFV-Unterdrückung und/oder Sprachaktivitätsdetektor (VAD), Signalenergie- und Störungsanalyse.
  • Die Brücke 150 kann eine oder mehrere Analyse- und Verstärkungseinheiten 152 aufweisen. Jede Analyse- und Verstärkungseinheit 152 wird einem einzelnen Teilnehmer zugeordnet und wird gemäß dem Verbindungszustand dieses Teilnehmers in der Konferenz programmiert. Die Steuereinheit 154 steuert eine Konferenz, die alle Signale von der Analyse- und Verstärkungseinheit 152 empfängt, und wählt die Teilnehmer aus, die über die Vermittlungsstelle 156 zum Mischer 160 geleitet werden. Die Steuereinheit 154 kann ein beispielhaftes Verfahren der vorliegenden Erfindung zur Bearbeitung unter Verwendung der Analysesignale 153, die von den Analyse- und Verstärkungseinheiten 152 stammen, und zum Steuern des 2VR-Moduls 154a und der Vermittlungsstelle 156 implementieren. Das beispielhafte Verfahren wird nachstehend in Verbindung mit 2A & 2B beschrieben. Eine einzelne Brücke 150 kann einer Konferenz, einer Gruppe von Konferenzteilnehmern oder einem einzelnen Konferenzteilnehmer dienen. In den letzten beiden Fällen kann mehr als eine Brücke 150 an der Konferenz beteiligt sein.
  • Der Mischer 160 empfängt die verstärkten Ströme von allen ausgewählten Teilnehmern und/oder das Signal von der IVR 154a und beliefert jeden Teilnehmer mit einem unkomprimierten gemischten Audiostrom der ausgewählten Teilnehmer und/oder der Signal-IVR 154a. Der Mischer 160 kann mehr als einen Strom 161 liefern, wobei jeder Strom eine andere Mischung aufweist.
  • Signale 153 von der Analyse- und Verstärkungseinheit 152 werden zur Steuereinheit 154 gesandt und die verstärkten decodierten Audiosignale 155 werden von den Analyse- und Verstärkungseinheiten 152 zur Vermittlungseinheit 156 gesandt. Die Vermittlungseinheit 156 ist ein Selektor, der die decodierten Ströme von allen Teilnehmern in einer Konferenz sowie der IVR-Einheit 154a empfängt und die ausgewählten Ströme zum Mischer 160 überträgt. Die Auswahl basiert auf den Entscheidungen der Steuereinheit 154. Die Entscheidungen der Steuereinheit 154 basieren auf empfangenen Befehlen vom MCS 1170, die den Verbindungszustand der Teilnehmer an der Konferenz definieren, die der Brücke 150 zugeordnet ist, und auf dem Informationssignal 153 von der Analyse- und Verstärkungseinheit 152. Die Steuereinheit 154 steuert über die Steuersignale 157 die Vermittlungsstelle 156 und den Mischer 160. In einem Fall, in dem beispielsweise der Verbindungszustand eines Teilnehmers normal (N) ist, kann die Analyse- und Verstärkungseinheit 152, die diesem Teilnehmer zugeordnet ist, angeben, dass das Sprachsignal bestimmte Kriterien erfüllt, wie z.B. durch VAD dargelegt (wie z.B. der Energiepegel, der über einem bestimmten Wert liegt). Dann wählt die Steuereinheit 154 über die Vermittlungsstelle 156 das Ausgangssignal 155 der Analyse- und Verstärkungseinheit 152, die dem Teilnehmer zugewiesen ist, als eines der Eingangssignale in den Mischer 160 aus.
  • Bei einem anderen Fall kann die Analyse- und Verstärkungseinheit 152, die einem Teilnehmer zugeordnet ist, der Steuereinheit 154 angeben, dass das Teilnehmersignal stört. Die Steuereinheit 154 kann ein beispielhaftes Ausführungsbeispiel der vorliegenden Erfindung einleiten, wie in 2A & 2B dargestellt. Sie kann die Vermittlungsstelle 156 anweisen, das Audiosignal 155, das zu diesem störenden Konferenzteilnehmer gehört, vom Mischer 160 aller anderen Teilnehmer zu entfernen, was den störenden Konferenzteilnehmer in den stumm geschalteten Zustand setzt. Parallel kann die Steuereinheit 154 die Vermittlungsstelle 156 anweisen, das Ausgangssignal der 2VR 154a als Eingangssignal in den Mischer des störenden Teilnehmers auszuwählen.
  • Bei einem alternativen Ausführungsbeispiel (in den Zeichnungen nicht gezeigt) kann das Ausgangssignal der 2VR-Einheit direkt zur DACI geliefert werden, wobei der Codierer des störenden Konferenzteilnehmers angewiesen wurde, das Signal der IVR von der DACI anstelle des Ausgangssignals des entsprechenden Mischers zu erfassen.
  • Der Mischer 160 mischt die ausgewählten Audiosignale, um die gemischten Signale 161 zu bilden, und sendet die gemischten Signale 161 über die DACI 140. Einige Ausführungsbeispiele der Brücke 150 weisen die Fähigkeit auf, die Stimme eines Sprechers vom gemischten Signal zu beseitigen, das auf den Endpunkt dieses Sprechers zielt. Die Steuereinheit 154 kann das MCS 1170 mit der neuen Situation des störenden Konferenzteilnehmers aktualisieren.
  • Das MCS 1170 befiehlt auf der Basis des in der Datenbank gespeicherten Verbindungszustandes einem oder mehreren Codecs 120, das gemischte Ausgangssignal 128 von der DACI 140 zu erfassen, um der Konferenz zuzuhören. Nach dem Erfassen des gemischten Ausgangssignals 128 von der DACI 140 codiert der Codierer 124 das decodierte Signal von der entsprechenden Brücke 150 und sendet das komprimierte Signal 117 über die CACI 110 zum entsprechenden Teilnehmer.
  • Die Codecs 120 und die Brücken 150 können durch Digitalsignalprozessoren (DSPs), wie z.B., jedoch nicht begrenzt auf den DSP von Texas Instruments, TMS320C31, implementiert werden. Ein DSP kann mehr als eine Einheit (z.B. mehr als einen Codec und/oder mehr als eine Brücke) umfassen. Bei dem obigen Beispiel bearbeitet der Codec 120 das Audiosignal eines einzelnen Teilnehmers und die Brücke 150 bearbeitet eine Konferenz oder einen Teil einer Konferenz.
  • Nimmt man nun auf 2A Bezug, die ein Blockdiagramm eines beispielhaften Ausführungsbeispiels darstellt, so ist der ND 2020 ein einstellbarer ND, der ein Teil der Analyse- und Verstärkungseinheit 152 in 1B sein kann. Bei dem beispielhaften Ausführungsbeispiel ist jede ND-Einheit 2020 einem einzelnen Konferenzteilnehmer zugeordnet. Der ND 2020 verwendet einen Störungsalgorithmus mit einer aktuellen Einrichtung und einem aktuellen Parametersatz. Der ND 2020 sendet Angaben zur Steuereinheit 154 (1B). Die Steuereinheit 154 erreicht auf der Basis dieser Angaben und der existierenden Steuerinformation die Entscheidungen 2025. Gemäß diesen Entscheidungen sendet die Steuereinheit 154 den Audiostrom beeinflussende Steuerbefehle zum entsprechenden Konferenzteilnehmer. Die Steuerbefehle können zum Mischer 160 oder zur Vermittlungsstelle 156 (1B) gesandt werden. Parallel kann eine IVR-Meldung 2040 zum störenden Konferenzteilnehmer gesandt werden, die eine Rückmeldung anfordert. Beim Empfangen der Rückmeldung vom Konferenzteilnehmer stimmt die Steuereinheit den ND durch Aktualisieren seiner Parameter ab/stellt diesen ein.
  • 2B ist ein Ablaufplan, der ein beispielhaftes Verfahren 200 gemäß der vorliegenden Erfindung zum Behandeln eines störenden Konferenzteilnehmers durch die beispielhafte Steuereinheit 154 (1B) darstellt. Beim Empfangen einer ND-Angabe von einer bestimmten A&E-Einheit 152 startet bei Schritt 210 die Steuereinheit 154 die Störungsbehandlungsaufgabe. Um die Störung vom Rest der Teilnehmer zu beseitigen, setzt bei Schritt 215 die Steuereinheit 154 den störenden Teilnehmer zuerst in den stumm geschalteten Zustand. Die Steuereinheit 154 weist die Vermittlungsstelle 156 an, die Audiosignale 155, die zu diesem störenden Konferenzteilnehmer gehören, vom entsprechenden Mischer 160 abzuhalten.
  • Dann weist bei Schritt 224 die Steuereinheit den IVR 154a an, eine "Stummschalt"-Meldung zum störenden Konferenzteilnehmer zu senden. Solange die IVR-Meldung aktiv ist, wird die Vermittlungsstelle 156 parallel angewiesen, das Eingangssignal der IVR-Einheit 154a als einziges Eingangssignal in einen Mischer 160 auszuwählen, der dem störenden Konferenzteilnehmer zugeordnet ist. Eine beispielhafte "Stummschalt"-Meldung kann sein "Nehmen Sie bitte zur Kenntnis, dass Sie stumm geschaltet wurden. Bitte drücken Sie "1" beim Zurückkehren von 'Halten". Bitte drücken Sie "3", wenn Sie nicht auf Halten waren".
  • Weitere beispielhafte Ausführungsbeispiele können andere oder zusätzliche Optionen bieten. Eine zusätzliche Option, die hinzugefügt werden kann, ist beispielsweise eine, wie z.B., jedoch nicht begrenzt auf "Bitte drücken Sie "5", um den ND-Algorithmus zu deaktivieren", usw.
  • Am Ende der Meldung kann die Steuereinheit bei Schritt 226 für einen Zeitraum "T1" warten. Der Zeitraum "T1" kann im Bereich von einigen hundert Millisekunden bis zu mehreren Sekunden liegen. Beispielhafte Werte von "T1" können 800 Millisekunden, 2 Sekunden usw. sein. Am Ende des Wartezeitraums überprüft die Steuereinheit bei Schritt 230, ob ein MFV-Signal durch die A&E-Einheit 152, die dem störenden Konferenzteilnehmer zugeordnet ist, identifiziert wurde. Wenn kein MFV-Signal empfangen wurde, das widerspiegeln kann, dass der störende Konferenzteilnehmer nicht der Konferenz zuhört, dann kehrt die Steuereinheit zu Schritt 224 zurück und fährt mit der Stummschaltentscheidung fort. Ein solcher Fall kann passieren, wenn der störende Konferenzteilnehmer den Konferenzanruf auf Halten gesetzt hat oder abgetrennt wurde. In irgendeinem dieser Fälle wird dem störenden Konferenzteilnehmer oder dem Rest der Teilnehmer kein Schaden zugefügt. Die Schleife mit den Schritten 224, 226 und 230 kann fortfahren, bis ein MFV-Signal empfangen wird.
  • Wenn kein MFV-Signal empfangen wird oder ein anderes MFV-Signal als "1" oder "3" oder "5" empfangen wurde, kann die Schleife bis zum Ende der Konferenz fortfahren. Andere Ausführungsbeispiele können einen Zähler hinzufügen, der die Anzahl von Zyklen zählt, und können den störenden Konferenzteilnehmer nach einer gewissen Anzahl von Zyklen abtrennen.
  • Falls ein MFV-Signal empfangen wurde und als "1" identifiziert wurde, was angibt, dass der störende Konferenzteilnehmer zur Konferenz zurückgekehrt ist und die entsprechende Taste gedrückt hat, dann weist bei Schritt 234 die Steuereinheit 154 (1B) die entsprechende Vermittlungsstelle 156 an, das Audiosignal 155 zu aktivieren, das dem störenden Konferenzteilnehmer zugeordnet ist, und die IVR-Einheit 154a vom entsprechenden Mischer zu trennen. Dann wird die Aufgabe bei Schritt 236 beendet.
  • Falls ein MFV-Signal empfangen wurde und als Zahl identifiziert wurde, die angibt, dass der störende Konferenzteilnehmer der Konferenz zuhört, kann die empfangene ND-Angabe an einer verrauschten Verbindung oder einer verrauschten Umgebung liegen. Beim aktuellen Beispiel ist die Zahl "3". Dann wird bei Schritt 238 der Pegel der Schwelle des ND 2020 erhöht. Das Erhöhen der Schwelle verringert die Empfindlichkeit gegen Rauschen. Die vorliegende Erfindung kann den anfänglichen Schwellenpegel auf einen niedrigen Pegel setzen. Auf der Basis der Rückmeldung von einem störenden Konferenzteilnehmer stellen Ausführungsbeispiele gemäß der vorliegenden Erfindung die Einrichtung gemäß der aktuellen Verbindung ein.
  • Verschiedene Ausführungsbeispiele der vorliegenden Erfindung können verschiedene Verfahren zum Erhöhen des Schwellenpegels verwenden. Ein beispielhaftes Verfahren kann den Pegel um einen gewissen Prozentsatz vom aktuellen Pegel jedes Mal erhöhen, beispielsweise 10%, 30% und 50%. Andere Verfahren können jedes Mal einen festen Wert verwenden; andere Verfahren können die Werte gemäß dem Wert eines Zählers (Cnt.) ändern, usw. Der Cnt. wird während der Einleitung der Konferenz zurückgesetzt und der Wert des Cnt. wird jedes Mal, wenn der Konferenzteilnehmer als Störung identifiziert wurde, bei Schritt 238 um Eins erhöht.
  • Bei Schritt 240 wird eine Entscheidung getroffen, ob der störende Konferenzteilnehmer stört. Wenn der störende Konferenzteilnehmer als Störkonferenzteilnehmer definiert wird, wird der stumm geschaltete Zustand des Konferenzteilnehmers für den Rest der Konferenz beibehalten. Wenn nicht, kann der stumm geschaltete Zustand aufgehoben werden. Ein beispielhaftes Ausführungsbeispiel kann den neuen ND-Pegel mit einem vordefinierten maximalen Pegel usw. Max bei Schritt 240 vergleichen. Der Max-Wert ist ein Parameter, der während der Einrichtung der Konferenz festgelegt werden kann, oder kann ein Standardwert sein, über dem das Rauschen stört und es besser ist, den störenden Konferenzteilnehmer dauerhaft stumm zu schalten. Andere Ausführungsbeispiele können eine Entscheidung auf der Basis des Werts des Cnt. treffen. wenn der Wert über einer bestimmten Anzahl von wechselseitigen Handlungen liegt, gibt er an, dass die Verbindung eine störende Verbindung ist, und der Konferenzteilnehmer kann als störender Konferenzteilnehmer definiert werden.
  • Wenn bei Schritt 240 die Verbindung keine störende Verbindung ist, beispielsweise der ND-Pegel unterhalb Max liegt, dann wird der stumm geschaltete Zustand bei Schritt 234 aufgehoben und die Aufgabe wird bei Schritt 236 beendet. Die Aufgabe kann erneut gestartet werden, wenn eine neue ND-Angabe empfangen wird. Dann startet die Aufgabe bei Schritt 210, aber diesmal ist der Wert des Cnt. von Null verschieden.
  • Wenn die Verbindung bei Schritt 240 eine störende Verbindung ist, beispielsweise der ND-Pegel oberhalb Max liegt, dann kann das beispielhafte Ausführungsbeispiel der vorliegenden Erfindung den stumm geschalteten Zustand des störenden Konferenzteilnehmers beibehalten und ermöglichen, dass der störende Konferenzteilnehmer nur der Konferenz zuhört. Bei Schritt 242 wird das IVR-Modul 154a (1B) angewiesen, eine "Störungs"-Meldung zu senden. Ein Beispiel für die "Störungs"-Meldung kann sein: "Bitte nehmen Sie zur Kenntnis, dass Sie stumm geschaltet wurden. Falls Sie sprechen wollen, wählen Sie sich bitte wieder ein".
  • Andere Ausführungsbeispiele können dem Konferenzteilnehmer die Option bieten, die aktuelle Verbindung zu trennen und es erneut zu versuchen. Andere Ausführungsbeispiele können menschliche Unterstützung anfordern, um zu entscheiden, wie mit dem störenden Konferenzteilnehmer zu verfahren ist.
  • Falls ein MFV-Signal empfangen wurde und als "5" identifiziert wurde, gibt dies an, dass der störende Konferenzteilnehmer angefordert hat, den ND 2020 zu deaktivieren. Eine solche Anforderung kann durchgeführt werden, wenn die Beteiligung dieses Konferenzteilnehmers bei dieser Konferenz entscheidend ist und er gehört werden muss, selbst wenn die Verbindung verrauscht ist. Dann deaktiviert die Steuereinheit bei Schritt 232 den ND 2020 und hebt den stumm geschalteten Zustand des störenden Konferenzteilnehmers auf.
  • Alternative Ausführungsbeispiele der vorliegenden Erfindung können andere als MFV-Rückmeldungsmittel zum Antworten verwenden, wie z.B., jedoch nicht begrenzt auf: Spracherkennung, Netzwerksteuersignale, wie z.B. ISDN-"D"-Kanal, Steuerpakete über 2P-Kommunikation usw.
  • Die vorliegende Erfindung kann mit mehr als einem störenden Konferenzteilnehmer umgehen. Für jeden störenden Konferenzteilnehmer kann eine zweckgebundene Aufgabe eingeleitet werden.
  • In dieser Anmeldung werden die Worte "Einheit" und "Modul" austauschbar verwendet. Irgendetwas, das als Einheit oder Modul bezeichnet wird, kann eine eigenständige Einheit oder ein spezialisiertes Modul sein. Eine Einheit oder ein Modul kann modular sein oder modulare Aspekte aufweisen, was ermöglicht, dass es leicht entfernt oder gegen eine andere ähnliche Einheit oder ein anderes ähnliches Modul ausgetauscht werden kann. Jede Einheit oder jedes Moduls kann ein beliebiges von oder eine beliebige Kombination von Software, Hardware und/oder Firmware sein.
  • Insgesamt verbessern die Ausführungsbeispiele gemäß dieser Erfindung die Qualität einer Konferenz durch automatisches Behandeln eines störenden Konferenzteilnehmers mit einer Rückmeldung vom störenden Konferenzteilnehmer, die die automatische Entscheidung verbessert. Der Prozess ist für den Rest der Konferenzteilnehmer transparent.
  • In der Beschreibung und den Ansprüchen der vorliegenden Anmeldung wird jedes der Verben "umfassen", "einschließen" und "aufweisen" und Konjugierte davon" verwendet, um anzugeben, dass das Objekt oder die Objekte des Verbs nicht notwendigerweise eine vollständige Auflistung von Mitgliedern, Komponenten, Elementen oder Teilen des Subjekts oder der Subjekte des Verbs sind.
  • Die vorliegende Erfindung wurde unter Verwendung von detaillierten Beschreibungen von Ausführungsbeispielen derselben beschrieben, die als Beispiel vorgesehen sind und den Schutzbereich der Erfindung nicht begrenzen sollen. Die beschriebenen Ausführungsbeispiele umfassen verschiedene Merkmale, die nicht alle in allen Ausführungsbeispielen der Erfindung erforderlich sind. Einige Ausführungsbeispiele der vorliegenden Erfindung verwenden nur einige der Merkmale oder mögliche Kombinationen der Merkmale. Variationen von Ausführungsbeispielen der vorliegenden Erfindung, die beschrieben sind, und Ausführungsbeispiele der vorliegenden Erfindung mit verschiedenen Kombinationen von Merkmalen, die in den beschriebenen Ausführungsbeispielen angegeben sind, kommen Fachleuten in den Sinn. Der Schutzbereich der Erfindung ist nur durch die folgenden Ansprüche begrenzt.

Claims (18)

  1. Verfahren zum Verbessern der Qualität einer Konferenz zwischen einer Vielzahl von Konferenzteilnehmern, aufweisend: Identifizieren (2025) eines Konferenzteilnehmers als störenden Konferenzteilnehmer, wenn ein Störpegel eines Audiostroms (2010) dieses Konferenzteilnehmers eine Störerfassungsschwelle überschreitet; Stummschalten (215) des störenden Konferenzteilnehmers von der Konferenz; Anfordern (230) einer Rückmeldung vom störenden Konferenzteilnehmer; und dadurch gekennzeichnet, dass als Reaktion auf eine solche Rückmeldung die Störerfassungsschwelle für den störenden Konferenzteilnehmer erhöht wird (238).
  2. Verfahren nach Anspruch 1, welches ferner das Lautschalten (234) des störenden Konferenzteilnehmers aufweist, wenn der Störpegel des Audiostroms (2010) geringer ist als die geänderte Störerfassungsschwelle.
  3. Verfahren nach Anspruch 1 oder 2, welches ferner das Fortsetzen (242) der Stummschaltung des störenden Konferenzteilnehmers aufweist, wenn der Störpegel des Audiostroms (2010) einen maximalen Pegel überschreitet.
  4. Verfahren nach Anspruch 1, 2 oder 3, wobei das Anfordern (230) einer Rückmeldung vom störenden Konferenzteilnehmer das Senden einer Meldung (224) zum störenden Konferenzteilnehmer aufweist.
  5. Verfahren nach einem der vorangehenden Ansprüche, wobei die Rückmeldung eine Meldung, insbesondere eine Sprachmeldung, vom störenden Konferenzteilnehmer aufweist.
  6. Verfahren nach einem der vorangehenden Ansprüche, wobei die Rückmeldung einen Tastendruck an einem Endgerät des störenden Konferenzteilnehmers aufweist.
  7. Verfahren nach Anspruch 6, wobei die Taste einen MFV-Ton erzeugt.
  8. Verfahren nach Anspruch 6, wobei die Taste mindestens ein Netzwerksteuersignal erzeugt, das aus einer Gruppe ausgewählt ist, die aus einem ISDN-"D"-Kanalsignal und einem Steuerpaket über IP-Kommunikation besteht.
  9. Verfahren nach einem der vorangehenden Ansprüche, wobei das Ändern der Störerfassungsschwelle für den störenden Konferenzteilnehmer das Erhöhen einer Störerfassungsschwelle aufweist, die nur den störenden Konferenzteilnehmer betrifft.
  10. Mehrpunkt-Steuereinheit (1160) zum Steuern einer Konferenz zwischen einer Vielzahl von Konferenzteilnehmern, aufweisend: eine Analyseeinheit (152), die dazu ausgelegt ist, Audiosignale (2010) von den Konferenzteilnehmern zu beurteilen, um einen Konferenzteilnehmer als störenden Konferenzteilnehmer zu identifizieren (2025), wenn ein Störpegel der Audiosignale (2010) dieses Konferenzteilnehmers eine Störerfassungsschwelle überschreitet, und dazu ausgelegt ist, die Information (2035) hinsichtlich desselben zu einer Steuereinheit (154) der Mehrpunkt-Steuereinheit (1160) zu senden; wobei die Steuereinheit (154) dazu ausgelegt ist, einen Mischer (160) zu steuern, um die Audiosignale (2010) für diejenigen Konferenzteilnehmer zu mischen, die nicht als störende Konferenzteilnehmer identifiziert werden, und um den identifizierten störenden Konferenzteilnehmer stumm zu schalten; und eine Antworteinheit (154a), die dazu ausgelegt ist, eine Rückmeldung vom identifizierten störenden Konferenzteilnehmer anzufordern, dadurch gekennzeichnet, dass die Steuereinheit dazu ausgelegt ist, die Störerfassungsschwelle für den störenden Konferenzteilnehmer zu ändern.
  11. Mehrpunkt-Steuereinheit nach Anspruch 10, wobei die Steuereinheit (154) dazu ausgelegt ist, den Mischer (160) zu steuern, um den störenden Konferenzteilnehmer laut zu schalten (234), wenn der Störpegel der Audiosignale (2010) geringer ist als die geänderte Störerfassungsschwelle.
  12. Mehrpunkt-Steuereinheit nach Anspruch 10 oder 11, wobei die Steuereinheit (154) dazu ausgelegt ist, den störenden Konferenzteilnehmer weiterhin stumm zu schalten (242), wenn der Störpegel der Audiosignale (2010) einen maximalen Pegel überschreitet.
  13. Mehrpunkt-Steuereinheit nach Anspruch 10, 11 oder 12, wobei das Anfordern (224) einer Rückmeldung vom störenden Konferenzteilnehmer das Senden einer Meldung zum störenden Konferenzteilnehmer aufweist.
  14. Mehrpunkt-Steuereinheit nach einem der vorangehenden Ansprüche, wobei die Rückmeldung eine Meldung, insbesondere eine Sprachmeldung, vom störenden Konferenzteilnehmer aufweist.
  15. Mehrpunkt-Steuereinheit nach einem der vorangehenden Ansprüche, wobei die Rückmeldung einen Tastendruck an einem Endgerät des störenden Konferenzteilnehmers aufweist.
  16. Mehrpunkt-Steuereinheit nach Anspruch 15, wobei die Taste einen MFV-Ton erzeugt.
  17. Mehrpunkt-Steuereinheit nach Anspruch 15, wobei die Taste mindestens ein Netzwerksteuersignal erzeugt, das aus einer Gruppe ausgewählt ist, die aus einem ISDN-"D"-Kanalsignal und einem Steuerpaket über IP-Kommunikation besteht.
  18. Mehrpunkt-Steuereinheit nach einem der vorangehenden Ansprüche, wobei die Steuereinheit (154) dazu ausgelegt ist, die Störerfassungsschwelle, die nur den störenden Konferenzteilnehmer betrifft, zu ändern (238).
DE602004001637T 2003-08-06 2004-05-14 Verfahren und Vorrichtung zur Verbesserung von störenden Signalen in einer Audio/Videokonferenz Active DE602004001637T8 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/636,909 US7269252B2 (en) 2003-08-06 2003-08-06 Method and apparatus for improving nuisance signals in audio/video conference
US636909 2003-08-06

Publications (3)

Publication Number Publication Date
DE602004001637D1 DE602004001637D1 (de) 2006-09-07
DE602004001637T2 true DE602004001637T2 (de) 2007-07-26
DE602004001637T8 DE602004001637T8 (de) 2007-10-31

Family

ID=33552965

Family Applications (2)

Application Number Title Priority Date Filing Date
DE602004001637T Active DE602004001637T8 (de) 2003-08-06 2004-05-14 Verfahren und Vorrichtung zur Verbesserung von störenden Signalen in einer Audio/Videokonferenz
DE602004032506T Expired - Lifetime DE602004032506D1 (de) 2003-08-06 2004-05-14 Verfahren und Gerät zur Verbesserung von störenden Signalen in einer Audio/Videokonferenz

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE602004032506T Expired - Lifetime DE602004032506D1 (de) 2003-08-06 2004-05-14 Verfahren und Gerät zur Verbesserung von störenden Signalen in einer Audio/Videokonferenz

Country Status (4)

Country Link
US (1) US7269252B2 (de)
EP (2) EP1549035B1 (de)
AT (1) ATE508578T1 (de)
DE (2) DE602004001637T8 (de)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7359979B2 (en) 2002-09-30 2008-04-15 Avaya Technology Corp. Packet prioritization and associated bandwidth and buffer management techniques for audio over IP
US20040073690A1 (en) 2002-09-30 2004-04-15 Neil Hepworth Voice over IP endpoint call admission
US7474634B1 (en) 2004-03-12 2009-01-06 West Corporation System, methods, and computer-readable media for expedited access to conference calls
JP2005269347A (ja) * 2004-03-19 2005-09-29 Nec Personal Products Co Ltd Ipネットワークを用いた多地点会議システムとその構成方法
US7978827B1 (en) 2004-06-30 2011-07-12 Avaya Inc. Automatic configuration of call handling based on end-user needs and characteristics
US20060023061A1 (en) * 2004-07-27 2006-02-02 Vaszary Mark K Teleconference audio quality monitoring
US7612793B2 (en) * 2005-09-07 2009-11-03 Polycom, Inc. Spatially correlated audio in multipoint videoconferencing
US20070081647A1 (en) * 2005-09-29 2007-04-12 Agere Systems Inc. Conference bridge alert method and system
KR100666995B1 (ko) * 2006-01-16 2007-01-10 삼성전자주식회사 멀티미디어 컨퍼런스 서비스에서의 선택적 미디어 데이터제공 방법 및 그 시스템
US8150450B1 (en) * 2006-04-11 2012-04-03 Alcatel Lucent System and method for two-way radio and telephone conferencing and collaboration
EP1848241A3 (de) * 2006-04-17 2008-05-21 Roamware, Inc. Verfahren und System zum Bereitstellen von Mehrwertdiensten ohne Verwendung eines Präfixes mittels eines In-Band-Ansatzes
US20100020955A1 (en) * 2006-09-20 2010-01-28 Alcatel Lucent Systems and methods for implementing generalized conferencing
US7957512B2 (en) 2006-10-27 2011-06-07 Nortel Networks Limited Source selection for conference bridges
US7945442B2 (en) * 2006-12-15 2011-05-17 Fortemedia, Inc. Internet communication device and method for controlling noise thereof
US8750484B2 (en) * 2007-03-19 2014-06-10 Avaya Inc. User-programmable call progress tone detection
US20090097625A1 (en) * 2007-10-15 2009-04-16 Peters Mark E Method of and System for Controlling Conference Calls
US20090238263A1 (en) * 2008-03-20 2009-09-24 Pawan Jaggi Flexible field based energy efficient multimedia processor architecture and method
US20090316870A1 (en) * 2008-06-19 2009-12-24 Motorola, Inc. Devices and Methods for Performing N-Way Mute for N-Way Voice Over Internet Protocol (VOIP) Calls
US8184790B2 (en) 2008-09-09 2012-05-22 Avaya Inc. Notification of dropped audio in a teleconference call
US8218751B2 (en) * 2008-09-29 2012-07-10 Avaya Inc. Method and apparatus for identifying and eliminating the source of background noise in multi-party teleconferences
US8488745B2 (en) * 2009-06-17 2013-07-16 Microsoft Corporation Endpoint echo detection
CN101605187A (zh) * 2009-07-10 2009-12-16 北京中星微电子有限公司 会议服务器、用户终端和语音会议中控制语音质量的方法
CN103703719B (zh) * 2011-05-31 2018-06-05 谷歌有限责任公司 使通信会话中的参与者静音的方法及设备
US9443518B1 (en) 2011-08-31 2016-09-13 Google Inc. Text transcript generation from a communication session
EP2828854B1 (de) 2012-03-23 2016-03-16 Dolby Laboratories Licensing Corporation Aktive hierarchische spracherkennung
GB2504934B (en) 2012-08-13 2016-02-24 Sandeep Kumar Chintala Automatic call muting method and apparatus using sound localization
US8612211B1 (en) 2012-09-10 2013-12-17 Google Inc. Speech recognition and summarization
US20140348034A1 (en) * 2013-05-23 2014-11-27 Motorola Solutions, Inc. Systems and methods for group communication in noisy environments
CN105357467A (zh) * 2014-08-22 2016-02-24 中兴通讯股份有限公司 音频视频会议中的远程互动方法、装置及系统
US9800220B2 (en) 2014-09-24 2017-10-24 Intel Corporation Audio system with noise interference mitigation
CN105991851A (zh) 2015-02-17 2016-10-05 杜比实验室特许公司 处理电话会议系统中的烦扰
US9467569B2 (en) 2015-03-05 2016-10-11 Raytheon Company Methods and apparatus for reducing audio conference noise using voice quality measures
US9697198B2 (en) * 2015-10-05 2017-07-04 International Business Machines Corporation Guiding a conversation based on cognitive analytics
EP4005230A1 (de) 2019-07-25 2022-06-01 Unify Patente GmbH & Co. KG Verfahren und system zur vermeidung von heulstörungen bei konferenzen
CN113223546A (zh) * 2020-12-28 2021-08-06 南京愔宜智能科技有限公司 一种音视频会议系统及用于该音视频会议系统的回音抵消装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3370423D1 (en) * 1983-06-07 1987-04-23 Ibm Process for activity detection in a voice transmission system
US5548638A (en) * 1992-12-21 1996-08-20 Iwatsu Electric Co., Ltd. Audio teleconferencing apparatus
US6353662B1 (en) * 1997-10-17 2002-03-05 At&T Corp. Method and apparatus for eliminating nuisance signals in multi-party calls
US6556670B1 (en) * 1998-08-21 2003-04-29 Lucent Technologies Inc. Method for solving the music-on-hold problem in an audio conference
US6349136B1 (en) * 1999-07-23 2002-02-19 Lucent Technologies Inc. System and method for controlling a conference call
US6870807B1 (en) * 2000-05-15 2005-03-22 Avaya Technology Corp. Method and apparatus for suppressing music on hold
US7031448B2 (en) * 2002-01-09 2006-04-18 Avaya Technology Corp. Selectable muting on conference calls
DE10238286B4 (de) * 2002-08-21 2004-11-11 Siemens Ag Verfahren und Vorrichtung zum Bereitstellen von Konferenzen

Also Published As

Publication number Publication date
ATE508578T1 (de) 2011-05-15
US20050069114A1 (en) 2005-03-31
HK1075774A1 (en) 2005-12-23
EP1505815B1 (de) 2006-07-26
DE602004032506D1 (de) 2011-06-16
DE602004001637T8 (de) 2007-10-31
EP1549035B1 (de) 2011-05-04
EP1505815A1 (de) 2005-02-09
US7269252B2 (en) 2007-09-11
HK1072334A1 (en) 2005-08-19
DE602004001637D1 (de) 2006-09-07
EP1549035A1 (de) 2005-06-29

Similar Documents

Publication Publication Date Title
DE602004001637T2 (de) Verfahren und Gerät zur Verbesserung von störenden Signalen in einer Audio/Videokonferenz
DE102008062981B4 (de) Verfahren und Gerät zur Identifizierung und Beseitigung der Quelle von Störgeräuschen in Telefonkonferenzen mit mehreren Teilnehmern
RU2293368C2 (ru) Способ (варианты) и система (варианты) для управления конференциями и блок управления для многоточечной мультимедийной/речевой системы
DE60209637T2 (de) Steuerung eines Konferenzgespräches
DE60214391T2 (de) Erkennung von Ereignissen bei der Kommunikation mit mehreren Sprachkanälen
DE60038516T2 (de) Verfahren und System zum Bandbreitenreduktion von Multimedien-Konferenzen
DE69624250T2 (de) Verfahren und vorrichtung zur aufzeichnung und indexierung einer audio- und multimediakonferenz
DE68918907T2 (de) Kommunikationsendgerät.
DE60303839T2 (de) Zusammenarbeit mittels Instant Messaging in multimedialen Telefonie-über-LAN Konferenzen
EP2047669B1 (de) Verfahren zum durchführen einer audiokonferenz, audiokonferenzeinrichtung und umschalteverfahren zwischen kodierern
DE69906333T2 (de) System und verfahren zur durchführung einer auktion über ein kommunikationsnetzwerk
DE602005004507T2 (de) Drücken-zum-Sprechen Verfahren und Server
DE69533710T2 (de) Konferenzbrücke für Sprach-Paketnetze und zugehöriges Verfahren
DE69013177T2 (de) Fernsehtelefonkommunikationssystem und Vorrichtung dazu.
DE102009035796B4 (de) Benachrichtigung über Audio-Ausfall bei einer Telekonferenzverbindung
DE10013387A1 (de) Vorrichtung und Verfahren zum Zuführen von Klingel- und Sprachanrufen über eine Arbeitsstation
EP1392044A1 (de) Verfahren und Vorrichtung zum Bereitstellen von Konferenzen
EP1392042A1 (de) Planung von Konferenzen mittels eines IVRs
EP1392043B1 (de) Verfahren und Vorrichtung zum Bereitstellen von Konferenzen
EP2047632B1 (de) Verfahren zum durchführen einer sprachkonferenz und sprachkonferenzsystem
DE102008045929A1 (de) Konferenzeinheit und Verfahren zur Durchführung einer Mehrpunktkommunikation
EP1282293B1 (de) Verfahren zur Rufbearbeitung in einem Telekommunikationsnetz sowie zugehörige Einheiten
DE102005001886B4 (de) Verfahren zum Verbessern der Qualität einer Verbindung und Endgerät zur Durchführung des Verfahrens
DE2104263C2 (de) Schaltungsanordnung für eine Fernsprechvermittlungsanlage zum Aufbau von Fernsehkonferenzverbindungen
EP1148756A1 (de) Verfahren zur Abgabe von Daten in einem Telekommunikationssystem sowie Vermittlungszentrale

Legal Events

Date Code Title Description
8364 No opposition during term of opposition