DE69625793T2

DE69625793T2 - Telefonnetz-dienst zur umwandlung von sprache in wahltöne

Info

Publication number: DE69625793T2
Application number: DE69625793T
Authority: DE
Inventors: Frederick Bulfer
Original assignee: AT&T Corp
Current assignee: AT&T Corp
Priority date: 1995-09-29
Filing date: 1996-09-24
Publication date: 2003-10-02
Anticipated expiration: 2016-09-25
Also published as: EP0795170A1; WO1997012361A1; JPH10511252A; US6208966B1; DE69625793D1; EP0795170A4; EP0795170B1

Description

Die vorliegende Erfindung betrifft ein Verfahren zum Erstellen eines Telekommunikationsnetzwerkservices, der innerhalb eines Telekommunikationsnetzwerks ausgeführt wird, und zwar für die Verwendung mit einem automatisierten System, welches auf Dualton-Vielfachfrequenzsignale (DTMF) (Tastentöne) anspricht, nach dem Anspruch 1.

Stand der Technik und Hintergrund der Erfindung

Aus der US-A-4,837,808 ist eine Schaltungsanordnung bekannt, um eine zusätzliche sprachgesteuerte Anlage, die einer Telefonstation zugeordnet ist, an eine Telefonleitung anzuschließen. Gemäß diesem bekannten System wird eine Telefonstation mit einer sprachgesteuerten zusätzlichen Anlage verbunden. Die zusätzliche Anlage führt einen sprachgesteuerten Telefonwählvorgang und/oder sprachgesteuerte Operation eines Videotextterminals durch. Diese ist durch eine Verbindungseinheit implementiert, welche in die Telefonleitung eingefügt ist. Die Verbindungseinheit arbeitet mit einem Fernsprechamt oder -zentrale zusammen, um die Möglichkeit zu schaffen, Anrufe in einer bekannten Weise mit Hilfe eines Tastenfeldes an der Telefonstation zu initialisieren. Irgendein Typ einer Telefonstation kann an die sprachgesteuerte zusätzliche Anlage angeschlossen werden.
Aus der US-A-5,402,477 ist ein Verfahren und ein System zum Konfigurieren eines Telefons bekannt. Eine Verbindung wird zwischen einem Telefon und einer Telefonumgebung hergestellt. Eine Liste von Dienstleistungen, die über die Telefonumgebung angeboten werden können, wird generiert. Eine Liste von Kandidatenprozeduren zur Herstellung jeder aufgelisteten Dienstleistung über die Telefonumgebung wird erzeugt. Wenigstens eine der aufgelisteten Prozeduren wird für jede aufgelistete Dienstleistung ausgeführt, um zu bestimmen, ob die aufgelistete Dienstleistung durch den Anschluß unterstützt wird.
Die US-A-5,220,595 offenbart eine sprachgesteuerte Vorrichtung, die einen Empfangs-/Diskriminiermechanismus enthält, um ein DTMF-Signal zu empfangen, welches extern über eine Telefonleitung eingespeist wird und um das DTMF-Signal zu diskriminieren, enthält einen Pegel-Detektormechanismus zum Detektieren eines Signalpegels des DTMF-Signals, welches in den Empfangs-/Diskriminiermechanismus eingespeist wurde, eine Spracherkennungseinrichtung zum Erkennen des Inhaltes eines Sprachsignals, welches extern über die Telefonleitung eingespeist wurde, und eine Eingangspegeleinstellvorrichtung zum Einstellen eines Signalpegels des Sprachsignals, welches in die Spracherkennungseinrichtung eingespeist wird, auf der Grundlage des Signalpegeldetektionsergebnisses durch den Pegel-Detektionsmechanismus, und enthält eine. Funktionsausführeinrichtung zum Ausführen einer Funktion entsprechend dem Inhalt des Sprachsignals, welches durch die Spracherkennungseinrichtung erkannt worden ist.
In den letzten Jahren hat die Telekommunikationsindustrie ein explosionsartiges Wachstum bei der Verwendung von DTMF-(das heißt Tastenton)-gesteuerten Systemen erfahren. Diese Systeme wurden in typischer Weise entweder für den Zweck verwendet, uni eine zusätzliche Anwenderbequemlichkeit oder Annehmlichkeit zu schaffen, oder zu dem Zwecke, eine Zugriffsmöglichkeit auf Informationen zu schaffen, oder um den Bedarf an menschlichen Telefonoperatoren zu reduzieren oder zu beseitigen. Beispielsweise kann auf Sprachnachrichtsysteme häufig durch Verwendung der Tastentöne zugegriffen werden, um einem Anrufer die Möglichkeit zu schaffen, seine oder ihre Nachrichten aufzurufen oder um abgehende Grußnachrichten aufzuzeichnen oder um andere administrative Aufgaben durchzuführen. Selbst Heimtelefonbeantworter liefern nunmehr einen Fernzugriff von irgendeinem Telefon aus, und zwar über die Tastentonsteuerung. Zusätzlich bieten viele Teilnehmer-Service-Telefonnummern tastenton-gesteuerte Menüs für den Anrufer, wobei so ein Menü dazu verwendet werden kann, um effizient eine Verbindung zu einer geeigneten Person oder einer Gesellschaft herzustellen. Darüber hinaus werden Tastentöne häufig dazu verwendet, um viele andere automatisierte Systeme zu steuern, wie beispielsweise automatisierte Banking- Transaktionen und Börsenkursdienste. Diese Dienste ermöglichen es häufig einem Anrufer, eine gesamte Transaktion durchzuführen, ohne daß dabei ein menschlicher Teilnehmer auf der anderen Seite des Rufes mit involviert ist.
Obwohl der Anteil an Telefonen, die keine Tastentonfähigkeit haben (das heißt Dreh- oder Wählimuulstelefone) klein ist und in den Vereinigten Staaten abnimmt, gibt es dennoch eine wesentliche Anzahl solcher Telefone, speziell außerhalb von den Vereinigten Staaten darüber hinaus bieten viele moderne Tastentontelefone - die beispielsweise meistens schnurlose und zellulare Telefone umfassen - ein Tastenfeld in dem Handapparat, wodurch es für den Anwender extrem mühsam wird, die erforderlichen Steuersignale für solch ein automatisiertes auf Tastentöne basierendes System zu erzeugen, und zwar unter Fortsetzung des Anhörens der Antworten von dem System. Somit involviert die Verwendung dieser automatisierten Systeme mit typischen schnurlosen oder zellularen Telefonen häufig ein Vorwärts- und Rückwärtsbewegen des Handapparats, was sehr unangenehm werden kann. Zusätzlich würden es viele Telefonverwender, selbst diejenigen, die mit den oben erläuterten Einschränkungen nicht konfrontiert sind, es angenehmer empfinden, wenn sie lediglich einen Befehl sprechen könnten anstatt eine geeignete Taste zu lokalisieren und dann mit seinen Fingern niederzudrücken.
Mittlerweile ist die Spracherkennungstechnologie während der letzten paar Jahre entscheidend vorangekommen. Es ist nunmehr technologisch ohne weiteres möglich, eine sprecher-unabhängige Spracherkennung zu realisieren (das heißt die Erkennung der Sprache von irgendeinem Sprecher, welcher früher dem System unbekannt war), und zwar anhand von einzelnen Worten, die aus einem beschränkten Vokabular ausgewählt sind. In der Tat liefern einige der zuvor erläuterten automatisierten Systeme solche eine Spracherkennungsfähigkeit, so daß der Bedarf dafür, daß der Anwender Berührungstontasten drückt, beseitigt wird. Andererseits kann es noch eine Weile dauern, bevor der Hauptteil dieser Systeme mit einer Spracherkennungsfähigkeit ausgestattet ist, um deren gegenwärtigen Tastentonsteuermechanismus zu ersetzen (oder zu unterstützen), da beispielsweise die Investition, die für das Hinzufügen der Spracherkennungsfähigkeit zu solch einem System erforderlich ist, auf der Grundlage eines einzelnen individuellen Systems alleine nicht gerechtfertigt ist.
Es wäre daher vorteilhaft, eine verallgemeinerte Fähigkeit zu schaffen, die es einem Anwender eines Telefons ermöglicht, ein Wort zu sprechen, welches eine Ziffer (oder einen Buchstaben) bzw. die entsprechende Tast wiedergibt, wie z. B. die "*"-Taste (z.B. das Wort "Stern") oder die "#"-Taste (z. B. das Wort "Pound") mit der Maßgabe, daß das entsprechende DTMF-Signal (das heißt der Tastenton) automatisch erzeugt wird, um dadurch die erforderliche Eingabe in ein beliebiges tastenton-gesteuertes System vorzusehen. Das US-Patent Nr. 5,402,477, ausgegeben an Michael L. McMahan und Michele B. Gammel am 28. März 1995, offenbart ein Telefonset, welches unter anderem die Fähigkeit besitzt, Tastentonsignale im Ansprechen auf eine Ziffer, das Wort "Stern" oder das Wort "Pound" zu erzeugen, die durch den Anwender in den Handapparat eingesprochen werden. Um diese Fähigkeit jedoch ausnützen oder einsetzen zu können, ist es in offensichtlicher Weise erforderlich, daß dieses spezielle spezialisierte Telefonterminalequipment, welches darin offenbart ist, für den Anwender verfügbar ist. Insofern liefert der Vorschlag des US-Patents Nr. 5,402,477 eindeutig keine Lösung des Problems, welches oben beschrieben ist und hier angesprochen wird - nämlich, daß viele Telefonanrufe momentan in der Tat entweder mit Hilfe von Dreh- oder Impulstyptelefonen abgesetzt werden oder mit Hilfe von Tastentelefonen, deren Tastenfelder in dem Handapparat gelegen sind, und dies auch für eine vorhersehbare Zukunft so ausgestattet bleiben.

Zusammenfassung der Erfindung

Es ist Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren zum Liefern eines Telekommunikationsnetzwerkdienstes zu schaffen, der innerhalb eines Telekommunikationsnetzwerks ausgeführt wird, und zwar für einen Anwender, und mit Hilfe eines automatisierten Systems, welches auf Dualton-Vielfachfrequenzsignale (DTMF) (Tastentöne) anspricht.
Gemäß der vorliegenden Erfindung wird diese Aufgabe durch die im Anspruch 1 an gegebenen Verfahrensschritte gelöst.
Vorteilhafte Ausführungsformen des erfindungsgemäßen Verfahrens ergeben sich aus den Unteransprüchen 2 bis 9.
Gemäß einem veranschaulichenden Ausführungsbeispiel der Erfindung spricht ein Telefonanwender eine Äußerung mit einem Wort, welches eine Ziffer, einen Buchstaben, die "*"-Taste (z. B. das Wort "Stern") oder die "#"-Taste (z. B. das Wort "Pound" (Raute)) enthält. Der veranschaulichende Netzwerkdienst führt eine herkömmliche, sprecher-unabhängige Spracherkennung an der Äußerung durch, um das gesprochene Wort zu identifizieren, und erzeugt dann das Tastentonsignal, welches dem gesprochenen Wort entspricht, welches so identifiziert wurde (z. B. eine Ziffer, ein Buchstabe oder ein spezielles Zeichen, welches auf einem herkömmlichen Tastentelefon gefunden werden kann). Dieses erzeugte DTMF-Signal wird dann zu einem automatisierten System, wie beispielsweise einem Sprachnachrichtensystem oder Telefonbeantworter, gesendet, um den Betrieb desselben zu steuern. Der Netzwerkdienst nach der vorliegenden Erfindung kann in vorteilhafter Weise dann verwendet werden, wenn das von dem Anrufer verwendete Telefon aus einem Dreh- oder Wählimpulstelefon besteht oder auch bei anderen Umständen, bei denen es vorteilhaft ist zu sprechen, anstatt Tasten eines Telefontastenfeldes zu drücken.

Kurze Beschreibung der Zeichnungen

Fig. 1 zeigt ein veranschaulichendes Telekommunikationsnetzwerk, in welchem ein Sprach-zu-Tastenton-Umsetznetzwerkdienst gemäß einer veranschaulichenden Ausführungsform der vorliegenden Erfindung realisiert wurde;
Fig. 2 zeigt ein Flußdiagramm, welches den Betrieb des veranschaulichenden Sprach- zu-Tastenton-Umsetzservers von Fig. 1 gemäß einer veranschaulichenden Ausführungsform der vorliegenden Erfindung beschreibt.

Detaillierte Beschreibung

Fig. 1 zeigt ein veranschaulichendes Telekommunikationsnetzwerk, in welchem ein Sprach-zu-Tastenton-Umsetznetzwerkdienst gemäß einer veranschaulichenden Ausführungsform der vorliegenden Erfindung eingebaut wurde. Ein Anrufer verwendet das Telefon 11 in einer herkömmlichen Weise, um einen Telefonanruf gemäß einer bestimmten Telefonnummer abzusetzen, die dem Sprach-zu-Tastenton-Umsetzserver 15 zugeordnet ist. Das Telefon 11 kann irgendein Typ eines herkömmlichen Telefons sein, obwohl die Verwendung der vorliegenden Erfindung als speziell vorteilhaft dann anzusehen ist, wenn das Telefon 11 aus einem Dreh- oder Wählimpulstelefon besteht oder wenn alternativ ein Tastentontelefon, wie beispielsweise ein schnurloses oder Zellentelefon, verwendet wird, wobei das Tastenton-Tastenfeld in dem Handapparat gelegen ist. Im Ansprechen auf das Absetzen des Rufes durch das Telefon 11 verbindet ein Telekommunikationsnetzwerkschalter 13 das Telefon 11 mit dem Sprach-zu- Tastenton-Umsetzserver 16. Der Telekommunikationsnetzwerkschalter 13 kann aus einem herkömmlichen Fernsprech- oder Orts-Fernsprechamt- Telekommunikationsschalter bestehen, wie dieser Fachleuten auf dem vorliegenden Gebiet vertraut ist.
Wenn der Ruf zwischen dem Telefon 11 und dem Sprach-zu-Tastenton- Umsetzserver 15 einmal hergestellt worden ist, fragt der Server an, daß der Anwender die Telefonnummer eines automatisierten Systems liefern soll, welches auf Tastentonsteuerung anspricht, wie beispielsweise ein Sprach-Mail-System, ein Telefonbeantworter oder ein automatisierter Transaktionsservice, wie beispielsweise ein Banking- oder ein Börsenkursservice. Die angefragte Telefonnummer kann in einer herkömmlichen Weise (z. B. durch Wählen) geliefert werden, oder kann oral durch den Anrufer geliefert werden. In dem letzteren Fall kann eine herkömmliche Spracherkennungstechnik dafür eingesetzt werden, um die Sequenz der Ziffern zu bestimmen, welche die Telefonnummer des gewünschten automatisierten Systems ausmachen. Bei der veranschaulichten Ausführungsform von Fig. 1 besteht die anwender-spezifizierte Telefonnummer aus derjenigen des automatisierten Tastentonansprechsystems 19.
Wenn der Server einmal mit der Telefonnummer versehen worden ist, mit welcher der Anrufer verbunden werden will, kann er irgendeine einer Anzahl von herkömmlichen Techniken verwenden, die der Fachwelt gut bekannt sind, um eine Verbindung zwischen dem Anrufer und dem automatisierten Tastentonansprechsystem 19 zu bewirken, wobei der Server selbst dazwischen eingefügt ist. Bei der veranschaulichten Ausführungsform von Fig. 1 wird beispielsweise solch eine Verbindung auf dem Weg des Telekommunikationsnetzwerkschalters 17 erstellt, der ähnlich wie der Telekommunikationsnetzwerkschalter 13 aus einem herkömmlichen Fernsprech- oder Orts-Amt-Telekommunikationsschalter bestehen kann. (Es sei darauf hingewiesen, daß der Netzwerkschalter 17 in der Tat aus irgendeinem Schalter, wie beispielsweise dem Netzwerkschalter 13 bestehen kann.)
Bei einer Ausführungsform kann die Funktionalität des Sprach-zu-Tastenton- Umsetzservers 15 durch die Verwendung eines PBX-(private Anschlußvermittlung)- System gebildet sein, welches direkt an den Netzwerkschalter 17 angeschlossen ist. Diese Verbindung zwischen dem PBX-System und dem Netzwerkschalter kann beispielsweise einen Satz von T1 Strangleitungen umfassen, wie sie den Fachleuten bekannt sind, und kann eine herkömmliche digitale Signalgabetechnik verwenden, um eine Kommunikation dazwischen herzustellen. Speziell kann der Sprach-zu-Tastenton- Umsetzserver 15 an die Leitungsseite des zuvor erwähnten PBX-Systems angeschlossen werden, und zwar so als ob es sich um ein oder um mehrere Telefonsets handeln würde (es sei erwähnt, daß der Sprach-zu-Tastenton-Umsetzserver 15 im allgemeinen eine Vielzahl an Ports aufweisen kann, so daß dessen gleichzeitige Verwendung durch eine Anzahl von individuellen Anrufen ermöglicht wird, wobei jeder Anrufer mit einem individuellen zugeordneten automatisierten, auf Tastenton ansprechendes System kommuniziert).
Bei der Verwendung kann der Anruf von dem Telefon 11 zu dem Server 15 über das zuvor erwähnte PBX-System aufgebaut werden. Auf diese Weise wird der Anrufer mit einer ersten Leitung des Servers verbunden. Dann fragt, wie oben beschrieben wurde, der Sprach-zu-Tastenton-Umsetzserver 15 bei dem Anrufer die Telefonnummer ab, und zwar die Telefonnummer für das automatisierte, auf Tastenton ansprechende System 19. Wenn der Server diese Nummer einmal empfangen hat, greift er auf eine zweite Leitung (auf das PBX-System) zu und fragt an, daß das PBX-System einen Anruf zu dem automatisierten System vornehmen bzw. wählen soll, so daß der Server mit diesem verbunden wird. Der Server instruiert dann das PBX-System darüber, die erste Leitung und die zweite Leitung zur Konferenz zusammenzuführen, woraus dann resultiert, daß der Anrufer mit dem automatisierten System verbunden wird, wobei der Server dazwischen eingefügt ist. An dieser Stelle ist es Aufgabe des Servers, eine Sprach-zu-Tastenton-Umsetzung in Einklang mit einem veranschaulichten Ausführungsbeispiel der vorliegenden Erfindung durchzuführen, wie weiter unten beschrieben wird.
Fig. 2 zeigt ein Flußdiagramm, welches den Betrieb des veranschaulichten Sprach-zu-Tastenton-Umsetzservers von Fig. 1 in Einklang mit einer veranschaulichten Ausführungsform der vorliegenden Erfindung beschreibt. Spezifischer ausgedrückt, wird bei den Schritten 21-25 der Prozess der Verbindung des Anrufes mit der vom Verwender spezifizierten Telefonnummer, wie dies oben beschrieben wurde, mit dem Server durchgeführt, der zwischen dem Anrufer und der gerufenen Nummer dazwischengefügt ist. Bei dem Schritt 21 antwortet der Sprach-zu-Tastenton- Umsetzserver 15 auf den hereinkommenden Anruf (was im folgenden als "erste" Leitung bezeichnet wird). Bei dem Schritt 22 wird dann der Anrufer instruiert, die Telefonnummer des automatisierten, auf den Tastenton ansprechenden Systems 19 zu liefern - von dem automatisierten System, mit welchem der Anrufer verbunden zu werden wünscht. Bei dem Schritt 23 empfängt der Server die Telefonnummer von dem Anrufer. Wie oben beschrieben wurde, kann dies beispielsweise das herkömmliche Erkennen von Sprachäußerungen umfassen, welche die Nummer spezifizieren, oder kann herkömmliche Techniken umfassen, wie beispielsweise das Empfangen der hereinkommenden Tastentöne.
Nachdem der Sprach-zu-Tastenton-Umsetzserver 15 die Telefonnummer, die angerufen werden, soll, einmal empfangen hat, fragt er eine zweite (ausgehende) Leitung von dem Telefonnetzwerk an und wählt auf dieser die vom Anwender gelieferte Nummer des automatisierten, auf Tastenton ansprechenden Systems (Schritt 24). Und schließlich, wenn die Verbindung auf der zweiten Leitung realisiert worden ist, bewirkt der Server, daß die zwei Leitungen (das heißt die erste Leitung, die den Anrufer angeschlossen enthält, und die zweite Leitung, die das angeschlossene automatisierte System enthält) miteinander "in Konferenz" treten (das heißt diese Leitungen werden miteinander verbunden), was bei dem Schritt 25 erfolgt. Dies kann entweder intern innerhalb des Servers erreicht werden oder der Server kann das Telefonnetzwerk instruieren, die zwei Leitungen zu einer einzelnen verbundenen Leitung zusammenzuführen. In jedem Fall ist es an dieser Stelle Aufgabe des Servers, eine Sprach-zu-Tastenton-Umsetzung in Einklang mit der veranschaulichten Ausführungsform der vorliegenden Erfindung durchzuführen, wie dies in den Schritten 31-34 gezeigt ist.
Spezifischer ausgedrückt, wird bei den Schritten 31 bis 34 eine Sprach-zu- Tastenton-Umsetzung in der erforderlichen Weise durchgeführt, bis der Server von dem Ruf durch den Anrufer abgetrennt wird (oder bis der Anruf selbst von irgendeiner Partei beendet bzw. getrennt wird), wie dies entsprechend dem Entscheidungsschritt 35 festgelegt wird. Speziell bei dem Schritt 31 wird auf ein gesprochenes Wort von dem Anwender gehört. Es sei erwähnt, daß für viele automatisierte, auf Tastenton ansprechende Systeme die einzige Sprache, die der Anrufer erzeugen muss, aus derjenigen besteht, die gemäß der vorliegenden Erfindung zum Zwecke der Erzeugung von Tastentönen erforderlich sind. Es kann somit in solch einem Fall in vorteilhafter Weise angenommen werden, daß das gesprochene Wort aus einem solchen besteht, welches irgendeine der Ziffern "0" bis "9", die Buchstaben "A" bis "Z" wiedergibt oder auch irgendeines der speziellen Zeichen, die auf herkömmlichen Tastentontelefonen gefunden werden können (das heißt "*" oder "#"). Jedoch bei Systemen, die letztendlich den Anrufer mit einer anderen Person verbinden, kann der Anrufer beispielsweise in vorteilhafter Weise mit einem Mechanismus ausgestattet sein, um den Server von dem Ruf abzutrennen, bevor der Ruf selbst getrennt wird, wodurch die Möglichkeit beseitigt wird, daß der Server in fehlerhafter Weise versucht, die DTMF-Töne im Ansprechen auf eine Konversationssprache des Anrufers zu erzeugen.
Wenn das Wort für jede Ziffer oder Buchstaben gesprochen wird, führt der Sprach-zu-Tastenton-Umsetzserver 15 eine herkömmliche sprecher-unabhängige Spracherkennung hinsichtlich der gesprochenen Äußerung bei dem Schritt 32 durch, wodurch das gesprochene Wort als eines der Wörter identifiziert wird, welche die Ziffern "0" bis "9", die Buchstaben "A" bis "Z" oder eines der speziellen Zeichen "*" oder "#" wiedergeben. Speziell kann der Satz an Wörtern, der zur Wiedergabe der Ziffern verwendet wird, beispielsweise die Worte "eins", "zwei", "drei", "vier", "fünf", "sechs", "sieben", "acht", "neun", "null" und "oh" enthalten. In ähnlicher Weise kann der Satz der Wörter, die zum Wiedergeben des Zeichens "*" verwendet werden, die Worte "Stern" und "Sternchen" enthalten, und der Satz der Wörter, die zur Wiedergabe des Zeichens "#" verwendet werden, kann die Worte "Raute (Pound)", "Sharp" und "Number" enthalten. Darüber hinaus können auch Worte in Sprachen, die von Englisch verschieden sind, in offensichtlicher Weise entweder zusätzlich oder anstelle der vertrauten englischen Worte für die Ziffern, Buchstaben und speziellen Zeichnen vorgesehen sein oder möglich sein. Basierend auf dem oben beschriebenen Spracherkennungsprozeß wird bei dem Schritt 33 das identifizierte Wort in eine geeignete Telefontastenkategorie klassifiziert.
Nachdem das gesprochene Wort einmal identifiziert und klassifiziert wurde, verwendet der Server einen DTMF-Signalgenerator, um ein Tastentonsignal zu erzeugen, welches der gegebenen Telefondrucktastenkategorie (Schritt 34) entspricht, wodurch die erforderliche Eingabe an das automatisierte System geliefert wird. Wenn beispielsweise das identifizierte Wort aus irgendeinem der Worte "zwei", "A", "B" oder "C" besteht, so wird das Tastentonsignal, welches der Ziffer "2" zugeordnet ist, um eine tastenton-basierte Telekommunikationssignalgebung durchzuführen, in geeigneter Weise erzeugt. (Wie den Fachleuten auf dem vorliegenden Gebiet gut bekannt ist, umfassen die DTMF-Signale oder Tastentonsignale ein Matrixkombination von zwei Frequenzen, jede aus einer Gruppe von vier, die bei dem Betrieb der Tastentontelefonsets verwendet werden, um numerische Adresseninformationen auszusenden. Spezifischer ausgedrückt, wurden die zwei Gruppen von vier Frequenzen standardisiert, und zwar auf 697 Hz, 770 Hz, 852 Hz und 941 Hz und 1209 Hz, 1336 Hz, 1477 Hz und 1633 Hz.)
Wie oben ausgeführt wurde, liefert der Server kontinuierlich eine Sprach-zu- Tastenton-Umsetzung, wie sie benötigt wird, bis der Anrufer eine Anfrage stellt, daß der Server aus dem Anruf herausgenommen werden soll, an welcher Stelle der Server sich selbst aus der Leitung abtrennt (das heißt sowohl von der ersten Leitung als auch von der zweiten Leitung), was bei dem Schritt 36 erfolgt. (Der Server kann sich auch in vorteilhafter Weise selbst von der Leitung abtrennen, wenn der Anrufer aufhängt.) Solch eine Anfrage kann zu dem Server in einer Anzahl von möglichen Arten übertragen werden. Beispielsweise kann das Wort "abtrennen" zu dem Vokabular der Spracherkennungskapazität des Servers hinzugefügt werden und, nach dem Erkennen, daß das Wort "abtrennen" durch den Anrufer ausgesprochen worden ist, trennt sich der Server selbst von dem Anruf ab. Viele andere mögliche Mechanismen zum Beenden der Teilnahme des Servers an dem Anruf sind für Fachleute offensichtlich.
Obwohl eine spezifische. Ausführungsform der Erfindung dargestellt und hier beschrieben wurde, sei darauf hingewiesen, daß diese Ausführungsform lediglich der Veranschaulichung von vielen möglichen spezifischen Anordnungen dient, die in der Anwendung der Prinzipien der vorliegenden Erfindung realisiert werden können. Es können zahlreiche und abgewandelte andere Anordnungen gemäß diesen Prinzipien realisiert werden, wie sie von Fachleuten vorgenommen werden können, ohne dadurch den Rahmen der Erfindung zu verlassen. Beispielsweise sind zahlreiche alternative Mechanismen dafür einsetzbar, um eine anrufende Partei mit einem automatisierten System zu verbinden, welches auf eine Tastentonsteuerung anspricht, wobei eine Sprach-zu-Tastenton-Umsetzfähigkeit dazwischen eingefügt sein kann, an welcher Stelle die Prinzipien der vorliegenden Erfindung verwendet werden können, um die gesprochenen Worte in Tastentöne für die Verwendung durch das automatisierte System umzusetzen. Ferner können einige oder auch alle der Funktionen des Sprach-zu- Tastenton-Umsetzservers 15, wie sie in der veranschaulichten Ausführungsform, die hier dargestellt wurde, beschrieben wurden, beispielsweise direkt in einen oder in mehrere Telekommunikationsnetzwerkschalter inkorporiert werden (wie beispielsweise den Schalter 13 und/oder den Schalter 17 von Fig. 1), oder diese Funktionen können innerhalb des Telekommunikationsnetzwerks durch irgendeinen anderen Mechanismus einer Anzahl von anderen möglichen Mechanismen realisiert werden, die der Fachwelt bekannt sind. Darüber hinaus kann, wie oben dargelegt wurde, der Sprach-zu-Tastenton- Umsetzserver 15 mit der Fähigkeit ausgestattet sein, um gleichzeitig eine Vielzahl von unabhängigen Telefonanrufen zu handhaben, wodurch ein allgemein verfügbarer Netzwerkdienst geschaffen wird.

Claims

1. Verfahren zum Erstellen eines Telekommunikationsnetzwerk-Services, der innerhalb eines Telekommunikationsnetzwerks ausgeführt wird und zwar für die Verwendung mit einem automatisierten System, welches auf Dualton- Multifrequenzsignale (DTMF; Tastentöne) anspricht, welches Verfahren die folgenden Sehritte umfaßt:

Auffordern eines Anrufers einen ersten Ruf zu dem automatisierten System zu initialisieren;

Initialisieren eines zweiten Rufes in dem Netzwerk zu einer Ausrüstung, um eine Spracherkennung durchzuführen;

Überbrücken des ersten und des zweiten Rufs;

Empfangen einer Sprachäußerung mit einem gesprochenen Wort;

Durchführen einer Spracherkennung hinsichtlich der Sprachäußerung, um dadurch das gesprochene Wort zu identifizieren;

Klassifizieren der Sprachäußerung in eine eines Satzes von Kategorien basierend auf der Identifikation des gesprochenen Wortes, wobei jede der Kategorien ein dieser zugeordnetes DTMF Signal aufweist;

Erzeugen des DTMF Signals, welches der Kategorie zugeordnet ist, innerhalb des Telekommunikationsnetzwerks, innerhalb welcher Kategorie die Sprachäußerung klassifiziert worden ist; und

Übertragen des erzeugten DTMF Signals über das Telekommunikationsnetzwerks zu dem automatisierten System.

2. Verfahren nach Anspruch 1, bei dem der Satz der Kategorien einen Satz an Ziffern "0" bis "91" ein Zeichen "*", und ein Zeichen "#" umfaßt, und bei dem die zugeordneten DTMF Signale Tastentonsignale umfassen, die entsprechend den Ziffern "0" bis "9" bzw. dem Zeichen "bzw. dem Zeichen "#" zugeordnet wurden.

3. Verfahren nach Anspruch 2, bei dem das gesprochene Wort aus einem Satz heraus identifiziert wird, welches die Worte enthält, die die Ziffern "0" bis "9" wiedergeben.

4 Verfahren nach Anspruch 3, bei dem die Worte, die die Ziffern "0" bis "9" wiedergeben, die Worte "oh oder zero", bzw. "one (1)", bzw. "two (2)", bzw. "three (3)", bzw. "four (4)", bzw. "five (5)", bzw. "six (6)", bzw. "seven (7)", bzw. "eight (8)" bzw. "nine (9)"umfassen.

5. Verfahren nach Anspruch 2, bei dem das gesprochene Wort aus einem Satz identifiziert wird, der die Worte enthält, die die alphabetischen Buchstaben "A" bis "Z" wiedergeben.

6. Verfahren nach Anspruch 2, bei dem das gesprochene Wort aus einem Satz identifiziert wird, der die Worte enthält, welche "*" und "#" wiedergeben.

7. Verfahren nach Anspruch 6, bei dem die Worte, die "*" und "#" wiedergeben, die Worte umfassen "star (Sternchen)" und "asterisk", und die Worte "pound" und "sharp" und "number (Nummer)" jeweils umfassen.

8. Verfahren nach Anspruch 2, bei dem das automatisierte System ein Sprachnachrichtensystem aufweist.

9. Verfahren nach Anspruch 8, bei dem das Sprachnachrichtensystem einen Telefonbeantworter umfaßt.