DE69625793T2 - Telefonnetz-dienst zur umwandlung von sprache in wahltöne - Google Patents
Telefonnetz-dienst zur umwandlung von sprache in wahltöneInfo
- Publication number
- DE69625793T2 DE69625793T2 DE69625793T DE69625793T DE69625793T2 DE 69625793 T2 DE69625793 T2 DE 69625793T2 DE 69625793 T DE69625793 T DE 69625793T DE 69625793 T DE69625793 T DE 69625793T DE 69625793 T2 DE69625793 T2 DE 69625793T2
- Authority
- DE
- Germany
- Prior art keywords
- telephone
- words
- tone
- spoken word
- touch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims description 19
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/27—Devices whereby a plurality of signals may be stored simultaneously
- H04M1/271—Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42204—Arrangements at the exchange for service or number selection by voice
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/53—Centralised arrangements for recording incoming messages, i.e. mailbox systems
- H04M3/533—Voice mail systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/60—Medium conversion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q1/00—Details of selecting apparatus or arrangements
- H04Q1/18—Electrical details
- H04Q1/30—Signalling arrangements; Manipulation of signalling currents
- H04Q1/44—Signalling arrangements; Manipulation of signalling currents using alternate current
- H04Q1/444—Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
- H04Q1/45—Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies using multi-frequency signalling
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Telephonic Communication Services (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Saccharide Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Description
- Die vorliegende Erfindung betrifft ein Verfahren zum Erstellen eines Telekommunikationsnetzwerkservices, der innerhalb eines Telekommunikationsnetzwerks ausgeführt wird, und zwar für die Verwendung mit einem automatisierten System, welches auf Dualton-Vielfachfrequenzsignale (DTMF) (Tastentöne) anspricht, nach dem Anspruch 1.
- Aus der US-A-4,837,808 ist eine Schaltungsanordnung bekannt, um eine zusätzliche sprachgesteuerte Anlage, die einer Telefonstation zugeordnet ist, an eine Telefonleitung anzuschließen. Gemäß diesem bekannten System wird eine Telefonstation mit einer sprachgesteuerten zusätzlichen Anlage verbunden. Die zusätzliche Anlage führt einen sprachgesteuerten Telefonwählvorgang und/oder sprachgesteuerte Operation eines Videotextterminals durch. Diese ist durch eine Verbindungseinheit implementiert, welche in die Telefonleitung eingefügt ist. Die Verbindungseinheit arbeitet mit einem Fernsprechamt oder -zentrale zusammen, um die Möglichkeit zu schaffen, Anrufe in einer bekannten Weise mit Hilfe eines Tastenfeldes an der Telefonstation zu initialisieren. Irgendein Typ einer Telefonstation kann an die sprachgesteuerte zusätzliche Anlage angeschlossen werden.
- Aus der US-A-5,402,477 ist ein Verfahren und ein System zum Konfigurieren eines Telefons bekannt. Eine Verbindung wird zwischen einem Telefon und einer Telefonumgebung hergestellt. Eine Liste von Dienstleistungen, die über die Telefonumgebung angeboten werden können, wird generiert. Eine Liste von Kandidatenprozeduren zur Herstellung jeder aufgelisteten Dienstleistung über die Telefonumgebung wird erzeugt. Wenigstens eine der aufgelisteten Prozeduren wird für jede aufgelistete Dienstleistung ausgeführt, um zu bestimmen, ob die aufgelistete Dienstleistung durch den Anschluß unterstützt wird.
- Die US-A-5,220,595 offenbart eine sprachgesteuerte Vorrichtung, die einen Empfangs-/Diskriminiermechanismus enthält, um ein DTMF-Signal zu empfangen, welches extern über eine Telefonleitung eingespeist wird und um das DTMF-Signal zu diskriminieren, enthält einen Pegel-Detektormechanismus zum Detektieren eines Signalpegels des DTMF-Signals, welches in den Empfangs-/Diskriminiermechanismus eingespeist wurde, eine Spracherkennungseinrichtung zum Erkennen des Inhaltes eines Sprachsignals, welches extern über die Telefonleitung eingespeist wurde, und eine Eingangspegeleinstellvorrichtung zum Einstellen eines Signalpegels des Sprachsignals, welches in die Spracherkennungseinrichtung eingespeist wird, auf der Grundlage des Signalpegeldetektionsergebnisses durch den Pegel-Detektionsmechanismus, und enthält eine. Funktionsausführeinrichtung zum Ausführen einer Funktion entsprechend dem Inhalt des Sprachsignals, welches durch die Spracherkennungseinrichtung erkannt worden ist.
- In den letzten Jahren hat die Telekommunikationsindustrie ein explosionsartiges Wachstum bei der Verwendung von DTMF-(das heißt Tastenton)-gesteuerten Systemen erfahren. Diese Systeme wurden in typischer Weise entweder für den Zweck verwendet, uni eine zusätzliche Anwenderbequemlichkeit oder Annehmlichkeit zu schaffen, oder zu dem Zwecke, eine Zugriffsmöglichkeit auf Informationen zu schaffen, oder um den Bedarf an menschlichen Telefonoperatoren zu reduzieren oder zu beseitigen. Beispielsweise kann auf Sprachnachrichtsysteme häufig durch Verwendung der Tastentöne zugegriffen werden, um einem Anrufer die Möglichkeit zu schaffen, seine oder ihre Nachrichten aufzurufen oder um abgehende Grußnachrichten aufzuzeichnen oder um andere administrative Aufgaben durchzuführen. Selbst Heimtelefonbeantworter liefern nunmehr einen Fernzugriff von irgendeinem Telefon aus, und zwar über die Tastentonsteuerung. Zusätzlich bieten viele Teilnehmer-Service-Telefonnummern tastenton-gesteuerte Menüs für den Anrufer, wobei so ein Menü dazu verwendet werden kann, um effizient eine Verbindung zu einer geeigneten Person oder einer Gesellschaft herzustellen. Darüber hinaus werden Tastentöne häufig dazu verwendet, um viele andere automatisierte Systeme zu steuern, wie beispielsweise automatisierte Banking- Transaktionen und Börsenkursdienste. Diese Dienste ermöglichen es häufig einem Anrufer, eine gesamte Transaktion durchzuführen, ohne daß dabei ein menschlicher Teilnehmer auf der anderen Seite des Rufes mit involviert ist.
- Obwohl der Anteil an Telefonen, die keine Tastentonfähigkeit haben (das heißt Dreh- oder Wählimuulstelefone) klein ist und in den Vereinigten Staaten abnimmt, gibt es dennoch eine wesentliche Anzahl solcher Telefone, speziell außerhalb von den Vereinigten Staaten darüber hinaus bieten viele moderne Tastentontelefone - die beispielsweise meistens schnurlose und zellulare Telefone umfassen - ein Tastenfeld in dem Handapparat, wodurch es für den Anwender extrem mühsam wird, die erforderlichen Steuersignale für solch ein automatisiertes auf Tastentöne basierendes System zu erzeugen, und zwar unter Fortsetzung des Anhörens der Antworten von dem System. Somit involviert die Verwendung dieser automatisierten Systeme mit typischen schnurlosen oder zellularen Telefonen häufig ein Vorwärts- und Rückwärtsbewegen des Handapparats, was sehr unangenehm werden kann. Zusätzlich würden es viele Telefonverwender, selbst diejenigen, die mit den oben erläuterten Einschränkungen nicht konfrontiert sind, es angenehmer empfinden, wenn sie lediglich einen Befehl sprechen könnten anstatt eine geeignete Taste zu lokalisieren und dann mit seinen Fingern niederzudrücken.
- Mittlerweile ist die Spracherkennungstechnologie während der letzten paar Jahre entscheidend vorangekommen. Es ist nunmehr technologisch ohne weiteres möglich, eine sprecher-unabhängige Spracherkennung zu realisieren (das heißt die Erkennung der Sprache von irgendeinem Sprecher, welcher früher dem System unbekannt war), und zwar anhand von einzelnen Worten, die aus einem beschränkten Vokabular ausgewählt sind. In der Tat liefern einige der zuvor erläuterten automatisierten Systeme solche eine Spracherkennungsfähigkeit, so daß der Bedarf dafür, daß der Anwender Berührungstontasten drückt, beseitigt wird. Andererseits kann es noch eine Weile dauern, bevor der Hauptteil dieser Systeme mit einer Spracherkennungsfähigkeit ausgestattet ist, um deren gegenwärtigen Tastentonsteuermechanismus zu ersetzen (oder zu unterstützen), da beispielsweise die Investition, die für das Hinzufügen der Spracherkennungsfähigkeit zu solch einem System erforderlich ist, auf der Grundlage eines einzelnen individuellen Systems alleine nicht gerechtfertigt ist.
- Es wäre daher vorteilhaft, eine verallgemeinerte Fähigkeit zu schaffen, die es einem Anwender eines Telefons ermöglicht, ein Wort zu sprechen, welches eine Ziffer (oder einen Buchstaben) bzw. die entsprechende Tast wiedergibt, wie z. B. die "*"-Taste (z.B. das Wort "Stern") oder die "#"-Taste (z. B. das Wort "Pound") mit der Maßgabe, daß das entsprechende DTMF-Signal (das heißt der Tastenton) automatisch erzeugt wird, um dadurch die erforderliche Eingabe in ein beliebiges tastenton-gesteuertes System vorzusehen. Das US-Patent Nr. 5,402,477, ausgegeben an Michael L. McMahan und Michele B. Gammel am 28. März 1995, offenbart ein Telefonset, welches unter anderem die Fähigkeit besitzt, Tastentonsignale im Ansprechen auf eine Ziffer, das Wort "Stern" oder das Wort "Pound" zu erzeugen, die durch den Anwender in den Handapparat eingesprochen werden. Um diese Fähigkeit jedoch ausnützen oder einsetzen zu können, ist es in offensichtlicher Weise erforderlich, daß dieses spezielle spezialisierte Telefonterminalequipment, welches darin offenbart ist, für den Anwender verfügbar ist. Insofern liefert der Vorschlag des US-Patents Nr. 5,402,477 eindeutig keine Lösung des Problems, welches oben beschrieben ist und hier angesprochen wird - nämlich, daß viele Telefonanrufe momentan in der Tat entweder mit Hilfe von Dreh- oder Impulstyptelefonen abgesetzt werden oder mit Hilfe von Tastentelefonen, deren Tastenfelder in dem Handapparat gelegen sind, und dies auch für eine vorhersehbare Zukunft so ausgestattet bleiben.
- Es ist Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren zum Liefern eines Telekommunikationsnetzwerkdienstes zu schaffen, der innerhalb eines Telekommunikationsnetzwerks ausgeführt wird, und zwar für einen Anwender, und mit Hilfe eines automatisierten Systems, welches auf Dualton-Vielfachfrequenzsignale (DTMF) (Tastentöne) anspricht.
- Gemäß der vorliegenden Erfindung wird diese Aufgabe durch die im Anspruch 1 an gegebenen Verfahrensschritte gelöst.
- Vorteilhafte Ausführungsformen des erfindungsgemäßen Verfahrens ergeben sich aus den Unteransprüchen 2 bis 9.
- Gemäß einem veranschaulichenden Ausführungsbeispiel der Erfindung spricht ein Telefonanwender eine Äußerung mit einem Wort, welches eine Ziffer, einen Buchstaben, die "*"-Taste (z. B. das Wort "Stern") oder die "#"-Taste (z. B. das Wort "Pound" (Raute)) enthält. Der veranschaulichende Netzwerkdienst führt eine herkömmliche, sprecher-unabhängige Spracherkennung an der Äußerung durch, um das gesprochene Wort zu identifizieren, und erzeugt dann das Tastentonsignal, welches dem gesprochenen Wort entspricht, welches so identifiziert wurde (z. B. eine Ziffer, ein Buchstabe oder ein spezielles Zeichen, welches auf einem herkömmlichen Tastentelefon gefunden werden kann). Dieses erzeugte DTMF-Signal wird dann zu einem automatisierten System, wie beispielsweise einem Sprachnachrichtensystem oder Telefonbeantworter, gesendet, um den Betrieb desselben zu steuern. Der Netzwerkdienst nach der vorliegenden Erfindung kann in vorteilhafter Weise dann verwendet werden, wenn das von dem Anrufer verwendete Telefon aus einem Dreh- oder Wählimpulstelefon besteht oder auch bei anderen Umständen, bei denen es vorteilhaft ist zu sprechen, anstatt Tasten eines Telefontastenfeldes zu drücken.
- Fig. 1 zeigt ein veranschaulichendes Telekommunikationsnetzwerk, in welchem ein Sprach-zu-Tastenton-Umsetznetzwerkdienst gemäß einer veranschaulichenden Ausführungsform der vorliegenden Erfindung realisiert wurde;
- Fig. 2 zeigt ein Flußdiagramm, welches den Betrieb des veranschaulichenden Sprach- zu-Tastenton-Umsetzservers von Fig. 1 gemäß einer veranschaulichenden Ausführungsform der vorliegenden Erfindung beschreibt.
- Fig. 1 zeigt ein veranschaulichendes Telekommunikationsnetzwerk, in welchem ein Sprach-zu-Tastenton-Umsetznetzwerkdienst gemäß einer veranschaulichenden Ausführungsform der vorliegenden Erfindung eingebaut wurde. Ein Anrufer verwendet das Telefon 11 in einer herkömmlichen Weise, um einen Telefonanruf gemäß einer bestimmten Telefonnummer abzusetzen, die dem Sprach-zu-Tastenton-Umsetzserver 15 zugeordnet ist. Das Telefon 11 kann irgendein Typ eines herkömmlichen Telefons sein, obwohl die Verwendung der vorliegenden Erfindung als speziell vorteilhaft dann anzusehen ist, wenn das Telefon 11 aus einem Dreh- oder Wählimpulstelefon besteht oder wenn alternativ ein Tastentontelefon, wie beispielsweise ein schnurloses oder Zellentelefon, verwendet wird, wobei das Tastenton-Tastenfeld in dem Handapparat gelegen ist. Im Ansprechen auf das Absetzen des Rufes durch das Telefon 11 verbindet ein Telekommunikationsnetzwerkschalter 13 das Telefon 11 mit dem Sprach-zu- Tastenton-Umsetzserver 16. Der Telekommunikationsnetzwerkschalter 13 kann aus einem herkömmlichen Fernsprech- oder Orts-Fernsprechamt- Telekommunikationsschalter bestehen, wie dieser Fachleuten auf dem vorliegenden Gebiet vertraut ist.
- Wenn der Ruf zwischen dem Telefon 11 und dem Sprach-zu-Tastenton- Umsetzserver 15 einmal hergestellt worden ist, fragt der Server an, daß der Anwender die Telefonnummer eines automatisierten Systems liefern soll, welches auf Tastentonsteuerung anspricht, wie beispielsweise ein Sprach-Mail-System, ein Telefonbeantworter oder ein automatisierter Transaktionsservice, wie beispielsweise ein Banking- oder ein Börsenkursservice. Die angefragte Telefonnummer kann in einer herkömmlichen Weise (z. B. durch Wählen) geliefert werden, oder kann oral durch den Anrufer geliefert werden. In dem letzteren Fall kann eine herkömmliche Spracherkennungstechnik dafür eingesetzt werden, um die Sequenz der Ziffern zu bestimmen, welche die Telefonnummer des gewünschten automatisierten Systems ausmachen. Bei der veranschaulichten Ausführungsform von Fig. 1 besteht die anwender-spezifizierte Telefonnummer aus derjenigen des automatisierten Tastentonansprechsystems 19.
- Wenn der Server einmal mit der Telefonnummer versehen worden ist, mit welcher der Anrufer verbunden werden will, kann er irgendeine einer Anzahl von herkömmlichen Techniken verwenden, die der Fachwelt gut bekannt sind, um eine Verbindung zwischen dem Anrufer und dem automatisierten Tastentonansprechsystem 19 zu bewirken, wobei der Server selbst dazwischen eingefügt ist. Bei der veranschaulichten Ausführungsform von Fig. 1 wird beispielsweise solch eine Verbindung auf dem Weg des Telekommunikationsnetzwerkschalters 17 erstellt, der ähnlich wie der Telekommunikationsnetzwerkschalter 13 aus einem herkömmlichen Fernsprech- oder Orts-Amt-Telekommunikationsschalter bestehen kann. (Es sei darauf hingewiesen, daß der Netzwerkschalter 17 in der Tat aus irgendeinem Schalter, wie beispielsweise dem Netzwerkschalter 13 bestehen kann.)
- Bei einer Ausführungsform kann die Funktionalität des Sprach-zu-Tastenton- Umsetzservers 15 durch die Verwendung eines PBX-(private Anschlußvermittlung)- System gebildet sein, welches direkt an den Netzwerkschalter 17 angeschlossen ist. Diese Verbindung zwischen dem PBX-System und dem Netzwerkschalter kann beispielsweise einen Satz von T1 Strangleitungen umfassen, wie sie den Fachleuten bekannt sind, und kann eine herkömmliche digitale Signalgabetechnik verwenden, um eine Kommunikation dazwischen herzustellen. Speziell kann der Sprach-zu-Tastenton- Umsetzserver 15 an die Leitungsseite des zuvor erwähnten PBX-Systems angeschlossen werden, und zwar so als ob es sich um ein oder um mehrere Telefonsets handeln würde (es sei erwähnt, daß der Sprach-zu-Tastenton-Umsetzserver 15 im allgemeinen eine Vielzahl an Ports aufweisen kann, so daß dessen gleichzeitige Verwendung durch eine Anzahl von individuellen Anrufen ermöglicht wird, wobei jeder Anrufer mit einem individuellen zugeordneten automatisierten, auf Tastenton ansprechendes System kommuniziert).
- Bei der Verwendung kann der Anruf von dem Telefon 11 zu dem Server 15 über das zuvor erwähnte PBX-System aufgebaut werden. Auf diese Weise wird der Anrufer mit einer ersten Leitung des Servers verbunden. Dann fragt, wie oben beschrieben wurde, der Sprach-zu-Tastenton-Umsetzserver 15 bei dem Anrufer die Telefonnummer ab, und zwar die Telefonnummer für das automatisierte, auf Tastenton ansprechende System 19. Wenn der Server diese Nummer einmal empfangen hat, greift er auf eine zweite Leitung (auf das PBX-System) zu und fragt an, daß das PBX-System einen Anruf zu dem automatisierten System vornehmen bzw. wählen soll, so daß der Server mit diesem verbunden wird. Der Server instruiert dann das PBX-System darüber, die erste Leitung und die zweite Leitung zur Konferenz zusammenzuführen, woraus dann resultiert, daß der Anrufer mit dem automatisierten System verbunden wird, wobei der Server dazwischen eingefügt ist. An dieser Stelle ist es Aufgabe des Servers, eine Sprach-zu-Tastenton-Umsetzung in Einklang mit einem veranschaulichten Ausführungsbeispiel der vorliegenden Erfindung durchzuführen, wie weiter unten beschrieben wird.
- Fig. 2 zeigt ein Flußdiagramm, welches den Betrieb des veranschaulichten Sprach-zu-Tastenton-Umsetzservers von Fig. 1 in Einklang mit einer veranschaulichten Ausführungsform der vorliegenden Erfindung beschreibt. Spezifischer ausgedrückt, wird bei den Schritten 21-25 der Prozess der Verbindung des Anrufes mit der vom Verwender spezifizierten Telefonnummer, wie dies oben beschrieben wurde, mit dem Server durchgeführt, der zwischen dem Anrufer und der gerufenen Nummer dazwischengefügt ist. Bei dem Schritt 21 antwortet der Sprach-zu-Tastenton- Umsetzserver 15 auf den hereinkommenden Anruf (was im folgenden als "erste" Leitung bezeichnet wird). Bei dem Schritt 22 wird dann der Anrufer instruiert, die Telefonnummer des automatisierten, auf den Tastenton ansprechenden Systems 19 zu liefern - von dem automatisierten System, mit welchem der Anrufer verbunden zu werden wünscht. Bei dem Schritt 23 empfängt der Server die Telefonnummer von dem Anrufer. Wie oben beschrieben wurde, kann dies beispielsweise das herkömmliche Erkennen von Sprachäußerungen umfassen, welche die Nummer spezifizieren, oder kann herkömmliche Techniken umfassen, wie beispielsweise das Empfangen der hereinkommenden Tastentöne.
- Nachdem der Sprach-zu-Tastenton-Umsetzserver 15 die Telefonnummer, die angerufen werden, soll, einmal empfangen hat, fragt er eine zweite (ausgehende) Leitung von dem Telefonnetzwerk an und wählt auf dieser die vom Anwender gelieferte Nummer des automatisierten, auf Tastenton ansprechenden Systems (Schritt 24). Und schließlich, wenn die Verbindung auf der zweiten Leitung realisiert worden ist, bewirkt der Server, daß die zwei Leitungen (das heißt die erste Leitung, die den Anrufer angeschlossen enthält, und die zweite Leitung, die das angeschlossene automatisierte System enthält) miteinander "in Konferenz" treten (das heißt diese Leitungen werden miteinander verbunden), was bei dem Schritt 25 erfolgt. Dies kann entweder intern innerhalb des Servers erreicht werden oder der Server kann das Telefonnetzwerk instruieren, die zwei Leitungen zu einer einzelnen verbundenen Leitung zusammenzuführen. In jedem Fall ist es an dieser Stelle Aufgabe des Servers, eine Sprach-zu-Tastenton-Umsetzung in Einklang mit der veranschaulichten Ausführungsform der vorliegenden Erfindung durchzuführen, wie dies in den Schritten 31-34 gezeigt ist.
- Spezifischer ausgedrückt, wird bei den Schritten 31 bis 34 eine Sprach-zu- Tastenton-Umsetzung in der erforderlichen Weise durchgeführt, bis der Server von dem Ruf durch den Anrufer abgetrennt wird (oder bis der Anruf selbst von irgendeiner Partei beendet bzw. getrennt wird), wie dies entsprechend dem Entscheidungsschritt 35 festgelegt wird. Speziell bei dem Schritt 31 wird auf ein gesprochenes Wort von dem Anwender gehört. Es sei erwähnt, daß für viele automatisierte, auf Tastenton ansprechende Systeme die einzige Sprache, die der Anrufer erzeugen muss, aus derjenigen besteht, die gemäß der vorliegenden Erfindung zum Zwecke der Erzeugung von Tastentönen erforderlich sind. Es kann somit in solch einem Fall in vorteilhafter Weise angenommen werden, daß das gesprochene Wort aus einem solchen besteht, welches irgendeine der Ziffern "0" bis "9", die Buchstaben "A" bis "Z" wiedergibt oder auch irgendeines der speziellen Zeichen, die auf herkömmlichen Tastentontelefonen gefunden werden können (das heißt "*" oder "#"). Jedoch bei Systemen, die letztendlich den Anrufer mit einer anderen Person verbinden, kann der Anrufer beispielsweise in vorteilhafter Weise mit einem Mechanismus ausgestattet sein, um den Server von dem Ruf abzutrennen, bevor der Ruf selbst getrennt wird, wodurch die Möglichkeit beseitigt wird, daß der Server in fehlerhafter Weise versucht, die DTMF-Töne im Ansprechen auf eine Konversationssprache des Anrufers zu erzeugen.
- Wenn das Wort für jede Ziffer oder Buchstaben gesprochen wird, führt der Sprach-zu-Tastenton-Umsetzserver 15 eine herkömmliche sprecher-unabhängige Spracherkennung hinsichtlich der gesprochenen Äußerung bei dem Schritt 32 durch, wodurch das gesprochene Wort als eines der Wörter identifiziert wird, welche die Ziffern "0" bis "9", die Buchstaben "A" bis "Z" oder eines der speziellen Zeichen "*" oder "#" wiedergeben. Speziell kann der Satz an Wörtern, der zur Wiedergabe der Ziffern verwendet wird, beispielsweise die Worte "eins", "zwei", "drei", "vier", "fünf", "sechs", "sieben", "acht", "neun", "null" und "oh" enthalten. In ähnlicher Weise kann der Satz der Wörter, die zum Wiedergeben des Zeichens "*" verwendet werden, die Worte "Stern" und "Sternchen" enthalten, und der Satz der Wörter, die zur Wiedergabe des Zeichens "#" verwendet werden, kann die Worte "Raute (Pound)", "Sharp" und "Number" enthalten. Darüber hinaus können auch Worte in Sprachen, die von Englisch verschieden sind, in offensichtlicher Weise entweder zusätzlich oder anstelle der vertrauten englischen Worte für die Ziffern, Buchstaben und speziellen Zeichnen vorgesehen sein oder möglich sein. Basierend auf dem oben beschriebenen Spracherkennungsprozeß wird bei dem Schritt 33 das identifizierte Wort in eine geeignete Telefontastenkategorie klassifiziert.
- Nachdem das gesprochene Wort einmal identifiziert und klassifiziert wurde, verwendet der Server einen DTMF-Signalgenerator, um ein Tastentonsignal zu erzeugen, welches der gegebenen Telefondrucktastenkategorie (Schritt 34) entspricht, wodurch die erforderliche Eingabe an das automatisierte System geliefert wird. Wenn beispielsweise das identifizierte Wort aus irgendeinem der Worte "zwei", "A", "B" oder "C" besteht, so wird das Tastentonsignal, welches der Ziffer "2" zugeordnet ist, um eine tastenton-basierte Telekommunikationssignalgebung durchzuführen, in geeigneter Weise erzeugt. (Wie den Fachleuten auf dem vorliegenden Gebiet gut bekannt ist, umfassen die DTMF-Signale oder Tastentonsignale ein Matrixkombination von zwei Frequenzen, jede aus einer Gruppe von vier, die bei dem Betrieb der Tastentontelefonsets verwendet werden, um numerische Adresseninformationen auszusenden. Spezifischer ausgedrückt, wurden die zwei Gruppen von vier Frequenzen standardisiert, und zwar auf 697 Hz, 770 Hz, 852 Hz und 941 Hz und 1209 Hz, 1336 Hz, 1477 Hz und 1633 Hz.)
- Wie oben ausgeführt wurde, liefert der Server kontinuierlich eine Sprach-zu- Tastenton-Umsetzung, wie sie benötigt wird, bis der Anrufer eine Anfrage stellt, daß der Server aus dem Anruf herausgenommen werden soll, an welcher Stelle der Server sich selbst aus der Leitung abtrennt (das heißt sowohl von der ersten Leitung als auch von der zweiten Leitung), was bei dem Schritt 36 erfolgt. (Der Server kann sich auch in vorteilhafter Weise selbst von der Leitung abtrennen, wenn der Anrufer aufhängt.) Solch eine Anfrage kann zu dem Server in einer Anzahl von möglichen Arten übertragen werden. Beispielsweise kann das Wort "abtrennen" zu dem Vokabular der Spracherkennungskapazität des Servers hinzugefügt werden und, nach dem Erkennen, daß das Wort "abtrennen" durch den Anrufer ausgesprochen worden ist, trennt sich der Server selbst von dem Anruf ab. Viele andere mögliche Mechanismen zum Beenden der Teilnahme des Servers an dem Anruf sind für Fachleute offensichtlich.
- Obwohl eine spezifische. Ausführungsform der Erfindung dargestellt und hier beschrieben wurde, sei darauf hingewiesen, daß diese Ausführungsform lediglich der Veranschaulichung von vielen möglichen spezifischen Anordnungen dient, die in der Anwendung der Prinzipien der vorliegenden Erfindung realisiert werden können. Es können zahlreiche und abgewandelte andere Anordnungen gemäß diesen Prinzipien realisiert werden, wie sie von Fachleuten vorgenommen werden können, ohne dadurch den Rahmen der Erfindung zu verlassen. Beispielsweise sind zahlreiche alternative Mechanismen dafür einsetzbar, um eine anrufende Partei mit einem automatisierten System zu verbinden, welches auf eine Tastentonsteuerung anspricht, wobei eine Sprach-zu-Tastenton-Umsetzfähigkeit dazwischen eingefügt sein kann, an welcher Stelle die Prinzipien der vorliegenden Erfindung verwendet werden können, um die gesprochenen Worte in Tastentöne für die Verwendung durch das automatisierte System umzusetzen. Ferner können einige oder auch alle der Funktionen des Sprach-zu- Tastenton-Umsetzservers 15, wie sie in der veranschaulichten Ausführungsform, die hier dargestellt wurde, beschrieben wurden, beispielsweise direkt in einen oder in mehrere Telekommunikationsnetzwerkschalter inkorporiert werden (wie beispielsweise den Schalter 13 und/oder den Schalter 17 von Fig. 1), oder diese Funktionen können innerhalb des Telekommunikationsnetzwerks durch irgendeinen anderen Mechanismus einer Anzahl von anderen möglichen Mechanismen realisiert werden, die der Fachwelt bekannt sind. Darüber hinaus kann, wie oben dargelegt wurde, der Sprach-zu-Tastenton- Umsetzserver 15 mit der Fähigkeit ausgestattet sein, um gleichzeitig eine Vielzahl von unabhängigen Telefonanrufen zu handhaben, wodurch ein allgemein verfügbarer Netzwerkdienst geschaffen wird.
Claims (9)
1. Verfahren zum Erstellen eines Telekommunikationsnetzwerk-Services, der
innerhalb eines Telekommunikationsnetzwerks ausgeführt wird und zwar für die
Verwendung mit einem automatisierten System, welches auf Dualton-
Multifrequenzsignale (DTMF; Tastentöne) anspricht, welches Verfahren die
folgenden Sehritte umfaßt:
Auffordern eines Anrufers einen ersten Ruf zu dem automatisierten System zu
initialisieren;
Initialisieren eines zweiten Rufes in dem Netzwerk zu einer Ausrüstung, um eine
Spracherkennung durchzuführen;
Überbrücken des ersten und des zweiten Rufs;
Empfangen einer Sprachäußerung mit einem gesprochenen Wort;
Durchführen einer Spracherkennung hinsichtlich der Sprachäußerung, um dadurch
das gesprochene Wort zu identifizieren;
Klassifizieren der Sprachäußerung in eine eines Satzes von Kategorien basierend
auf der Identifikation des gesprochenen Wortes, wobei jede der Kategorien ein
dieser zugeordnetes DTMF Signal aufweist;
Erzeugen des DTMF Signals, welches der Kategorie zugeordnet ist, innerhalb des
Telekommunikationsnetzwerks, innerhalb welcher Kategorie die Sprachäußerung
klassifiziert worden ist; und
Übertragen des erzeugten DTMF Signals über das Telekommunikationsnetzwerks
zu dem automatisierten System.
2. Verfahren nach Anspruch 1, bei dem der Satz der Kategorien einen Satz an Ziffern
"0" bis "91" ein Zeichen "*", und ein Zeichen "#" umfaßt, und bei dem die
zugeordneten DTMF Signale Tastentonsignale umfassen, die entsprechend den Ziffern
"0" bis "9" bzw. dem Zeichen "bzw. dem Zeichen "#" zugeordnet wurden.
3. Verfahren nach Anspruch 2, bei dem das gesprochene Wort aus einem Satz heraus
identifiziert wird, welches die Worte enthält, die die Ziffern "0" bis "9"
wiedergeben.
4 Verfahren nach Anspruch 3, bei dem die Worte, die die Ziffern "0" bis "9"
wiedergeben, die Worte "oh oder zero", bzw. "one (1)", bzw. "two (2)", bzw. "three
(3)", bzw. "four (4)", bzw. "five (5)", bzw. "six (6)", bzw. "seven (7)", bzw. "eight
(8)" bzw. "nine (9)"umfassen.
5. Verfahren nach Anspruch 2, bei dem das gesprochene Wort aus einem Satz
identifiziert wird, der die Worte enthält, die die alphabetischen Buchstaben "A" bis "Z"
wiedergeben.
6. Verfahren nach Anspruch 2, bei dem das gesprochene Wort aus einem Satz
identifiziert wird, der die Worte enthält, welche "*" und "#" wiedergeben.
7. Verfahren nach Anspruch 6, bei dem die Worte, die "*" und "#" wiedergeben, die
Worte umfassen "star (Sternchen)" und "asterisk", und die Worte "pound" und
"sharp" und "number (Nummer)" jeweils umfassen.
8. Verfahren nach Anspruch 2, bei dem das automatisierte System ein
Sprachnachrichtensystem aufweist.
9. Verfahren nach Anspruch 8, bei dem das Sprachnachrichtensystem einen
Telefonbeantworter umfaßt.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US53629695A | 1995-09-29 | 1995-09-29 | |
| PCT/US1996/015283 WO1997012361A1 (en) | 1995-09-29 | 1996-09-24 | Telephone network service for converting speech to touch-tones |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE69625793D1 DE69625793D1 (de) | 2003-02-20 |
| DE69625793T2 true DE69625793T2 (de) | 2003-10-02 |
Family
ID=24137923
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE69625793T Expired - Lifetime DE69625793T2 (de) | 1995-09-29 | 1996-09-24 | Telefonnetz-dienst zur umwandlung von sprache in wahltöne |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US6208966B1 (de) |
| EP (1) | EP0795170B1 (de) |
| JP (1) | JPH10511252A (de) |
| DE (1) | DE69625793T2 (de) |
| WO (1) | WO1997012361A1 (de) |
Families Citing this family (32)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3192107B2 (ja) * | 1997-04-25 | 2001-07-23 | 日本電気株式会社 | 音声情報提供装置及びその操作方法 |
| KR100264852B1 (ko) * | 1997-07-04 | 2000-09-01 | 윤종용 | 디지털휴대용전화기의음성인식장치및방법 |
| FI973093A7 (fi) * | 1997-07-23 | 1999-01-24 | Nokia Corp | Menetelmä telepalvelun ohjaamiseksi ja päätelaite |
| JPH1198270A (ja) * | 1997-09-19 | 1999-04-09 | Fujitsu Ltd | 通信支援装置 |
| US7406084B2 (en) * | 1997-09-19 | 2008-07-29 | Nokia Siemens Networks Gmbh & Co. Kg | Flexible software architecture for a call processing system |
| US7319957B2 (en) * | 2004-02-11 | 2008-01-15 | Tegic Communications, Inc. | Handwriting and voice input with automatic correction |
| US7712053B2 (en) | 1998-12-04 | 2010-05-04 | Tegic Communications, Inc. | Explicit character filtering of ambiguous text entry |
| US7720682B2 (en) * | 1998-12-04 | 2010-05-18 | Tegic Communications, Inc. | Method and apparatus utilizing voice input to resolve ambiguous manually entered text input |
| US7881936B2 (en) | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
| US7679534B2 (en) | 1998-12-04 | 2010-03-16 | Tegic Communications, Inc. | Contextual prediction of user words and user actions |
| US8938688B2 (en) | 1998-12-04 | 2015-01-20 | Nuance Communications, Inc. | Contextual prediction of user words and user actions |
| US6526292B1 (en) | 1999-03-26 | 2003-02-25 | Ericsson Inc. | System and method for creating a digit string for use by a portable phone |
| GB2352933A (en) * | 1999-07-31 | 2001-02-07 | Ibm | Speech encoding in a client server system |
| US6493670B1 (en) * | 1999-10-14 | 2002-12-10 | Ericsson Inc. | Method and apparatus for transmitting DTMF signals employing local speech recognition |
| US6804539B2 (en) | 1999-10-20 | 2004-10-12 | Curo Interactive Incorporated | Single action audio prompt interface utilizing binary state time domain multiple selection protocol |
| US6771982B1 (en) | 1999-10-20 | 2004-08-03 | Curo Interactive Incorporated | Single action audio prompt interface utlizing binary state time domain multiple selection protocol |
| US9232037B2 (en) | 1999-10-20 | 2016-01-05 | Curo Interactive Incorporated | Single action sensory prompt interface utilising binary state time domain selection protocol |
| US6947893B1 (en) * | 1999-11-19 | 2005-09-20 | Nippon Telegraph & Telephone Corporation | Acoustic signal transmission with insertion signal for machine control |
| AU2001251190A1 (en) † | 2000-03-31 | 2001-10-15 | Qualcomm Incorporated | Method and apparatus for alphanumeric address book conversions in a wireless personal digital assistant |
| US6366669B1 (en) | 2000-04-26 | 2002-04-02 | Iosif Meynekhdrun | System and method for providing universal access to interactive voice response systems |
| JP3542026B2 (ja) * | 2000-05-02 | 2004-07-14 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体 |
| US6868142B2 (en) | 2001-01-10 | 2005-03-15 | At&T Corp. | Voice-operated interface for DTMF-controlled systems |
| US6731724B2 (en) * | 2001-01-22 | 2004-05-04 | Pumatech, Inc. | Voice-enabled user interface for voicemail systems |
| US7110530B2 (en) | 2002-02-01 | 2006-09-19 | Iosif Meynekhdrun | System and method for providing universal access to voice response systems |
| US8239197B2 (en) * | 2002-03-28 | 2012-08-07 | Intellisist, Inc. | Efficient conversion of voice messages into text |
| CA2735329C (en) | 2002-03-28 | 2016-05-03 | Intellisist, Inc. | Closed-loop command and response system for automatic communications between interacting computer systems over an audio communications channel |
| US7054421B2 (en) * | 2002-05-31 | 2006-05-30 | International Business Machines Corporation | Enabling legacy interactive voice response units to accept multiple forms of input |
| US8583440B2 (en) * | 2002-06-20 | 2013-11-12 | Tegic Communications, Inc. | Apparatus and method for providing visual indication of character ambiguity during text entry |
| KR100467593B1 (ko) * | 2002-07-20 | 2005-01-24 | 삼성전자주식회사 | 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체 |
| US8095364B2 (en) | 2004-06-02 | 2012-01-10 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
| KR100834652B1 (ko) * | 2006-10-31 | 2008-06-02 | 삼성전자주식회사 | 신용카드 분실신고 기능을 갖는 휴대단말기 및 그에 따른방법 |
| JP2019057777A (ja) * | 2017-09-20 | 2019-04-11 | 株式会社東芝 | 自動音声応答システムの音声ガイダンス選択支援装置及びプログラム |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0041195A1 (de) * | 1980-05-30 | 1981-12-09 | General Electric Company | Rufanordnung |
| JPS5781796A (en) * | 1980-11-11 | 1982-05-21 | Nec Corp | Voice dial exchanging system |
| DE3236272A1 (de) * | 1982-09-30 | 1984-04-05 | Siemens AG, 1000 Berlin und 8000 München | Fernsprechvermittlungssystem fuer oeffentliche oder private waehlnetze mit zumindest einer zentralen waehlinformations-aufnahme/verarbeitungs-einrichtung |
| DE3425789A1 (de) * | 1984-07-13 | 1986-01-16 | Standard Elektrik Lorenz Ag, 7000 Stuttgart | Schaltungsanordnung zum anschalten einer einer fernsprechstelle zugeordneten sprachgesteuerten zusatzeinrichtung an eine fernsprechleitung |
| US4827500A (en) * | 1987-01-30 | 1989-05-02 | American Telephone And Telegraph Company, At&T Bell Laboratories | Automatic speech recognition to select among call destinations |
| US5220595A (en) * | 1989-05-17 | 1993-06-15 | Kabushiki Kaisha Toshiba | Voice-controlled apparatus using telephone and voice-control method |
| US5339358A (en) * | 1990-03-28 | 1994-08-16 | Danish International, Inc. | Telephone keypad matrix |
| US5187735A (en) * | 1990-05-01 | 1993-02-16 | Tele Guia Talking Yellow Pages, Inc. | Integrated voice-mail based voice and information processing system |
| US5402477A (en) * | 1992-07-31 | 1995-03-28 | Mcmahan; Michael L. | System and method for configuring a telephone |
| US5353336A (en) * | 1992-08-24 | 1994-10-04 | At&T Bell Laboratories | Voice directed communications system archetecture |
-
1996
- 1996-09-24 EP EP96935932A patent/EP0795170B1/de not_active Expired - Lifetime
- 1996-09-24 DE DE69625793T patent/DE69625793T2/de not_active Expired - Lifetime
- 1996-09-24 JP JP9513558A patent/JPH10511252A/ja not_active Ceased
- 1996-09-24 WO PCT/US1996/015283 patent/WO1997012361A1/en not_active Ceased
-
1997
- 1997-06-02 US US08/867,773 patent/US6208966B1/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| EP0795170A1 (de) | 1997-09-17 |
| WO1997012361A1 (en) | 1997-04-03 |
| JPH10511252A (ja) | 1998-10-27 |
| US6208966B1 (en) | 2001-03-27 |
| DE69625793D1 (de) | 2003-02-20 |
| EP0795170A4 (de) | 1999-08-11 |
| EP0795170B1 (de) | 2003-01-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69625793T2 (de) | Telefonnetz-dienst zur umwandlung von sprache in wahltöne | |
| DE69330694T2 (de) | Automatische Verarbeitung von Anrufen mit verschiedenen Kommunikationsmoden in einem Telekommunikationssystem | |
| EP0166318B1 (de) | Einrichtung zur Erkennung und Umsetzung von Wahlinformation sowie von Steuerinformation für Leistungsmerkmale einer Fernsprechvermittlungsanlage | |
| DE69129883T2 (de) | Rufnummerwahl mit Spracherkennung | |
| DE69731907T2 (de) | Sprachpost über Internet | |
| DE69839068T2 (de) | System und Verfahren zur automatischen Verarbeitung von Anruf und Datenübertragung | |
| DE4406354A1 (de) | Schaltungsanordnung zur Integration von EDV-Systemen bei der Benutzung von Telefonanlagen | |
| DE69831536T2 (de) | Verfahren zur Steuerung eines Telekommunikationsdienst und eines Endgerät | |
| EP0168039B1 (de) | Schaltungsanordnung zum Anschalten einer einer Fernsprechstelle zugeordneten sprachgesteuerten Zusatzeinrichtung an eine Fernsprechleitung | |
| EP0929200A2 (de) | Verfahren und Vorrichtung zur Bereitstellung einer Durchwahlfunktion bei Telekommunikationsanlagen | |
| DE10147549A1 (de) | Vermittlungsverfahren zwischen Dialogsystemen | |
| EP0920238B1 (de) | Verfahren zur Übermittlung einer Teilnehmernummer eines gewünschten Teilnehmers, sowie Telefonauskunftseinrichtung und Endgerät hierfür | |
| EP1016312B1 (de) | Verfahren und anordnung für eine automatische übersetzung von nachrichten in einem kommunikationssystem | |
| DE60304939T2 (de) | Anruferidentifizierung basiert auf Spracherkennung | |
| DE19744965A1 (de) | Verfahren zum telefonischen Anfordern von Dienstleistungen | |
| EP1232657B1 (de) | Verfahren zum erzeugen eines wählverzeichnisses in einem netzwerkendgerät und kommunikationsnetzwerk für ein solches verfahren | |
| WO1999013663A1 (de) | Dezentrale ausführung von funktionen/diensten eines mobilfunksystems | |
| DE3328059C2 (de) | Verfahren zur empfangsseitigen Auswahl von über eine Vermittlungsstelle einer Fernmelde- bzw. Fernsprechanlage laufende Daten- bzw. Sprechverbindungen | |
| DE4228997C2 (de) | Verfahren zur Herstellung von Fernsprechverbindungen in einem Fernsprechvermittlungssystem | |
| EP0339467B1 (de) | Verfahren und Vorrichtung zur Bildung elektronischer, aus Sprach- und Nichtsprachbestandteilen bestehender Kommunikationsdienstnachrichten | |
| EP1404091B1 (de) | Verfahren und Vorrichtung zur Steuerung und/oder Überwachung einer MULAP-Leitung | |
| WO1995005046A1 (de) | Verfahren zur fernbedienung von anrufbeantwortern | |
| DE19729126C1 (de) | Verfahren zur Signalisierung von Diensten in Telefonnetzen mit analogen Teilnehmeranschlüssen | |
| EP0765100A2 (de) | Schnittstelleneinrichtung zur Verbindung eines Computers mit dem ISDN-Netz | |
| DE10138151A1 (de) | Telefonkonferenzsystem und Verfahren zum Authentifizieren eines Teilnehmers einer Telefonkonferenz |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 8364 | No opposition during term of opposition |