[go: up one dir, main page]

DE69625793T2 - Telefonnetz-dienst zur umwandlung von sprache in wahltöne - Google Patents

Telefonnetz-dienst zur umwandlung von sprache in wahltöne

Info

Publication number
DE69625793T2
DE69625793T2 DE69625793T DE69625793T DE69625793T2 DE 69625793 T2 DE69625793 T2 DE 69625793T2 DE 69625793 T DE69625793 T DE 69625793T DE 69625793 T DE69625793 T DE 69625793T DE 69625793 T2 DE69625793 T2 DE 69625793T2
Authority
DE
Germany
Prior art keywords
telephone
words
tone
spoken word
touch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69625793T
Other languages
English (en)
Other versions
DE69625793D1 (de
Inventor
Frederick Bulfer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of DE69625793D1 publication Critical patent/DE69625793D1/de
Application granted granted Critical
Publication of DE69625793T2 publication Critical patent/DE69625793T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42204Arrangements at the exchange for service or number selection by voice
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/30Signalling arrangements; Manipulation of signalling currents
    • H04Q1/44Signalling arrangements; Manipulation of signalling currents using alternate current
    • H04Q1/444Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
    • H04Q1/45Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies using multi-frequency signalling

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Telephonic Communication Services (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Saccharide Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Description

  • Die vorliegende Erfindung betrifft ein Verfahren zum Erstellen eines Telekommunikationsnetzwerkservices, der innerhalb eines Telekommunikationsnetzwerks ausgeführt wird, und zwar für die Verwendung mit einem automatisierten System, welches auf Dualton-Vielfachfrequenzsignale (DTMF) (Tastentöne) anspricht, nach dem Anspruch 1.
  • Stand der Technik und Hintergrund der Erfindung
  • Aus der US-A-4,837,808 ist eine Schaltungsanordnung bekannt, um eine zusätzliche sprachgesteuerte Anlage, die einer Telefonstation zugeordnet ist, an eine Telefonleitung anzuschließen. Gemäß diesem bekannten System wird eine Telefonstation mit einer sprachgesteuerten zusätzlichen Anlage verbunden. Die zusätzliche Anlage führt einen sprachgesteuerten Telefonwählvorgang und/oder sprachgesteuerte Operation eines Videotextterminals durch. Diese ist durch eine Verbindungseinheit implementiert, welche in die Telefonleitung eingefügt ist. Die Verbindungseinheit arbeitet mit einem Fernsprechamt oder -zentrale zusammen, um die Möglichkeit zu schaffen, Anrufe in einer bekannten Weise mit Hilfe eines Tastenfeldes an der Telefonstation zu initialisieren. Irgendein Typ einer Telefonstation kann an die sprachgesteuerte zusätzliche Anlage angeschlossen werden.
  • Aus der US-A-5,402,477 ist ein Verfahren und ein System zum Konfigurieren eines Telefons bekannt. Eine Verbindung wird zwischen einem Telefon und einer Telefonumgebung hergestellt. Eine Liste von Dienstleistungen, die über die Telefonumgebung angeboten werden können, wird generiert. Eine Liste von Kandidatenprozeduren zur Herstellung jeder aufgelisteten Dienstleistung über die Telefonumgebung wird erzeugt. Wenigstens eine der aufgelisteten Prozeduren wird für jede aufgelistete Dienstleistung ausgeführt, um zu bestimmen, ob die aufgelistete Dienstleistung durch den Anschluß unterstützt wird.
  • Die US-A-5,220,595 offenbart eine sprachgesteuerte Vorrichtung, die einen Empfangs-/Diskriminiermechanismus enthält, um ein DTMF-Signal zu empfangen, welches extern über eine Telefonleitung eingespeist wird und um das DTMF-Signal zu diskriminieren, enthält einen Pegel-Detektormechanismus zum Detektieren eines Signalpegels des DTMF-Signals, welches in den Empfangs-/Diskriminiermechanismus eingespeist wurde, eine Spracherkennungseinrichtung zum Erkennen des Inhaltes eines Sprachsignals, welches extern über die Telefonleitung eingespeist wurde, und eine Eingangspegeleinstellvorrichtung zum Einstellen eines Signalpegels des Sprachsignals, welches in die Spracherkennungseinrichtung eingespeist wird, auf der Grundlage des Signalpegeldetektionsergebnisses durch den Pegel-Detektionsmechanismus, und enthält eine. Funktionsausführeinrichtung zum Ausführen einer Funktion entsprechend dem Inhalt des Sprachsignals, welches durch die Spracherkennungseinrichtung erkannt worden ist.
  • In den letzten Jahren hat die Telekommunikationsindustrie ein explosionsartiges Wachstum bei der Verwendung von DTMF-(das heißt Tastenton)-gesteuerten Systemen erfahren. Diese Systeme wurden in typischer Weise entweder für den Zweck verwendet, uni eine zusätzliche Anwenderbequemlichkeit oder Annehmlichkeit zu schaffen, oder zu dem Zwecke, eine Zugriffsmöglichkeit auf Informationen zu schaffen, oder um den Bedarf an menschlichen Telefonoperatoren zu reduzieren oder zu beseitigen. Beispielsweise kann auf Sprachnachrichtsysteme häufig durch Verwendung der Tastentöne zugegriffen werden, um einem Anrufer die Möglichkeit zu schaffen, seine oder ihre Nachrichten aufzurufen oder um abgehende Grußnachrichten aufzuzeichnen oder um andere administrative Aufgaben durchzuführen. Selbst Heimtelefonbeantworter liefern nunmehr einen Fernzugriff von irgendeinem Telefon aus, und zwar über die Tastentonsteuerung. Zusätzlich bieten viele Teilnehmer-Service-Telefonnummern tastenton-gesteuerte Menüs für den Anrufer, wobei so ein Menü dazu verwendet werden kann, um effizient eine Verbindung zu einer geeigneten Person oder einer Gesellschaft herzustellen. Darüber hinaus werden Tastentöne häufig dazu verwendet, um viele andere automatisierte Systeme zu steuern, wie beispielsweise automatisierte Banking- Transaktionen und Börsenkursdienste. Diese Dienste ermöglichen es häufig einem Anrufer, eine gesamte Transaktion durchzuführen, ohne daß dabei ein menschlicher Teilnehmer auf der anderen Seite des Rufes mit involviert ist.
  • Obwohl der Anteil an Telefonen, die keine Tastentonfähigkeit haben (das heißt Dreh- oder Wählimuulstelefone) klein ist und in den Vereinigten Staaten abnimmt, gibt es dennoch eine wesentliche Anzahl solcher Telefone, speziell außerhalb von den Vereinigten Staaten darüber hinaus bieten viele moderne Tastentontelefone - die beispielsweise meistens schnurlose und zellulare Telefone umfassen - ein Tastenfeld in dem Handapparat, wodurch es für den Anwender extrem mühsam wird, die erforderlichen Steuersignale für solch ein automatisiertes auf Tastentöne basierendes System zu erzeugen, und zwar unter Fortsetzung des Anhörens der Antworten von dem System. Somit involviert die Verwendung dieser automatisierten Systeme mit typischen schnurlosen oder zellularen Telefonen häufig ein Vorwärts- und Rückwärtsbewegen des Handapparats, was sehr unangenehm werden kann. Zusätzlich würden es viele Telefonverwender, selbst diejenigen, die mit den oben erläuterten Einschränkungen nicht konfrontiert sind, es angenehmer empfinden, wenn sie lediglich einen Befehl sprechen könnten anstatt eine geeignete Taste zu lokalisieren und dann mit seinen Fingern niederzudrücken.
  • Mittlerweile ist die Spracherkennungstechnologie während der letzten paar Jahre entscheidend vorangekommen. Es ist nunmehr technologisch ohne weiteres möglich, eine sprecher-unabhängige Spracherkennung zu realisieren (das heißt die Erkennung der Sprache von irgendeinem Sprecher, welcher früher dem System unbekannt war), und zwar anhand von einzelnen Worten, die aus einem beschränkten Vokabular ausgewählt sind. In der Tat liefern einige der zuvor erläuterten automatisierten Systeme solche eine Spracherkennungsfähigkeit, so daß der Bedarf dafür, daß der Anwender Berührungstontasten drückt, beseitigt wird. Andererseits kann es noch eine Weile dauern, bevor der Hauptteil dieser Systeme mit einer Spracherkennungsfähigkeit ausgestattet ist, um deren gegenwärtigen Tastentonsteuermechanismus zu ersetzen (oder zu unterstützen), da beispielsweise die Investition, die für das Hinzufügen der Spracherkennungsfähigkeit zu solch einem System erforderlich ist, auf der Grundlage eines einzelnen individuellen Systems alleine nicht gerechtfertigt ist.
  • Es wäre daher vorteilhaft, eine verallgemeinerte Fähigkeit zu schaffen, die es einem Anwender eines Telefons ermöglicht, ein Wort zu sprechen, welches eine Ziffer (oder einen Buchstaben) bzw. die entsprechende Tast wiedergibt, wie z. B. die "*"-Taste (z.B. das Wort "Stern") oder die "#"-Taste (z. B. das Wort "Pound") mit der Maßgabe, daß das entsprechende DTMF-Signal (das heißt der Tastenton) automatisch erzeugt wird, um dadurch die erforderliche Eingabe in ein beliebiges tastenton-gesteuertes System vorzusehen. Das US-Patent Nr. 5,402,477, ausgegeben an Michael L. McMahan und Michele B. Gammel am 28. März 1995, offenbart ein Telefonset, welches unter anderem die Fähigkeit besitzt, Tastentonsignale im Ansprechen auf eine Ziffer, das Wort "Stern" oder das Wort "Pound" zu erzeugen, die durch den Anwender in den Handapparat eingesprochen werden. Um diese Fähigkeit jedoch ausnützen oder einsetzen zu können, ist es in offensichtlicher Weise erforderlich, daß dieses spezielle spezialisierte Telefonterminalequipment, welches darin offenbart ist, für den Anwender verfügbar ist. Insofern liefert der Vorschlag des US-Patents Nr. 5,402,477 eindeutig keine Lösung des Problems, welches oben beschrieben ist und hier angesprochen wird - nämlich, daß viele Telefonanrufe momentan in der Tat entweder mit Hilfe von Dreh- oder Impulstyptelefonen abgesetzt werden oder mit Hilfe von Tastentelefonen, deren Tastenfelder in dem Handapparat gelegen sind, und dies auch für eine vorhersehbare Zukunft so ausgestattet bleiben.
  • Zusammenfassung der Erfindung
  • Es ist Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren zum Liefern eines Telekommunikationsnetzwerkdienstes zu schaffen, der innerhalb eines Telekommunikationsnetzwerks ausgeführt wird, und zwar für einen Anwender, und mit Hilfe eines automatisierten Systems, welches auf Dualton-Vielfachfrequenzsignale (DTMF) (Tastentöne) anspricht.
  • Gemäß der vorliegenden Erfindung wird diese Aufgabe durch die im Anspruch 1 an gegebenen Verfahrensschritte gelöst.
  • Vorteilhafte Ausführungsformen des erfindungsgemäßen Verfahrens ergeben sich aus den Unteransprüchen 2 bis 9.
  • Gemäß einem veranschaulichenden Ausführungsbeispiel der Erfindung spricht ein Telefonanwender eine Äußerung mit einem Wort, welches eine Ziffer, einen Buchstaben, die "*"-Taste (z. B. das Wort "Stern") oder die "#"-Taste (z. B. das Wort "Pound" (Raute)) enthält. Der veranschaulichende Netzwerkdienst führt eine herkömmliche, sprecher-unabhängige Spracherkennung an der Äußerung durch, um das gesprochene Wort zu identifizieren, und erzeugt dann das Tastentonsignal, welches dem gesprochenen Wort entspricht, welches so identifiziert wurde (z. B. eine Ziffer, ein Buchstabe oder ein spezielles Zeichen, welches auf einem herkömmlichen Tastentelefon gefunden werden kann). Dieses erzeugte DTMF-Signal wird dann zu einem automatisierten System, wie beispielsweise einem Sprachnachrichtensystem oder Telefonbeantworter, gesendet, um den Betrieb desselben zu steuern. Der Netzwerkdienst nach der vorliegenden Erfindung kann in vorteilhafter Weise dann verwendet werden, wenn das von dem Anrufer verwendete Telefon aus einem Dreh- oder Wählimpulstelefon besteht oder auch bei anderen Umständen, bei denen es vorteilhaft ist zu sprechen, anstatt Tasten eines Telefontastenfeldes zu drücken.
  • Kurze Beschreibung der Zeichnungen
  • Fig. 1 zeigt ein veranschaulichendes Telekommunikationsnetzwerk, in welchem ein Sprach-zu-Tastenton-Umsetznetzwerkdienst gemäß einer veranschaulichenden Ausführungsform der vorliegenden Erfindung realisiert wurde;
  • Fig. 2 zeigt ein Flußdiagramm, welches den Betrieb des veranschaulichenden Sprach- zu-Tastenton-Umsetzservers von Fig. 1 gemäß einer veranschaulichenden Ausführungsform der vorliegenden Erfindung beschreibt.
  • Detaillierte Beschreibung
  • Fig. 1 zeigt ein veranschaulichendes Telekommunikationsnetzwerk, in welchem ein Sprach-zu-Tastenton-Umsetznetzwerkdienst gemäß einer veranschaulichenden Ausführungsform der vorliegenden Erfindung eingebaut wurde. Ein Anrufer verwendet das Telefon 11 in einer herkömmlichen Weise, um einen Telefonanruf gemäß einer bestimmten Telefonnummer abzusetzen, die dem Sprach-zu-Tastenton-Umsetzserver 15 zugeordnet ist. Das Telefon 11 kann irgendein Typ eines herkömmlichen Telefons sein, obwohl die Verwendung der vorliegenden Erfindung als speziell vorteilhaft dann anzusehen ist, wenn das Telefon 11 aus einem Dreh- oder Wählimpulstelefon besteht oder wenn alternativ ein Tastentontelefon, wie beispielsweise ein schnurloses oder Zellentelefon, verwendet wird, wobei das Tastenton-Tastenfeld in dem Handapparat gelegen ist. Im Ansprechen auf das Absetzen des Rufes durch das Telefon 11 verbindet ein Telekommunikationsnetzwerkschalter 13 das Telefon 11 mit dem Sprach-zu- Tastenton-Umsetzserver 16. Der Telekommunikationsnetzwerkschalter 13 kann aus einem herkömmlichen Fernsprech- oder Orts-Fernsprechamt- Telekommunikationsschalter bestehen, wie dieser Fachleuten auf dem vorliegenden Gebiet vertraut ist.
  • Wenn der Ruf zwischen dem Telefon 11 und dem Sprach-zu-Tastenton- Umsetzserver 15 einmal hergestellt worden ist, fragt der Server an, daß der Anwender die Telefonnummer eines automatisierten Systems liefern soll, welches auf Tastentonsteuerung anspricht, wie beispielsweise ein Sprach-Mail-System, ein Telefonbeantworter oder ein automatisierter Transaktionsservice, wie beispielsweise ein Banking- oder ein Börsenkursservice. Die angefragte Telefonnummer kann in einer herkömmlichen Weise (z. B. durch Wählen) geliefert werden, oder kann oral durch den Anrufer geliefert werden. In dem letzteren Fall kann eine herkömmliche Spracherkennungstechnik dafür eingesetzt werden, um die Sequenz der Ziffern zu bestimmen, welche die Telefonnummer des gewünschten automatisierten Systems ausmachen. Bei der veranschaulichten Ausführungsform von Fig. 1 besteht die anwender-spezifizierte Telefonnummer aus derjenigen des automatisierten Tastentonansprechsystems 19.
  • Wenn der Server einmal mit der Telefonnummer versehen worden ist, mit welcher der Anrufer verbunden werden will, kann er irgendeine einer Anzahl von herkömmlichen Techniken verwenden, die der Fachwelt gut bekannt sind, um eine Verbindung zwischen dem Anrufer und dem automatisierten Tastentonansprechsystem 19 zu bewirken, wobei der Server selbst dazwischen eingefügt ist. Bei der veranschaulichten Ausführungsform von Fig. 1 wird beispielsweise solch eine Verbindung auf dem Weg des Telekommunikationsnetzwerkschalters 17 erstellt, der ähnlich wie der Telekommunikationsnetzwerkschalter 13 aus einem herkömmlichen Fernsprech- oder Orts-Amt-Telekommunikationsschalter bestehen kann. (Es sei darauf hingewiesen, daß der Netzwerkschalter 17 in der Tat aus irgendeinem Schalter, wie beispielsweise dem Netzwerkschalter 13 bestehen kann.)
  • Bei einer Ausführungsform kann die Funktionalität des Sprach-zu-Tastenton- Umsetzservers 15 durch die Verwendung eines PBX-(private Anschlußvermittlung)- System gebildet sein, welches direkt an den Netzwerkschalter 17 angeschlossen ist. Diese Verbindung zwischen dem PBX-System und dem Netzwerkschalter kann beispielsweise einen Satz von T1 Strangleitungen umfassen, wie sie den Fachleuten bekannt sind, und kann eine herkömmliche digitale Signalgabetechnik verwenden, um eine Kommunikation dazwischen herzustellen. Speziell kann der Sprach-zu-Tastenton- Umsetzserver 15 an die Leitungsseite des zuvor erwähnten PBX-Systems angeschlossen werden, und zwar so als ob es sich um ein oder um mehrere Telefonsets handeln würde (es sei erwähnt, daß der Sprach-zu-Tastenton-Umsetzserver 15 im allgemeinen eine Vielzahl an Ports aufweisen kann, so daß dessen gleichzeitige Verwendung durch eine Anzahl von individuellen Anrufen ermöglicht wird, wobei jeder Anrufer mit einem individuellen zugeordneten automatisierten, auf Tastenton ansprechendes System kommuniziert).
  • Bei der Verwendung kann der Anruf von dem Telefon 11 zu dem Server 15 über das zuvor erwähnte PBX-System aufgebaut werden. Auf diese Weise wird der Anrufer mit einer ersten Leitung des Servers verbunden. Dann fragt, wie oben beschrieben wurde, der Sprach-zu-Tastenton-Umsetzserver 15 bei dem Anrufer die Telefonnummer ab, und zwar die Telefonnummer für das automatisierte, auf Tastenton ansprechende System 19. Wenn der Server diese Nummer einmal empfangen hat, greift er auf eine zweite Leitung (auf das PBX-System) zu und fragt an, daß das PBX-System einen Anruf zu dem automatisierten System vornehmen bzw. wählen soll, so daß der Server mit diesem verbunden wird. Der Server instruiert dann das PBX-System darüber, die erste Leitung und die zweite Leitung zur Konferenz zusammenzuführen, woraus dann resultiert, daß der Anrufer mit dem automatisierten System verbunden wird, wobei der Server dazwischen eingefügt ist. An dieser Stelle ist es Aufgabe des Servers, eine Sprach-zu-Tastenton-Umsetzung in Einklang mit einem veranschaulichten Ausführungsbeispiel der vorliegenden Erfindung durchzuführen, wie weiter unten beschrieben wird.
  • Fig. 2 zeigt ein Flußdiagramm, welches den Betrieb des veranschaulichten Sprach-zu-Tastenton-Umsetzservers von Fig. 1 in Einklang mit einer veranschaulichten Ausführungsform der vorliegenden Erfindung beschreibt. Spezifischer ausgedrückt, wird bei den Schritten 21-25 der Prozess der Verbindung des Anrufes mit der vom Verwender spezifizierten Telefonnummer, wie dies oben beschrieben wurde, mit dem Server durchgeführt, der zwischen dem Anrufer und der gerufenen Nummer dazwischengefügt ist. Bei dem Schritt 21 antwortet der Sprach-zu-Tastenton- Umsetzserver 15 auf den hereinkommenden Anruf (was im folgenden als "erste" Leitung bezeichnet wird). Bei dem Schritt 22 wird dann der Anrufer instruiert, die Telefonnummer des automatisierten, auf den Tastenton ansprechenden Systems 19 zu liefern - von dem automatisierten System, mit welchem der Anrufer verbunden zu werden wünscht. Bei dem Schritt 23 empfängt der Server die Telefonnummer von dem Anrufer. Wie oben beschrieben wurde, kann dies beispielsweise das herkömmliche Erkennen von Sprachäußerungen umfassen, welche die Nummer spezifizieren, oder kann herkömmliche Techniken umfassen, wie beispielsweise das Empfangen der hereinkommenden Tastentöne.
  • Nachdem der Sprach-zu-Tastenton-Umsetzserver 15 die Telefonnummer, die angerufen werden, soll, einmal empfangen hat, fragt er eine zweite (ausgehende) Leitung von dem Telefonnetzwerk an und wählt auf dieser die vom Anwender gelieferte Nummer des automatisierten, auf Tastenton ansprechenden Systems (Schritt 24). Und schließlich, wenn die Verbindung auf der zweiten Leitung realisiert worden ist, bewirkt der Server, daß die zwei Leitungen (das heißt die erste Leitung, die den Anrufer angeschlossen enthält, und die zweite Leitung, die das angeschlossene automatisierte System enthält) miteinander "in Konferenz" treten (das heißt diese Leitungen werden miteinander verbunden), was bei dem Schritt 25 erfolgt. Dies kann entweder intern innerhalb des Servers erreicht werden oder der Server kann das Telefonnetzwerk instruieren, die zwei Leitungen zu einer einzelnen verbundenen Leitung zusammenzuführen. In jedem Fall ist es an dieser Stelle Aufgabe des Servers, eine Sprach-zu-Tastenton-Umsetzung in Einklang mit der veranschaulichten Ausführungsform der vorliegenden Erfindung durchzuführen, wie dies in den Schritten 31-34 gezeigt ist.
  • Spezifischer ausgedrückt, wird bei den Schritten 31 bis 34 eine Sprach-zu- Tastenton-Umsetzung in der erforderlichen Weise durchgeführt, bis der Server von dem Ruf durch den Anrufer abgetrennt wird (oder bis der Anruf selbst von irgendeiner Partei beendet bzw. getrennt wird), wie dies entsprechend dem Entscheidungsschritt 35 festgelegt wird. Speziell bei dem Schritt 31 wird auf ein gesprochenes Wort von dem Anwender gehört. Es sei erwähnt, daß für viele automatisierte, auf Tastenton ansprechende Systeme die einzige Sprache, die der Anrufer erzeugen muss, aus derjenigen besteht, die gemäß der vorliegenden Erfindung zum Zwecke der Erzeugung von Tastentönen erforderlich sind. Es kann somit in solch einem Fall in vorteilhafter Weise angenommen werden, daß das gesprochene Wort aus einem solchen besteht, welches irgendeine der Ziffern "0" bis "9", die Buchstaben "A" bis "Z" wiedergibt oder auch irgendeines der speziellen Zeichen, die auf herkömmlichen Tastentontelefonen gefunden werden können (das heißt "*" oder "#"). Jedoch bei Systemen, die letztendlich den Anrufer mit einer anderen Person verbinden, kann der Anrufer beispielsweise in vorteilhafter Weise mit einem Mechanismus ausgestattet sein, um den Server von dem Ruf abzutrennen, bevor der Ruf selbst getrennt wird, wodurch die Möglichkeit beseitigt wird, daß der Server in fehlerhafter Weise versucht, die DTMF-Töne im Ansprechen auf eine Konversationssprache des Anrufers zu erzeugen.
  • Wenn das Wort für jede Ziffer oder Buchstaben gesprochen wird, führt der Sprach-zu-Tastenton-Umsetzserver 15 eine herkömmliche sprecher-unabhängige Spracherkennung hinsichtlich der gesprochenen Äußerung bei dem Schritt 32 durch, wodurch das gesprochene Wort als eines der Wörter identifiziert wird, welche die Ziffern "0" bis "9", die Buchstaben "A" bis "Z" oder eines der speziellen Zeichen "*" oder "#" wiedergeben. Speziell kann der Satz an Wörtern, der zur Wiedergabe der Ziffern verwendet wird, beispielsweise die Worte "eins", "zwei", "drei", "vier", "fünf", "sechs", "sieben", "acht", "neun", "null" und "oh" enthalten. In ähnlicher Weise kann der Satz der Wörter, die zum Wiedergeben des Zeichens "*" verwendet werden, die Worte "Stern" und "Sternchen" enthalten, und der Satz der Wörter, die zur Wiedergabe des Zeichens "#" verwendet werden, kann die Worte "Raute (Pound)", "Sharp" und "Number" enthalten. Darüber hinaus können auch Worte in Sprachen, die von Englisch verschieden sind, in offensichtlicher Weise entweder zusätzlich oder anstelle der vertrauten englischen Worte für die Ziffern, Buchstaben und speziellen Zeichnen vorgesehen sein oder möglich sein. Basierend auf dem oben beschriebenen Spracherkennungsprozeß wird bei dem Schritt 33 das identifizierte Wort in eine geeignete Telefontastenkategorie klassifiziert.
  • Nachdem das gesprochene Wort einmal identifiziert und klassifiziert wurde, verwendet der Server einen DTMF-Signalgenerator, um ein Tastentonsignal zu erzeugen, welches der gegebenen Telefondrucktastenkategorie (Schritt 34) entspricht, wodurch die erforderliche Eingabe an das automatisierte System geliefert wird. Wenn beispielsweise das identifizierte Wort aus irgendeinem der Worte "zwei", "A", "B" oder "C" besteht, so wird das Tastentonsignal, welches der Ziffer "2" zugeordnet ist, um eine tastenton-basierte Telekommunikationssignalgebung durchzuführen, in geeigneter Weise erzeugt. (Wie den Fachleuten auf dem vorliegenden Gebiet gut bekannt ist, umfassen die DTMF-Signale oder Tastentonsignale ein Matrixkombination von zwei Frequenzen, jede aus einer Gruppe von vier, die bei dem Betrieb der Tastentontelefonsets verwendet werden, um numerische Adresseninformationen auszusenden. Spezifischer ausgedrückt, wurden die zwei Gruppen von vier Frequenzen standardisiert, und zwar auf 697 Hz, 770 Hz, 852 Hz und 941 Hz und 1209 Hz, 1336 Hz, 1477 Hz und 1633 Hz.)
  • Wie oben ausgeführt wurde, liefert der Server kontinuierlich eine Sprach-zu- Tastenton-Umsetzung, wie sie benötigt wird, bis der Anrufer eine Anfrage stellt, daß der Server aus dem Anruf herausgenommen werden soll, an welcher Stelle der Server sich selbst aus der Leitung abtrennt (das heißt sowohl von der ersten Leitung als auch von der zweiten Leitung), was bei dem Schritt 36 erfolgt. (Der Server kann sich auch in vorteilhafter Weise selbst von der Leitung abtrennen, wenn der Anrufer aufhängt.) Solch eine Anfrage kann zu dem Server in einer Anzahl von möglichen Arten übertragen werden. Beispielsweise kann das Wort "abtrennen" zu dem Vokabular der Spracherkennungskapazität des Servers hinzugefügt werden und, nach dem Erkennen, daß das Wort "abtrennen" durch den Anrufer ausgesprochen worden ist, trennt sich der Server selbst von dem Anruf ab. Viele andere mögliche Mechanismen zum Beenden der Teilnahme des Servers an dem Anruf sind für Fachleute offensichtlich.
  • Obwohl eine spezifische. Ausführungsform der Erfindung dargestellt und hier beschrieben wurde, sei darauf hingewiesen, daß diese Ausführungsform lediglich der Veranschaulichung von vielen möglichen spezifischen Anordnungen dient, die in der Anwendung der Prinzipien der vorliegenden Erfindung realisiert werden können. Es können zahlreiche und abgewandelte andere Anordnungen gemäß diesen Prinzipien realisiert werden, wie sie von Fachleuten vorgenommen werden können, ohne dadurch den Rahmen der Erfindung zu verlassen. Beispielsweise sind zahlreiche alternative Mechanismen dafür einsetzbar, um eine anrufende Partei mit einem automatisierten System zu verbinden, welches auf eine Tastentonsteuerung anspricht, wobei eine Sprach-zu-Tastenton-Umsetzfähigkeit dazwischen eingefügt sein kann, an welcher Stelle die Prinzipien der vorliegenden Erfindung verwendet werden können, um die gesprochenen Worte in Tastentöne für die Verwendung durch das automatisierte System umzusetzen. Ferner können einige oder auch alle der Funktionen des Sprach-zu- Tastenton-Umsetzservers 15, wie sie in der veranschaulichten Ausführungsform, die hier dargestellt wurde, beschrieben wurden, beispielsweise direkt in einen oder in mehrere Telekommunikationsnetzwerkschalter inkorporiert werden (wie beispielsweise den Schalter 13 und/oder den Schalter 17 von Fig. 1), oder diese Funktionen können innerhalb des Telekommunikationsnetzwerks durch irgendeinen anderen Mechanismus einer Anzahl von anderen möglichen Mechanismen realisiert werden, die der Fachwelt bekannt sind. Darüber hinaus kann, wie oben dargelegt wurde, der Sprach-zu-Tastenton- Umsetzserver 15 mit der Fähigkeit ausgestattet sein, um gleichzeitig eine Vielzahl von unabhängigen Telefonanrufen zu handhaben, wodurch ein allgemein verfügbarer Netzwerkdienst geschaffen wird.

Claims (9)

1. Verfahren zum Erstellen eines Telekommunikationsnetzwerk-Services, der innerhalb eines Telekommunikationsnetzwerks ausgeführt wird und zwar für die Verwendung mit einem automatisierten System, welches auf Dualton- Multifrequenzsignale (DTMF; Tastentöne) anspricht, welches Verfahren die folgenden Sehritte umfaßt:
Auffordern eines Anrufers einen ersten Ruf zu dem automatisierten System zu initialisieren;
Initialisieren eines zweiten Rufes in dem Netzwerk zu einer Ausrüstung, um eine Spracherkennung durchzuführen;
Überbrücken des ersten und des zweiten Rufs;
Empfangen einer Sprachäußerung mit einem gesprochenen Wort;
Durchführen einer Spracherkennung hinsichtlich der Sprachäußerung, um dadurch das gesprochene Wort zu identifizieren;
Klassifizieren der Sprachäußerung in eine eines Satzes von Kategorien basierend auf der Identifikation des gesprochenen Wortes, wobei jede der Kategorien ein dieser zugeordnetes DTMF Signal aufweist;
Erzeugen des DTMF Signals, welches der Kategorie zugeordnet ist, innerhalb des Telekommunikationsnetzwerks, innerhalb welcher Kategorie die Sprachäußerung klassifiziert worden ist; und
Übertragen des erzeugten DTMF Signals über das Telekommunikationsnetzwerks zu dem automatisierten System.
2. Verfahren nach Anspruch 1, bei dem der Satz der Kategorien einen Satz an Ziffern "0" bis "91" ein Zeichen "*", und ein Zeichen "#" umfaßt, und bei dem die zugeordneten DTMF Signale Tastentonsignale umfassen, die entsprechend den Ziffern "0" bis "9" bzw. dem Zeichen "bzw. dem Zeichen "#" zugeordnet wurden.
3. Verfahren nach Anspruch 2, bei dem das gesprochene Wort aus einem Satz heraus identifiziert wird, welches die Worte enthält, die die Ziffern "0" bis "9" wiedergeben.
4 Verfahren nach Anspruch 3, bei dem die Worte, die die Ziffern "0" bis "9" wiedergeben, die Worte "oh oder zero", bzw. "one (1)", bzw. "two (2)", bzw. "three (3)", bzw. "four (4)", bzw. "five (5)", bzw. "six (6)", bzw. "seven (7)", bzw. "eight (8)" bzw. "nine (9)"umfassen.
5. Verfahren nach Anspruch 2, bei dem das gesprochene Wort aus einem Satz identifiziert wird, der die Worte enthält, die die alphabetischen Buchstaben "A" bis "Z" wiedergeben.
6. Verfahren nach Anspruch 2, bei dem das gesprochene Wort aus einem Satz identifiziert wird, der die Worte enthält, welche "*" und "#" wiedergeben.
7. Verfahren nach Anspruch 6, bei dem die Worte, die "*" und "#" wiedergeben, die Worte umfassen "star (Sternchen)" und "asterisk", und die Worte "pound" und "sharp" und "number (Nummer)" jeweils umfassen.
8. Verfahren nach Anspruch 2, bei dem das automatisierte System ein Sprachnachrichtensystem aufweist.
9. Verfahren nach Anspruch 8, bei dem das Sprachnachrichtensystem einen Telefonbeantworter umfaßt.
DE69625793T 1995-09-29 1996-09-24 Telefonnetz-dienst zur umwandlung von sprache in wahltöne Expired - Lifetime DE69625793T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US53629695A 1995-09-29 1995-09-29
PCT/US1996/015283 WO1997012361A1 (en) 1995-09-29 1996-09-24 Telephone network service for converting speech to touch-tones

Publications (2)

Publication Number Publication Date
DE69625793D1 DE69625793D1 (de) 2003-02-20
DE69625793T2 true DE69625793T2 (de) 2003-10-02

Family

ID=24137923

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69625793T Expired - Lifetime DE69625793T2 (de) 1995-09-29 1996-09-24 Telefonnetz-dienst zur umwandlung von sprache in wahltöne

Country Status (5)

Country Link
US (1) US6208966B1 (de)
EP (1) EP0795170B1 (de)
JP (1) JPH10511252A (de)
DE (1) DE69625793T2 (de)
WO (1) WO1997012361A1 (de)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3192107B2 (ja) * 1997-04-25 2001-07-23 日本電気株式会社 音声情報提供装置及びその操作方法
KR100264852B1 (ko) * 1997-07-04 2000-09-01 윤종용 디지털휴대용전화기의음성인식장치및방법
FI973093A7 (fi) * 1997-07-23 1999-01-24 Nokia Corp Menetelmä telepalvelun ohjaamiseksi ja päätelaite
JPH1198270A (ja) * 1997-09-19 1999-04-09 Fujitsu Ltd 通信支援装置
US7406084B2 (en) * 1997-09-19 2008-07-29 Nokia Siemens Networks Gmbh & Co. Kg Flexible software architecture for a call processing system
US7319957B2 (en) * 2004-02-11 2008-01-15 Tegic Communications, Inc. Handwriting and voice input with automatic correction
US7712053B2 (en) 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
US7720682B2 (en) * 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US7881936B2 (en) 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7679534B2 (en) 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US8938688B2 (en) 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US6526292B1 (en) 1999-03-26 2003-02-25 Ericsson Inc. System and method for creating a digit string for use by a portable phone
GB2352933A (en) * 1999-07-31 2001-02-07 Ibm Speech encoding in a client server system
US6493670B1 (en) * 1999-10-14 2002-12-10 Ericsson Inc. Method and apparatus for transmitting DTMF signals employing local speech recognition
US6804539B2 (en) 1999-10-20 2004-10-12 Curo Interactive Incorporated Single action audio prompt interface utilizing binary state time domain multiple selection protocol
US6771982B1 (en) 1999-10-20 2004-08-03 Curo Interactive Incorporated Single action audio prompt interface utlizing binary state time domain multiple selection protocol
US9232037B2 (en) 1999-10-20 2016-01-05 Curo Interactive Incorporated Single action sensory prompt interface utilising binary state time domain selection protocol
US6947893B1 (en) * 1999-11-19 2005-09-20 Nippon Telegraph & Telephone Corporation Acoustic signal transmission with insertion signal for machine control
AU2001251190A1 (en) 2000-03-31 2001-10-15 Qualcomm Incorporated Method and apparatus for alphanumeric address book conversions in a wireless personal digital assistant
US6366669B1 (en) 2000-04-26 2002-04-02 Iosif Meynekhdrun System and method for providing universal access to interactive voice response systems
JP3542026B2 (ja) * 2000-05-02 2004-07-14 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体
US6868142B2 (en) 2001-01-10 2005-03-15 At&T Corp. Voice-operated interface for DTMF-controlled systems
US6731724B2 (en) * 2001-01-22 2004-05-04 Pumatech, Inc. Voice-enabled user interface for voicemail systems
US7110530B2 (en) 2002-02-01 2006-09-19 Iosif Meynekhdrun System and method for providing universal access to voice response systems
US8239197B2 (en) * 2002-03-28 2012-08-07 Intellisist, Inc. Efficient conversion of voice messages into text
CA2735329C (en) 2002-03-28 2016-05-03 Intellisist, Inc. Closed-loop command and response system for automatic communications between interacting computer systems over an audio communications channel
US7054421B2 (en) * 2002-05-31 2006-05-30 International Business Machines Corporation Enabling legacy interactive voice response units to accept multiple forms of input
US8583440B2 (en) * 2002-06-20 2013-11-12 Tegic Communications, Inc. Apparatus and method for providing visual indication of character ambiguity during text entry
KR100467593B1 (ko) * 2002-07-20 2005-01-24 삼성전자주식회사 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
US8095364B2 (en) 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
KR100834652B1 (ko) * 2006-10-31 2008-06-02 삼성전자주식회사 신용카드 분실신고 기능을 갖는 휴대단말기 및 그에 따른방법
JP2019057777A (ja) * 2017-09-20 2019-04-11 株式会社東芝 自動音声応答システムの音声ガイダンス選択支援装置及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0041195A1 (de) * 1980-05-30 1981-12-09 General Electric Company Rufanordnung
JPS5781796A (en) * 1980-11-11 1982-05-21 Nec Corp Voice dial exchanging system
DE3236272A1 (de) * 1982-09-30 1984-04-05 Siemens AG, 1000 Berlin und 8000 München Fernsprechvermittlungssystem fuer oeffentliche oder private waehlnetze mit zumindest einer zentralen waehlinformations-aufnahme/verarbeitungs-einrichtung
DE3425789A1 (de) * 1984-07-13 1986-01-16 Standard Elektrik Lorenz Ag, 7000 Stuttgart Schaltungsanordnung zum anschalten einer einer fernsprechstelle zugeordneten sprachgesteuerten zusatzeinrichtung an eine fernsprechleitung
US4827500A (en) * 1987-01-30 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Automatic speech recognition to select among call destinations
US5220595A (en) * 1989-05-17 1993-06-15 Kabushiki Kaisha Toshiba Voice-controlled apparatus using telephone and voice-control method
US5339358A (en) * 1990-03-28 1994-08-16 Danish International, Inc. Telephone keypad matrix
US5187735A (en) * 1990-05-01 1993-02-16 Tele Guia Talking Yellow Pages, Inc. Integrated voice-mail based voice and information processing system
US5402477A (en) * 1992-07-31 1995-03-28 Mcmahan; Michael L. System and method for configuring a telephone
US5353336A (en) * 1992-08-24 1994-10-04 At&T Bell Laboratories Voice directed communications system archetecture

Also Published As

Publication number Publication date
EP0795170A1 (de) 1997-09-17
WO1997012361A1 (en) 1997-04-03
JPH10511252A (ja) 1998-10-27
US6208966B1 (en) 2001-03-27
DE69625793D1 (de) 2003-02-20
EP0795170A4 (de) 1999-08-11
EP0795170B1 (de) 2003-01-15

Similar Documents

Publication Publication Date Title
DE69625793T2 (de) Telefonnetz-dienst zur umwandlung von sprache in wahltöne
DE69330694T2 (de) Automatische Verarbeitung von Anrufen mit verschiedenen Kommunikationsmoden in einem Telekommunikationssystem
EP0166318B1 (de) Einrichtung zur Erkennung und Umsetzung von Wahlinformation sowie von Steuerinformation für Leistungsmerkmale einer Fernsprechvermittlungsanlage
DE69129883T2 (de) Rufnummerwahl mit Spracherkennung
DE69731907T2 (de) Sprachpost über Internet
DE69839068T2 (de) System und Verfahren zur automatischen Verarbeitung von Anruf und Datenübertragung
DE4406354A1 (de) Schaltungsanordnung zur Integration von EDV-Systemen bei der Benutzung von Telefonanlagen
DE69831536T2 (de) Verfahren zur Steuerung eines Telekommunikationsdienst und eines Endgerät
EP0168039B1 (de) Schaltungsanordnung zum Anschalten einer einer Fernsprechstelle zugeordneten sprachgesteuerten Zusatzeinrichtung an eine Fernsprechleitung
EP0929200A2 (de) Verfahren und Vorrichtung zur Bereitstellung einer Durchwahlfunktion bei Telekommunikationsanlagen
DE10147549A1 (de) Vermittlungsverfahren zwischen Dialogsystemen
EP0920238B1 (de) Verfahren zur Übermittlung einer Teilnehmernummer eines gewünschten Teilnehmers, sowie Telefonauskunftseinrichtung und Endgerät hierfür
EP1016312B1 (de) Verfahren und anordnung für eine automatische übersetzung von nachrichten in einem kommunikationssystem
DE60304939T2 (de) Anruferidentifizierung basiert auf Spracherkennung
DE19744965A1 (de) Verfahren zum telefonischen Anfordern von Dienstleistungen
EP1232657B1 (de) Verfahren zum erzeugen eines wählverzeichnisses in einem netzwerkendgerät und kommunikationsnetzwerk für ein solches verfahren
WO1999013663A1 (de) Dezentrale ausführung von funktionen/diensten eines mobilfunksystems
DE3328059C2 (de) Verfahren zur empfangsseitigen Auswahl von über eine Vermittlungsstelle einer Fernmelde- bzw. Fernsprechanlage laufende Daten- bzw. Sprechverbindungen
DE4228997C2 (de) Verfahren zur Herstellung von Fernsprechverbindungen in einem Fernsprechvermittlungssystem
EP0339467B1 (de) Verfahren und Vorrichtung zur Bildung elektronischer, aus Sprach- und Nichtsprachbestandteilen bestehender Kommunikationsdienstnachrichten
EP1404091B1 (de) Verfahren und Vorrichtung zur Steuerung und/oder Überwachung einer MULAP-Leitung
WO1995005046A1 (de) Verfahren zur fernbedienung von anrufbeantwortern
DE19729126C1 (de) Verfahren zur Signalisierung von Diensten in Telefonnetzen mit analogen Teilnehmeranschlüssen
EP0765100A2 (de) Schnittstelleneinrichtung zur Verbindung eines Computers mit dem ISDN-Netz
DE10138151A1 (de) Telefonkonferenzsystem und Verfahren zum Authentifizieren eines Teilnehmers einer Telefonkonferenz

Legal Events

Date Code Title Description
8364 No opposition during term of opposition