-
TECHNISCHES
GEBIET DER ERFINDUNG
-
Diese
Erfindung bezieht sich auf die Spracherkennung und insbesondere
auf das Eintragen von Spracherkennungsadressen in eine Spracherkennungsdatenbank.
-
HINTERGRUND
DER ERFINDUNG
-
Das
Eintragen von Namensadressen in eine Spracherkennungsdatenbank wird
bei der Kurzwahl verwendet. Bei der Kurzwahl wird beispielsweise eine
bestimmte Nummer oder eine Reihe von Telephonnummern zuvor gespeichert,
und der Anwender muss nur diese Reihe von Nummern aufrufen, indem er
einen Namen spricht, damit die Telephonnummer angerufen wird. Es
ist sehr erwünscht,
dass der Anwender durch Hineinsprechen der Adressen in das Telephon über den
Namen kurzwählt
und die diesem Namen zugeordnete Telephonnummer in der Reihe von
Telephonnummern angewählt
wird. Daher ist es erwünscht,
ein verbessertes Verfahren und System zum Eintragen der Kurzwahlnamensadressen
in das Telephonsystem bereitzustellen, sodass die richtigen Nummern
gewählt
werden, wenn in das Telephonsystem hineingesprochen wird.
-
JP-A-06
266386 offenbart ein System zum präzisen Erfassen eines Kennworts
in einer eingegebenen Sprache mit hoher Geschwindigkeit und zeitsynchron
mit der eingegebenen Sprache.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Gemäß der vorliegenden
Erfindung wird ein Verfahren zum Eintragen von Kurzwahlnamen in
einem Telephon geschaffen, das umfasst: Vorsehen eines Müllmodells;
Zuweisen einer Strafe an das Müllmodell;
Empfangen einer Äußerung eines
neuen Kurzwahlnamens von einem Anwender; Vergleichen der Äußerung mit
dem mit Strafe belegten Müllmodell und
mit Schablonen früher
hinzugefügter
Kurzwahlnamen, um festzustellen, ob die Äußerung zu einem früher hinzugefügten Kurzwahlnamen
zu ähnlich
ist; und in Reaktion darauf, dass die erste Äußerung zu einem früher hinzugefügten Kurzwahlnamen
nicht zu ähnlich
ist, Eintragen des neuen Kurzwahlnamens in eine Kurzwahlliste.
-
Gemäß der vorliegenden
Erfindung wird ferner ein Telephonapparat geschaffen, der eine Schaltungsanordnung
zum Eintragen von Kurzwahlnamen enthält, wobei die Schaltungsanordnung
umfasst: einen Speicher zum Speichern einer Kurzwahlliste einschließlich mehrerer
Schablonen für
früher
hinzugefügte
Kurzwahlnamen und zum Speichern eines Müllmodells zur Spracherkennung;
und einen Prozessor, der so programmiert ist, dass er eine Folge von
Operationen ausführt,
die umfassen: Zuweisen einer Strafe zu dem Müllmodell; Empfangen einer Äußerung eines
neuen Kurzwahlnamens von einem Anwender; Vergleichen der Äußerung mit
dem mit Strafe belegten Müllmodell
und mit mehreren gespeicherten Schablonen, um festzustellen, ob
die erste Äußerung zu
einem früher
hinzugefügten
Kurzwahlnamen zu ähnlich
ist; und in Reaktion auf die Tatsache, dass die Äußerung zu einem früher hinzugefügten Kurzwahlnamen
nicht zu ähnlich
ist, Eintragen des neuen Kurzwahlnamens in eine Kurzwahlliste.
-
BESCHREIBUNG
DER ZEICHNUNG
-
Die
vorliegende Erfindung wird nun mit Bezug auf die beigefügte Zeichnung
beispielhaft weiter beschrieben, in der:
-
1 einen
vereinfachten Blockschaltplan eines Telephonsystems veranschaulicht,
das ein Verfahren der vorliegenden Erfindung ausführt;
-
2 einen
Ablaufplan eines Verfahrens zum Erzeugen von Kurzwahlanweisungen,
die von mehreren Anwendern gesprochen werden, im Spracherkennungs-Telephonsystem
veranschaulicht;
-
3 einen
allgemeinen Ablaufplan zum Eintragen und Löschen eines Verzeichnisnamens
im Telephonsystem veranschaulicht;
-
4 einen
Ablaufplan eines Verfahrens zum Eintragen und Ändern einer Kurzwahlliste gemäß einem
Verzeichnisnamen im Telephonsystem veranschaulicht;
-
5 ein
Ablaufplan einer Sprachwahlergänzungs-Eintragung
gemäß einer
Ausführungsform der
vorliegenden Erfindung ist;
-
6 ein
einzelnes Müllmodell
veranschaulicht;
-
7 ein
Ablaufplan einer Eintragung eines Sprachwahlergänzungseintrags in 5 ist;
-
8 ein
Ablaufplan einer Aktualisierung eines Sprachwahlergänzungseintrags
in 7 ist; und
-
9 ein
Ablaufplan für
eine Wiederholung eines Sprachwahlergänzungseintrags in 8 ist.
-
AUSFÜHRLICHE
BESCHREIBUNG DER ERFINDUNG
-
1 ist
ein vereinfachter Blockschaltplan eines Telephonsystems 10.
Das Telephonsystem 10 enthält ein Telephon 11,
das mit einem Prozessor 12 verbindet. Eine Nicht-aufgelegt-Erfassungsschaltung 13 sowie
eine Erkennungs- und Aufzeichnungsschaltung 14 verbinden
mit dem Telephon 11 und dem Prozessor 12. Der
Prozessor 12 verbindet auch mit einem Speicher 15.
Während
des Betriebs meldet die Nicht-aufgelegt-Erfassungsschaltung 13 dem
Prozessor 12, dass das Telephon 11 einen Nicht-aufgelegt-Zustand
anzeigt, und ermöglicht
es dem Prozessor 12, Befehle gemäß einem Programm zu überwachen,
das im Prozessor 12 gespeichert ist und von ihm ausgeführt wird.
Das Programm im Prozessor 12 ermöglicht es einem Anwender, eine
Verzeichnisnamensadresse sowie eine Kurzwahlliste mit Eintragsnamen
und entsprechenden Telephonnummern zu erzeugen, die der Verzeichnisnamensadresse
zugeordnet sind. Das Telephonsystem 10 speichert sprecherabhängige Schablonen
von Verzeichnisnamensadressen sowie zugeordneten Eintragsnamen und Telephonnummern,
sodass jeder Anwender nur auf diesen bestimmten Verzeichnisnamen
und diese bestimmte Kurzwahlliste zugreifen kann.
-
2 ist
ein anfänglicher
Ablaufplan eines Verfahrens zum Erzeugen von Kurzwahlverzeichnissen
im Spracherkennungs-Telephonsystem 10, die von mehreren
Anwendern gesprochen werden. In einer Ausführungsform ist der Prozessor 12 in Übereinstimmung
mit diesem Ablaufplan programmiert. Die Nicht-aufgelegt-Erfassungsschaltung 13 des
Telephonsystems 10 überwacht
im Schritt 16 das Telephon 11, um bei dem bestimmten
Telephon einen Nicht-aufgelegt-Zustand
zu erfassen. Sobald die Erfassung eines Nicht-aufgelegt-Zustands
erfolgt, fordert der Prozessor 12 im Schritt 17 einen
Anwender zur Eingabe ein Befehls auf. Im Schritt 18 vergleicht der
Prozessor 12 in Verbindung mit der Er kennungs- und Aufzeichnungsschaltung 14,
die den Prozessor einschließlich
eines Komparators und des Speichers 15 enthalten kann,
die Reaktion des Anwenders mit einer von mehreren Schablonen, die
im Speicher 15 des Telephonsystems 10 codiert
sind. Die Flexibilität des
Telephonsystems 10 ermöglicht
im Schritt 18 das Empfangen entweder von einem Anwender
gesprochener Wörter
oder, in einigen Fällen,
entsprechender DTMF-Drucktastencodes vom Telephon 11, die gesprochene
Befehlswörter
darstellen. In der Zeichnung zeigt ein Sternchen durchgehend an,
dass das Telephonsystem 10 entweder gesprochene Befehlswörter oder
entsprechende DTMF-Drucktastencodes erkennen kann, die Befehlswörter darstellen.
Sternchen zeigen auch an, dass das Telephonsystem 10 beim
Anpassen eines Modells an eine Reaktion eines Anwenders eine sprecherunabhängige Spracherkennung
ausführt.
Die Beschreibung der bevorzugten Ausführungsform wird, lediglich
zum Zweck der Veranschaulichung, so fortgesetzt, als ob das Telephonsystem
gesprochene Reaktionen anstatt repräsentativer Befehle über entsprechende
DTMF-Drucktastencodes empfängt.
-
Im
Schritt 18 kann das Telephonsystem 10 einen von
verschiedenem Befehlsausdrücken
erkennen und gemäß dem angeforderten
Befehl fortfahren. Das Telephonsystem 10 kann im Schritt 19 eine von
einem Anwender als einen ersten Befehl empfangene Telephonnummer
erkennen. Das Telephonsystem 10 informiert den Anwender
im Schritt 20 über
die empfangene Nummer, und der Ablauf wird mit dem Schritt 22 fortgesetzt,
in dem die Telephonnummer automatisch gewählt wird, um das angeforderte
Gespräch
anzumelden. Das Telephonsystem 10 kann im Schritt 24 als
einen zweiten vom Anwender empfangenen Befehlsausdruck auch einen
Notfallbefehl wie etwa "Hilfe" erkennen. Das Telephonsystem 10 meldet
im Schritt 26 dem Anwender, dass die Notfalltelephonnummer,
wie zum Beispiel 911, gewählt
wird, und der Ablauf wird mit dem Schritt 22 fortgesetzt,
in dem das Gespräch
erneut angemeldet wird. Das Telephonsystem kann auch einen dritten Befehlsausdruck
vom Anwender, "ABBRECHEN", erkennen, der das
Telephonsystem automatisch zum Schritt 17 zurück führt, wobei
jegliche momentan ablaufende Befehlsfolge beendet wird. Beispielsweise kann
der Anwender, wie in 1 gezeigt ist, das Anmelden
eines Telephonanrufs stoppen, bevor eine Verbindung mit dem anderen
Ende der Telephonleitung hergestellt wird. Obwohl sie in 1 an
nur einem Punkt gezeigt ist, kann die Erkennung eines ABBRECHEN-Befehls
im Schritt 28 an irgendeiner Stelle in dem Telephonsystemverfahren
erfolgen, das mit Bezug auf nachfolgende Figuren beschrieben wird.
-
Das
Telephonsystem 10 kann im Schritt 30 ein viertes
Befehlswort erkennen, wenn der Anwender den Eintritt in die Anwenderverzeichnisliste
anfordert. Wenn das Telephonsystem 10 diesen Befehl erkennt,
geht der Ablauf zum Schritt 32 über, damit der Anwender in
die Verzeichnisoption eintreten kann. 3 veranschaulicht
einen Ablaufplan der Prozessschritte im Verzeichnisoptions-Abschnitt
des Telephonsystemprogramms. Nach der Befehlserkennung tritt der
Anwender im Schritt 34 in die Verzeichnisoption ein. Um
sicherzustellen, dass nur autorisierte Anwender in die Verzeichnisoption
eintreten können, führt das
Telephonsystem 10 in den Schritten 36 und 38 Sicherheitsmaßnahmen
durch, bei denen der Anwender aufgefordert wird, eine Verifikation
der Befugnis zum Eintritt in die Verzeichnisoption bereitzustellen
Die Verifikation kann ein Autorisierungscode sein, den der Anwender
in das System eingibt, oder es können
sprecherabhängige
Spracherkennungsschablonen vorliegen, um Sprachmuster des Anwenders an
im Telephonsystem 10 gespeicherte Verifikationsschablonen
anzupassen.
-
Im
Schritt 36 fordert das Telephonsystem 10 den Anwender
zur ordnungsgemäßen Verifikation auf
und erkennt im Schritt 38 die Verifikationsreaktion des
Anwenders. Das Telephonsystem 10 kann die Schritte 36 und 38 als
Teil des Verifikationsprozesses mehr als einmal ausführen. Wenn
das Telephonsystem den vom Anwender angegebenen Verifikationscode
nicht erkennt, kehrt der Verarbeitungsablauf auf eine ähnliche
Weise wie ein ABBRECHEN-Befehl zum Schritt 17 von 2 zurück. Wenn
das Telephonsystem 10 einen gültigen Verifikationscode erkennt,
wird der Verarbeitungsablauf mit dem Schritt 40 fortgesetzt,
in dem das Telephonsystem 10 den Anwender auffordert, einen
von vier Befehlen für
die Verzeichnisoption einzugeben. Zur Anwenderverifikation siehe
auch Kero, US Patent Nr. 5.369.685.
-
Sobald
der Anwender die richtige Verifikation bereitgestellt hat und in
die Verzeichnisoption eintritt, kann das Telephonsystem 10 im
Schritt 42 ein erstes Unterbefehlswort erkennen, um dem
System einen Anwenderverzeichnisnamen hinzuzufügen. Das Telephonsystem 10 trägt im Schritt 44 den
Anwender ein, indem es einen Verzeichnisnamen anfordert und im Schritt 46 die
Reaktion des Anwenders in einer im Telephonsystem zu speichernden
Schablone sichert.
-
Beim
Eintragen eines Anwenderverzeichnisnamens kann das Telephonsystem 10 die
Schritte 44 und 46 wiederholen, um die Schablone
zu erzeugen und sie mit der bestehenden Liste von Anwenderidentifikations-Schablonen
zu sichern, die für
dieses Benutzerkonto oder Telephon bereits registriert sind. Sobald
eine Schablone gesichert ist, kehrt der Verarbeitungsablauf zum
Schritt 40 zurück,
in dem das Telephonsystem 10 vom Anwender ein weiteres
Befehlswort anfordert.
-
Das
Telephonsystem 10 kann im Schritt 48 ein zweites
Unterbefehlswort erkennen, um einen Anwenderverzeichnisnamen zu
löschen.
Nach dem Erkennen fordert das Telephonsystem 10 im Schritt 50 vom
Anwender den Namen des zu löschenden Anwenderverzeichnisses
an. Das Telephonsystem 10 erkennt im Schritt 52 den
vom Anwender angegebenen Verzeichnisnamen und fordert im Schritt 54 den
Anwender auf, das Löschen
des Verzeichnisnamens zu bestätigen.
Bestätigt
der Anwender das Löschen
des Verzeichnisnamens nicht, kehrt der Verarbeitungsablauf zum Schritt 40 zurück, in dem
das Telephonsystem 10 einen Befehlsausdruck vom Anwender
anfordert. Bestätigt
der Anwender im Schritt 54 das Löschen des Verzeichnisnamens,
löscht
das Telephonsystem 10 im Schritt 56 die für diesen
Verzeichnisnamen erzeugte Schablone sowie jegliche Telephonlisteneinträge, die
diesem Verzeichnisnamen entsprechen. Nach dem Löschen kehrt der Verarbeitungsablauf
zum Schritt 40 zurück,
in dem das Telephonsystem 10 einen neuen Befehlsausdruck vom
Anwender anfordert.
-
Das
Telephonsystem 10 kann im Schritt 58 einen dritten
Unterbefehlsausdruck erkennen, um die Liste von Verzeichnisnamen
zu überprüfen. Nach dem
Erkennen spielt das Telephonsystem 10 im Schritt 60 die
Anwenderverzeichnisliste ab, bevor es zum Schritt 40 zurückkehrt,
um einen neuen Befehlsausdruck anzufordern. Das Telephonsystem 10 kann
im Schritt 62 auch einen vierten Befehlsausdruck erkennen,
wobei festgestellt wird, dass der Anwender die Anforderung der Verzeichnisoption
abgearbeitet hat. Nach dem Erkennen kehrt der Verarbeitungsablauf
zum Schritt 17 von 2 zurück, in dem das
Telephonsystem 10 eine Telephonnummer vom Anwender anfordert.
-
Wie
ebenfalls in 2 gezeigt ist, kann das Telephonsystem 10 im
Schritt 64 einen Verzeichnisnamen als einen fünften Befehlsausdruck
erkennen. Wenn das Telephonsystem 10 einen Anwenderverzeichnisnamen
erkennt, geht der Verarbeitungsablauf zum Schritt 66 über, in
dem das Telephonsystem in eine Kurz wahllistenoption eintritt. 4 ist
ein Ablaufplan der Verarbeitung der Kurzwahllistenoption der vorliegenden
Erfindung. Das Telephonsystem 10 tritt im Schritt 68 in
die Kurzwahllistenoption ein und fordert anschließend im
Schritt 70 den Anwender auf, entweder einen anzurufenden
Namen anzufordern oder in die Liste einzutreten. Wenn das Telephonsystem 10 im
Schritt 72 einen Eintragsnamen erkennt, wird im Schritt 74 für den Anwender
eine Meldung ausgegeben, die anzeigt, dass der angeforderte Name
durch das Telephonsystem 10 angerufen werden soll. Das
Telephonsystem 10 meldet dann im Schritt 22 in 2 den
Anruf an, wie zuvor beschrieben wurde. Das Telephonsystem 10 kann
im Schritt 76 auch einen Listenbefehl erkennen und eingeben sowie
im Schritt 78 einen von fünf Listenbefehlsausdrücken vom
Anwender anfordern.
-
Das
Telephonsystem 10 kann im Schritt 80 einen ersten
Listenbefehlsausdruck erkennen, um unter dem Verzeichnisnamen eines
Anwenders einen Eintragsnamen und eine Telephonnummer zur Kurzwahlliste
hinzuzufügen.
Nach dem Erkennen fordert das Telephonsystem 10 den Anwender
im Schritt 82 auf, den Eintragsnamen in die Kurzwahlliste
einzutragen. Das Telephonsystem 10 fordert den Anwender
im Schritt 83 auf, eine Telephonnummer einzutragen, die
dem im Schritt 82 gerade eingetragenen Eintragsnamen entspricht.
Das Telephonsystem 10 erzeugt und sichert im Schritt 84 eine
Schablone, die dem Namen und der Telephonnummer entspricht, die
vom Anwender eingetragen wurden. Das Telephonsystem 10 kann
die Schritte 82, 83 und 84 wiederholen,
um eine gültige
Schablone des Eintragsnamens und der Telephonnummer für die Kurzwahlliste zu
verifizieren und zu erzeugen. Nach dem Sichern kehrt der Verarbeitungsablauf
zum Beginn der Kurzwahllistenoptions-Routine im Schritt 70 zurück.
-
Das
Telephonsystem 10 kann im Schritt 86 einen zweiten
Listenbefehl erkennen, um eine Telephonnummer zu ändern, die
einem Eintragsnamen entspricht. Nach dem Erkennen fordert das Telephonsystem 10 den
Anwender im Schritt 88 auf, den Namen bereitzustellen,
dessen Telephonnummer geändert werden soll. Das Telephonsystem 10 erkennt im
Schritt 90 den vom Anwender angegebenen Namen und ermöglicht es
dem Anwender im Schritt 92, die diesem Namen entsprechende
Telephonnummer zu ändern.
Das Telephonsystem 10 sichert im Schritt 94 eine
Schablone der modifizierten Nummer, die dem Eintragsnamen entspricht,
mit dem die Änderung
angefordert wurde. Das Telephonsystem 10 kann die Schritte 92 und 94 wiederholen,
um eine gültige
Erzeugung der Telephonnummernschablone sicherzustellen. Sobald die
Schablone gesichert ist, kehrt der Verarbeitungsablauf zum Schritt 70 zurück, wie
zuvor beschrieben wurde.
-
Das
Telephonsystem 10 kann im Schritt 96 einen dritten
Listenbefehl erkennen, um einen Namen aus der Kurzwahlliste zu löschen. Nach
dem Erkennen fordert das Telephonsystem 10 vom Anwender
im Schritt 98 den Namen an, der aus der Kurzwahlliste zu
löschen
ist. Das Telephonsystem 10 erkennt im Schritt 100 den
Namen und fordert den Anwender im Schritt 102 auf, das
Löschen
des Namens zu bestätigen.
Wenn der Anwender den Eintragsnamen nicht löschen möchte, kehrt der Verarbeitungsablauf
zum Schritt 70 zurück.
Wenn der Anwender das Löschen
des Eintragsnamens bestätigt,
löscht das
Telephonsystem im Schritt 104 die Eintragsnamensschablone
und die entsprechende Telephonnummernschablone, bevor der Verarbeitungsablauf zum
Schritt 70 zurückgeführt wird.
-
Das
Telephonsystem 10 kann im Schritt 106 einen vierten
Listenbefehlsausdruck erkennen, um einem Anwender das Überprüfen seiner
Kurzwahlliste zu ermöglichen.
Nach dem Erkennen spielt das Telephonsystem 10 im Schritt 108 die
Kurzwahlliste des Anwenders ab und führt den Verarbeitungsablauf zum
Schritt 70 zurück.
-
Das
Telephonsystem 10 kann im Schritt 110 auch einen
fünften
Listenbefehlsausdruck erkennen, der angibt, dass der Anwender die
Kurzwahllistenoption abgearbeitet hat. Nach dem Erkennen kehrt der Verarbeitungsablauf
zum Schritt 17 von 2 zurück, und
das Verfahren wiederholt sich, wie zuvor beschrieben wurde.
-
Zusammenfassend
ist zu sagen, dass das Telephonsystem für jeden autorisierten Anwender des
Telephonsystems ein separates Verzeichnis erzeugen kann. Jeder Anwender
kann eine Kurzwahlliste erzeugen, die unter dem dem Anwender gehörenden Verzeichnis
Namen und Telephonnummern enthält.
Auf Grund der Verwendung sprecherabhängiger Merkmale kann niemand
Zugang zu einem Verzeichnis oder einer Kurzwahlliste eines autorisierten Anwenders
erlangen. Das oben Erwähnte
beruht auf dem Eintragen von Kurzwahlnamen unter Verwendung der
Spracherkennung.
-
In Übereinstimmung
mit einer Ausführungsform
der vorliegenden Erfindung ist der Prozessor 12 in 1 so
programmiert, dass er gemäß dem Ablaufplan
von 5 so arbeitet, dass Kurzwahlnamen in eine Kurzwahlliste
eingetragen werden. Der Prozessor 12 enthält ELPC-
und ULPC-Zähler
und ermöglicht
es einem Teilnehmer, einen Basisausdruck zu erzeugen und ihn dann
zu aktualisieren. Dem Teilnehmer werden drei Chancen gegeben, den
gesprochenen Namen hineinzusprechen, damit dieser auf eine solche
Weise in eine Liste aufgenommen wird, dass der gesprochene Name
am besten zu erkennen ist. Das System behandelt außerdem das
Problem, das entsteht, wenn der Teilnehmer einen Namen zur Liste
hinzufügt,
der entweder bereits in der Liste enthalten ist, oder einen sehr ähnlichen
Namen zur Liste hinzufügt.
Es behandelt außerdem
das Problem das entsteht, wenn der Teilnehmer den Namen zu unterschiedlich
ausspricht, wenn dieser eingetragen und aktualisiert wird.
-
Neuere
Entwicklungen bei der Verwendung von Müllmodellen zum Bestimmen von
vokabularexterner Sprache führten
zu einem neuen Erkennungsprozess, der sowohl eine Fähigkeit
zur vokabularexternen Erkennung bereitstellt als auch eine hohe Rate
vokabularinterner Erkennung aufrecht erhält. Dieser neue Erkennungsprozess
verwendet ein mit Strafe belegtes Müllmodell parallel zu gesprochenen Kurzwahlnamen,
um vokabularexterne Sprache zu unterscheiden Dieser Ansatz wird
auf eine Erkennung gesprochener Kurzwahleintragung angewendet, um
das Problem des Eintragens von Namen zu behandeln, die in einer
Kurzwahlliste bereits enthalten sind, und auch das einer zu großen Variabilität während des
Eintragens. Ein "Müllmodell" ist als ein Modell
für jegliche
Sprache definiert, die aus Wörtern oder
Lauten bestehen kann, für
die im Erkennungssystem kein anderes Modell existiert. Es gibt mehrere Möglichkeiten
für Mittel
zum Konstruieren von Müllmodellen.
Ein bei der Erkennung nach dem Stand der Technik allgemein verwendetes,
in 6 gezeigtes einzelnes Müllmodell modelliert eine Sammlung
von umfassenden phonetischen Klassen von Sprachlauten, die zusammengefügt werden,
um Laute zu bilden, die ein Wort ergeben. Wie sie in 6 gezeigt sind,
stellen die Kreise die akustischen umfassenden phonetischen Klassen
dar. Die durchgezogenen Linien bezeichnen Übergänge, die von einer umfassenden
phonetischen Klasse zu einer anderen in jeder Richtung ausgeführt werden
können.
Die punktierten Linien zeigen an, dass das Modell in einem bestimmten
Zustand eine Schleife durchlaufen kann. Übergänge sind durch Wahrscheinlichkeiten
gewichtet, die auf zeitlichen phonotaktischen Beschränkungen beruhen.
Diese Beschränkungen
erfordern, dass, je länger
eine gegebene phonetische Klasse verwendet wird, um Sprache zu erklären, die
Klasse umso weniger wahrscheinlich verwendet wird, um Sprache zu erklären, die
Klasse umso weniger wahrscheinlich verwendet wird, um nachfolgende
Sprache zu erklären,
und die nachfolgende Sprache umso wahrscheinlicher durch andere
unterschiedliche phonetische Klassen erklärt wird. Das Modell kann beginnen,
Sprache unter Eintritt oder Austritt in irgendeinem Zustand zu erklären.
-
Während einer Überprüfung auf
einen ähnlichen
Namen wird die Erkennung bei dem neuen Namen durchgeführt, der
zur Liste hinzugefügt
wird. Der neue Name kann entweder mit einem in der Liste vorhandenen
Namen übereinstimmen
oder mit dem parallelen Müllmodell übereinstimmen.
Wenn der Name mit einem vorhandenen Namen übereinstimmt, dann wird der
Anwender darüber
informiert, dass der Name oder ein ähnlicher Name bereits in der
Liste enthalten ist und dass der Name nicht hinzugefügt wird.
Wenn der neue Name mit dem parallelen Müllmodell übereinstimmt, dann wird angenommen,
dass der Name nicht in der Liste enthalten ist, und das Hinzufügen des
Namens wird fortgesetzt. Die Strafe für das Müllmodell kann eingestellt werden,
um die Empfindlichkeit bei der Anpassung entweder an einen Namen
in der Liste oder an das Müllmodell
zu beeinflussen.
-
Wenn
der Teilnehmer versucht, einen neuen Namen in die Kurzwahlliste
einzutragen, tritt er in ein Menü mit
der Bezeichnung "Sprachwahllisten-Management" oder in Position 40 in 3 oder 78 in 4 ein
und gibt "Eintrag
hinzufügen" ein oder spricht
dies. Wenn dieser Befehl erkannt wird, überprüft das System im Schritt 201 zunächst, ob
die Liste voll ist oder nicht. Wenn sie voll ist, teilt das System dem
Anwender mit, dass sie voll ist. Dies kann durch einen synthetisierten
Sprachbefehl aus dem Speicher 15 und dem Synthesizer 15a erfolgen,
der besagt: "Ihre
Liste ist voll. Sie müssen
einen Namen löschen,
bevor Sie einen neuen hinzufügen." Der Anwender kann
zum Listenmanagement zurückkehren und
einen Namen in der Liste löschen.
Siehe Schritte 96–104 in 4.
Wenn die Liste voll ist, oder nach dem Löschen eines Namens in der Liste
und der Rückkehr
zu "Eintrag LPCCNT
hinzufügen", werden Zähler ELPC
und ULPC auf null gesetzt (Schritt 202). Das System verfolgt
dann die Zählungen
des LPC (lineare prädiktive
Codierung) oder des ELPC der Eintragung sowie der linearen prädikti ven
Aktualisierungs-Codierung (ULPC). Die LPC ist eine durch lineare
Prädiktionsparameter
dargestellte Sprachabtastung. Die LPC wird als linear angenommen.
Für den Fall
von mehr als einer LPC siehe z. B. Seiten 81–124 in "Linear Predictive Coding of Speech" von Bishnu S. Ital
(Kapitel 4) in "Computer
Speech Processing",
herausgegeben von Frank Fallside und William Woods, Prentice Hall
(ISBN 0-13-163841-6). Wenn die Zählung
von ELPC wie auch von ULPC auf null steht (Schritt 203),
was anzeigt, dass zuvor nichts eingegeben wurde, wird eine synthetisierte
anleitende Aufforderungsaussage abgespielt (Entscheidung "ja" im Schritt 203).
Die synthetisierte Aussage kann beispielsweise besagen: "Das System muss lernen,
wie Sie den Namen sprechen. Nachdem Sie den Namen zum ersten Mal
gesprochen haben, folgt eine lange Pause, und dann fordert das System
Sie auf, den Namen zwischen ein- und viermal zu wiederholen. In
Zukunft können
Sie diese Mitteilung durch Drücken
der Doppelkreuztaste überspringen.
Sprechen Sie nach dem Piepton bitte den Sprachwahlnamen." (Am Ende ertönt ein Piepton,
damit der Anwender den Namen spricht.) Der Anwender spricht den Namen.
Im Schritt 205 erfolgt eine Überprüfung, um zu bestimmen, ob der
Name in der Liste von (beispielsweise) fünfzehn aufgelisteten Namen
bereits vorhanden ist, ob er zu einem Namen ähnlich ist oder ob er mit dem
Müllmodell übereinstimmt.
Wenn sich eine Übereinstimmung
mit dem in der Liste ergibt (was anzeigt, dass ein ähnlicher
Name in der Liste bereits vorhanden ist), geht das System zum Wiederholen
des Ergänzungseintrags
von Schritt 206 über. Bei "ja" auf die Frage, ob
die Wiederholungen ausgeschöpft
sind (Schritt 207), kehrt das System zum Menü des Sprachwahllisten-Managements
oder zur Position 40 in 3 oder 78 in 4 zurück. Sind
die Versuche nicht ausgeschöpft
("nein" im Schritt 207), spielt
das System über
den Synthesizer 15a eine Mitteilung "zu ähnlich" ab ("... ist zu einem
anderen Namen in Ihrer Liste zu ähnlich.
Bitte wählen
Sie einen abweichenden Namen")
und inkrementiert den in 5 gezeigten ELPC-Zähler 202 und
verwendet für den
erneuten Versuch die kürzere
Eingabeaufforderung ("Sprechen
Sie nach dem Piepton bitte den Sprachwahlnamen"). Wenn der Anwender nicht rechtzeitig
einen neuen Namen angibt, aktiviert das System die Zeitsperre, inkrementiert
den Zähler
und fordert einen neuen Namen an. Wird auf der Tastatur eine Taste
gedrückt,
die nicht gültig
ist, und/oder wird nach einer Zeitsperre eine Taste gedrückt, inkrementiert
das System im Schritt 202 den Zähler und fragt nach einem gesprochenen
Namen.
-
Wenn
das System nach drei Versuchen oder der fünften ungültigem DTMF-Taste beim Eintragen scheitert,
trennt das System (Schritt 209). Wenn der gesprochene Name
keine Übereinstimmung
ergibt, kehrt das System zu "Ergänzungseintrag
eintragen" von 7 zurück.
-
Nach
einem erfolgreichen Sprechen eines Namens, der beim Eintragen eines
Ergänzungseintrags
in 5 keine Übereinstimmung
ergibt, folgt das System dem Ablaufplan von 6. Die Äußerung wird
gespeichert, wenn die Online-Eintragung begonnen wird. Die gesicherte Äußerung dient
dazu, eine Schablone zu erzeugen (Schritt 301), indem eine
Offline-Eintragung ausgeführt
wird. Wenn die Länge
der Äußerung nicht
zu kurz ist, etwa wenigstens so groß wie ein Mindestschwellenwert,
wie beispielsweise zehn Datenrahmen ("nein" im
Schritt 302), geht das System zum Schritt 305 über, um
einen Ergänzungseintrag
zu aktualisieren, und folgt dem Ablaufplan von 8.
Ist die Mitteilung zu kurz oder kürzer als der Mindestschwellenwert
(bei dem Beispiel weniger als zehn (10) Datenrahmen) ("ja" im Schritt 302),
fragt das System über
den Synthesizer, ob der Anwender die Schablone verwenden möchte, auch
wenn sie zuvor nicht verwendet wurde. Wenn "ja" weniger
als den Mindestschwellenwert bedeutet, kann die Aufforderungsmitteilung
besagen:
"Der
Name [angegebener Name] ist kürzer
als die empfohlene Namenslänge.
Es ist am besten, sowohl Vor- als auch Nachnamen zu verwenden. Um
diesen Namen trotzdem zu verwenden, sprechen Sie OKAY. Um das Hinzufügen dieses
Namens abzubrechen, sprechen Sie ABBRECHEN."
-
Danach
folgt ein Aufforderungspiepton. Wenn im Reaktionsschritt 307 "OKAY" empfangen wird,
geht das System zum Ergänzungseintrag
Aktualisieren von 8 über. Wird "ABBRECHEN" empfangen, so wird eine synthetisierte
Aussage erzeugt und bereitgestellt, wie etwa "Name nicht hinzugefügt", und das System kehrt zum Menü Sprachlisten-Management
oder zur Position 40 in 3 oder 78 in 4 zurück. Wenn
nichts gesprochen wurde (Zeitsperre), bei einem nicht erkannten
Befehl oder wenn eine falsche Taste gedrückt wird, liefert das System
synthetisierte Anweisungen und kehrt zur Suche nach einer Reaktion
zurück.
Wenn nach dem fünften
Mal keine erkannte Reaktion vorliegt, oder nach drei Zeitsperren
wird das System mit einer Mitteilung getrennt (Schritt 309).
Wird eine DTMF-Taste gedrückt,
stellt der Synthesizer die Mitteilung "Falsche Taste" bereit. Nach jeder Zeitsperre, jeder
falschen Taste sowie nach dem dritten und vierten nicht erkannten
Sprachbefehl kann der Synthesizer "Sprechen Sie OK oder Abbrechen" ausgeben oder, um ausführlichere
Anweisungen zu geben: "Sprechen Sie
okay, um das Hinzufügen
dieses Namens fortzusetzen. Sprechen Sie abbrechen, um das Hinzufügen dieses
Namens abzubrechen." Wenn
auch bei einem kurzen Namen "OKAY" erkannt wird, geht
das System zum Ergänzungseintrag
Aktualisieren von 8 über.
-
Beim
Feststellen des Erkennens verwendet das System das Müllmodell
mit nachstehend ausgeführten
Strafen.
-
-
-
Wenn
die empfangene Schablone für
irgendeines der aufgeführten
Müllmodelle
einen hohen Zählerstand
hat, nimmt sie einen hohen Zählerstand
für nicht
erkennbare Sprache an und wird als nicht erkannte Sprache abgelehnt.
-
Wie
in 8 gezeigt ist, wird die Schablone heruntergeladen
(Schritt 401), und das System stellt fest, ob eine Aktualisierung
erfolgte. Während
der Aktualisierung wird das Müllmodell
dazu verwendet, Sprache zu erklären,
die in der Eintragsschablone nicht enthalten ist. Wenn der Anwender
während
des Eintragens beispielsweise "Oh,
Roger Rabbit" sprach,
dann erklärt
das Müllmodell
das "Oh" (ein Schnaufen),
und nur der Abschnitt "Roger
Rabbit" der Aktualisierungsäußerung wird
in die Schablone des neuen Namens gemittelt. Wenn der Aktuali sierungszähler (ULPC)
auf null steht (Schritt 402), bedeutet dies, dass keine
Aktualisierung erfolgte, und das System fordert über den Synthesizer den Anwender
auf: "Bitte sprechen
Sie den Namen noch einmal." Der
Aktualisierungszähler
wird inkrementiert (Schritt 403), und wenn eine Reaktion
vorliegt, erfolgt unter Verwendung dieser Reaktion eine Aktualisierung
der Schablone (Schritt 404). Die Schablone wird überprüft, um festzustellen,
ob eine ordnungsgemäße Aktualisierung
erfolgte. Wenn eine ordnungsgemäße Aktualisierung
erfolgte, wird der Anwender aufgefordert, die Telephonnummer für diesen
Namen einzugeben (Schritt 405). Sie kann eingetastet oder unter
Verwendung der Spracherkennung mit sprecherunabhängigen Erkennungsmodellen hineingesprochen
werden. Wenn die Aktualisierung fehlschlägt, geht das System zu den
Schritten Ergänzungseintrag
Wiederholen von 9 über. Wenn die Aktualisierung
fehlschlägt,
werden die Eintrags- und die Aktualisierungsäußerungen vertauscht, und das Eintragen
und die Aktualisierung werden in dieser Reihenfolge versucht. Oft
ist ein Anwender beim ersten Mal nicht sprechbereit, und ein Einfügen beispielsweise
eines "Oh" (eines Schnaufens)
wird wahrscheinlich erfolgen, bevor der Name gesprochen wird, aber
wenn erneutes Sprechen angefordert wird, ist er darauf vorbereitet,
zu sprechen. Die erste Schablone enthält das Schnaufen des "Oh", und wenn eine Aktualisierung
durchgeführt
wird, kann die Aktualisierung fehlschlagen, da kein "Oh" vorliegt. Wenn Äußerungen
vertauscht sind, wird für
das Eintragen die sauberere zweite Äußerung verwendet, und es wird
mit der ersten Äußerung aktualisiert,
sodass das "Oh"-Schnaufen am Beginn
der Äußerung durch
das Müllmodell
erklärt
und das "Oh" nicht in die Schablone
aufgenommen wird. Wenn dieses Vertauschen der ersten und der zweiten Äußerung fehlschlägt, wird über das
Ausschöpfen
der Versuche (Schritt 406) eine dritte Äußerung angefordert, und die
Reaktion sowie die zweite Äußerung werden
für die
Aktualisierung verwendet. Wird für
das Eintragen eine dritte Äußerung angefordert,
dann wird dieser Name zuerst überprüft, um festzustellen,
ob er zu einem anderen Namen in der Liste zu ähnlich ist. Wenn dies der Fall
ist, wird er nicht verwendet, und die Verarbeitung geht zur Eingabe
A in 5 über.
Wenn das Eintragen fehlschlägt,
da die Äußerung zu
kurz war, benachrichtigt das System den Teilnehmer und fordert erneut
eine weitere Äußerung an.
Wenn das Eintragen erfolgreich verläuft, aber die Äußerung (Rahmenlänge) zu
kurz ist (weniger als der Schwellenwert der Mindestlänge), dann
erhält
der Teilnehmer eine War nung, dass schlechte Erkennungsergebnisse
resultieren können,
da der Eintragsname zu kurz ist. Der Teilnehmer wird aufgefordert, "OKAY" oder "ABBRECHEN" zu sprechen.
-
Zusammenfassend
ist zu sagen, dass die Äußerungen
beim Fehlschlagen einer Aktualisierung vertauscht werden, um festzustellen,
ob die zweite (oder, wenn erforderlich, dritte) Äußerung eine bessere Eintragsäußerung ergibt
als die erste. Es wird die nachfolgend angegebene Reihenfolge von
Eintragen und Aktualisierungen versucht, aber es werden vom Anwender
nur maximal drei Äußerungen angefordert.
-