[go: up one dir, main page]

DE102005037621A1 - Verfahren und Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation - Google Patents

Verfahren und Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation Download PDF

Info

Publication number
DE102005037621A1
DE102005037621A1 DE102005037621A DE102005037621A DE102005037621A1 DE 102005037621 A1 DE102005037621 A1 DE 102005037621A1 DE 102005037621 A DE102005037621 A DE 102005037621A DE 102005037621 A DE102005037621 A DE 102005037621A DE 102005037621 A1 DE102005037621 A1 DE 102005037621A1
Authority
DE
Germany
Prior art keywords
transaction
user
context information
information
transactions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102005037621A
Other languages
English (en)
Inventor
Hans-Ulrich Dr. Block
Rudolf Caspari
Dong Yi Song
Jürgen Totzke
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Corp
Original Assignee
Siemens Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Corp filed Critical Siemens Corp
Priority to DE102005037621A priority Critical patent/DE102005037621A1/de
Priority to PCT/EP2006/064501 priority patent/WO2007017361A1/de
Publication of DE102005037621A1 publication Critical patent/DE102005037621A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Unter Auswertung von zumindest einer in einer Benutzeräußerung (BE) enthaltenen Aktionsinformation (AI) wird in einem Sprachdialogsystem (1) zur Ermittlung zumindest einer aktuellen Transaktion (T1-Tx) in einem Sinnzusammenhang stehenden Transaktionen (T1-Tx) im Sprachdialogsystem (1) jeweils zumindest eine übereinstimmende Kontextinformation (KI) zugeordnet. Die Kontextinformation (KI¶letzt¶) zumindest der zuletzt ausgeführten Transaktion (T¶letzt¶) wird im Sprachdialogsystem (1) gespeichert und bei der Ermittlung der aktuellen Transaktion (T1-Tx) werden bevorzugt diejenigen Transaktionen (T2, T3) berücksichtigt, deren zugeordnete Kontextinformation (KI) mit der gespeicherten Kontextinformation (KI¶letzt¶) übereinstimmt.

Description

  • Die Erfindung betrifft ein Verfahren sowie ein zugehöriges Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation unter Auswertung von in einer Benutzeräußerung enthaltenen Aktionsinformationen in einem derartigen Sprachdialogsystem, wobei jeweils einer Hintergrundapplikation eine endliche Menge auswählbarer Transaktionen zugeordnet ist und bei dem über eine im Sprachdialogsystem vorgesehene Eingabeeinheit zumindest eine Benutzeräußerung erfasst und im Sprachdialogsystem gespeichert wird.
  • Sprachdialogsysteme für Datenbankzugriffe, welche Informationszugriffe sowie eine Steuerung von Kommunikationsapplikationen via Sprachkommunikation ermöglichen, sind als Schnittstellen zu vielen computergestützten Anwendungen bekannt. Anwendungen bzw. Hintergrundapplikationen, wie z.B. ein technisches Gerät der Unterhaltungselektronik, ein telefonisches Auskunftsystem (Bahn, Flug, Kino, etc.), ein computergestütztes Transaktionssystem (Homebanking-System, elektronische Warenbestellung etc.) sind in zunehmendem Maße über derartige Sprachdialogsysteme als Zugangssysteme („User-Interfaces") bedienbar. Derartige Sprachdialogsysteme können in Hardware, Software oder in einer Kombination daraus realisiert werden.
  • Der Dialogverlauf zur Erreichung von anwendungspezifischen Dialogzielen wird über ein derartiges Sprachdialogsystem gesteuert, welches die Interaktionen zwischen einer Dialog-Management-Einheit und dem einzelnen Benutzer verwaltet. Hierzu weist die Dialog-Management-Einheit eine Eingabeeinheit sowie Ausgabeeinheit auf.
  • Eine von einem Benutzer erzeugte Benutzeräußerung beispielsweise in Form eines Sprachsignals wird durch die Eingabeeinheit erfasst und in der Dialog-Management-Einheit gespeichert. Der Eingabeeinheit kann beispielsweise eine Spracherkennungseinheit nachgeschaltet sein, über welche eine Ermittlung von in einer Benutzeräußerung enthaltenen Aktionsinformationen durchgeführt wird. Zur Ausgabe von Aktionsprompts in Form von Sprachsignalen kann die Ausgabeeinheit als Sprachsyntheseeinheit ausgebildet sein.
  • Über die in der Dialog-Management-Einheit vorgesehene Spracherkennungseinheit werden aus dem Sprachsignal Aktionsinformationen beispielsweise in Form von einzelnen Wörtern oder Wörterketten gewonnen, welche durch Vergleich mit in einer Parsereinheit geladenen Schlüsselbegriffen bzw. Grammatiken ausgewertet werden. Abhängig von dem Auswerteergebnis wird eine einem oder mehreren Schlüsselbegriffen zugeordnete Transaktion zur Bedienung einer Hintergrundinformation gestartet. Abhängig von den Transaktionen wird über die Dialog-Management-Einheit ein Dialogverlauf mit dem jeweiligen Benutzer zur Steuerung der zugehörigen Hintergrundapplikation aufgenommen.
  • Derzeit sind drei Ansätze zur Realisierung von derartigen Sprachdialogsystemen bekannt, nämlich der „Finite-State-Based" Ansatz, der „Frame-Based" Ansatz und der „Agent-Based" Ansatz. Der „Frame-Based" bzw. rahmenorientierte Ansatz findet derzeitig in der Praxis die weiteste Verbreitung. Da der Dialogverlauf von rahmenorientierten Sprachdialogsystemen nicht an einer hierarchischen Baumstruktur organisiert ist, ermöglichen dieser eine große Flexibilität. Vielmehr ist jede Transaktion anhand eines Rahmens modelliert, welcher mehrere Lücken aufweist, die durch die Zuordnung von Transaktionsparameter gefüllt werden.
  • Damit ein Benutzer seine Anfragen in gesprochener natürlicher Sprache stellen kann, ist die Verwendung von Spracherkennungsmodulen bzw. -einheiten erforderlich. Derartige Sprach erkennungsmodule sind beispielsweise aus der DE 197 19 381 C1 und der DE 199 56 747 C1 bekannt.
  • Ferner ist bereits ein Verfahren zur Aktionsermittlung ( DE 196 15 693 C1 ) bekannt, bei dem ein Benutzer gezielte Befehle erteilt oder eine gezielte Anfrage an ein Sprachdialogsystem stellt, ohne dass ihm die zur Verfügung stehenden Auswahlalternativen langwierig aufgezählt werden. Hierdurch wird ein direkter Zugriff auf eine Vielzahl von Funktionen eines Sprachdialogsystems möglich, der lediglich einen Dialog erfordert, sofern die Anfangsäußerungen des Benutzers unvoll-ständig oder mehrdeutig oder in Widerspruch zu einzelnen Möglichkeiten der Hintergrundapplikation stehen. In dem beschrieben Fällen greift das beschriebene Sprachdialogsystem mit der Bezeichnung DIANE ein und führt mit dem Benutzer einen Klärungsdialog durch, um die Benutzerintension zu ermitteln und fehlende Informationseinheiten zu erfragen. Dem beschriebenen Verfahren liegt das folgende abstrakte Aufgabenmodell zugrunde:
    Eine Hintergrundapplikation wird als eine endliche Menge von Transaktionen (T1, T2, .... Tx) aufgefasst, wobei jeder Transaktion eine endliche Menge (die auch leer sein kann) von Transaktionsparametern (P1, P2, .....Px) zugeordnet sind. Die Transaktionsparameter sind dem Sprachdialogsystem bekannt. Zu jedem Transaktionsparameter ist eine Grammatik vorgesehen, die dazu dient, den Transaktionsparameter im Dialog zu erfassen.
  • Der Benutzer kann die gewünschte Transaktion und die zugeordneten Transaktionsparameter in einem Satz benennen oder auch nicht. Im ersten Fall kann die Transaktion sofort durchgeführt werden, im zweiten Fall werden die noch unbekannten Parameter im Dialog mit dem Benutzer erfasst. Falls durch die Benutzeräußerung keine Transaktion eindeutig bestimmbar ist, führt das System automatisch einen Klärungsdialog zur Ermittlung der gewünschten Transaktion durch. Gleiches gilt für unklare oder unvollständige Transaktionsparametereingaben.
  • Aus der DE 101 10 977 C1 ist ein Verfahren und eine Anordnung zum Bereitstellen von Hilfe-Informationen für einen Benutzer eines Sprachdialogssystems zum Bedienen einer Hintergrundapplikation bekannt, bei dem abhängig von dem jeweils vorliegenden Dialogstatus vorgegebene Hilfeinformationen ermittelt und an den Benutzer ausgegeben werden. Dem Benutzer werden somit abhängig von seinem jeweiligen Dialogsstatus kontextsensitive Hilfe-Informationen durch das Sprachdialogssystem bereitgestellt.
  • Ferner sind „Unified Messaging Systeme" bekannt, durch welche verschiedene Nachrichten auf einer Kommunikationsplattform gespeichert, verwaltet sowie der Zugriff auf diese über unterschiedliche Zugriffsarten ermöglicht wird. Beispielsweise können Emails, SMS oder auch klassische Telefon-, Fax- und Anrufbeantworter-Funktionen hierüber verknüpft werden, so dass beispielsweise über ein derartiges „Unified Messaging System" ein Fax, eine Email oder per Email eine SMS-Botschaft an ein Handy geschickt werden können. Anrufbeantworter-Nachrichten können wie gewohnt abgehört werden oder auch SMS und Emails mittels „Text-To-Speech" (TTS)-Verfahren vorgelesen werden. Über ein Sprachdialogsystem können somit die einzelnen Nachrichten von unterwegs abgehört, beantwortet, weitergeleitet oder gelöscht werden. Insbesondere bei einer derartigen Vielzahl von Funktionen der Hintergrundapplikation „Unified Messaging System" ist es für einen Benutzer oft sehr mühsam, sich von einer bestimmten Funktion zu einer anderen Funktion zu bewegen.
  • Damit derartige Sprachdialogsystem auf Dauer von einem breiten Benutzerkreis akzeptiert werden, ist neben einer sicheren Spracherkennung auch der Einsatz von Sprachdialogsystemen erforderlich, die den Benutzer nicht unnötige Zeit damit verbringen lassen, auf die richtige Frage des Sprachdialogsystems zu warten oder die richtige Frage durch etwaige Manipulationen zu erzwingen.
  • Die Aufgabe der vorliegenden Erfindung besteht somit darin, ein Verfahren zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation sowie ein zugehöriges Sprachdialogsystem anzugeben, bei dem eine eindeutige Identifizierung der vom Benutzer gewünschten Hintergrundapplikation schnell und benutzerfreundlich, insbesondere auch bereits anhand von reduzierten Aktionsinformationen möglich wird. Die Aufgabe wird durch ein Verfahren gemäß Patentanspruch 1 sowie ein Sprachdialogsystem gemäß Patentanspruch 16 gelöst.
  • Der wesentliche Gedanke des erfindungsgemäßen Verfahrens zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation und Auswertung von zumindest einer in einer Benutzungsäußerung enthaltenen Aktionsinformation in einem Sprachdialogsystem, bei dem jeweils einer Hintergrundapplikation eine endliche Menge auswählbarer Transaktionen zugeordnet ist und bei dem über eine im Sprachdialogsystem vorgesehene Eingabeeinheit zumindest eine Benutzeräußerung erfasst und im Sprachdialogsystem gespeichert wird, besteht darin, dass einzelnen in einem Sinnzusammenhang stehenden Transaktionen im Sprachdialogsystem jeweils zumindest eine übereinstimmende Kontextinformation zugeordnet wird und die Kontextinformation zumindest der zuletzt ausgeführten Transaktion im Sprachdialogsystem gespeichert wird. Bei der Ermittlung einer Transaktion werden vorteilhaft bevorzugt diejenigen Transaktionen berücksichtigt, deren zugeordnete Kontextinformation mit der gespeicherten Kontextinformation übereinstimmt. Vorteilhaft werden durch die Zuordnung zumindest einer Kontextinformationen zu den in einem Sinnzusammenhang stehenden Transaktionen bevorzugt diejenigen Transaktionen bei der Suche nach der aktuell durch den Benutzer durch die Benutzeräußerung angesprochene Transaktion berücksichtigt und hierdurch der sowohl zeitintensive als auch rechenintensive Ermittlungsaufwand deutlich reduziert. Weiterhin vorteilhaft können anhand von kontextabhängigen Grammatiken bereits verkürzte Schlüsselbegriffe ausreichen, um die vom Benutzer gewünschte Aktion zu bestimmen.
  • Weitere vorteilhafte Ausgestaltungen des erfindungsgemäßen Verfahrens, insbesondere ein Sprachdialogsystem zur Ausführung des Verfahrens sind den weiteren Ansprüchen zu entnehmen.
  • Die vorliegende Erfindung wird nachfolgend an einem Ausführungsbeispiel anhand von Figuren näher erläutert.
  • Es zeigen:
  • 1 in einem schematischen Blockschaltbild beispielhaft ein Sprachdialogsystem,
  • 2 in einem weiteren Blockschaltbild beispielhaft die einzelnen Komponenten einer Transaktion und
  • 3 in einem Ablaufdiagramm beispielhaft die einzelnen Schritte des erfindungsgemäßen Verfahren.
  • In 1 ist in einem schematischen Blockschaltbild beispielhaft ein Sprachdialogsystem 1 dargestellt, über welches ein Benutzer B zumindest eine Hintergrundapplikation HA bedienen kann. Die Bedienung der Hintergrundapplikation HA erfolgt hierbei beispielhaft anhand einzelner ausgewählter und im Sprachdialogsystem 1 hinterlegter Transaktionen T1 bis Tx, welche einer oder mehrerer Funktionen der Hintergrundapplikation HA zugeordnet sind. Das in 1 dargestellte Sprachdialogsystem 1 umfasst hierzu eine Eingabeeinheit 2, eine Dialog-Management-Einheit 3 und eine Ausgabeeinheit 4, wobei die Dialog-Management-Einheit 3 jeweils mit der Eingabeeinheit 2, der Ausgabeeinheit 4 sowie der Hintergrundapplikation HA in Verbindung steht.
  • In der Dialog-Management-Einheit 3 ist eine Speichereinheit 5 zur Speicherung der Transaktionen T1 bis Tx zur Bedienung der Hintergrundapplikation HA sowie weiterer Parameter vorgesehen. Die Dialog-Management-Einheit 3 weist ferner eine Spracherkennungseinheit 6, eine Sprachsyntheseeinheit 7, eine Parsereinheit 8 sowie eine Steuereinheit 9 auf, welche beispielsweise über ein Datenbussystem DBS miteinander verbunden sind. An das Datenbussystem DBS ist ebenfalls die Hintergrundapplikation HA angeschlossen, welche in einer alternativen Ausführungsform über ein Schnittstellenmodul (nicht in 1 dargestellt) mit der Dialog-Management-Einheit 3 verbunden sein kann. Die Eingabeeinheit 2 des Sprachdialogsystems 1 ist mit der Spracherkennungseinheit 6 und die Ausgabeeinheit 4 mit der Sprachsyntheseeinheit 7 verbunden.
  • Durch den Benutzer B wird eine Benutzeräußerung BE erzeugt, welche Aktionsinformationen AI aufweist. Hierbei kann eine Benutzeräußerung BE eine oder mehrere Aktionsinformationen AI aufweisen, welche innerhalb der Benutzeräußerung BE in unterschiedlichen Reihenfolgen angeordnet sein können. Über die Eingabeeinheit 2 wird eine Benutzeräußerung BE des Benutzers B, vorzugsweise als Sprachsignal erfasst und in der Dialog-Management-Einheit 3 abgespeichert. In einer bevorzugten Ausführungsform wird die Benutzeräußerung BE digitalisiert bzw. in digitaler Form der Speichereinheit 5 zugeführt und über die Spracherkennungseinheit 6 in an sich bekannter Weise die in der Benutzeräußerung BE enthaltenen Aktionsinformation(en) AI ermittelt sowie in der Speichereinheit 5 abgelegt.
  • Über die Ausgabeeinheit 4 können darüber hinaus dem Benutzer B Ausgabeprompts bzw. Informationsprompts AP zur Verfügung gestellt werden, welche beispielsweise in Form eines durch die Sprachsyntheseeinheit 7 erzeugtes synthetisiertes Sprachsignal über die Ausgabeeinheit 4 ausgegeben werden. Hierdurch wird der Benutzer B beispielsweise über den aktuellen Status der zu bedienenden Hintergrundapplikation HA bzw. der vom System aufgrund der letzten Benutzeräußerung BE durchgeführten Aktionen informiert oder der Benutzer B zur Abgabe zumindest einer weiteren Benutzeräußerungen BE veranlasst. Hierzu kann ein zwischen Ausgabeprompts AP und Benutzeräußerungen BE wechselnder Klärungsdialog durchgeführt werden.
  • In 2 sind in einer schematischen Darstellung beispielhaft die einzelnen Komponenten einer derartiger Transaktion T1 bis Tx dargestellt, welche zur Bedienung der unterschied lichen Funktionen der Hintergrundapplikation HA in der Dialog-Management-Einheit 3 vorgesehen sind. Einer Hintergrundapplikation HA ist eine endliche Menge derartiger Transaktionen T1 – Tx zugeordnet, deren Auswahl über eine jeweils einer Transaktion T1 – Tx zugeordneten Grammatikroutine GR getriggert wird. Hierbei werden der Transaktion T1 eine oder mehrere derartiger Grammatiken G1 – Gx zugeordnet, welche zur Ermittlung der zur gespeicherten Aktionsinformation AI zugehörigen Transaktion T1 bis Tx in die Parsereinheit 8 geladen werden. In der Parsereinheit 8 werden die einzelnen für die jeweilige Transaktion T1 charakterisierenden Schlüsselbegriffe der Grammatiken G1 – Gx mit den Aktionsinformationen AI verglichen. Hierbei können die Grammatiken G1 – Gx beispielhaft durch bzw. um kontextabhängige Grammatiken G1* – Gx* ersetzt bzw. erweitert werden, die unter Berücksichtigung des Sinnzusammenhangs zwischen den einzelnen Transaktionen T1 bis Tx verkürzte Schlüsselbegriffe aufweisen.
  • Ferner weist die in 2 beispielhaft dargestellte erste Transaktion T1 eine Vorbedingungsroutine VBR auf, welche vor der weiteren Ausführung einer Transaktion T1 – Tx in der Steuereinheit 9 ausgeführt wird, um das Vorliegen von Vorbedingungen wie beispielsweise der erfolgreichen Ausführung einer weiteren Transaktion T2 zu verifizieren. Hierzu weist die Vorbedingungsroutine VBR einen oder mehrere Vorbedingungsparameter VBP sowie zugehörige Parameterprompts PP auf. Durch die in der Steuereinheit 9 ausgeführte Vorbedingungsroutine VBR wird beispielsweise die Aktivierung bzw. Deaktivierung einer weiteren Transaktion T2 überprüft und abhängig vom Ergebnis der zugeordnete Parameterprompt PP ausgewählt und über die Sprachsyntheseeinheit 7 sowie die Ausgabeeinheit 4 an den Benutzer B ausgegeben. Ist die anhand der Vorbedingungsparameter VBP definierte Vorbedingung für die Ausführung der betrachteten ersten Transaktion T1 erfüllt, wird ohne eine Ausgabe eines Parameterprompts PP die weitere Ausführung der ermittelten ersten Transaktion T1 initiiert.
  • Erfindungsgemäß wird den in einem Sinnzusammenhang stehenden Transaktionen T1 – Tx im Sprachdialogsystem 1 jeweils zumindest eine übereinstimmende Kontextinformation KI zugeordnet und somit die einen Sinnzusammenhang aufweisenden Transaktionen T2, T3 zu jeweils einer Transaktionsgruppe TG1 – TGx mit übereinstimmender Kontextinformation KI zusammengefasst. In 1 sind beispielhaft eine zweite und dritte Transaktion T2, T3 zu einer ersten Transaktionsgruppe TG1 zusammengefasst.
  • Insbesondere eine Hintergrundapplikation HA wie beispielsweise ein „Unified Messaging System" mit einer Vielzahl von ähnlichen Funktionen betreffenden Transaktionen T1 – Tx, so dass viele der Transaktionen T1 – Tx derartige Übereinstimmungen aufweisen. Beispielsweise der ersten Transaktion T1 = „Email lesen" und der zweiten Transaktion T2 = „Email löschen" kann durch die Zuordnung der Kontextinformation KI = „Email Verarbeitung" zu einer ersten Transaktionsgruppe TG1 = „Email Verarbeitung" zusammengefasst werden. Somit wird durch die Kontextinformation KI die kontextbedingte Verknüpfung unterschiedlicher Transaktionen T1 – Tx untereinander für die aktuelle Ermittlung einer Transaktion T1 bis Tx ausgewertet und hierdurch der Zeit- und Rechenaufwand für die Durchführung des Ermittlungsverfahrens deutlich reduziert.
  • In der Speichereinheit 5 wird die Kontextinformation KIletzt zumindest der zuletzt in der Dialog-Management-Einheit 3 ausgeführten Transaktion Tletzt gespeichert und bei der aktuellen Ermittlung einer Transaktion T1 – Tx berücksichtigt, und zwar derart, dass bevorzugt diejenigen Transaktionen T2, T3 bei der Ermittlung berücksichtigt werden, deren zugeordnete Kontextinformation KI mit der gespeicherten Kontextinformtion KIletzt übereinstimmt. Für die Ermittlung der aktuellen Transaktion T1 – Tx wird somit zunächst diejenige Transaktionengruppe TG1 – TGx betrachtet, der die zuletzt ausgeführte Transaktion Tletzt angehört. Hierdurch werden besonders vorteilhaft die Transaktionen T1 – Tx der ermittelten Transaktionsgruppe TG1 – TGx im Auswahlverfahren priorisiert und somit diejenigen Transaktionen T1 – Tx ausgeführt, die die größte „Trefferwahrscheinlichkeit" aufweisen.
  • Zur Überprüfung der Kontextinformation KI ist der Transaktion T1 – Tx jeweils eine Kontextinformationsroutine KIR zugeordnet, die die Übereinstimmung der der Transaktion T1 zugeordneten Kontextinformation KI mit der in der Speichereinheit 5 gespeicherten Kontextinformation KIletzt der zuletzt in der Dialog-Management-Einheit 3 ausgeführten Transaktion Tletzt überprüft. Stimmen die zuletzt gespeicherte Kontextinformation KIletzt und die der ersten Transaktion T1 zugeordnete Kontextinformation KI überein, so wird die betrachtete erste Transaktion T1 bei der Ermittlung der aktuellen Transaktion bevorzugt berücksichtigt, d.h. die aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI über die in der Parsereinheit 8 ausgeführte Grammatikroutine GR der betrachteten Transaktion T1 ausgewertet. Die Kontextinformation KI kann beispielsweise den Parametertyp „String" aufweisen, der einen den Sinnzusammenhang zwischen den Transaktionen T1 bis Tx wiedergebenden Oberbegriff darstellt.
  • Zusätzlich ist jeder Transaktion T1 – Tx eine Transaktionsparameterroutine TPR zugeordnet, die – neben den ermittelten Transaktionsparametern P1 – Px – Transaktionsparameterprompts TPP, eine Parametergrammatik PGR sowie eine Wertermittlungsinformation WEI aufweist. Die Transaktion T1 wird durch ihre Transaktionsparameter P1 – Px inhaltlich spezifiziert, deren Werte über die Transaktionsparameterroutine TPR ermittelt werden. Hierzu werden über die in Parsereinheit 8 ausgeführte Parametergrammatik PGR aus den Aktionsinformationen AI die Werte der Transaktionsparameter P1 – P1x ermittelt. Die zur Ausführung der Transaktion T1 – Tx noch zu bestimmenden Transaktionsparameter P1 – Px werden durch Ausgabe des jeweils zugeordneten Transaktionsparameterprompts TPP an den Benutzer B und dessen in einer weiteren Benutzeräußerung BE enthaltenen Aktionsinformationen AI im Rahmen eines Klärungsdialoges abgefragt.
  • Ferner wird über jeweils den einzelnen Transaktionsparametern P1 – Px zugeordnete Wertermittlungsinformationen WEI festgelegt, auf welche Weise die Ermittlung der Transaktionsparameter P1 – Px erfolgen soll bzw. kann. Beispielsweise können zur Ermittlung der Transaktionsparameter P1 – Px neben der Durchführung eines Klärungsdialogs mit dem Benutzer B bereits im Sprachdialogsystem 1 vorliegende Parameterwerte bzw. Statusinformationen ausgewertet werden. Hierzu wird die Abhängigkeit eines Transaktionsparameters P1 – Px von dem Vorliegen oder Nicht-Vorliegen eines vorgegebenen Dialogstatus ausgewertet. Somit können mit Hilfe von Wertermittlungsinformationen WEI unterschiedliche Wege zur Ermittlung des Wertes eines Transaktionsparameters P1 – Px vorgegeben werden, wodurch unnötige Benutzerabfragen im Rahmen eines Klärungsdialoges vermieden werden können.
  • Zur Überprüfung der Gültigkeit eines geänderten Transaktionsparameters ist eine Constraint-Routine CR pro Transaktion T1 – Tx vorgesehen, welche Triggerparameter TR, logische Bedingungen LB sowie Aktionsanweisungsprompts AA umfasst. Über die Contraint-Routine CR wird somit der geänderte Parameterwert eines Transaktionsparameters P1 – Px auf seine Gültigkeit mit Hilfe der vorgegebenen Triggerparameter TR sowie der logischen Bedingung LB ermittelt und bei einem Abweichen über Aktionsanweisungsprompts AA an dem Benutzer B kommuniziert. Beispielsweise wird als logische Bedingung LB vorgegeben, die Summe aus zwei Transaktionsparametern P1, P2 zu bilden und zu überprüfen, ob diese beispielsweise einen oberen Grenzwert Pmax überschreitet. Beim Überschreiten des oberen Grenzwertes Pmax wird der zugeordnete Aktionsanweisungsprompt AA der Contraint-Routine CR ausgegeben. Alternativ kann auch abhängig von der Auswertung der logischen Bedingung LB eine vorgegebene Systemfunktion initiiert werden.
  • Über eine Nachbedingungsroutine NBR wird überprüft, ob sämtliche für die Ausführung der jeweiligen Transaktion T1 – Tx erforderlichen Nachbedingungen NB, beispielsweise die für die Ausführung zumindest erforderlichen Transaktionsparameter P1 – Px, nunmehr vorliegen, d.h. die Lücken der als Rahmen modellierten Transaktion T1 gefüllt sind und mit Hilfe der ausgewählten Transaktion T1 die zugeordnete Funktion der Hintergrundapplikation HA nunmehr gestartet werden kann. Somit werden über die Nachbedingungsroutine NBR diejenigen Nachbedingungen NB überprüft, welche am Ende des Dialoges vorliegen müssen, um eine Übergabe sämtlicher für die Bedienung der Hintergrundapplikation HA erforderlichen Informationen über die Transaktion T1 zu gewährleisten. Vorteilhaft können durch die Nachbedingungsroutine NBR unterschiedlich komplexe Nachbedingungen NB für unterschiedliche Transaktionen T1 – Tx individuell definiert und abgeprüft werden.
  • Schließlich weist eine Transaktion T1 – Tx eine Systemaktionsroutine SAR auf, mit deren Hilfe die Ausgabe von spezifischen Aktionsprompts AP bzw. Systemaktionen SA umgesetzt wird. Die Systemaktionsroutine SAR umfasst hierzu beispielsweise Systemtriggerparameter TRP sowie Vorbedingungsinformationen VBI als auch vorgegebene Systemaktionen SA. Bei einer Änderung der Systemtriggerparameter TRP wird über die Vorbedingungsinformationen VBI die Initiierung der vorgegeben Systemaktionen SA verifiziert und gegebenenfalls die zugeordneten Systemaktionen SA gestartet. Mit Hilfe der Systemaktionsroutine SAR wird somit der Benutzer B über eine Änderung des Dialogstatus oder des Status der Hintergrundapplikation HA informiert.
  • In 3 ist das erfindungsgemäße Verfahren zur Ermittlung zumindest einer Transaktion T1 – Tx im Sprachdialogsystem 1 in einem Ablaufdiagramm beispielhaft dargestellt. Mittels einer in der Steuereinheit 9 ausgeführten Auswahlroutine AR werden die in 3 dargestellten fünf Verfahrensschritte S1 – S5 abgearbeitet. Zunächst wird in einem ersten Schritt S1 den in einem Sinnzusammenhang stehenden Transaktionen T1 – Tx jeweils eine übereinstimmende Kontextinformation KI zugeordnet.
  • Ferner wird im Rahmen der Ausführung einer Transaktion T1 – Tx jeweils die dieser zugeordnete Kontextinformation KI als zuletzt zugeordnete Kontextinformation KIletzt im Sprachdialogsystem 1 bzw. der Speichereinheit 5 der Dialog-Management-Einheit 3 gespeichert (zweiter Schritt S2).
  • Nach der Ermittlung der Aktionsinformationen AI aus der jeweils erfassten Benutzeräußerung BE (dritter Schritt S3) werden diejenigen Transaktionen T1 – Tx ermittelt, deren zugeordnete Kontextinformationen KI mit der zuletzt zugeordneten Kontextinformation KIletzt übereinstimmen (vierter Schritt S4).
  • In einem fünften und letzten Schritt S5 werden aus der endlichen Menge der Transaktionen T1 – Tx die zuvor ermittelten Transaktionen T2, T3 für die Ermittlung der aktuellen Transaktion T1 – Tx bevorzugt herangezogen.
  • Im Folgenden wird an einem Ausführungsbeispiel der Aufbau sowie die Parameter P1 – Px einzelner Transaktionen T1 bis T4 innerhalb des Sprachdialogsystems 1 näher beschrieben. Als Hintergrundapplikation HA wird beispielhaft ein „Unified Messaging System" betrachtet, welches in der Regel eine Telefonverbindung zwischen dem Benutzer B und dem Sprachdialogsystem 1 besteht, d.h. die Eingabeeinheit 2 ist als Mikrofoneinheit eines Telefons und die Ausgabeeinheit 4 als Lautsprechereinheit desselben ausgebildet. Als Grundfunktionen eines derartigen Unified Messaging System lassen sich folgende Funktionen nennen:
    • 1. Benutzeridentifizierung im Sprachdialogsystem (Login)
    • 2. Abfrage neuer Nachrichten
    • 3. Abfrage neuer Nachrichten einer bestimmten Person
    • 4. Senden von Nachrichten.
  • Zur Bedienung der genannten Grundfunktionen der Hintergrundapplikation Unified Messaging System werden vier Transaktionen T1 – T4 auf Dialoglevel modelliert, wobei beispielhaft jeweils eine Transaktion T1 – T4 eine der genannten Grundfunktionen zugeordnet ist, d.h. anhand der ersten Transaktion T1 wird die Benutzeridentifizierung, anhand der zweiten Transaktion T2 das Abhören von neuen Nachrichten, über die dritte Transaktion T3 das Abhören von Nachrichten einer bestimmten Person und mittels der vierten Transaktion T4 das Senden von Nachrichten über das Sprachdialogsystem 1 gesteuert.
  • Erste Transaktion T1: „Benutzeridentifizierung"
  • Über die Dialog-Management-Einheit 3 werden anhand der Grammatikroutine GR die aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der ersten Transaktion T1 erforderlichen Grammatiken G1 – Gx bzw. deren Schlüsselbegriffe verglichen und bei Übereinstimmung die zugehörige Transaktion T1 gestartet.
  • Für die weitere Ausführung der ersten Transaktion T1 „Benutzeridentifizierung" ist es erforderlich, dass der Benutzer B noch nicht im Sprachdialogsystem 1 angemeldet ist. Dies entspricht zugleich dem Vorbedingungsparameter VBP für die Ausführung der ersten Transaktion T1, welcher über die Vorbedingungsroutine VBR überprüft wird. Ist der Benutzer B bereits im Sprachdialogssystem 1 eingeloggt, so wird die Ausführung der ersten Transaktion T1 unterbrochen und dem Benutzer B ein entsprechendes Aktionsprompt AP ausgegeben. Ist der Benutzer noch nicht im Sprachdialogssystem 1 angemeldet, wird die erste Transaktion T1 weiter ausgeführt und anhand der Transaktionsparameterroutine TPR die der ersten Transaktion T1 „Benutzeridentifizierung" zugeordneten Transaktionsparameter P1 = "Benutzername" und P2 = "Passwort" ermittelt. Als Benutzername wird im Folgenden beispielhaft die Telefonnummer des Benutzers B angenommen.
  • Der Benutzer B gibt als Benutzeräußerung BE seine Telefonnummer und das zugehörige Passwort in das Sprachdialogsystem 1 ein. Die Benutzeräußerung BE wird über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Telefonnummer und das Passwort ermittelt sowie als Aktionsinformationen AI in der Speichereinheit 5 gespeichert. Mittels der Transaktionsparameterroutine TPR werden aus den gespeicherten Aktionsinformationen AI die zur Ausführung der ersten Transaktion T1 erforderlichen ersten und zweiten Transaktionsparameter P1 = „Benutzername" und P2 = „Passwort" bestimmt.
  • Über die Nachbedingungsroutine NBR wird das Vorliegen der für die Ausführung der der ersten Transaktion T1 „Benutzeridentifizierung" zugeordneten Funktion der Hintergrundapplikation HA „Unified Messaging System" erforderlichen ersten und zweiten Transaktionsparameter P1, P2 überprüft und anschließend die zugehörige Funktion aufgerufen. Ferner wird ein den Status des Identifizierungsprozesses anzeigender Aktionsprompt AP an den Benutzer B über die Ausgabeeinheit 4 ausgegeben.
  • Abschließend oder zu einem beliebig gewählten Zeitpunkt während der Transaktionsverarbeitung wird gegebenenfalls eine der ersten Transaktion T1 zugeordnete Kontextinformation KI in der Speichereinheit 5 gespeichert.
  • Die geschilderte Dialogabfolge wird anhand der nachfolgenden schematischen Tabellendarstellung nochmals kurz zusammengefasst:
    Figure 00150001
  • Zweite Transaktion T2: „Abfrage neuer Nachrichten"
  • Der Benutzer B gibt hierzu beispielsweise folgende Benutzeräußerung BE in das Sprachdialogsystem 1 ein: „Ich möchte meine neuen Nachrichten abhören". Die Benutzeräußerung BE wird über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt und in der Speichereinheit 5 gespeichert. Mögliche Aktionsinformationen AI können hierbei die Begriffe „neue", „Nachrichten" und „abhören" sein.
  • Über die Kontextinformationsroutine KIR wird zunächst die jeweils einer Transaktion T1 – Tx zugeordnete Kontextinformation KI mit der der zuletzt abgespeicherten Kontextinformation KIletzt verglichen und bei einer Übereinstimmung dieser die betrachtete Transaktion T2, T3 bevorzugt zur Ermittlung der aktuellen Transaktion T2 herangezogen. Alternativ kann mittels der in der Steuereinheit 9 ausgeführten Auswahlroutine AR die zuletzt abgespeicherte Kontextinformation KIletzt geladen werden und nach Abfrage der Kontextinformationen KI der einzelnen Transaktionen T1 – Tx diejenigen Transaktionen T2, T3 mit übereinstimmender Kontextinformation KI für die Ermittlung der aktuellen Transaktion T2, T3 bereitgestellt werden.
  • Anschließend wird die jeweilige Grammatikroutine GR der in einem Sinnzusammenhang stehenden, d.h. dieselbe Kontextinformation KI aufweisenden Transaktionen T2, T3 gestartet und die Übereinstimmung der aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der zweiten bzw. dritten Transaktion T2, T3 erforderlichen Grammatiken G1 – Gx bzw. deren Schlüsselbegriffe überprüft und bei Übereinstimmung die ermittelte Transaktion T2 gestartet. Im vorliegenden Fall ist der zweiten Transaktion T2 „Abfrage neuer Nachrichten" beispielsweise die Kontextinformation „Unified Messaging System: Nachrichtenabfrage" zugeordnet, welche bei Ausführung der zweiten Transaktion T2 wiederum in der Spei chereinheit 5 der Dialog-Management-Einheit 3 als zuletzt zugeordnete Kontextinformation KIletzt gespeichert wird.
  • Bevor die ermittelte zweite Transaktion T2 „Abfrage neuer Nachrichten" weiter ausgeführt wird, wird analog zuvor anhand der zugeordneten Vorbedingungsroutine VBR überprüft, ob die erste Transaktion T1 „Benutzeridentifizierung" erfolgreich durchgeführt wurde, d.h. der Benutzer B im Sprachdialogsystem angemeldet bzw. eingeloggt ist.
  • Über die Nachbedingungsroutine NBR der zweiten Transaktion T2 wird im Anschluss die der zweiten Transaktion T2 zugeordnete Funktion („Abfragen neuer Nachrichten") der Hintergrundapplikation HA „Unified Messaging System" aufgerufen und der zugehörige Informationsprompt AP zusammen mit den Nachrichten an den Benutzer B über die Ausgabeeinheit 4 ausgegeben.
  • Die der zweiten Transaktion T2 zugrundeliegende Dialogstruktur lässt sich somit beispielhaft wie folgt schematisch darstellen:
    Figure 00170001
  • Dritte Transaktion T3: „Abfrage neuer Nachrichten einer bestimmten Person"
  • Die abgegebene Benutzeräußerung BE „Ich möchte die neuen Nachrichten von Herrn Maier abhören" wird wiederum über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt, welche in der Speichereinheit 5 gespeichert wird. In der Dialog-Management-Einheit 3 ist nach der Ausführung der zweiten Transaktion T2 als zuletzt abgespeicherte Kontextinformation KIletzt „Unified Messaging System: Nachrichtenabfrage" gespeichert.
  • Über die jeweilige Kontextinformationsroutine KIR der Transaktionen T1 – Tx wird die Übereinstimmung mit der Kontextinformation „Unified Messaging System: Nachrichtenabfrage" geprüft und aufgrund der Übereinstimmung der Kontextinformation KI der dritten Transaktion T3 mit der zuletzt abgespeicherten Kontextinformation KIletzt diese bevorzugt herangezogen.
  • Anschließend wird die jeweilige Grammatikroutine GR der dritten Transaktion T3 gestartet und die Übereinstimmung der aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der dritten Transaktion T3 erforderlichen Grammatiken G1 – Gx bzw. deren Schlüsselbegriffe überprüft und bei Übereinstimmung dieser die dritte Transaktion T3 weiter ausgeführt.
  • In analoger Weise wird anhand der Vorbedingungsroutine VBR auch im Rahmen der dritten Transaktion T3 die erfolgreiche Ausführung der ersten Transaktion T1 „Benutzeridentifizierung" überprüft und aus den gespeicherten Aktionsinformationen AI über die Transaktionsparameterroutine TPR als Transaktionsparameter P1 = „Name" der Name der Person („Herr Maier") ermittelt, dessen neue Nachrichten dem Benutzer B ausgegeben werden sollen. Ebenso wird die Kontextinformation KI „Unified Messaging System: Nachrichtenabfrage" in der Speichereinheit 5 als zuletzt vorliegende Kontextinformation KIletzt gespeichert.
  • Anhand der folgenden Tabelle werden die beschriebenen Schritte der dritten Transaktion T3 beispielhaft anhand einer Tabelle dargestellt:
    Figure 00190001
  • Vierte Transaktion T4: „Senden einer Nachricht"
  • Um eine Nachricht über das Unified Messaging System aufzuzeichnen und anschließend an eine ausgewählte Person zu versenden ist die vierte Transaktion T4 vorgesehen.
  • Diese wird durch den Benutzer B mittels der Eingabe beispielsweise der Benutzeräußerung BE = „Ich möchte eine Nachricht an Herrn Maier senden" initiiert. Die Benutzeräußerung BE wird wiederum über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt und in der Speichereinheit 5 gespeichert.
  • Unter Berücksichtigung der in der Dialog-Management-Einheit 3, nach der Ausführung der dritten Transaktion T3 zuletzt gespeicherten Kontextinformation KIletzt „Unified Messaging System: Nachrichtenabfrage" werden zunächst die Grammatikroutinen GR der zweiten und dritten Transaktionen T2, T3 auf Übereinstimmungen mit den gespeicherten Aktionsinformationen AI überprüft und im Anschluss daran die weiteren Transaktionen T4 – Tx herangezogen.
  • Schließlich wird die Grammatikroutine GR der vierten Transaktion T4 gestartet und die Übereinstimmung der aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der vierten Transaktion T4 erforderlichen Grammatiken G1 – Gx bzw. deren Schlüsselbegriffe überprüft und aufgrund deren Übereinstimmung mit den gespeicherten Transaktionsinformationen die vierte Transaktion T4 weiter ausgeführt.
  • Als Vorbedingung ist hierbei wiederum die erfolgreiche Anmeldung des Benutzers im System erforderlich, welche anhand der Vorbedingungsroutine VBR verifiziert wird.
  • Um eine Nachricht an den vorgegebenen Empfänger „Herrn Maier" zu senden, ist es zunächst erforderlich, dass der Benutzer BE die Nachricht in das Sprachdialogsystem 1 eingibt. Die Nachricht wird über die Dialog-Management-Einheit 3 als erster Transaktionsparameter P1 = „Message" aufgezeichnet. Nachdem der Benutzer die Nachricht eingegeben hat, hat dieser die Möglichkeit die korrekte Eingabe durch Abhören der aufgezeichneten Nachricht überprüfen zu können. Der Benutzer B kann hierzu über einen zweiten Transaktionsparameter P2 = „Listen" festlegen, ob er die aufgenommene Nachricht abhören will oder nicht.
  • Auch sollte durch das Sprachdialogsystem 1 bei einer fehlerhaften Aufnahme der Benutzer B dahingehend Unterstützung er fahren, dass eine erneute Aufnahme der Nachricht initiiert wird. Ist die aufgezeichnete Nachricht korrekt, so soll anhand eines dritten Transaktionsparameters P3 = „Confirm Message" dem Sprachdialogsystem 1 angezeigt werden, dass die aufgezeichnete Nachricht weiterbearbeitet werden kann.
  • Alternativ ist durch das Vorsehen der Wertermittlungsinformation WEI auch eine indirekte Bestätigung der korrekten Aufnahme der Nachricht, d.h. ohne Benutzereingriff möglich. Hierzu wird die Abhängigkeit zwischen dem zweiten und dritten Transaktionsparameter P2 = „Listen" und P3 = „Confirm Message" verwertet, und zwar derart, dass über die Wertermittlungsroutine WEI automatisch der Wert des dritten Transaktionsparameters P3 = "Confirm Message" auf „Ja" gesetzt wird und somit eine Weiterverarbeitung der aufgezeichneten Nachricht ohne nochmaliges Abspielen umgesetzt wird, sofern der zweite Transaktionsparameter P3 = "Listen" den Wert „Nein" aufweist.
  • Nach erfolgter Bestätigung der fehlerfreien Aufzeichnung der Nachricht wir mittels der Transaktionsparameterroutine TPR der Wert des vierten Transaktionsparameters P4 = "Receiver", nämlich der Empfänger der aufgezeichneten Nachricht, ermittelt.
  • Schließlich wird nochmals mittels einem fünften Transaktionsparameter P5 = "Confirm Sending" vom Benutzer B die Bestätigung zum Absenden der aufgezeichneten Nachricht an den im Dialog-Management-System 3 gespeicherten Empfänger („Herrn Maier") abgefragt.
  • Zusätzlich können noch die Übermittlungsparameter bzgl. der aufgezeichneten Nachricht als weitere Transaktionsparameter P6 – Px („Special Settings"), beispielsweise die Vertraulichkeit, Dringlichkeit, Verschlüsselung etc., mittels eines weiteren Klärungsdialogs vom Benutzer B abgefragt werden.
  • Ferner werden abhängig von Systemtriggerparameter TRR bzgl. der vorliegenden Transaktionsparameter P1 – Px mittels der Systemactionroutine SAR zu den unterschiedlichen Systemtriggerparameter TRR zugeordnete Systemactions SA ausgeführt. Beispielsweise wird bei einem den Wert „Ja" aufweisenden zweiten Transaktionsparameter P2 = „Listen" die Ausgabe der aufgezeichneten Nachricht gestartet und bei einem den Wert „Nein" aufweisenden dritten Transaktionsparameter P3 = „Confirm Message" oder einem den Wert „Nein" aufweisenden fünften Transaktionsparameter P5 = "Confirm Sending" das Löschen der aufgezeichneten Nachricht vorgenommen.
  • Über die Kontextinformationsroutine KIR wird auch im Rahmen der vierten Transaktion T4 die Kontextinformation KI „Unified Messaging System: Nachrichtenversand" in der Speichereinheit 5 als zuletzt vorliegende Kontextinformation KIletzt gespeichert.
  • Über die Nachbedingungsroutine NBR der vierten Transaktion T4 wird die zugeordnete Funktion („Nachricht senden") innerhalb des Unified Messaging Systems aufgerufen und der zugehörige Informationsprompt AP erzeugt und über die Ausgabeeinheit 4 ausgegeben.
  • Im Folgenden wird anhand einer Tabelle die Modellierung der vierten Transaktion T4 schematisch dargestellt:
    Figure 00220001
    Figure 00230001
  • Basierend auf der erläuterten Spezifizierung von vier Transaktionen T1 bis T4 wird im Folgenden beispielhaft ein Dialog zwischen einem Benutzer B und dem Sprachdialogsystem 1 beschrieben.
    System (AP1): Willkommen im Unified Messaging System. Bitte identifizieren Sie sich im System.
    Benutzer (BE1): 123456
    System (AP2): Telefonnummer 123456, bitte geben Sie Ihr Passwort ein.
    Benutzer (BE2): 333666
    System (AP3): Sie sind im System eingeloggt. Was kann ich für Sie tun?
    Benutzer (BE3): Ich möchte alle neuen Nachrichten von Herrn Maier abhören.
    System (AP4): Nachrichten von Herrn Maier ... einen Moment bitte ...
    System (AP5): Sie haben zwei neue Nachrichten von Herrn Maier: Erste Nachricht ...; Zweite Nachricht ...
    Benutzer (BE4): Ich möchte eine Nachricht an Herrn Maier senden.
    System (AP6): Bitte geben Sie Ihre Nachricht ein und drücken Sie nach Ihrer Eingabe die #-Taste.
    Benutzer (BE5): Sehr geehrter Herr Maier, ich nehme ... (# gedrückt)
    System (AP7): Wollen Sie Ihre aufgenommen Nachricht abhören?
    Benutzer (BE6): Nein
    System (AP8): Wollen Sie die Nachricht normal senden?
    Benutzer (BE7): Ja
    System (AP9): Ihre Nachricht wurde gesendet.
  • Anhand der nachfolgenden tabellarischen Darstellung wird die Veränderung der jeweiligen Transaktionsparameter P1 – Px im Rahmen des beschriebenen Dialoges tabellarisch dargestellt:
  • BE4: Ich möchte eine Nachricht an Herrn Maier senden.
    Figure 00250001
  • BE5: Sehr geehrter Herr Maier, ich nehme ... (# gedrückt)
    Figure 00250002
  • BE6: Nein
    Figure 00250003
  • BE7: Ja
    Figure 00260001
  • Über die Vorbedingungsparameter VBP sowie die zugeordneten Kontextinformationen KI wird somit eine schnelle Identifizierung der vom Benutzer B gewünschten Funktion der Hintergrundapplikation bzw. der dieser zugeordneten Transaktion T1 – Tx realisiert. Insbesondere durch die Abspeicherung der zuletzt vorliegenden Kontextinformation KIletzt in der Speichereinheit 5 der Dialog-Management-Einheit 3 und die zunächst beschränkte Auswertung der mit den erhaltenen Aktionsinformationen AI im Hinblick auf die eine übereinstimmende Kontextinformation KI aufweisenden Transaktionen T2, T3 einer Transaktionsgruppe TG1 wird die Nutzerfreundlichkeit sowie der Bedienkomfort des Sprachdialogsystems 1 deutlich erhöht.
  • Die Erfindung wurde voranstehend anhand eines Ausführungsbeispiels näher beschrieben. Es versteht sich von selbst, daß zahlreiche Modifikationen sowie Abwandlungen möglich sind, ohne daß dadurch der der Erfindung zugrunde liegende Erfindungsgedanke verlassen wird.
  • 1
    Sprachdialogsystem
    2
    Eingabeeinheit
    3
    Dialog-Management-Einheit
    4
    Ausgabeeinheit
    5
    Speichereinheit
    6
    Spracherkennungseinheit
    7
    Sprachsyntheseeinheit
    8
    Parsereinheit
    9
    Steuereinheit
    AA
    Aktionsprompts
    AI
    Aktionsinformation
    AP, AP1 – AP9
    Ausgabeprompt
    AR
    Auswahlroutine
    B
    Benutzer
    BE, BE1 – BE7
    Benutzeräußerung
    CR
    Constraint-Routine
    DBS
    Datenbussystem
    G1 – Gx
    Grammatiken
    G1* – Gx*
    kontextabhängige Grammatiken
    GR
    Grammatikroutine
    HA
    Hintergrundapplikation
    KI
    Kontextinformation
    KIletzt
    zuletzt gespeicherte Kontextinformation
    KIR
    Kontextinformationsroutine
    LB
    logische Bedingungsparameter
    NBA
    Nachbedingungsaktionen
    NBP
    Nachbedingungsparameter
    NBR
    Nachbedingungsroutine
    P1 – Px
    Transaktionsparameter
    Pmax
    oberer Grenzwert
    PGR
    Parametergrammatiken
    PP
    Parameterprompt
    S1 – S5
    erster bis fünfter Schritt
    SA
    Systemaction
    SAR
    Systemactionroutine
    T1 – Tx
    Transaktionen
    Tletzt
    zuletzt ausgeführte Transaktion
    TG
    Transaktionsgruppe
    TPP
    Triggerparameter
    TPR
    Transaktionsparameterroutine
    TRR
    Systemtriggerparameter
    VBI
    Vorbedingungsinformationen
    VBP
    Vorbedingungsparameter
    VBR
    Vorbedingungsroutine
    VBR
    Vorbedingungsroutine
    VB
    Vorbedingung
    WEI
    Wertermittlungsinformation

Claims (19)

  1. Verfahren zur Ermittlung zumindest einer Transaktion (T1 – Tx) zur Bedienung einer Hintergrundapplikation (HA) unter Auswertung von zumindest einer in einer Benutzeräußerung (BE) enthaltenen Aktionsinformation (AI) in einem Sprachdialogsystem (1), wobei jeweils einer Hintergrundapplikation (HA) eine endliche Menge auswählbarer Transaktionen (T1 –Tx) zugeordnet sind und bei dem über eine im Sprachdialogsystem (1) vorgesehene Eingabeeinheit (2) zumindest eine Benutzeräußerung (BE) erfasst und im Sprachdialogsystem (1) gespeichert wird, dadurch gekennzeichnet, – dass in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) im Sprachdialogsystem (1) jeweils zumindest eine übereinstimmende Kontextinformation (KI) zugeordnet wird, – dass die Kontextinformation (KIletzt) zumindest der zuletzt ausgeführten Transaktion (Tletzt) im Sprachdialogsystem gespeichert wird und – dass zur Ermittlung der aktuellen Transaktion (T1 –Tx) bevorzugt diejenigen Transaktionen (T2, T3) berücksichtigt werden, deren zugeordnete Kontextinformation (KI) mit der gespeicherten Kontextinformation (KIletzt) übereinstimmt.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) zu einer Transaktionsgruppe (TG1) mit jeweils übereinstimmender Kontextinformation (KI) zusammengefasst werden.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die aktuelle Transaktion (T1 – T4) mittels der jeweils einer Transaktion (T1 – Tx) zugeordneten Grammatikroutine (GR) und dieser zugeordneter Grammatiken (G1 – Gx) durch Auswertung der in der Benutzeräußerung (BE) enthaltenen Aktionsinformationen (AI) ermittelt wird.
  4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass im Sprachdialogsystem (1) jeweils einer Transaktion (T1 – Tx) eine vorgebbare Anzahl an Transaktionsparametern (P1 – Px) zugeordnet wird.
  5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zumindest eine in der gespeicherten Benutzeräußerung (BE) enthaltene Aktionsinformation (AI) mit Hilfe einer Spracherkennungseinheit (6) ermittelt wird.
  6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zumindest einer der Transaktionen (T1 – Tx) zumindest ein Vorbedingungsparameter (VBP) zugeordnet wird.
  7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass das Vorliegen des zumindest einen zugeordneten Vorbedingungsparameters (VBP) mittels einer zugehörigen Vorbedingungsroutine (VBR) verifiziert wird.
  8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass durch die Vorbedingungsroutine (VBR) die Aktivierung bzw. Deaktivierung einer weiteren Transaktion (T1) überprüft wird.
  9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass abhängig vom Ergebnis der Überprüfung ein im Sprachdialogsystem (1) gespeicherter, zugeordneter Parameterprompt (PP) ausgewählt und über die Ausgabeeinheit (4) ausgegeben wird oder die Ausführung der aktuell ermittelten Transaktion (T2, T3, T4) fortgeführt wird.
  10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zumindest einer der Transaktionen (T1 – Tx) zumindest ein Nachbedingungsparameter (NBP) zugeordnet wird.
  11. Verfahren nach Ansprüche 10, dadurch gekennzeichnet, dass nach der Ausführung der aktuell ermittelten Transaktion (T1, T2, T3, T4) eine zugehörige Nachbedingungsroutine (BNR) gestartet wird und mittels dieser das Vorliegen der zugeordneten Nachbedingungsparameter (NBP) überprüft sowie zugeordnete Nachbedingungsaktionen (NBA) initiiert werden.
  12. Verfahren nach einem der Ansprüche 4 bis 11, dadurch gekennzeichnet, dass der Parameterwert eines Transaktionsparameters (P1 – Px) mittels einer Transaktionsparameterroutine (TPR) ermittelt wird, wobei zumindest einem Transaktionsparameter (P5) eine Wertermittlungsinformation (WEI) zugeordnet ist, die den Ermittlungsweg angibt.
  13. Verfahren nach einem der Ansprüche 4 bis 12, dadurch gekennzeichnet, dass bei einer Änderung eines Transaktionsparameters (P1 – Px) einer Transaktion (T1 – Tx) die Gültigkeit des geänderten Transaktionsparameters (P1 – Px) überprüft wird.
  14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass die Überprüfung der Gültigkeit des geänderten Transaktionsparameters (P1 – Px) mittels einer Constraint-Routine (CR) durchgeführt wird, welche Trigger-Parameter (TR), zumindest eine logische Bedingung (LB) und Aktionsanweisungsprompts (AA) umfasst.
  15. Verfahren nach einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, dass dem Benutzer (B) des Sprachdialogsystem (1) während der Ausführung der aktuell ermittelten Transaktion (T1 – Tx) einer Hintergrundapplikation (HA) vorgegebene Informations- bzw. Aktionsprompts (AP) angezeigt werden.
  16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass die vorgegebenen Informations- bzw. Aktionsprompts (AP) mit Hilfe einer System-Action-Routine (SAR) ermittelt werden, welche Trigger-Parameter (TRR), Vorbedingungsinformationen (VBI) und vorgegebene Systemactions (SA) umfasst.
  17. Verfahren nach Anspruch 1 bis 16, dadurch gekennzeichnet, dass den einzelnen Transaktionen (T1 – T4) jeweils eine von der zugeordneten Kontextinformation (KI) abhängige Grammatik (G1* – Gx*) zugeordnet wird.
  18. Sprachdialogsystem zur Durchführung des Verfahrens gemäß einer der Ansprüche 1 bis 17 bestehend aus zumindest einer Eingabeeinheit (2), einer Dialog-Management-Einheit (3) und einer Ausgabeeinheit (4), dadurch gekennzeichnet, – dass die Dialog-Management-Einheit (3) eine Steuereinheit (9) zur Zuordnung zumindest einer übereinstimmenden Kontextinformation (KI) zu in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) aufweist, – dass eine Speichereinheit (5) zur Speicherung zumindest der Kontextinformation (KIletzt) der zuletzt ausgeführten Transaktion (Tletzt) vorgesehen ist und – dass eine in der Steuereinheit (9) ausgeführte Auswahlroutine (AR) vorgesehen ist, die bevorzugt diejenigen Transaktionen (T2, T3) für die Ermittlung der aktuellen Transkation (T1 – Tx) auswählt, deren zugeordnete Kontextinformation (KI) mit der gespeicherten Kontextinformation (KIletzt) übereinstimmt.
  19. Sprachdialogsystem nach Anspruch 18, dadurch gekennzeichnet, dass die zu bedienende Hintergrundapplikation (HA) als „Unified Messaging Systeme" ausgebildet ist.
DE102005037621A 2005-08-09 2005-08-09 Verfahren und Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation Ceased DE102005037621A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102005037621A DE102005037621A1 (de) 2005-08-09 2005-08-09 Verfahren und Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation
PCT/EP2006/064501 WO2007017361A1 (de) 2005-08-09 2006-07-21 Verfahren und sprachdialogsystem zur ermittlung zumindest einer transaktion zur bedienung einer hintergrundapplikation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102005037621A DE102005037621A1 (de) 2005-08-09 2005-08-09 Verfahren und Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation

Publications (1)

Publication Number Publication Date
DE102005037621A1 true DE102005037621A1 (de) 2007-02-22

Family

ID=37179086

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102005037621A Ceased DE102005037621A1 (de) 2005-08-09 2005-08-09 Verfahren und Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation

Country Status (2)

Country Link
DE (1) DE102005037621A1 (de)
WO (1) WO2007017361A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008025532A1 (de) * 2008-05-28 2009-12-10 Audi Ag Kommunikationssystem und Verfahren zum Durchführen einer Kommunikation zwischen einem Nutzer und einer Kommunikationseinrichtung

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9661138B2 (en) 2015-01-14 2017-05-23 Unify Gmbh & Co. Kg System and method for automatic intention evaluation and communication routing

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6314398B1 (en) * 1999-03-01 2001-11-06 Matsushita Electric Industrial Co., Ltd. Apparatus and method using speech understanding for automatic channel selection in interactive television
CA2408584A1 (en) * 2000-04-06 2001-10-18 One Voice Technologies, Inc. Natural language and dialogue generation processing
EP1335352A1 (de) * 2002-02-11 2003-08-13 Sony International (Europe) GmbH Dialogverwaltungsserver und Verfahren zur Dialogverwaltung
ATE470218T1 (de) * 2004-10-05 2010-06-15 Inago Corp System und verfahren zur verbesserung der genauigkeit der spracherkennung

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008025532A1 (de) * 2008-05-28 2009-12-10 Audi Ag Kommunikationssystem und Verfahren zum Durchführen einer Kommunikation zwischen einem Nutzer und einer Kommunikationseinrichtung
DE102008025532B4 (de) * 2008-05-28 2014-01-09 Audi Ag Kommunikationssystem und Verfahren zum Durchführen einer Kommunikation zwischen einem Nutzer und einer Kommunikationseinrichtung

Also Published As

Publication number Publication date
WO2007017361A1 (de) 2007-02-15

Similar Documents

Publication Publication Date Title
EP1964110B1 (de) Verfahren zur ansteuerung von zumindest einer ersten und zweiten hintergrundapplikation über ein universelles sprachdialogsystem
DE69839068T2 (de) System und Verfahren zur automatischen Verarbeitung von Anruf und Datenübertragung
EP1071075B1 (de) Verfahren und Vorrichtung zur Eingabe von Daten
DE69835718T2 (de) Verfahren und Gerät zur Sprachinteraktion über ein Netzwerk unter Verwendung von parametrierbaren Interaktionsdefinitionen
DE60037164T2 (de) Verfahren und Vorrichtung zum Zugriff auf ein Dialog-System für mehrere Klienten
DE60001765T2 (de) Verfahren und Gerät zur Zusammensetzung und Präsentation von strukturierten Sprachpostnachrichten
EP3108476B1 (de) Verfahren zur erfassung wenigstens zweier zu erfassender informationen mit zu verknüpfendem informationsgehalt durch eine sprachdialogeinrichtung, sprachdialogeinrichtung und kraftfahrzeug
EP0852051A1 (de) Verfahren zur automatischen steuerung eines oder mehrerer geräte durch sprachkommandos oder per sprachdialog im echtzeitbetrieb und vorrichtung zum ausführen des verfahrens
DE102011118780A1 (de) Verfahren und system für das erzeugen einerzusammenarbeitszeitachse, die anwendungsartefakte im kontext illustriert
EP1590797A1 (de) Kommunikationssystem, kommunikationsendeinrichtung und vorrichtung zum erkennen fehlerbehafteter text-nachrichten
DE10208295A1 (de) Verfahren zum Betrieb eines Sprach-Dialogsystems
EP1282897B1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
DE69636731T2 (de) System und Verfahren zur Aufnahme von Namen in einer Spracherkennungsdatenbank
EP1251680A1 (de) Sprachgesteuerter Verzeichnisdienst für Verbindung an ein Datennetzwerk
DE102012200138B4 (de) Telefonbuchdatenprozessor
EP3058565B1 (de) Sprachsteuerungsverfahren sowie computerprogrammprodukt zur durchführung des verfahrens
DE102005037621A1 (de) Verfahren und Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation
DE60125597T2 (de) Vorrichtung für die Dienstleistungsvermittlung
EP1340169A2 (de) Verfahren und vorrichtung zur automatischen auskunfterleitung mittels einer suchmaschine
EP3115886A1 (de) Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem
EP3576084B1 (de) Effiziente dialoggestaltung
WO2001013196A2 (de) Serversystem und verfahren zur automatischen bestimmung, überwachung und übermittlung von aktuellen wertdaten individueller portefeuilles
DE102010026708A1 (de) Verfahren zum Betreiben eines Sprachdialogsystems und Sprachdialogsystem
EP1150479A2 (de) Verfahren zur interaktive Informationsabfrage mittels eines Mobiltelefons
DE102016008862A1 (de) Verfahren zum Konfigurieren einer sprachgesteuerten Bedienvorrichtung, Bedienvorrichtung mit Sprachsteuerung und Kraftfahrzeug

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection