[go: up one dir, main page]

DE102005037621A1 - Method and speech dialog system for determining at least one transaction for operating a background application - Google Patents

Method and speech dialog system for determining at least one transaction for operating a background application Download PDF

Info

Publication number
DE102005037621A1
DE102005037621A1 DE102005037621A DE102005037621A DE102005037621A1 DE 102005037621 A1 DE102005037621 A1 DE 102005037621A1 DE 102005037621 A DE102005037621 A DE 102005037621A DE 102005037621 A DE102005037621 A DE 102005037621A DE 102005037621 A1 DE102005037621 A1 DE 102005037621A1
Authority
DE
Germany
Prior art keywords
transaction
user
context information
information
transactions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102005037621A
Other languages
German (de)
Inventor
Hans-Ulrich Dr. Block
Rudolf Caspari
Dong Yi Song
Jürgen Totzke
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Corp
Original Assignee
Siemens Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Corp filed Critical Siemens Corp
Priority to DE102005037621A priority Critical patent/DE102005037621A1/en
Priority to PCT/EP2006/064501 priority patent/WO2007017361A1/en
Publication of DE102005037621A1 publication Critical patent/DE102005037621A1/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Unter Auswertung von zumindest einer in einer Benutzeräußerung (BE) enthaltenen Aktionsinformation (AI) wird in einem Sprachdialogsystem (1) zur Ermittlung zumindest einer aktuellen Transaktion (T1-Tx) in einem Sinnzusammenhang stehenden Transaktionen (T1-Tx) im Sprachdialogsystem (1) jeweils zumindest eine übereinstimmende Kontextinformation (KI) zugeordnet. Die Kontextinformation (KI¶letzt¶) zumindest der zuletzt ausgeführten Transaktion (T¶letzt¶) wird im Sprachdialogsystem (1) gespeichert und bei der Ermittlung der aktuellen Transaktion (T1-Tx) werden bevorzugt diejenigen Transaktionen (T2, T3) berücksichtigt, deren zugeordnete Kontextinformation (KI) mit der gespeicherten Kontextinformation (KI¶letzt¶) übereinstimmt.By evaluating at least one action information item (AI) contained in a user utterance (BE), a speech dialog system (1) is used to determine at least one current transaction (T1-Tx) related transactions (T1-Tx) in the speech dialog system (1) at least one matching context information (KI) is assigned. The context information (KI¶letzt¶) of at least the most recently executed transaction (T¶letzt¶) is stored in the speech dialog system (1) and when determining the current transaction (T1-Tx) those transactions (T2, T3) are preferably taken into account whose assigned context information (KI) matches the stored context information (KI¶letzt¶).

Description

Die Erfindung betrifft ein Verfahren sowie ein zugehöriges Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation unter Auswertung von in einer Benutzeräußerung enthaltenen Aktionsinformationen in einem derartigen Sprachdialogsystem, wobei jeweils einer Hintergrundapplikation eine endliche Menge auswählbarer Transaktionen zugeordnet ist und bei dem über eine im Sprachdialogsystem vorgesehene Eingabeeinheit zumindest eine Benutzeräußerung erfasst und im Sprachdialogsystem gespeichert wird.The The invention relates to a method and an associated speech dialogue system for Determining at least one transaction for operating a background application under evaluation of action information contained in a user statement in such a speech dialogue system, each with a background application a finite set of selectable ones Transactions is assigned and with which over one in the speech dialogue system provided input unit detects at least one user utterance and stored in the speech dialogue system.

Sprachdialogsysteme für Datenbankzugriffe, welche Informationszugriffe sowie eine Steuerung von Kommunikationsapplikationen via Sprachkommunikation ermöglichen, sind als Schnittstellen zu vielen computergestützten Anwendungen bekannt. Anwendungen bzw. Hintergrundapplikationen, wie z.B. ein technisches Gerät der Unterhaltungselektronik, ein telefonisches Auskunftsystem (Bahn, Flug, Kino, etc.), ein computergestütztes Transaktionssystem (Homebanking-System, elektronische Warenbestellung etc.) sind in zunehmendem Maße über derartige Sprachdialogsysteme als Zugangssysteme („User-Interfaces") bedienbar. Derartige Sprachdialogsysteme können in Hardware, Software oder in einer Kombination daraus realisiert werden.IVR Systems for database access, which information accesses as well as a control of communication applications enable via voice communication, are known as interfaces to many computer-aided applications. Applications or background applications, e.g. a technical Device of Consumer electronics, a telephone information system (train, Flight, cinema, etc.), a computerized transaction system (home banking system, electronic goods order, etc.) are increasingly over such Speech dialogue systems as access systems ("user interfaces") operable Speech dialogue systems can realized in hardware, software or a combination thereof become.

Der Dialogverlauf zur Erreichung von anwendungspezifischen Dialogzielen wird über ein derartiges Sprachdialogsystem gesteuert, welches die Interaktionen zwischen einer Dialog-Management-Einheit und dem einzelnen Benutzer verwaltet. Hierzu weist die Dialog-Management-Einheit eine Eingabeeinheit sowie Ausgabeeinheit auf.Of the Dialogue course to achieve application-specific dialogue goals will over controlled such a speech dialogue system, which the interactions between a dialogue management unit and the individual user. This is indicated by the dialogue management unit an input unit and output unit.

Eine von einem Benutzer erzeugte Benutzeräußerung beispielsweise in Form eines Sprachsignals wird durch die Eingabeeinheit erfasst und in der Dialog-Management-Einheit gespeichert. Der Eingabeeinheit kann beispielsweise eine Spracherkennungseinheit nachgeschaltet sein, über welche eine Ermittlung von in einer Benutzeräußerung enthaltenen Aktionsinformationen durchgeführt wird. Zur Ausgabe von Aktionsprompts in Form von Sprachsignalen kann die Ausgabeeinheit als Sprachsyntheseeinheit ausgebildet sein.A for example, user generated user utterance a speech signal is detected by the input unit and stored in saved the dialogue management unit. The input unit can For example, be followed by a voice recognition unit, via which a determination of action information contained in a user utterance carried out becomes. To output action prompts in the form of speech signals the output unit can be designed as a speech synthesis unit.

Über die in der Dialog-Management-Einheit vorgesehene Spracherkennungseinheit werden aus dem Sprachsignal Aktionsinformationen beispielsweise in Form von einzelnen Wörtern oder Wörterketten gewonnen, welche durch Vergleich mit in einer Parsereinheit geladenen Schlüsselbegriffen bzw. Grammatiken ausgewertet werden. Abhängig von dem Auswerteergebnis wird eine einem oder mehreren Schlüsselbegriffen zugeordnete Transaktion zur Bedienung einer Hintergrundinformation gestartet. Abhängig von den Transaktionen wird über die Dialog-Management-Einheit ein Dialogverlauf mit dem jeweiligen Benutzer zur Steuerung der zugehörigen Hintergrundapplikation aufgenommen.About the provided in the dialogue management unit speech recognition unit For example, action information will become out of the speech signal in the form of individual words or words chains obtained by comparison with in a parser loaded keywords or grammars are evaluated. Depending on the evaluation result becomes a transaction associated with one or more key terms started to operate a background information. Depending on the transactions will be over the dialogue management unit a dialogue history with the respective user to control the associated Background application added.

Derzeit sind drei Ansätze zur Realisierung von derartigen Sprachdialogsystemen bekannt, nämlich der „Finite-State-Based" Ansatz, der „Frame-Based" Ansatz und der „Agent-Based" Ansatz. Der „Frame-Based" bzw. rahmenorientierte Ansatz findet derzeitig in der Praxis die weiteste Verbreitung. Da der Dialogverlauf von rahmenorientierten Sprachdialogsystemen nicht an einer hierarchischen Baumstruktur organisiert ist, ermöglichen dieser eine große Flexibilität. Vielmehr ist jede Transaktion anhand eines Rahmens modelliert, welcher mehrere Lücken aufweist, die durch die Zuordnung von Transaktionsparameter gefüllt werden.Currently are three approaches for the realization of such speech dialogue systems, namely the "Finite State Based" approach, the "Frame Based" approach and the "Agent Based" approach, the "Frame Based" or frame oriented Approach is currently the most widely used in practice. Since the dialogue process of frame-oriented speech dialogue systems not organized on a hierarchical tree structure this one big one Flexibility. Rather, each transaction is modeled on a framework that has multiple ones Gaps which are filled by the assignment of transaction parameters.

Damit ein Benutzer seine Anfragen in gesprochener natürlicher Sprache stellen kann, ist die Verwendung von Spracherkennungsmodulen bzw. -einheiten erforderlich. Derartige Sprach erkennungsmodule sind beispielsweise aus der DE 197 19 381 C1 und der DE 199 56 747 C1 bekannt.In order for a user to be able to voice his requests in spoken natural language, the use of speech recognition modules or units is required. Such speech recognition modules are for example from the DE 197 19 381 C1 and the DE 199 56 747 C1 known.

Ferner ist bereits ein Verfahren zur Aktionsermittlung ( DE 196 15 693 C1 ) bekannt, bei dem ein Benutzer gezielte Befehle erteilt oder eine gezielte Anfrage an ein Sprachdialogsystem stellt, ohne dass ihm die zur Verfügung stehenden Auswahlalternativen langwierig aufgezählt werden. Hierdurch wird ein direkter Zugriff auf eine Vielzahl von Funktionen eines Sprachdialogsystems möglich, der lediglich einen Dialog erfordert, sofern die Anfangsäußerungen des Benutzers unvoll-ständig oder mehrdeutig oder in Widerspruch zu einzelnen Möglichkeiten der Hintergrundapplikation stehen. In dem beschrieben Fällen greift das beschriebene Sprachdialogsystem mit der Bezeichnung DIANE ein und führt mit dem Benutzer einen Klärungsdialog durch, um die Benutzerintension zu ermitteln und fehlende Informationseinheiten zu erfragen. Dem beschriebenen Verfahren liegt das folgende abstrakte Aufgabenmodell zugrunde:
Eine Hintergrundapplikation wird als eine endliche Menge von Transaktionen (T1, T2, .... Tx) aufgefasst, wobei jeder Transaktion eine endliche Menge (die auch leer sein kann) von Transaktionsparametern (P1, P2, .....Px) zugeordnet sind. Die Transaktionsparameter sind dem Sprachdialogsystem bekannt. Zu jedem Transaktionsparameter ist eine Grammatik vorgesehen, die dazu dient, den Transaktionsparameter im Dialog zu erfassen.
Furthermore, a procedure for action determination ( DE 196 15 693 C1 ), in which a user gives specific commands or makes a specific request to a speech dialogue system, without him the choice alternatives available are tediously enumerated. As a result, a direct access to a variety of functions of a speech dialogue system is possible, which requires only a dialogue, provided that the initial utterances of the user are incomplete or ambiguous or in contradiction to individual possibilities of the background application. In the described cases, the described speech dialogue system with the name DIANE intervenes and carries out a clarification dialog with the user in order to determine the user's intention and to ask for missing information units. The described method is based on the following abstract task model:
A background application is considered to be a finite set of transactions (T1, T2, .... Tx), where each transaction is associated with a finite set (which may also be empty) of transaction parameters (P1, P2, ..... Px). The transaction parameters are known to the speech dialogue system. For each transaction parameter, a grammar is provided which serves to capture the transaction parameter in the dialog.

Der Benutzer kann die gewünschte Transaktion und die zugeordneten Transaktionsparameter in einem Satz benennen oder auch nicht. Im ersten Fall kann die Transaktion sofort durchgeführt werden, im zweiten Fall werden die noch unbekannten Parameter im Dialog mit dem Benutzer erfasst. Falls durch die Benutzeräußerung keine Transaktion eindeutig bestimmbar ist, führt das System automatisch einen Klärungsdialog zur Ermittlung der gewünschten Transaktion durch. Gleiches gilt für unklare oder unvollständige Transaktionsparametereingaben.Of the User can choose the desired Transaction and the assigned transaction parameters in one Naming a sentence or not. In the first case, the transaction done immediately In the second case, the still unknown parameters in Dialog with the user recorded. If by the user statement no Transaction is uniquely determinable, the system performs automatically a clarification dialogue for Determination of the desired Transaction through. The same applies to unclear or incomplete transaction parameter entries.

Aus der DE 101 10 977 C1 ist ein Verfahren und eine Anordnung zum Bereitstellen von Hilfe-Informationen für einen Benutzer eines Sprachdialogssystems zum Bedienen einer Hintergrundapplikation bekannt, bei dem abhängig von dem jeweils vorliegenden Dialogstatus vorgegebene Hilfeinformationen ermittelt und an den Benutzer ausgegeben werden. Dem Benutzer werden somit abhängig von seinem jeweiligen Dialogsstatus kontextsensitive Hilfe-Informationen durch das Sprachdialogssystem bereitgestellt.From the DE 101 10 977 C1 For example, a method and an arrangement for providing help information for a user of a speech dialogue system for operating a background application are known in which predefined help information is determined and output to the user depending on the existing dialog status. The user is thus provided with context-sensitive help information by the speech dialogue system, depending on his respective dialog status.

Ferner sind „Unified Messaging Systeme" bekannt, durch welche verschiedene Nachrichten auf einer Kommunikationsplattform gespeichert, verwaltet sowie der Zugriff auf diese über unterschiedliche Zugriffsarten ermöglicht wird. Beispielsweise können Emails, SMS oder auch klassische Telefon-, Fax- und Anrufbeantworter-Funktionen hierüber verknüpft werden, so dass beispielsweise über ein derartiges „Unified Messaging System" ein Fax, eine Email oder per Email eine SMS-Botschaft an ein Handy geschickt werden können. Anrufbeantworter-Nachrichten können wie gewohnt abgehört werden oder auch SMS und Emails mittels „Text-To-Speech" (TTS)-Verfahren vorgelesen werden. Über ein Sprachdialogsystem können somit die einzelnen Nachrichten von unterwegs abgehört, beantwortet, weitergeleitet oder gelöscht werden. Insbesondere bei einer derartigen Vielzahl von Funktionen der Hintergrundapplikation „Unified Messaging System" ist es für einen Benutzer oft sehr mühsam, sich von einer bestimmten Funktion zu einer anderen Funktion zu bewegen.Further are "unified Messaging Systems "known through which different messages on a communication platform stored, managed as well as access to these over different Allows access becomes. For example, you can Emails, SMS or even classic telephone, fax and answering machine functions here over connected so, for example, about such a "Unified Messaging System " Fax, send an email or email an SMS message to a mobile phone can be. Answering machine messages can listened to as usual or SMS and e-mails via "Text-To-Speech" (TTS) be read out. about a voice dialogue system can Thus, the individual messages heard while on the move, answered, forwarded or deleted become. Especially with such a variety of functions the background application "Unified Messaging System "is it for a user often very tedious, to move from one function to another move.

Damit derartige Sprachdialogsystem auf Dauer von einem breiten Benutzerkreis akzeptiert werden, ist neben einer sicheren Spracherkennung auch der Einsatz von Sprachdialogsystemen erforderlich, die den Benutzer nicht unnötige Zeit damit verbringen lassen, auf die richtige Frage des Sprachdialogsystems zu warten oder die richtige Frage durch etwaige Manipulationen zu erzwingen.In order to Such speech dialogue system in the long run by a wide circle of users Accepted is besides a secure speech recognition as well the use of speech dialogue systems required the user not unnecessary Spend time on the right question of the speech dialogue system to wait or ask the right question by any manipulation force.

Die Aufgabe der vorliegenden Erfindung besteht somit darin, ein Verfahren zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation sowie ein zugehöriges Sprachdialogsystem anzugeben, bei dem eine eindeutige Identifizierung der vom Benutzer gewünschten Hintergrundapplikation schnell und benutzerfreundlich, insbesondere auch bereits anhand von reduzierten Aktionsinformationen möglich wird. Die Aufgabe wird durch ein Verfahren gemäß Patentanspruch 1 sowie ein Sprachdialogsystem gemäß Patentanspruch 16 gelöst.The The object of the present invention is thus a method for determining at least one transaction for operating a background application and an associated Specify a speech dialogue system in which a unique identification the one desired by the user Background application fast and user-friendly, in particular already possible on the basis of reduced action information. The object is achieved by a method according to claim 1 and a Speech dialogue system according to claim 16 solved.

Der wesentliche Gedanke des erfindungsgemäßen Verfahrens zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation und Auswertung von zumindest einer in einer Benutzungsäußerung enthaltenen Aktionsinformation in einem Sprachdialogsystem, bei dem jeweils einer Hintergrundapplikation eine endliche Menge auswählbarer Transaktionen zugeordnet ist und bei dem über eine im Sprachdialogsystem vorgesehene Eingabeeinheit zumindest eine Benutzeräußerung erfasst und im Sprachdialogsystem gespeichert wird, besteht darin, dass einzelnen in einem Sinnzusammenhang stehenden Transaktionen im Sprachdialogsystem jeweils zumindest eine übereinstimmende Kontextinformation zugeordnet wird und die Kontextinformation zumindest der zuletzt ausgeführten Transaktion im Sprachdialogsystem gespeichert wird. Bei der Ermittlung einer Transaktion werden vorteilhaft bevorzugt diejenigen Transaktionen berücksichtigt, deren zugeordnete Kontextinformation mit der gespeicherten Kontextinformation übereinstimmt. Vorteilhaft werden durch die Zuordnung zumindest einer Kontextinformationen zu den in einem Sinnzusammenhang stehenden Transaktionen bevorzugt diejenigen Transaktionen bei der Suche nach der aktuell durch den Benutzer durch die Benutzeräußerung angesprochene Transaktion berücksichtigt und hierdurch der sowohl zeitintensive als auch rechenintensive Ermittlungsaufwand deutlich reduziert. Weiterhin vorteilhaft können anhand von kontextabhängigen Grammatiken bereits verkürzte Schlüsselbegriffe ausreichen, um die vom Benutzer gewünschte Aktion zu bestimmen.Of the essential idea of the method according to the invention for the determination at least one transaction for operating a background application and evaluation of at least one contained in an expression of use Action information in a speech dialogue system, in each case a background application a finite set of selectable ones Transactions is assigned and with which over one in the speech dialogue system provided input unit detects at least one user utterance and stored in the speech dialogue system, is that individual correlated transactions in the speech dialogue system at least one matching each Context information is assigned and the context information at least the last executed Transaction is stored in the speech dialogue system. In the investigation In a transaction, those transactions are preferably preferred considered, whose associated context information matches the stored context information. Advantageous are determined by the assignment of at least one context information preferred to transactions in a meaningful context those transactions in the search for the current by the User addressed by the user utterance Transaction considered and thus both time-consuming and computationally intensive Investigation costs significantly reduced. Further advantageous can by way of of contextual Grammars already shortened key terms sufficient to determine the action desired by the user.

Weitere vorteilhafte Ausgestaltungen des erfindungsgemäßen Verfahrens, insbesondere ein Sprachdialogsystem zur Ausführung des Verfahrens sind den weiteren Ansprüchen zu entnehmen.Further advantageous embodiments of the method according to the invention, in particular a voice dialog system for carrying out the method are given in the further claims.

Die vorliegende Erfindung wird nachfolgend an einem Ausführungsbeispiel anhand von Figuren näher erläutert.The The present invention will become more apparent from an embodiment explained in more detail with reference to figures.

Es zeigen:It demonstrate:

1 in einem schematischen Blockschaltbild beispielhaft ein Sprachdialogsystem, 1 in a schematic block diagram by way of example a speech dialogue system,

2 in einem weiteren Blockschaltbild beispielhaft die einzelnen Komponenten einer Transaktion und 2 in a further block diagram by way of example the individual components of a transaction and

3 in einem Ablaufdiagramm beispielhaft die einzelnen Schritte des erfindungsgemäßen Verfahren. 3 in a flow chart by way of example the individual steps of the method according to the invention.

In 1 ist in einem schematischen Blockschaltbild beispielhaft ein Sprachdialogsystem 1 dargestellt, über welches ein Benutzer B zumindest eine Hintergrundapplikation HA bedienen kann. Die Bedienung der Hintergrundapplikation HA erfolgt hierbei beispielhaft anhand einzelner ausgewählter und im Sprachdialogsystem 1 hinterlegter Transaktionen T1 bis Tx, welche einer oder mehrerer Funktionen der Hintergrundapplikation HA zugeordnet sind. Das in 1 dargestellte Sprachdialogsystem 1 umfasst hierzu eine Eingabeeinheit 2, eine Dialog-Management-Einheit 3 und eine Ausgabeeinheit 4, wobei die Dialog-Management-Einheit 3 jeweils mit der Eingabeeinheit 2, der Ausgabeeinheit 4 sowie der Hintergrundapplikation HA in Verbindung steht.In 1 is a schematic block diagram exemplified a voice dialogue system 1 represented, via which a user B can serve at least one background application HA. The operation of the background application HA takes place here by way of example on the basis of individually selected and in the speech dialogue system 1 stored transactions T1 to Tx, which are assigned to one or more functions of the background application HA. This in 1 illustrated speech dialogue system 1 includes an input unit for this purpose 2 , a dialogue management unit 3 and an output unit 4 , where the dialogue management unit 3 each with the input unit 2 , the output unit 4 and the background application HA.

In der Dialog-Management-Einheit 3 ist eine Speichereinheit 5 zur Speicherung der Transaktionen T1 bis Tx zur Bedienung der Hintergrundapplikation HA sowie weiterer Parameter vorgesehen. Die Dialog-Management-Einheit 3 weist ferner eine Spracherkennungseinheit 6, eine Sprachsyntheseeinheit 7, eine Parsereinheit 8 sowie eine Steuereinheit 9 auf, welche beispielsweise über ein Datenbussystem DBS miteinander verbunden sind. An das Datenbussystem DBS ist ebenfalls die Hintergrundapplikation HA angeschlossen, welche in einer alternativen Ausführungsform über ein Schnittstellenmodul (nicht in 1 dargestellt) mit der Dialog-Management-Einheit 3 verbunden sein kann. Die Eingabeeinheit 2 des Sprachdialogsystems 1 ist mit der Spracherkennungseinheit 6 und die Ausgabeeinheit 4 mit der Sprachsyntheseeinheit 7 verbunden.In the dialogue management unit 3 is a storage unit 5 for storing the transactions T1 to Tx for operating the background application HA and other parameters provided. The dialogue management unit 3 also has a speech recognition unit 6 , a speech synthesis unit 7 , a parser 8th and a control unit 9 on, which are interconnected for example via a data bus DBS. The background application HA is also connected to the data bus system DBS, which in an alternative embodiment is connected via an interface module (not in FIG 1 shown) with the dialogue management unit 3 can be connected. The input unit 2 of the speech dialogue system 1 is with the speech recognition unit 6 and the output unit 4 with the speech synthesis unit 7 connected.

Durch den Benutzer B wird eine Benutzeräußerung BE erzeugt, welche Aktionsinformationen AI aufweist. Hierbei kann eine Benutzeräußerung BE eine oder mehrere Aktionsinformationen AI aufweisen, welche innerhalb der Benutzeräußerung BE in unterschiedlichen Reihenfolgen angeordnet sein können. Über die Eingabeeinheit 2 wird eine Benutzeräußerung BE des Benutzers B, vorzugsweise als Sprachsignal erfasst und in der Dialog-Management-Einheit 3 abgespeichert. In einer bevorzugten Ausführungsform wird die Benutzeräußerung BE digitalisiert bzw. in digitaler Form der Speichereinheit 5 zugeführt und über die Spracherkennungseinheit 6 in an sich bekannter Weise die in der Benutzeräußerung BE enthaltenen Aktionsinformation(en) AI ermittelt sowie in der Speichereinheit 5 abgelegt.By the user B, a user statement BE is generated, which has action information AI. In this case, a user statement BE can have one or more action information AI, which can be arranged within the user statement BE in different orders. About the input unit 2 is a user statement BE of the user B, preferably recorded as a voice signal and in the dialogue management unit 3 stored. In a preferred embodiment, the user utterance BE is digitized or in digital form of the memory unit 5 supplied and via the speech recognition unit 6 in a manner known per se, the action information (s) AI contained in the user statement BE is determined as well as in the memory unit 5 stored.

Über die Ausgabeeinheit 4 können darüber hinaus dem Benutzer B Ausgabeprompts bzw. Informationsprompts AP zur Verfügung gestellt werden, welche beispielsweise in Form eines durch die Sprachsyntheseeinheit 7 erzeugtes synthetisiertes Sprachsignal über die Ausgabeeinheit 4 ausgegeben werden. Hierdurch wird der Benutzer B beispielsweise über den aktuellen Status der zu bedienenden Hintergrundapplikation HA bzw. der vom System aufgrund der letzten Benutzeräußerung BE durchgeführten Aktionen informiert oder der Benutzer B zur Abgabe zumindest einer weiteren Benutzeräußerungen BE veranlasst. Hierzu kann ein zwischen Ausgabeprompts AP und Benutzeräußerungen BE wechselnder Klärungsdialog durchgeführt werden.About the output unit 4 may also be provided to the user B output prompt or information prompt AP, for example in the form of a voice synthesis unit 7 generated synthesized speech signal via the output unit 4 be issued. As a result, the user B is informed, for example, about the current status of the background application HA to be operated or the actions carried out by the system on the basis of the last user statement BE, or the user B initiates the delivery of at least one further user statement BE. For this purpose, a clarification dialog which alternates between output prompt AP and user statements BE can be carried out.

In 2 sind in einer schematischen Darstellung beispielhaft die einzelnen Komponenten einer derartiger Transaktion T1 bis Tx dargestellt, welche zur Bedienung der unterschied lichen Funktionen der Hintergrundapplikation HA in der Dialog-Management-Einheit 3 vorgesehen sind. Einer Hintergrundapplikation HA ist eine endliche Menge derartiger Transaktionen T1 – Tx zugeordnet, deren Auswahl über eine jeweils einer Transaktion T1 – Tx zugeordneten Grammatikroutine GR getriggert wird. Hierbei werden der Transaktion T1 eine oder mehrere derartiger Grammatiken G1 – Gx zugeordnet, welche zur Ermittlung der zur gespeicherten Aktionsinformation AI zugehörigen Transaktion T1 bis Tx in die Parsereinheit 8 geladen werden. In der Parsereinheit 8 werden die einzelnen für die jeweilige Transaktion T1 charakterisierenden Schlüsselbegriffe der Grammatiken G1 – Gx mit den Aktionsinformationen AI verglichen. Hierbei können die Grammatiken G1 – Gx beispielhaft durch bzw. um kontextabhängige Grammatiken G1* – Gx* ersetzt bzw. erweitert werden, die unter Berücksichtigung des Sinnzusammenhangs zwischen den einzelnen Transaktionen T1 bis Tx verkürzte Schlüsselbegriffe aufweisen.In 2 are shown in a schematic representation by way of example the individual components of such a transaction T1 to Tx, which for the operation of the different functions of the back office HA HA in the dialogue management unit 3 are provided. A background application HA is assigned a finite set of such transactions T1-Tx whose selection is triggered via a respective grammatical routine GR assigned to a respective transaction T1-Tx. In this case, the transaction T1 is assigned one or more of such grammars G1-Gx, which are used to determine the transactions T1 to Tx associated with the stored action information AI in the parser unit 8th getting charged. In the parser 8th the individual keywords of the grammars G1-Gx characterizing the respective transaction T1 are compared with the action information AI. Here, the grammars G1 - Gx By way of example, contextual grammars G1 * - Gx * are replaced or extended, which have abbreviated key terms, taking into account the context of meaning between the individual transactions T1 to Tx.

Ferner weist die in 2 beispielhaft dargestellte erste Transaktion T1 eine Vorbedingungsroutine VBR auf, welche vor der weiteren Ausführung einer Transaktion T1 – Tx in der Steuereinheit 9 ausgeführt wird, um das Vorliegen von Vorbedingungen wie beispielsweise der erfolgreichen Ausführung einer weiteren Transaktion T2 zu verifizieren. Hierzu weist die Vorbedingungsroutine VBR einen oder mehrere Vorbedingungsparameter VBP sowie zugehörige Parameterprompts PP auf. Durch die in der Steuereinheit 9 ausgeführte Vorbedingungsroutine VBR wird beispielsweise die Aktivierung bzw. Deaktivierung einer weiteren Transaktion T2 überprüft und abhängig vom Ergebnis der zugeordnete Parameterprompt PP ausgewählt und über die Sprachsyntheseeinheit 7 sowie die Ausgabeeinheit 4 an den Benutzer B ausgegeben. Ist die anhand der Vorbedingungsparameter VBP definierte Vorbedingung für die Ausführung der betrachteten ersten Transaktion T1 erfüllt, wird ohne eine Ausgabe eines Parameterprompts PP die weitere Ausführung der ermittelten ersten Transaktion T1 initiiert.Furthermore, the in 2 exemplified first transaction T1 a Vorbedingungsroutine VBR, which before the further execution of a transaction T1 - Tx in the control unit 9 is executed to verify the existence of preconditions such as the successful execution of another transaction T2. For this purpose, the preconditioning routine VBR has one or more precondition parameters VBP and associated parameter prompts PP. Through the in the control unit 9 executed preconditioning routine VBR, for example, the activation or deactivation of another transaction T2 checked and selected depending on the result of the associated Parameterprompt PP and the speech synthesis unit 7 as well as the output unit 4 issued to the user B. If the precondition defined by the precondition parameters VBP for the execution of the considered first transaction T1 is met, the further execution of the determined first transaction T1 is initiated without an output of a parameter prompts PP.

Erfindungsgemäß wird den in einem Sinnzusammenhang stehenden Transaktionen T1 – Tx im Sprachdialogsystem 1 jeweils zumindest eine übereinstimmende Kontextinformation KI zugeordnet und somit die einen Sinnzusammenhang aufweisenden Transaktionen T2, T3 zu jeweils einer Transaktionsgruppe TG1 – TGx mit übereinstimmender Kontextinformation KI zusammengefasst. In 1 sind beispielhaft eine zweite und dritte Transaktion T2, T3 zu einer ersten Transaktionsgruppe TG1 zusammengefasst.According to the invention, the transactions T1 - Tx which are connected in a meaningful context are in the speech dialogue system 1 each associated with at least one matching context information KI and thus summarizing the meaningful relationship having transactions T2, T3 to a respective transaction group TG1 - TGx with matching context information KI. In 1 By way of example, a second and a third transaction T2, T3 are combined to form a first transaction group TG1.

Insbesondere eine Hintergrundapplikation HA wie beispielsweise ein „Unified Messaging System" mit einer Vielzahl von ähnlichen Funktionen betreffenden Transaktionen T1 – Tx, so dass viele der Transaktionen T1 – Tx derartige Übereinstimmungen aufweisen. Beispielsweise der ersten Transaktion T1 = „Email lesen" und der zweiten Transaktion T2 = „Email löschen" kann durch die Zuordnung der Kontextinformation KI = „Email Verarbeitung" zu einer ersten Transaktionsgruppe TG1 = „Email Verarbeitung" zusammengefasst werden. Somit wird durch die Kontextinformation KI die kontextbedingte Verknüpfung unterschiedlicher Transaktionen T1 – Tx untereinander für die aktuelle Ermittlung einer Transaktion T1 bis Tx ausgewertet und hierdurch der Zeit- und Rechenaufwand für die Durchführung des Ermittlungsverfahrens deutlich reduziert.Especially a background application HA such as a "Unified Messaging System "with a Variety of similar Functions related transactions T1 - Tx, so many of the transactions T1 - Tx such matches exhibit. For example, the first transaction T1 = "Email read "and the second Transaction T2 = "Email delete "can by the assignment the context information KI = "Email Processing " a first transaction group TG1 = "Email processing" summarized become. Thus, the contextual information KI becomes the contextual shortcut different transactions T1 - Tx among each other for the current Determination of a transaction T1 to Tx evaluated and thereby the Time and computational effort for the implementation significantly reduced in the preliminary investigation.

In der Speichereinheit 5 wird die Kontextinformation KIletzt zumindest der zuletzt in der Dialog-Management-Einheit 3 ausgeführten Transaktion Tletzt gespeichert und bei der aktuellen Ermittlung einer Transaktion T1 – Tx berücksichtigt, und zwar derart, dass bevorzugt diejenigen Transaktionen T2, T3 bei der Ermittlung berücksichtigt werden, deren zugeordnete Kontextinformation KI mit der gespeicherten Kontextinformtion KIletzt übereinstimmt. Für die Ermittlung der aktuellen Transaktion T1 – Tx wird somit zunächst diejenige Transaktionengruppe TG1 – TGx betrachtet, der die zuletzt ausgeführte Transaktion Tletzt angehört. Hierdurch werden besonders vorteilhaft die Transaktionen T1 – Tx der ermittelten Transaktionsgruppe TG1 – TGx im Auswahlverfahren priorisiert und somit diejenigen Transaktionen T1 – Tx ausgeführt, die die größte „Trefferwahrscheinlichkeit" aufweisen.In the storage unit 5 is the context information KI last at least the last in the dialog management unit 3 executed transaction T last and taken into account in the current determination of a transaction T1 - Tx, in such a way that preferably those transactions T2, T3 are taken into account in the determination whose associated context information KI with the stored context information KI last match. For the determination of the current transaction T1 - Tx, first of all that transaction group TG1 - TGx is considered to which the last executed transaction T belongs last . As a result, the transactions T1-Tx of the determined transaction group TG1-TGx are particularly advantageously prioritized in the selection process, and thus those transactions T1-Tx are executed which have the largest "hit probability".

Zur Überprüfung der Kontextinformation KI ist der Transaktion T1 – Tx jeweils eine Kontextinformationsroutine KIR zugeordnet, die die Übereinstimmung der der Transaktion T1 zugeordneten Kontextinformation KI mit der in der Speichereinheit 5 gespeicherten Kontextinformation KIletzt der zuletzt in der Dialog-Management-Einheit 3 ausgeführten Transaktion Tletzt überprüft. Stimmen die zuletzt gespeicherte Kontextinformation KIletzt und die der ersten Transaktion T1 zugeordnete Kontextinformation KI überein, so wird die betrachtete erste Transaktion T1 bei der Ermittlung der aktuellen Transaktion bevorzugt berücksichtigt, d.h. die aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI über die in der Parsereinheit 8 ausgeführte Grammatikroutine GR der betrachteten Transaktion T1 ausgewertet. Die Kontextinformation KI kann beispielsweise den Parametertyp „String" aufweisen, der einen den Sinnzusammenhang zwischen den Transaktionen T1 bis Tx wiedergebenden Oberbegriff darstellt.For checking the context information KI, the transaction T1-Tx is respectively assigned a context information routine KIR that matches the context information KI associated with the transaction T1 with that in the memory unit 5 stored last KI context information last in the dialogue management unit 3 completed transaction T last checked. If the last stored context information KI last and the context information KI assigned to the first transaction T1 agree, the considered first transaction T1 is preferably taken into account in the determination of the current transaction, ie the action information AI obtained from the user statement BE via that in the parser unit 8th executed grammar routine GR of the considered transaction T1 evaluated. The context information KI may, for example, have the parameter type "string", which represents a generic term representing the meaning relationship between the transactions T1 to Tx.

Zusätzlich ist jeder Transaktion T1 – Tx eine Transaktionsparameterroutine TPR zugeordnet, die – neben den ermittelten Transaktionsparametern P1 – Px – Transaktionsparameterprompts TPP, eine Parametergrammatik PGR sowie eine Wertermittlungsinformation WEI aufweist. Die Transaktion T1 wird durch ihre Transaktionsparameter P1 – Px inhaltlich spezifiziert, deren Werte über die Transaktionsparameterroutine TPR ermittelt werden. Hierzu werden über die in Parsereinheit 8 ausgeführte Parametergrammatik PGR aus den Aktionsinformationen AI die Werte der Transaktionsparameter P1 – P1x ermittelt. Die zur Ausführung der Transaktion T1 – Tx noch zu bestimmenden Transaktionsparameter P1 – Px werden durch Ausgabe des jeweils zugeordneten Transaktionsparameterprompts TPP an den Benutzer B und dessen in einer weiteren Benutzeräußerung BE enthaltenen Aktionsinformationen AI im Rahmen eines Klärungsdialoges abgefragt.In addition, each transaction T1-Tx is assigned a transaction parameter routine TPR which, in addition to the determined transaction parameters P1-Px, has transaction parameter prompts TPP, a parameter grammar PGR and a value determination information WEI. The transaction T1 is specified in terms of content by its transaction parameters P1-Px whose values are determined via the transaction parameter routine TPR. This will be done via in parsers 8th executed parameter grammar PGR from the action information AI, the values of the transaction parameters P1 - P1x determined. The transaction parameters P1-Px, which are yet to be determined for the execution of the transaction T1-Tx, are sent to the user B by issuing the respectively assigned transaction parameter prompts TPP and his in a further case user information BE contained action information AI in the context of a clarification dialogue.

Ferner wird über jeweils den einzelnen Transaktionsparametern P1 – Px zugeordnete Wertermittlungsinformationen WEI festgelegt, auf welche Weise die Ermittlung der Transaktionsparameter P1 – Px erfolgen soll bzw. kann. Beispielsweise können zur Ermittlung der Transaktionsparameter P1 – Px neben der Durchführung eines Klärungsdialogs mit dem Benutzer B bereits im Sprachdialogsystem 1 vorliegende Parameterwerte bzw. Statusinformationen ausgewertet werden. Hierzu wird die Abhängigkeit eines Transaktionsparameters P1 – Px von dem Vorliegen oder Nicht-Vorliegen eines vorgegebenen Dialogstatus ausgewertet. Somit können mit Hilfe von Wertermittlungsinformationen WEI unterschiedliche Wege zur Ermittlung des Wertes eines Transaktionsparameters P1 – Px vorgegeben werden, wodurch unnötige Benutzerabfragen im Rahmen eines Klärungsdialoges vermieden werden können.Furthermore, value determination information WEI assigned in each case to the individual transaction parameters P1-Px is determined in which manner the determination of the transaction parameters P1-Px should or can take place. For example, in order to determine the transaction parameters P1-Px, besides the execution of a clarification dialog with the user B, they can already be found in the speech dialogue system 1 present parameter values or status information are evaluated. For this purpose, the dependency of a transaction parameter P1-Px is evaluated by the presence or absence of a given dialog status. Thus, with the aid of value determination information WEI, different ways of determining the value of a transaction parameter P1-Px can be predetermined, whereby unnecessary user queries can be avoided in the context of a clarification dialog.

Zur Überprüfung der Gültigkeit eines geänderten Transaktionsparameters ist eine Constraint-Routine CR pro Transaktion T1 – Tx vorgesehen, welche Triggerparameter TR, logische Bedingungen LB sowie Aktionsanweisungsprompts AA umfasst. Über die Contraint-Routine CR wird somit der geänderte Parameterwert eines Transaktionsparameters P1 – Px auf seine Gültigkeit mit Hilfe der vorgegebenen Triggerparameter TR sowie der logischen Bedingung LB ermittelt und bei einem Abweichen über Aktionsanweisungsprompts AA an dem Benutzer B kommuniziert. Beispielsweise wird als logische Bedingung LB vorgegeben, die Summe aus zwei Transaktionsparametern P1, P2 zu bilden und zu überprüfen, ob diese beispielsweise einen oberen Grenzwert Pmax überschreitet. Beim Überschreiten des oberen Grenzwertes Pmax wird der zugeordnete Aktionsanweisungsprompt AA der Contraint-Routine CR ausgegeben. Alternativ kann auch abhängig von der Auswertung der logischen Bedingung LB eine vorgegebene Systemfunktion initiiert werden.To check the validity of a changed transaction parameter, a constraint routine CR is provided per transaction T1-Tx, which includes trigger parameters TR, logical conditions LB and action instruction prompts AA. The modified parameter value of a transaction parameter P1-Px is thus ascertained for validity via the contraint routine CR with the aid of the predetermined trigger parameters TR and the logical condition LB and communicated to the user B in the event of a deviation via action instruction prompts AA. For example, it is specified as a logical condition LB to form the sum of two transaction parameters P1, P2 and to check whether this exceeds, for example, an upper limit P max . When the upper limit value P max is exceeded, the associated action instruction prompt AA of the contraint routine CR is output. Alternatively, depending on the evaluation of the logical condition LB, a predetermined system function can also be initiated.

Über eine Nachbedingungsroutine NBR wird überprüft, ob sämtliche für die Ausführung der jeweiligen Transaktion T1 – Tx erforderlichen Nachbedingungen NB, beispielsweise die für die Ausführung zumindest erforderlichen Transaktionsparameter P1 – Px, nunmehr vorliegen, d.h. die Lücken der als Rahmen modellierten Transaktion T1 gefüllt sind und mit Hilfe der ausgewählten Transaktion T1 die zugeordnete Funktion der Hintergrundapplikation HA nunmehr gestartet werden kann. Somit werden über die Nachbedingungsroutine NBR diejenigen Nachbedingungen NB überprüft, welche am Ende des Dialoges vorliegen müssen, um eine Übergabe sämtlicher für die Bedienung der Hintergrundapplikation HA erforderlichen Informationen über die Transaktion T1 zu gewährleisten. Vorteilhaft können durch die Nachbedingungsroutine NBR unterschiedlich komplexe Nachbedingungen NB für unterschiedliche Transaktionen T1 – Tx individuell definiert und abgeprüft werden.Over a Nachbedingungsroutine NBR is checked if all for the execution the respective transaction T1 - Tx required post-conditions NB, for example, those for the execution at least required transaction parameters P1 - Px, now present, i. the gaps are modeled as a frame modeled transaction T1 and with the help of chosen Transaction T1 the assigned function of the background application HA can now be started. Thus, via the Nachbedingungsroutine NBR those post-conditions NB checks, which at the end of the dialogue must be present for a handover all for the Operation of the background application HA required information about the To ensure transaction T1. Can be advantageous by the Nachbedingungsroutine NBR different complex Nachbedingungen NB for different transactions T1 - Tx individually defined and checked become.

Schließlich weist eine Transaktion T1 – Tx eine Systemaktionsroutine SAR auf, mit deren Hilfe die Ausgabe von spezifischen Aktionsprompts AP bzw. Systemaktionen SA umgesetzt wird. Die Systemaktionsroutine SAR umfasst hierzu beispielsweise Systemtriggerparameter TRP sowie Vorbedingungsinformationen VBI als auch vorgegebene Systemaktionen SA. Bei einer Änderung der Systemtriggerparameter TRP wird über die Vorbedingungsinformationen VBI die Initiierung der vorgegeben Systemaktionen SA verifiziert und gegebenenfalls die zugeordneten Systemaktionen SA gestartet. Mit Hilfe der Systemaktionsroutine SAR wird somit der Benutzer B über eine Änderung des Dialogstatus oder des Status der Hintergrundapplikation HA informiert.Finally, points a transaction T1 - Tx a system action routine SAR, with the help of the output of specific action prompt AP or system action SA implemented becomes. The system action routine SAR comprises, for example, this System trigger parameter TRP and precondition information VBI as well as predetermined system actions SA. In case of a change the system trigger parameter TRP is via the precondition information VBI verifies the initiation of the given system actions SA and, if appropriate, the assigned system actions SA started. With the aid of the system action routine SAR, the user B is thus informed about a change the dialog status or the status of the background application HA.

In 3 ist das erfindungsgemäße Verfahren zur Ermittlung zumindest einer Transaktion T1 – Tx im Sprachdialogsystem 1 in einem Ablaufdiagramm beispielhaft dargestellt. Mittels einer in der Steuereinheit 9 ausgeführten Auswahlroutine AR werden die in 3 dargestellten fünf Verfahrensschritte S1 – S5 abgearbeitet. Zunächst wird in einem ersten Schritt S1 den in einem Sinnzusammenhang stehenden Transaktionen T1 – Tx jeweils eine übereinstimmende Kontextinformation KI zugeordnet.In 3 is the inventive method for determining at least one transaction T1 - Tx in the speech dialogue system 1 illustrated by way of example in a flow chart. By means of a in the control unit 9 executed selection routine AR, the in 3 shown five process steps S1 - S5 processed. First of all, in a first step S1, the correlated context information KI is assigned to the transactions T1-Tx, which are in a context of meaning.

Ferner wird im Rahmen der Ausführung einer Transaktion T1 – Tx jeweils die dieser zugeordnete Kontextinformation KI als zuletzt zugeordnete Kontextinformation KIletzt im Sprachdialogsystem 1 bzw. der Speichereinheit 5 der Dialog-Management-Einheit 3 gespeichert (zweiter Schritt S2).Furthermore, in the context of the execution of a transaction T1-Tx, the context information KI assigned to it as the last-assigned context information KI is last in the voice dialog system 1 or the storage unit 5 the dialogue management unit 3 stored (second step S2).

Nach der Ermittlung der Aktionsinformationen AI aus der jeweils erfassten Benutzeräußerung BE (dritter Schritt S3) werden diejenigen Transaktionen T1 – Tx ermittelt, deren zugeordnete Kontextinformationen KI mit der zuletzt zugeordneten Kontextinformation KIletzt übereinstimmen (vierter Schritt S4).After the determination of the action information AI from the respectively detected user statement BE (third step S3), those transactions T1-Tx are determined whose assigned context information KI last matches the last-assigned context information KI (fourth step S4).

In einem fünften und letzten Schritt S5 werden aus der endlichen Menge der Transaktionen T1 – Tx die zuvor ermittelten Transaktionen T2, T3 für die Ermittlung der aktuellen Transaktion T1 – Tx bevorzugt herangezogen.In a fifth and last step S5 are the finite amount of transactions T1 - Tx the previously determined transactions T2, T3 for the determination of the current Transaction T1 - Tx preferably used.

Im Folgenden wird an einem Ausführungsbeispiel der Aufbau sowie die Parameter P1 – Px einzelner Transaktionen T1 bis T4 innerhalb des Sprachdialogsystems 1 näher beschrieben. Als Hintergrundapplikation HA wird beispielhaft ein „Unified Messaging System" betrachtet, welches in der Regel eine Telefonverbindung zwischen dem Benutzer B und dem Sprachdialogsystem 1 besteht, d.h. die Eingabeeinheit 2 ist als Mikrofoneinheit eines Telefons und die Ausgabeeinheit 4 als Lautsprechereinheit desselben ausgebildet. Als Grundfunktionen eines derartigen Unified Messaging System lassen sich folgende Funktionen nennen:

  • 1. Benutzeridentifizierung im Sprachdialogsystem (Login)
  • 2. Abfrage neuer Nachrichten
  • 3. Abfrage neuer Nachrichten einer bestimmten Person
  • 4. Senden von Nachrichten.
In the following text, the structure and the parameters P1-Px of an exemplary embodiment will be described below Transactions T1 to T4 within the speech dialogue system 1 described in more detail. By way of example, a background application HA is considered to be a "unified messaging system", which as a rule provides a telephone connection between the user B and the voice dialogue system 1 exists, ie the input unit 2 is as a microphone unit of a telephone and the output unit 4 formed as a speaker unit of the same. The basic functions of such a Unified Messaging system include the following functions:
  • 1. User identification in the speech dialogue system (Login)
  • 2. Query new messages
  • 3. Query new messages of a specific person
  • 4. Sending messages.

Zur Bedienung der genannten Grundfunktionen der Hintergrundapplikation Unified Messaging System werden vier Transaktionen T1 – T4 auf Dialoglevel modelliert, wobei beispielhaft jeweils eine Transaktion T1 – T4 eine der genannten Grundfunktionen zugeordnet ist, d.h. anhand der ersten Transaktion T1 wird die Benutzeridentifizierung, anhand der zweiten Transaktion T2 das Abhören von neuen Nachrichten, über die dritte Transaktion T3 das Abhören von Nachrichten einer bestimmten Person und mittels der vierten Transaktion T4 das Senden von Nachrichten über das Sprachdialogsystem 1 gesteuert.To operate the said basic functions of the background application Unified Messaging System, four transactions T1-T4 are modeled at dialoglevel, one transaction T1-T4 being assigned one of the basic functions by way of example, ie the first transaction T1 is used to identify the user based on the second transaction T2 listening to new messages; via the third transaction T3, listening to messages of a particular person; and by means of the fourth transaction T4, sending messages via the speech dialogue system 1 controlled.

Erste Transaktion T1: „Benutzeridentifizierung"First transaction T1: "User identification"

Über die Dialog-Management-Einheit 3 werden anhand der Grammatikroutine GR die aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der ersten Transaktion T1 erforderlichen Grammatiken G1 – Gx bzw. deren Schlüsselbegriffe verglichen und bei Übereinstimmung die zugehörige Transaktion T1 gestartet.About the dialogue management unit 3 Using the grammar routine GR, the action information AI obtained from the user statement BE is compared with the grammars G1-Gx or their key terms required for executing the first transaction T1, and the associated transaction T1 is started if they match.

Für die weitere Ausführung der ersten Transaktion T1 „Benutzeridentifizierung" ist es erforderlich, dass der Benutzer B noch nicht im Sprachdialogsystem 1 angemeldet ist. Dies entspricht zugleich dem Vorbedingungsparameter VBP für die Ausführung der ersten Transaktion T1, welcher über die Vorbedingungsroutine VBR überprüft wird. Ist der Benutzer B bereits im Sprachdialogssystem 1 eingeloggt, so wird die Ausführung der ersten Transaktion T1 unterbrochen und dem Benutzer B ein entsprechendes Aktionsprompt AP ausgegeben. Ist der Benutzer noch nicht im Sprachdialogssystem 1 angemeldet, wird die erste Transaktion T1 weiter ausgeführt und anhand der Transaktionsparameterroutine TPR die der ersten Transaktion T1 „Benutzeridentifizierung" zugeordneten Transaktionsparameter P1 = "Benutzername" und P2 = "Passwort" ermittelt. Als Benutzername wird im Folgenden beispielhaft die Telefonnummer des Benutzers B angenommen.For the further execution of the first transaction T1 "user identification", it is necessary that the user B is not yet in the speech dialogue system 1 is logged in. This also corresponds to the precondition parameter VBP for the execution of the first transaction T1, which is checked via the preconditioning routine VBR. If user B is already in the speech dialogue system 1 logged in, the execution of the first transaction T1 is interrupted and the user B issued a corresponding action Prompt AP. If the user is not yet in the speech dialogue system 1 logged on, the first transaction T1 is executed further and the transaction parameter routine P1R determines the transaction parameters P1 = "user name" and P2 = "password" assigned to the first transaction T1 "user identification." In the following, the telephone number of user B is assumed as the user name.

Der Benutzer B gibt als Benutzeräußerung BE seine Telefonnummer und das zugehörige Passwort in das Sprachdialogsystem 1 ein. Die Benutzeräußerung BE wird über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Telefonnummer und das Passwort ermittelt sowie als Aktionsinformationen AI in der Speichereinheit 5 gespeichert. Mittels der Transaktionsparameterroutine TPR werden aus den gespeicherten Aktionsinformationen AI die zur Ausführung der ersten Transaktion T1 erforderlichen ersten und zweiten Transaktionsparameter P1 = „Benutzername" und P2 = „Passwort" bestimmt.The user B gives as a user statement BE his phone number and the associated password in the speech dialogue system 1 one. The user utterance BE is via the input unit 2 detected and based on the speech recognition unit 6 the telephone number contained in the user statement BE and the password and determined as action information AI in the memory unit 5 saved. By means of the transaction parameter routine TPR, the first and second transaction parameters P1 = "user name" and P2 = "password" required for executing the first transaction T1 are determined from the stored action information AI.

Über die Nachbedingungsroutine NBR wird das Vorliegen der für die Ausführung der der ersten Transaktion T1 „Benutzeridentifizierung" zugeordneten Funktion der Hintergrundapplikation HA „Unified Messaging System" erforderlichen ersten und zweiten Transaktionsparameter P1, P2 überprüft und anschließend die zugehörige Funktion aufgerufen. Ferner wird ein den Status des Identifizierungsprozesses anzeigender Aktionsprompt AP an den Benutzer B über die Ausgabeeinheit 4 ausgegeben.The postcondition routine NBR checks the existence of the first and second transaction parameters P1, P2 required for executing the function of the background application HA "Unified Messaging System" assigned to the first transaction T1 "user identification", and then calls the associated function. Further, an action prompt AP indicating the status of the identification process to the user B via the output unit 4 output.

Abschließend oder zu einem beliebig gewählten Zeitpunkt während der Transaktionsverarbeitung wird gegebenenfalls eine der ersten Transaktion T1 zugeordnete Kontextinformation KI in der Speichereinheit 5 gespeichert.Finally, or at any arbitrary point in time during the transaction processing, a context information item KI associated with the first transaction T1 is optionally stored in the memory unit 5 saved.

Die geschilderte Dialogabfolge wird anhand der nachfolgenden schematischen Tabellendarstellung nochmals kurz zusammengefasst:

Figure 00150001
The described dialogue sequence is briefly summarized by the following schematic table representation:
Figure 00150001

Zweite Transaktion T2: „Abfrage neuer Nachrichten"Second transaction T2: "Query new news "

Der Benutzer B gibt hierzu beispielsweise folgende Benutzeräußerung BE in das Sprachdialogsystem 1 ein: „Ich möchte meine neuen Nachrichten abhören". Die Benutzeräußerung BE wird über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt und in der Speichereinheit 5 gespeichert. Mögliche Aktionsinformationen AI können hierbei die Begriffe „neue", „Nachrichten" und „abhören" sein.For example, the user B gives the following user statement BE in the speech dialogue system 1 a: "I want to listen to my new messages." The user utterance BE is via the input unit 2 detected and based on the speech recognition unit 6 determines the action information AI contained in the user statement BE and in the storage unit 5 saved. Possible action information AI can here be the terms "new", "messages" and "listening".

Über die Kontextinformationsroutine KIR wird zunächst die jeweils einer Transaktion T1 – Tx zugeordnete Kontextinformation KI mit der der zuletzt abgespeicherten Kontextinformation KIletzt verglichen und bei einer Übereinstimmung dieser die betrachtete Transaktion T2, T3 bevorzugt zur Ermittlung der aktuellen Transaktion T2 herangezogen. Alternativ kann mittels der in der Steuereinheit 9 ausgeführten Auswahlroutine AR die zuletzt abgespeicherte Kontextinformation KIletzt geladen werden und nach Abfrage der Kontextinformationen KI der einzelnen Transaktionen T1 – Tx diejenigen Transaktionen T2, T3 mit übereinstimmender Kontextinformation KI für die Ermittlung der aktuellen Transaktion T2, T3 bereitgestellt werden.On the context information routine KIR each of a transaction is initially T1 - Tx associated context information AI with the most recently saved context information KI compared latter and that the observed transaction T2, T3 preferably used in a match for the determination of the current transaction T2. Alternatively, by means of the in the control unit 9 selection routine AR executed most recently saved context information KI to be loaded last and after reference to the context information AI of the individual transactions T1 - Tx those transactions T2, are provided T3 with matching context information AI for the determination of the current transaction T2, T3.

Anschließend wird die jeweilige Grammatikroutine GR der in einem Sinnzusammenhang stehenden, d.h. dieselbe Kontextinformation KI aufweisenden Transaktionen T2, T3 gestartet und die Übereinstimmung der aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der zweiten bzw. dritten Transaktion T2, T3 erforderlichen Grammatiken G1 – Gx bzw. deren Schlüsselbegriffe überprüft und bei Übereinstimmung die ermittelte Transaktion T2 gestartet. Im vorliegenden Fall ist der zweiten Transaktion T2 „Abfrage neuer Nachrichten" beispielsweise die Kontextinformation „Unified Messaging System: Nachrichtenabfrage" zugeordnet, welche bei Ausführung der zweiten Transaktion T2 wiederum in der Spei chereinheit 5 der Dialog-Management-Einheit 3 als zuletzt zugeordnete Kontextinformation KIletzt gespeichert wird.Subsequently, the respective grammar routine GR of the related context, ie the same context information KI having transactions T2, T3 is started and the match of the obtained from the user statement BE action information AI with the required to execute the second or third transaction T2, T3 grammars G1 - Gx or their keywords are checked and started the identified transaction T2 if they match. In the present case, the second transaction T2 "query new messages", for example, the context information "Unified Messaging System: message query" assigned, which in turn when the second transaction T2 in the storage unit 5 the dialogue management unit 3 as last assigned context information KI is last saved.

Bevor die ermittelte zweite Transaktion T2 „Abfrage neuer Nachrichten" weiter ausgeführt wird, wird analog zuvor anhand der zugeordneten Vorbedingungsroutine VBR überprüft, ob die erste Transaktion T1 „Benutzeridentifizierung" erfolgreich durchgeführt wurde, d.h. der Benutzer B im Sprachdialogsystem angemeldet bzw. eingeloggt ist.Before the determined second transaction T2 "query new messages" is executed further, is checked in analogy above on the basis of the assigned preconditioning routine VBR, whether the first transaction T1 "user identification" was successfully performed, i.e. the user B logged in or logged in the speech dialogue system is.

Über die Nachbedingungsroutine NBR der zweiten Transaktion T2 wird im Anschluss die der zweiten Transaktion T2 zugeordnete Funktion („Abfragen neuer Nachrichten") der Hintergrundapplikation HA „Unified Messaging System" aufgerufen und der zugehörige Informationsprompt AP zusammen mit den Nachrichten an den Benutzer B über die Ausgabeeinheit 4 ausgegeben.Via the post-condition routine NBR of the second transaction T2, the function ("polling new messages") of the background application HA "Unified Messaging System" assigned to the second transaction T2 is subsequently called, and the associated information prompt AP together with the messages to the user B via the output unit 4 output.

Die der zweiten Transaktion T2 zugrundeliegende Dialogstruktur lässt sich somit beispielhaft wie folgt schematisch darstellen:

Figure 00170001
The dialog structure on which the second transaction T2 is based can thus be illustrated as an example as follows:
Figure 00170001

Dritte Transaktion T3: „Abfrage neuer Nachrichten einer bestimmten Person"Third transaction T3: "Query new messages from a specific person "

Die abgegebene Benutzeräußerung BE „Ich möchte die neuen Nachrichten von Herrn Maier abhören" wird wiederum über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt, welche in der Speichereinheit 5 gespeichert wird. In der Dialog-Management-Einheit 3 ist nach der Ausführung der zweiten Transaktion T2 als zuletzt abgespeicherte Kontextinformation KIletzt „Unified Messaging System: Nachrichtenabfrage" gespeichert.The submitted user statement BE "I would like to listen to the new messages from Mr. Maier" will turn over the input unit 2 detected and based on the speech recognition unit 6 determines the action information AI contained in the user statement BE, which in the storage unit 5 is stored. In the dialogue management unit 3 is stored after the execution of the second transaction T2 as the last stored context information KI last "Unified Messaging System: message query ".

Über die jeweilige Kontextinformationsroutine KIR der Transaktionen T1 – Tx wird die Übereinstimmung mit der Kontextinformation „Unified Messaging System: Nachrichtenabfrage" geprüft und aufgrund der Übereinstimmung der Kontextinformation KI der dritten Transaktion T3 mit der zuletzt abgespeicherten Kontextinformation KIletzt diese bevorzugt herangezogen.By means of the respective context information routine KIR of the transactions T1-Tx, the correspondence with the context information "Unified Messaging System: Message polling" is checked and, based on the coincidence of the context information KI of the third transaction T3 with the last stored context information KI, the latter is preferably used.

Anschließend wird die jeweilige Grammatikroutine GR der dritten Transaktion T3 gestartet und die Übereinstimmung der aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der dritten Transaktion T3 erforderlichen Grammatiken G1 – Gx bzw. deren Schlüsselbegriffe überprüft und bei Übereinstimmung dieser die dritte Transaktion T3 weiter ausgeführt.Subsequently, will the respective grammar routine GR of the third transaction T3 is started and the match the user statement BE obtained action information AI with the execution of the third transaction T3 required grammars G1 - Gx or whose keywords are checked and if they match this continues the third transaction T3.

In analoger Weise wird anhand der Vorbedingungsroutine VBR auch im Rahmen der dritten Transaktion T3 die erfolgreiche Ausführung der ersten Transaktion T1 „Benutzeridentifizierung" überprüft und aus den gespeicherten Aktionsinformationen AI über die Transaktionsparameterroutine TPR als Transaktionsparameter P1 = „Name" der Name der Person („Herr Maier") ermittelt, dessen neue Nachrichten dem Benutzer B ausgegeben werden sollen. Ebenso wird die Kontextinformation KI „Unified Messaging System: Nachrichtenabfrage" in der Speichereinheit 5 als zuletzt vorliegende Kontextinformation KIletzt gespeichert.In an analogous manner, the preconditioning routine VBR also checks the successful execution of the first transaction T1 "user identification" in the context of the third transaction T3 and from the stored action information AI via the transaction parameter routine TPR as transaction parameter P1 = "name" the name of the person ("Mr. Maier ") whose new messages are to be output to user B. Similarly, the context information KI" Unified Messaging System: message query "in the memory unit 5 as last present context information KI last saved.

Anhand der folgenden Tabelle werden die beschriebenen Schritte der dritten Transaktion T3 beispielhaft anhand einer Tabelle dargestellt:

Figure 00190001
Using the following table, the described steps of the third transaction T3 are illustrated by way of example using a table:
Figure 00190001

Vierte Transaktion T4: „Senden einer Nachricht"Fourth transaction T4: "Send a message "

Um eine Nachricht über das Unified Messaging System aufzuzeichnen und anschließend an eine ausgewählte Person zu versenden ist die vierte Transaktion T4 vorgesehen.Around a message about record the unified messaging system and then log on a selected one To send person is the fourth transaction T4 provided.

Diese wird durch den Benutzer B mittels der Eingabe beispielsweise der Benutzeräußerung BE = „Ich möchte eine Nachricht an Herrn Maier senden" initiiert. Die Benutzeräußerung BE wird wiederum über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt und in der Speichereinheit 5 gespeichert.This is initiated by the user B by means of, for example, the user's statement BE = "I would like to send a message to Mr. Maier." The user utterance BE is again transmitted via the input unit 2 detected and based on the speech recognition unit 6 determines the action information AI contained in the user statement BE and in the storage unit 5 saved.

Unter Berücksichtigung der in der Dialog-Management-Einheit 3, nach der Ausführung der dritten Transaktion T3 zuletzt gespeicherten Kontextinformation KIletzt „Unified Messaging System: Nachrichtenabfrage" werden zunächst die Grammatikroutinen GR der zweiten und dritten Transaktionen T2, T3 auf Übereinstimmungen mit den gespeicherten Aktionsinformationen AI überprüft und im Anschluss daran die weiteren Transaktionen T4 – Tx herangezogen.Taking into account in the dialogue management unit 3 after the execution of the third transaction T3 last stored context information KI last "Unified Messaging System: Message query" are first the grammar routines GR of the second and third transactions T2, T3 checked for matches with the stored action information AI and then the other transactions T4 - Tx used.

Schließlich wird die Grammatikroutine GR der vierten Transaktion T4 gestartet und die Übereinstimmung der aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der vierten Transaktion T4 erforderlichen Grammatiken G1 – Gx bzw. deren Schlüsselbegriffe überprüft und aufgrund deren Übereinstimmung mit den gespeicherten Transaktionsinformationen die vierte Transaktion T4 weiter ausgeführt.Finally will the grammar routine GR of the fourth transaction T4 is started and agreement the user statement BE obtained action information AI with the execution of the fourth Transaction T4 required grammars G1 - Gx or their keywords are checked and based their agreement with the stored transaction information the fourth transaction T4 continued.

Als Vorbedingung ist hierbei wiederum die erfolgreiche Anmeldung des Benutzers im System erforderlich, welche anhand der Vorbedingungsroutine VBR verifiziert wird.When Prerequisite is again the successful registration of the User required in the system, based on the precondition routine VBR is verified.

Um eine Nachricht an den vorgegebenen Empfänger „Herrn Maier" zu senden, ist es zunächst erforderlich, dass der Benutzer BE die Nachricht in das Sprachdialogsystem 1 eingibt. Die Nachricht wird über die Dialog-Management-Einheit 3 als erster Transaktionsparameter P1 = „Message" aufgezeichnet. Nachdem der Benutzer die Nachricht eingegeben hat, hat dieser die Möglichkeit die korrekte Eingabe durch Abhören der aufgezeichneten Nachricht überprüfen zu können. Der Benutzer B kann hierzu über einen zweiten Transaktionsparameter P2 = „Listen" festlegen, ob er die aufgenommene Nachricht abhören will oder nicht.To send a message to the given recipient "Mr. Maier", it is first necessary that the user BE the message in the speech dialogue system 1 enters. The message is through the dialogue management unit 3 After the user has entered the message, the user has the option of being able to check the correct input by listening to the recorded message, for which user B can specify P2 = "lists" via a second transaction parameter. whether he wants to listen to the recorded message or not.

Auch sollte durch das Sprachdialogsystem 1 bei einer fehlerhaften Aufnahme der Benutzer B dahingehend Unterstützung er fahren, dass eine erneute Aufnahme der Nachricht initiiert wird. Ist die aufgezeichnete Nachricht korrekt, so soll anhand eines dritten Transaktionsparameters P3 = „Confirm Message" dem Sprachdialogsystem 1 angezeigt werden, dass die aufgezeichnete Nachricht weiterbearbeitet werden kann.Also should be through the speech dialogue system 1 in case of an erroneous inclusion of the user B support he drive that a re-recording of the message is initiated. If the recorded message is correct, P3 = "Confirm Message" is to use the language based on a third transaction parameter dialog system 1 that the recorded message can be processed further.

Alternativ ist durch das Vorsehen der Wertermittlungsinformation WEI auch eine indirekte Bestätigung der korrekten Aufnahme der Nachricht, d.h. ohne Benutzereingriff möglich. Hierzu wird die Abhängigkeit zwischen dem zweiten und dritten Transaktionsparameter P2 = „Listen" und P3 = „Confirm Message" verwertet, und zwar derart, dass über die Wertermittlungsroutine WEI automatisch der Wert des dritten Transaktionsparameters P3 = "Confirm Message" auf „Ja" gesetzt wird und somit eine Weiterverarbeitung der aufgezeichneten Nachricht ohne nochmaliges Abspielen umgesetzt wird, sofern der zweite Transaktionsparameter P3 = "Listen" den Wert „Nein" aufweist.alternative is also a by providing the value determination information WEI indirect confirmation of correct reception of the message, i. without user intervention possible. For this becomes the dependency between the second and third transaction parameters P2 = "lists" and P3 = "confirm Message "recycled, and Although such that over the validation routine WEI automatically returns the value of the third one Transaction parameter P3 = "Confirm Message "is set to" Yes "and thus further processing the recorded message without replay is implemented, provided the second transaction parameter P3 = "Lists" has the value "No".

Nach erfolgter Bestätigung der fehlerfreien Aufzeichnung der Nachricht wir mittels der Transaktionsparameterroutine TPR der Wert des vierten Transaktionsparameters P4 = "Receiver", nämlich der Empfänger der aufgezeichneten Nachricht, ermittelt.To confirmation the error-free recording of the message we by means of the transaction parameter routine TPR is the value of the fourth transaction parameter P4 = "receiver", namely the Recipient of recorded message, determined.

Schließlich wird nochmals mittels einem fünften Transaktionsparameter P5 = "Confirm Sending" vom Benutzer B die Bestätigung zum Absenden der aufgezeichneten Nachricht an den im Dialog-Management-System 3 gespeicherten Empfänger („Herrn Maier") abgefragt.Finally, by means of a fifth transaction parameter P5 = "Confirm Sending" by the user B, the confirmation for sending the recorded message to the in the dialogue management system 3 stored receiver ("Mr. Maier") queried.

Zusätzlich können noch die Übermittlungsparameter bzgl. der aufgezeichneten Nachricht als weitere Transaktionsparameter P6 – Px („Special Settings"), beispielsweise die Vertraulichkeit, Dringlichkeit, Verschlüsselung etc., mittels eines weiteren Klärungsdialogs vom Benutzer B abgefragt werden.In addition, still can the delivery parameters regarding the recorded message as further transaction parameters P6 - Px ( "Special Settings "), for example the confidentiality, urgency, encryption, etc., by means of a further clarification dialogue be queried by user B.

Ferner werden abhängig von Systemtriggerparameter TRR bzgl. der vorliegenden Transaktionsparameter P1 – Px mittels der Systemactionroutine SAR zu den unterschiedlichen Systemtriggerparameter TRR zugeordnete Systemactions SA ausgeführt. Beispielsweise wird bei einem den Wert „Ja" aufweisenden zweiten Transaktionsparameter P2 = „Listen" die Ausgabe der aufgezeichneten Nachricht gestartet und bei einem den Wert „Nein" aufweisenden dritten Transaktionsparameter P3 = „Confirm Message" oder einem den Wert „Nein" aufweisenden fünften Transaktionsparameter P5 = "Confirm Sending" das Löschen der aufgezeichneten Nachricht vorgenommen.Further become dependent of system trigger parameter TRR regarding the present transaction parameters P1 - Px by means of the system action routine SAR for the different system trigger parameters Systemactions SA assigned to TRR. For example, at a second having the value "yes" Transaction parameter P2 = "Lists" the output of the started message and with a value of "no" third Transaction parameter P3 = "Confirm Message "or one the value "No" has the fifth transaction parameter P5 = "Confirm Sending" deleting the recorded message.

Über die Kontextinformationsroutine KIR wird auch im Rahmen der vierten Transaktion T4 die Kontextinformation KI „Unified Messaging System: Nachrichtenversand" in der Speichereinheit 5 als zuletzt vorliegende Kontextinformation KIletzt gespeichert.In the context of the fourth transaction T4, the context information routine KIR also contains the context information KI "Unified Messaging System: Messaging" in the memory unit 5 as last present context information KI last saved.

Über die Nachbedingungsroutine NBR der vierten Transaktion T4 wird die zugeordnete Funktion („Nachricht senden") innerhalb des Unified Messaging Systems aufgerufen und der zugehörige Informationsprompt AP erzeugt und über die Ausgabeeinheit 4 ausgegeben.The postprocessing routine NBR of the fourth transaction T4 invokes the assigned function ("send message") within the Unified Messaging system and generates the associated information prompt AP and via the output unit 4 output.

Im Folgenden wird anhand einer Tabelle die Modellierung der vierten Transaktion T4 schematisch dargestellt:

Figure 00220001
Figure 00230001
The modeling of the fourth transaction T4 is shown schematically below using a table:
Figure 00220001
Figure 00230001

Basierend auf der erläuterten Spezifizierung von vier Transaktionen T1 bis T4 wird im Folgenden beispielhaft ein Dialog zwischen einem Benutzer B und dem Sprachdialogsystem 1 beschrieben. System (AP1): Willkommen im Unified Messaging System. Bitte identifizieren Sie sich im System. Benutzer (BE1): 123456 System (AP2): Telefonnummer 123456, bitte geben Sie Ihr Passwort ein. Benutzer (BE2): 333666 System (AP3): Sie sind im System eingeloggt. Was kann ich für Sie tun? Benutzer (BE3): Ich möchte alle neuen Nachrichten von Herrn Maier abhören. System (AP4): Nachrichten von Herrn Maier ... einen Moment bitte ... System (AP5): Sie haben zwei neue Nachrichten von Herrn Maier: Erste Nachricht ...; Zweite Nachricht ... Benutzer (BE4): Ich möchte eine Nachricht an Herrn Maier senden. System (AP6): Bitte geben Sie Ihre Nachricht ein und drücken Sie nach Ihrer Eingabe die #-Taste. Benutzer (BE5): Sehr geehrter Herr Maier, ich nehme ... (# gedrückt) System (AP7): Wollen Sie Ihre aufgenommen Nachricht abhören? Benutzer (BE6): Nein System (AP8): Wollen Sie die Nachricht normal senden? Benutzer (BE7): Ja System (AP9): Ihre Nachricht wurde gesendet. Based on the explained specification of four transactions T1 to T4, a dialog between a user B and the speech dialogue system will be described below by way of example 1 described. System (AP1): Welcome to the Unified Messaging System. Please identify yourself in the system. User (BE1): 123456 System (AP2): Phone number 123456, please enter your password. User (BE2): 333666 System (AP3): You are logged in to the system. What can I do for you? User (BE3): I would like to hear all new messages from Mr Maier. System (AP4): Messages from Mr. Maier ... a moment please ... System (AP5): You have two new messages from Mr. Maier: First message ...; Second message ... User (BE4): I would like to send a message to Mr. Maier. System (AP6): Please enter your message and press the # key as you type. User (BE5): Dear Mr. Maier, I take ... (# pressed) System (AP7): Do you want to listen to your recorded message? User (BE6): No System (AP8): Do you want to send the message normally? User (BE7): Yes System (AP9): Your message has been sent.

Anhand der nachfolgenden tabellarischen Darstellung wird die Veränderung der jeweiligen Transaktionsparameter P1 – Px im Rahmen des beschriebenen Dialoges tabellarisch dargestellt: Based the following tabular presentation becomes the change the respective transaction parameters P1 - Px in the context of the described Dialogues tabulated:

BE4: Ich möchte eine Nachricht an Herrn Maier senden.

Figure 00250001
BE4: I would like to send a message to Mr Maier.
Figure 00250001

BE5: Sehr geehrter Herr Maier, ich nehme ... (# gedrückt)

Figure 00250002
BE5: Dear Mr. Maier, I'll take ... (# pressed)
Figure 00250002

BE6: Nein

Figure 00250003
BE6: No.
Figure 00250003

BE7: Ja

Figure 00260001
BE7: Yes
Figure 00260001

Über die Vorbedingungsparameter VBP sowie die zugeordneten Kontextinformationen KI wird somit eine schnelle Identifizierung der vom Benutzer B gewünschten Funktion der Hintergrundapplikation bzw. der dieser zugeordneten Transaktion T1 – Tx realisiert. Insbesondere durch die Abspeicherung der zuletzt vorliegenden Kontextinformation KIletzt in der Speichereinheit 5 der Dialog-Management-Einheit 3 und die zunächst beschränkte Auswertung der mit den erhaltenen Aktionsinformationen AI im Hinblick auf die eine übereinstimmende Kontextinformation KI aufweisenden Transaktionen T2, T3 einer Transaktionsgruppe TG1 wird die Nutzerfreundlichkeit sowie der Bedienkomfort des Sprachdialogsystems 1 deutlich erhöht.By means of the precondition parameters VBP and the associated context information KI, a quick identification of the function of the background application or of the transaction T1-Tx assigned to it by the user B is thus realized. In particular, by the storage of the last available context information KI last in the memory unit 5 the dialogue management unit 3 and the initially limited evaluation of the obtained with the received action information AI in terms of a matching context information KI having transactions T2, T3 a transaction group TG1 is the ease of use and ease of use of the speech dialogue system 1 clearly increased.

Die Erfindung wurde voranstehend anhand eines Ausführungsbeispiels näher beschrieben. Es versteht sich von selbst, daß zahlreiche Modifikationen sowie Abwandlungen möglich sind, ohne daß dadurch der der Erfindung zugrunde liegende Erfindungsgedanke verlassen wird.The The invention has been described above with reference to an embodiment. It goes without saying that numerous Modifications and modifications are possible without thereby leave the inventive concept underlying the invention becomes.

11
SprachdialogsystemVoice control system
22
Eingabeeinheitinput unit
33
Dialog-Management-EinheitDialog management unit
44
Ausgabeeinheitoutput unit
55
Speichereinheitstorage unit
66
SpracherkennungseinheitVoice recognition unit
77
SprachsyntheseeinheitSpeech synthesis unit
88th
Parsereinheitparser
99
Steuereinheitcontrol unit
AAAA
Aktionspromptsaction prompts
AIAI
Aktionsinformationaction information
AP, AP1 – AP9AP, AP1 - AP9
Ausgabepromptoutput prompt
ARAR
Auswahlroutineselection routine
BB
Benutzeruser
BE, BE1 – BE7BE, BE1 - BE7
Benutzeräußerunguser utterance
CRCR
Constraint-RoutineConstraint routine
DBSDBS
Datenbussystemdata bus system
G1 – GxG1 - Gx
Grammatikengrammars
G1* – Gx*G1 * - Gx *
kontextabhängige Grammatikencontextual grammars
GRGR
GrammatikroutineGrammar routine
HAHA
HintergrundapplikationBackground application
KIKI
Kontextinformationcontext information
KIletzt AI last
zuletzt gespeicherte Kontextinformationlast saved context information
KIRKIR
KontextinformationsroutineContext information Routine
LBLB
logische Bedingungsparameterlogical condition parameters
NBANBA
NachbedingungsaktionenNachbedingungsaktionen
NBPNBP
NachbedingungsparameterNachbedingungsparameter
NBRNBR
Nachbedingungsroutinepostcondition
P1 – PxP1 - Px
Transaktionsparametertransaction parameters
Pmax P max
oberer Grenzwertupper limit
PGRPGR
Parametergrammatikenparameter grammars
PPPP
Parameterpromptparameter prompt
S1 – S5S1 - S5
erster bis fünfter Schrittfirst until fifth step
SASA
Systemactionsystem Action
SARSAR
SystemactionroutineSystem Action Routine
T1 – TxT1 - Tx
Transaktionentransactions
Tletzt T last
zuletzt ausgeführte Transaktionlast executed transaction
TGTG
Transaktionsgruppetransaction group
TPPTPP
Triggerparametertrigger parameters
TPRTPR
TransaktionsparameterroutineTransaction parameters routine
TRRTRR
SystemtriggerparameterSystem parameters Trigger
VBIVBI
Vorbedingungsinformationenprecondition information
VBPVBP
VorbedingungsparameterVorbedingungsparameter
VBRVBR
VorbedingungsroutineVorbedingungsroutine
VBRVBR
VorbedingungsroutineVorbedingungsroutine
VBVB
Vorbedingungprecondition
WEIWEI
WertermittlungsinformationValuation Information

Claims (19)

Verfahren zur Ermittlung zumindest einer Transaktion (T1 – Tx) zur Bedienung einer Hintergrundapplikation (HA) unter Auswertung von zumindest einer in einer Benutzeräußerung (BE) enthaltenen Aktionsinformation (AI) in einem Sprachdialogsystem (1), wobei jeweils einer Hintergrundapplikation (HA) eine endliche Menge auswählbarer Transaktionen (T1 –Tx) zugeordnet sind und bei dem über eine im Sprachdialogsystem (1) vorgesehene Eingabeeinheit (2) zumindest eine Benutzeräußerung (BE) erfasst und im Sprachdialogsystem (1) gespeichert wird, dadurch gekennzeichnet, – dass in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) im Sprachdialogsystem (1) jeweils zumindest eine übereinstimmende Kontextinformation (KI) zugeordnet wird, – dass die Kontextinformation (KIletzt) zumindest der zuletzt ausgeführten Transaktion (Tletzt) im Sprachdialogsystem gespeichert wird und – dass zur Ermittlung der aktuellen Transaktion (T1 –Tx) bevorzugt diejenigen Transaktionen (T2, T3) berücksichtigt werden, deren zugeordnete Kontextinformation (KI) mit der gespeicherten Kontextinformation (KIletzt) übereinstimmt.Method for determining at least one transaction (T1-Tx) for operating a background application (HA) by evaluating at least one action information (AI) contained in a user statement (BE) in a speech dialogue system ( 1 ), wherein in each case a background application (HA) a finite set of selectable transactions (T1 -Tx) are assigned and in which a speech application in the system ( 1 ) provided input unit ( 2 ) at least one user utterance (BE) and in the speech dialogue system ( 1 ), characterized in that transactions (T2, T3) in the speech dialogue system ( 1 ) in each case at least one matching context information (KI) is assigned, - that the context information (KI last ) at least the last executed transaction (T last ) is stored in the speech dialogue system and - that for determining the current transaction (T1 -Tx) preferably those transactions ( T2, T3) whose associated context information (KI) matches the stored context information (KI last ). Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) zu einer Transaktionsgruppe (TG1) mit jeweils übereinstimmender Kontextinformation (KI) zusammengefasst werden.Method according to claim 1, characterized in that that the transactions in a meaningful relationship (T2, T3) to a transaction group (TG1) with matching ones Context information (AI) are summarized. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die aktuelle Transaktion (T1 – T4) mittels der jeweils einer Transaktion (T1 – Tx) zugeordneten Grammatikroutine (GR) und dieser zugeordneter Grammatiken (G1 – Gx) durch Auswertung der in der Benutzeräußerung (BE) enthaltenen Aktionsinformationen (AI) ermittelt wird.Method according to claim 1 or 2, characterized that the current transaction (T1 - T4) by means of one each Transaction (T1 - Tx) associated grammar routine (GR) and associated grammars (G1 - Gx) by evaluating the action information contained in the user statement (BE) (AI) is determined. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass im Sprachdialogsystem (1) jeweils einer Transaktion (T1 – Tx) eine vorgebbare Anzahl an Transaktionsparametern (P1 – Px) zugeordnet wird.Method according to one of claims 1 to 3, characterized in that in the speech dialogue system ( 1 ) a respective number of transaction parameters (P1 - Px) is assigned to a respective transaction (T1 - Tx). Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zumindest eine in der gespeicherten Benutzeräußerung (BE) enthaltene Aktionsinformation (AI) mit Hilfe einer Spracherkennungseinheit (6) ermittelt wird.Method according to one of the preceding claims, characterized in that the at least one action information (AI) contained in the stored user statement (BE) is recorded by means of a speech recognition unit ( 6 ) is determined. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zumindest einer der Transaktionen (T1 – Tx) zumindest ein Vorbedingungsparameter (VBP) zugeordnet wird.Method according to one of the preceding claims, characterized characterized in that at least one of the transactions (T1 - Tx) at least a precondition parameter (VBP) is assigned. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass das Vorliegen des zumindest einen zugeordneten Vorbedingungsparameters (VBP) mittels einer zugehörigen Vorbedingungsroutine (VBR) verifiziert wird.Method according to Claim 6, characterized in that the presence of the at least one assigned precondition parameter (VBP) by means of an associated Preconditioning routine (VBR) is verified. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass durch die Vorbedingungsroutine (VBR) die Aktivierung bzw. Deaktivierung einer weiteren Transaktion (T1) überprüft wird.Method according to claim 7, characterized in that that by the Vorbedingungsroutine (VBR) the activation or deactivation another transaction (T1) is checked. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass abhängig vom Ergebnis der Überprüfung ein im Sprachdialogsystem (1) gespeicherter, zugeordneter Parameterprompt (PP) ausgewählt und über die Ausgabeeinheit (4) ausgegeben wird oder die Ausführung der aktuell ermittelten Transaktion (T2, T3, T4) fortgeführt wird.Method according to claim 8, characterized in that, depending on the result of the check, a speech dialogue system ( 1 stored, assigned Parameterprompt (PP) and via the output unit ( 4 ) or the execution of the currently determined transaction (T2, T3, T4) is continued. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zumindest einer der Transaktionen (T1 – Tx) zumindest ein Nachbedingungsparameter (NBP) zugeordnet wird.Method according to one of the preceding claims, characterized characterized in that at least one of the transactions (T1 - Tx) at least a Nachbedingungsparameter (NBP) is assigned. Verfahren nach Ansprüche 10, dadurch gekennzeichnet, dass nach der Ausführung der aktuell ermittelten Transaktion (T1, T2, T3, T4) eine zugehörige Nachbedingungsroutine (BNR) gestartet wird und mittels dieser das Vorliegen der zugeordneten Nachbedingungsparameter (NBP) überprüft sowie zugeordnete Nachbedingungsaktionen (NBA) initiiert werden.Method according to claims 10, characterized in that that after the execution the currently determined transaction (T1, T2, T3, T4) an associated Nachbedingungsroutine (BNR) is started and by means of this the presence of the assigned Nachbedingungsparameter (NBP) checked as well associated post-conditional actions (NBA) are initiated. Verfahren nach einem der Ansprüche 4 bis 11, dadurch gekennzeichnet, dass der Parameterwert eines Transaktionsparameters (P1 – Px) mittels einer Transaktionsparameterroutine (TPR) ermittelt wird, wobei zumindest einem Transaktionsparameter (P5) eine Wertermittlungsinformation (WEI) zugeordnet ist, die den Ermittlungsweg angibt.Method according to one of claims 4 to 11, characterized that the parameter value of a transaction parameter (P1 - Px) by means of a transaction parameter routine (TPR) is determined, wherein at least a transaction parameter (P5) a value determination information (WEI), which indicates the investigation path. Verfahren nach einem der Ansprüche 4 bis 12, dadurch gekennzeichnet, dass bei einer Änderung eines Transaktionsparameters (P1 – Px) einer Transaktion (T1 – Tx) die Gültigkeit des geänderten Transaktionsparameters (P1 – Px) überprüft wird.Method according to one of Claims 4 to 12, characterized that at a change a transaction parameter (P1 - Px) of a transaction (T1 - Tx) the validity of the changed Transaction parameter (P1 - Px) is checked. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass die Überprüfung der Gültigkeit des geänderten Transaktionsparameters (P1 – Px) mittels einer Constraint-Routine (CR) durchgeführt wird, welche Trigger-Parameter (TR), zumindest eine logische Bedingung (LB) und Aktionsanweisungsprompts (AA) umfasst.Method according to claim 13, characterized in that that the review of validity of the changed Transaction parameters (P1 - Px) is performed by means of a constraint routine (CR), which trigger parameters (TR), at least one logical condition (LB) and action instruction prompts (AA). Verfahren nach einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, dass dem Benutzer (B) des Sprachdialogsystem (1) während der Ausführung der aktuell ermittelten Transaktion (T1 – Tx) einer Hintergrundapplikation (HA) vorgegebene Informations- bzw. Aktionsprompts (AP) angezeigt werden.Method according to one of claims 1 to 14, characterized in that the user (B) of the speech dialogue system ( 1 ) during the execution of the currently determined transaction (T1 - Tx) of a background application (HA) given information or Aktionsprompts (AP) are displayed. Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass die vorgegebenen Informations- bzw. Aktionsprompts (AP) mit Hilfe einer System-Action-Routine (SAR) ermittelt werden, welche Trigger-Parameter (TRR), Vorbedingungsinformationen (VBI) und vorgegebene Systemactions (SA) umfasst.Method according to claim 15, characterized in that that the given information or action prompts (AP) with Help of a system action routine (SAR) can be determined which Trigger parameter (TRR), precondition information (VBI) and default Systemactions (SA). Verfahren nach Anspruch 1 bis 16, dadurch gekennzeichnet, dass den einzelnen Transaktionen (T1 – T4) jeweils eine von der zugeordneten Kontextinformation (KI) abhängige Grammatik (G1* – Gx*) zugeordnet wird.Method according to Claims 1 to 16, characterized that the individual transactions (T1 - T4) each one of the associated with context information (KI) dependent grammar (G1 * - Gx *) is assigned. Sprachdialogsystem zur Durchführung des Verfahrens gemäß einer der Ansprüche 1 bis 17 bestehend aus zumindest einer Eingabeeinheit (2), einer Dialog-Management-Einheit (3) und einer Ausgabeeinheit (4), dadurch gekennzeichnet, – dass die Dialog-Management-Einheit (3) eine Steuereinheit (9) zur Zuordnung zumindest einer übereinstimmenden Kontextinformation (KI) zu in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) aufweist, – dass eine Speichereinheit (5) zur Speicherung zumindest der Kontextinformation (KIletzt) der zuletzt ausgeführten Transaktion (Tletzt) vorgesehen ist und – dass eine in der Steuereinheit (9) ausgeführte Auswahlroutine (AR) vorgesehen ist, die bevorzugt diejenigen Transaktionen (T2, T3) für die Ermittlung der aktuellen Transkation (T1 – Tx) auswählt, deren zugeordnete Kontextinformation (KI) mit der gespeicherten Kontextinformation (KIletzt) übereinstimmt.Speech dialogue system for carrying out the method according to one of claims 1 to 17, comprising at least one input unit ( 2 ), a dialogue management unit ( 3 ) and an output unit ( 4 ), characterized in that - the dialogue management unit ( 3 ) a control unit ( 9 ) to associate at least one match context information (KI) to transactions in a meaningful relationship (T2, T3), - that a memory unit ( 5 ) is provided for storing at least the context information (KI last ) of the last executed transaction (T last ) and - that in the control unit ( 9 ) is executed, which preferably selects those transactions (T2, T3) for the determination of the current transaction (T1 - Tx) whose associated context information (KI) matches the stored context information (KI last ). Sprachdialogsystem nach Anspruch 18, dadurch gekennzeichnet, dass die zu bedienende Hintergrundapplikation (HA) als „Unified Messaging Systeme" ausgebildet ist.Speech dialogue system according to claim 18, characterized in that that the background application to be used (HA) as "Unified Messaging systems "trained is.
DE102005037621A 2005-08-09 2005-08-09 Method and speech dialog system for determining at least one transaction for operating a background application Ceased DE102005037621A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102005037621A DE102005037621A1 (en) 2005-08-09 2005-08-09 Method and speech dialog system for determining at least one transaction for operating a background application
PCT/EP2006/064501 WO2007017361A1 (en) 2005-08-09 2006-07-21 Method and vocal interaction system for determining at least one transaction for operating a background application

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102005037621A DE102005037621A1 (en) 2005-08-09 2005-08-09 Method and speech dialog system for determining at least one transaction for operating a background application

Publications (1)

Publication Number Publication Date
DE102005037621A1 true DE102005037621A1 (en) 2007-02-22

Family

ID=37179086

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102005037621A Ceased DE102005037621A1 (en) 2005-08-09 2005-08-09 Method and speech dialog system for determining at least one transaction for operating a background application

Country Status (2)

Country Link
DE (1) DE102005037621A1 (en)
WO (1) WO2007017361A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008025532A1 (en) * 2008-05-28 2009-12-10 Audi Ag Communication system for providing communication with passengers in vehicle, has selection unit for selecting one of language grammars for producing outputs depending on acoustic signals of user, which are given as inputs

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9661138B2 (en) 2015-01-14 2017-05-23 Unify Gmbh & Co. Kg System and method for automatic intention evaluation and communication routing

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6314398B1 (en) * 1999-03-01 2001-11-06 Matsushita Electric Industrial Co., Ltd. Apparatus and method using speech understanding for automatic channel selection in interactive television
EP1273004A1 (en) * 2000-04-06 2003-01-08 One Voice Technologies Inc. Natural language and dialogue generation processing
EP1335352A1 (en) * 2002-02-11 2003-08-13 Sony International (Europe) GmbH Dialogue management server and method for dialogue management
WO2006037219A1 (en) * 2004-10-05 2006-04-13 Inago Corporation System and methods for improving accuracy of speech recognition

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008025532A1 (en) * 2008-05-28 2009-12-10 Audi Ag Communication system for providing communication with passengers in vehicle, has selection unit for selecting one of language grammars for producing outputs depending on acoustic signals of user, which are given as inputs
DE102008025532B4 (en) * 2008-05-28 2014-01-09 Audi Ag A communication system and method for performing communication between a user and a communication device

Also Published As

Publication number Publication date
WO2007017361A1 (en) 2007-02-15

Similar Documents

Publication Publication Date Title
EP1964110B1 (en) Method for triggering at least one first and second background application via a universal language dialogue system
DE69839068T2 (en) System and method for automatic processing of call and data transmission
DE60037164T2 (en) Method and apparatus for accessing a multi-client dialogue system
DE60001765T2 (en) Method and device for the composition and presentation of structured voice mail messages
DE60305458T2 (en) A SYSTEM AND METHOD FOR PROVIDING A MESSAGE BASED COMMUNICATION INFRASTRUCTURE FOR AN AUTOMATED CALLING CENTER OPERATION
EP3108476B1 (en) Method for acquiring at least two pieces of information to be acquired, comprising information content to be linked, using a speech dialogue device, speech dialogue device, and motor vehicle
EP0852051A1 (en) Process for automatic control of one or more devices by voice commands or by real-time voice dialog and apparatus for carrying out this process
DE10100725C1 (en) Automatic dialogue system for speech interrogation of databank entries uses speech recognition system assisted by speech model obtained before beginning of dialogue
DE102011118780A1 (en) PROCESS AND SYSTEM FOR CREATING A COOPERATION TIME AXIS ILLUSTRATING APPLICATION ARTICLES IN THE CONTEXT
DE102005060072B4 (en) Method and apparatus for managing user nametags for a vehicle communication system
EP1590797A1 (en) Communication system, communication emitter, and appliance for detecting erroneous text messages
DE10208295A1 (en) Method for operating a voice dialog system
DE69636731T2 (en) System and method for recording names in a voice recognition database
WO2001086634A1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
EP1251680A1 (en) Voice-controlled directory service for connection to a Data Network
EP3335405A1 (en) Method for processing a user input and motor vehicle having a data-processing device
EP3058565B1 (en) Voice control method and computer program product for performing the method
DE102005037621A1 (en) Method and speech dialog system for determining at least one transaction for operating a background application
DE102018132160A1 (en) SYSTEM AND METHOD FOR UNDERSTANDING STANDARD LANGUAGE AND DIALECTS
EP3576084B1 (en) Efficient dialog design
DE60125597T2 (en) Device for the provision of services
EP1340169A2 (en) Method and device for automatically issuing information using a search engine
EP3115886A1 (en) Method for operating a voice controlled system and voice controlled system
WO2001013196A2 (en) Server system and method for automatically determining, monitoring and transmitting data relating to the current value of individual portfolios
CN108063823A (en) Data processing method, device, equipment and storage medium

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection