[go: up one dir, main page]

WO2007017361A1 - Method and vocal interaction system for determining at least one transaction for operating a background application - Google Patents

Method and vocal interaction system for determining at least one transaction for operating a background application Download PDF

Info

Publication number
WO2007017361A1
WO2007017361A1 PCT/EP2006/064501 EP2006064501W WO2007017361A1 WO 2007017361 A1 WO2007017361 A1 WO 2007017361A1 EP 2006064501 W EP2006064501 W EP 2006064501W WO 2007017361 A1 WO2007017361 A1 WO 2007017361A1
Authority
WO
WIPO (PCT)
Prior art keywords
transaction
user
context information
transactions
parameter
Prior art date
Application number
PCT/EP2006/064501
Other languages
German (de)
French (fr)
Inventor
Dongyi Song
Hans-Ulrich Block
Rudolf Caspari
Jürgen Totzke
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Publication of WO2007017361A1 publication Critical patent/WO2007017361A1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning

Definitions

  • the invention relates to a method and an associated speech dialogue system for determining at least one transaction for operating a background application by evaluating contained in a user statement action information in such a speech dialogue system, each of a background application is associated with a finite set of selectable transactions and in which provided for in the speech dialogue system Input unit at least one user utterance recorded and stored in the speech dialogue system.
  • Speech dialog systems for database access which permit information access and control of communication applications via voice communication, are known as interfaces to many computer-aided applications.
  • Applications or background applications e.g. A technical device for consumer electronics, a telephone information system (train, flight, cinema, etc.), a computer-aided transaction system (home banking system, electronic goods ordering, etc.) are increasingly being used as access systems ("user interfaces") via such speech dialogue systems.
  • Such speech dialogue systems may be implemented in hardware, software or a combination thereof.
  • Dialogue progression to achieve application-specific dialogue goals is controlled via such a speech dialogue system, which manages the interactions between a dialogue management unit and the individual user.
  • the dialogue management unit has an input unit and output unit.
  • a user-generated user utterance for example in the form of a voice signal, is detected by the input unit and stored in the dialog management unit.
  • the input unit may for example be followed by a speech recognition unit, via which a determination of action information contained in a user statement is performed.
  • the output unit can be designed as a speech synthesis unit.
  • action information is obtained from the speech signal, for example in the form of individual words or word strings, which are evaluated by comparison with key words or grammars loaded in a parser.
  • a transaction associated with one or more key terms is started to handle background information.
  • a dialogue history with the respective user is created via the dialog management unit
  • voice recognition modules In order for a user to be able to place his requests in spoken natural language, the use of voice recognition modules or units is required.
  • Such language Detection modules are known, for example, from DE 197 19 381 C1 and DE 199 56 747 C1.
  • a background application is considered to be a finite set of transactions (T1, T2, .... Tx), where each transaction is associated with a finite set (which may also be empty) of transaction parameters (Pl, P2, Px).
  • the transaction parameters are known to the speech dialogue system.
  • a grammar is provided which serves to capture the transaction parameter in the dialog.
  • DE 101 10 977 C1 discloses a method and an arrangement for providing help information for a user of a speech dialogue system for operating a background application, in which predetermined help information is determined and output to the user depending on the current dialog status. The user is thus provided with context-sensitive help information by the speech dialogue system, depending on his respective dialog status.
  • unified messaging systems are known, by means of which various messages are stored on a communication platform, managed and accessed via different types of access, for example emails, SMS or even classic telephone, fax and answering machine functions be linked, so that for example via such a "Unified Messaging System” a fax, an e-mail or email an SMS message can be sent to a mobile phone. Answering machine messages can be monitored as usual or texts and emails can be read out using the "Text-to-Speech" (TTS) procedure.
  • TTS Text-to-Speech
  • the object of the present invention is thus to provide a method for determining at least one transaction for operating a background application and an associated speech dialogue system, in which a clear identification of the desired user application background fast and user-friendly, in particular already on the basis of reduced action information possible becomes.
  • the object is achieved by a method according to claim 1 and a speech dialogue system according to claim 16.
  • the essential idea of the method according to the invention for determining at least one transaction for operating a background application and evaluation of at least one action information contained in a user statement in a speech dialogue system, in each of which a background application is assigned a finite set of selectable transactions and in which via an input unit provided in the speech dialogue system at least one user statement is recorded and stored in the speech dialogue system, is that each in the context of transactions in the speech dialogue system is assigned at least one matching context information and the context information of at least the last executed transaction is stored in the speech dialogue system.
  • those transactions whose associated context information corresponds with the stored context information are advantageously preferably taken into account.
  • FIG. 1 shows a schematic block diagram of a speech dialogue system by way of example
  • FIG. 2 shows by way of example the individual components of a transaction in a further block diagram
  • FIG. 3 shows by way of example the individual steps of the method according to the invention in a flowchart.
  • Fig. 1 is a schematic block diagram exemplified a voice dialogue system 1, via which a user B can operate at least one background application HA.
  • the operation of the background application HA takes place here by way of example on the basis of individual selected and stored in the speech dialogue system 1 transactions Tl to Tx, which are assigned to one or more functions of the background application HA.
  • the speech dialogue system 1 illustrated in FIG. 1 comprises an input unit 2, a dialog management unit 3 and an output unit 4, the dialog management unit 3 being in each case in communication with the input unit 2, the output unit 4 and the background application HA.
  • a memory unit 5 for storing the transactions Tl to Tx for operating the background application HA and other parameters is provided.
  • the dialogue management unit 3 also has a
  • Speech recognition unit 6, a speech synthesis unit 7, a parser unit 8 and a control unit 9 which, for example, connected to each other via a data bus DBS system are.
  • the background application HA which in an alternative embodiment can be connected to the dialogue management unit 3 via an interface module (not shown in FIG. 1), is likewise connected to the data bus system DBS.
  • the input unit 2 of the speech dialogue system 1 is connected to the speech recognition unit 6 and the output unit 4 to the speech synthesis unit 7.
  • a user statement BE is generated, which has action information AI. This can be a
  • User statement BE have one or more action information AI, which can be arranged within the user statement BE in different orders.
  • a user statement BE of the user B preferably detected as a voice signal and stored in the dialogue management unit 3.
  • the user utterance BE is digitized or supplied in digital form to the storage unit 5 and the action information (s) AI contained in the user statement BE is determined via the speech recognition unit 6 in a manner known per se and stored in the storage unit 5.
  • the output unit 4 can provide the user B with output prompts or information prompts AP, which are output via the output unit 4, for example in the form of a synthesized speech signal generated by the speech synthesis unit 7.
  • the user B is informed, for example, about the current status of the background application HA to be operated or the actions carried out by the system on the basis of the last user statement BE, or the user B initiates the delivery of at least one further user statement BE.
  • a clarification dialog which alternates between output prompt AP and user statements BE can be carried out.
  • FIG. 2 is a schematic representation of the individual components of such a transaction T 1 to T x, which are used to operate the different lent functions of the background application HA are provided in the dialogue management unit 3.
  • a background application HA is assigned a finite set of such transactions Tl-Tx whose selection is triggered via a respective grammatical routine GR assigned to a respective transaction Tl-Tx.
  • one or more such grammars G1-Gx are assigned to the transaction T1, which are loaded into the parser unit 8 for determining the transactions T1 to Tx belonging to the stored action information AI.
  • the parser unit 8 the individual key terms of the grammars G1-Gx characterizing the respective transaction T1 are compared with the action information AI.
  • the grammars G1-Gx can be replaced or extended, for example, by contextual grammars G1 * - Gx * which, taking into account the
  • the first transaction T 1 shown by way of example in FIG. 2 has a preconditioning routine VBR, which is executed before the further execution of a transaction T 1 -Tx in the control unit 9 in order to verify the existence of preconditions such as, for example, the successful execution of another transaction T 2.
  • the preconditioning routine VBR has one or more precondition parameters VBP and associated parameter prompts PP.
  • the preconditioning routine VBR executed in the control unit 9 checks, for example, the activation or deactivation of a further transaction T2 and, depending on the result, selects the associated parameter prompt PP and outputs it to the user B via the speech synthesis unit 7 and the output unit 4.
  • the mutually correlated context information KI is assigned to the transactions T1-Tx in the speech dialogue system 1, and thus the transactions T2, T3 having a meaningful relationship are combined into a respective transaction group TG1-TGx with matching context information KI.
  • a second and third transaction T2, T3 are combined to form a first transaction group TG1.
  • the context-related link KI interlinks different transactions Tl-Tx evaluated for the current determination of a transaction Tl to Tx, thereby significantly reducing the time and computational effort for the conduct of the investigation.
  • the context information Klo t z t is stored at least the last executed in the dialogue management unit 3 transaction T iet z t and taken into account in the current determination of a transaction Tl - Tx, in such a way that preferably those transactions T2 , T3 are considered in the determination whose associated context information KI matches the stored context information Klo t z t .
  • the current transaction Tl - Tx first of all that transaction group TG1 - TGx is considered to which the last executed transaction Tietzt belongs.
  • the transactions Tl-Tx of the determined transaction group TG1-TGx are particularly advantageously prioritized in the selection process, and thus those Transactions Tl - Tx executed having the largest "hit probability".
  • context information KI transaction Tl - Tx each associated with a context information routine KIR that t the conformity of the transaction Tl associated context information AI with the data stored in the storage unit 5.
  • context information toilet z t of the last executed in the dialog management unit 3 Transaction T iet z t checked. If the last stored context information Klo t z t and the context information KI associated with the first transaction Tl match, the considered first transaction Tl is preferably taken into account in the determination of the current transaction, ie the action information AI obtained from the user statement BE in the parser unit 8 executed grammar routine GR of the considered transaction Tl evaluated.
  • the context information KI may, for example, have the parameter type "string", which represents a preamble representing the meaning context between the transactions Tl to Tx.
  • each transaction Tl-Tx is assigned a transaction parameter routine TPR which, in addition to the determined transaction parameters P1-Px, has transaction parameter prompts TPP, a parameter grammar PGR and a value determination information WEI.
  • the transaction Tl is specified content by its transaction parameters Pl - Px whose values are determined via the transaction parameter routine TPR.
  • the values of the transaction parameters Pl-Pix are determined from the action information AI via the parameter grammar PGR executed in parser unit 8.
  • the transaction parameters Pl - Px still to be determined for the execution of the transaction Tl - Tx are queried by issuing the respectively assigned transaction parameter prompt TPP to the user B and his action information AI contained in another user statement BE in the context of a clarification dialog.
  • value determination information WEI assigned in each case to the individual transaction parameters Pl - Px is determined in which manner the determination of the transaction parameters P1 - Px should or can take place. For example, to determine the transaction parameters Pl - Px in addition to the
  • a constraint routine CR per transaction Tl-Tx which includes trigger parameters TR, logical conditions LB and action instruction prompts AA.
  • the modified parameter value of a transaction parameter P 1 -Px is thus ascertained for validity via the contraint routine CR with the aid of the predetermined trigger parameters TR and the logical condition LB and communicated to the user B in the event of a deviation via action instruction prompts AA.
  • a logical condition LB it is predetermined as a logical condition LB to form the sum of two transaction parameters P 1 , P 2 and to check whether this, for example, exceeds an upper limit P max .
  • the upper limit P max is exceeded, the associated action instruction prompt AA becomes the
  • Contraint routine CR issued.
  • a predetermined system function can also be initiated.
  • a Nachbedingungsroutine NBR is checked whether all necessary for the execution of the respective transaction Tl - Tx post-conditions NB, for example, at least the required transaction parameter Pl - Px, now present, ie the gaps of the frame-modeled transaction Tl are filled and using the selected transaction Tl the associated function of the background application HA can now be started.
  • the Nachbedingungsroutine NBR those post-conditions NB are checked, which must be present at the end of the dialog to ensure a transfer of all necessary for the operation of the background application HA information about the transaction Tl.
  • the post-conditional routine NBR can be used to individually define and check different complex post-conditions NB for different transactions Tl-Tx.
  • a transaction Tl-Tx has a system operation routine SAR, with the aid of which the output of specific action prompts AP or system actions SA is implemented.
  • the system action routine SAR comprises, for example, system trigger parameters TRP and precondition information VBI as well as predetermined system actions SA.
  • system trigger parameter TRP changes, the initiation of the predetermined system actions SA is verified via the precondition information VBI and, if appropriate, the assigned system actions SA are started.
  • the user B is thus informed about a change in the dialog status or the status of the background application HA.
  • FIG. 3 shows by way of example the method according to the invention for determining at least one transaction Tl -Tx in the speech dialogue system 1 in a flow chart.
  • a selection routine AR executed in the control unit 9
  • the five method steps S1-S5 shown in FIG. 3 are executed.
  • the correlated context information KI is assigned to the transactions Tl-Tx that are in a context of meaning.
  • the context information KI associated therewith is used as last stock response associated context information i m Pushdia- logssystem 1 and the memory unit 5 of the dialogue management unit 3 stored (second step S2).
  • the previously determined transactions T2, T3 are preferably used for determining the current transaction Tl-Tx from the finite quantity of the transactions Tl-Tx.
  • a "unified messaging system" is considered by way of example, which as a rule consists of a telephone connection between the user B and the speech dialogue system 1, ie the input unit 2 is designed as a microphone unit of a telephone and the output unit 4 as a loudspeaker unit thereof
  • Basic functions of such a Unified Messaging system can be called the following functions:
  • the action information AI obtained from the user statement BE is compared with the grammars G1-Gx or their key terms required for executing the first transaction T1, and the associated transaction T1 is started if the match is correct.
  • the user B inputs his telephone number and the associated password in the voice dialogue system 1 as a user statement BE.
  • the user utterance BE is detected via the input unit 2 and, based on the speech recognition unit 6, the telephone number contained in the user utterance BE and the password determined and stored as action information AI in the memory unit 5.
  • the Nachbedingungsroutine NBR is the existence of the for the execution of the first transaction Tl "user identification" assigned function of the background application
  • an action prompt AP indicating the status of the identification process is output to the user B via the output unit 4.
  • a context information KI associated with the first transaction Tl is optionally stored in the memory unit 5.
  • the user B enters the following user statement BE in the speech dialogue system 1: "I want to listen to my new messages.”
  • the user utterance BE is recorded via the input unit 2 and the action information AI included in the user utterance BE using the speech recognition unit 6 determined and stored in the memory unit 5.
  • Possible action information AI can here be the terms “new”, “messages” and “listening”.
  • the context information routine KIR firstly compares the context information KI associated with each transaction Tl-Tx with the last stored context information Klo t z t , and preferably uses this transaction T2, T3 to determine the current transaction T2.
  • the last stored context information Klo t z t can be loaded and after querying the context information KI of the individual transactions Tl-Tx those transactions T2, T3 with matching context information KI for the determination of the current transaction T2, T3 be provided.
  • the respective grammar routine GR is considered to be meaningful, i.
  • the transactions T2, T3 having the same context information KI are started, and the agreement of the action information AI obtained from the user statement BE with the grammars G1 - Gx required for executing the second or third transaction T2, T3 and their keywords is checked and, if they match, the determined transaction T2 started.
  • the second transaction T2 is "query new
  • Unified Messaging System message query "assigned, which in turn executes the second transaction T2 in the memory storage unit 5 of the dialogue management unit 3 is stored as last assigned context information Klo t z t .
  • the function ("polling new messages") of the background application HA "Unified Messaging System" assigned to the second transaction T2 is subsequently called, and the associated information prompt AP together with the messages to the user B via the output unit 4 issued.
  • the dialogue structure on which the second transaction T2 is based can thus be illustrated as an example as follows:
  • the submitted user statement BE "I would like to listen to the new messages from Mr. Maier" is in turn detected via the input unit 2 and the voice information unit 6 determines the action information AI contained in the user statement BE, which is stored in the memory unit 5.
  • the dialog Management unit 3 is stored after the execution of the second transaction T2 as the last stored context information Klo t z t "unified messaging system: message query".
  • the respective grammar routine GR of the third transaction T3 is started and the correspondence of the action information AI obtained from the user statement BE with the grammars G1 - Gx required for executing the third transaction T3 or their key terms is checked and, if they match, the third transaction T3 continue running.
  • transaction parameter Pl "name" the name of the person ("Mr. Maier ") whose new messages are to be output to user B.
  • the context information KI" Unified Messaging System message query "in the memory unit 5 as the last present context information loo t z t stored.
  • the fourth transaction T4 is provided.
  • the grammar routine GR of the fourth transaction T4 is started and the correspondence of the action information AI obtained from the user request BE with the grammars G1 - Gx required for executing the fourth transaction T4 or their key terms is checked and, on the basis of their agreement with the stored transaction information, the fourth transaction T4 further executed.
  • the user BE In order to send a message to the given recipient "Mr Maier", it is first necessary for the user BE to enter the message into the speech dialogue system 1.
  • the value of the fourth transaction parameter P4 "receiver", namely the receiver of the recorded message, is determined by means of the transaction parameter routine TPR.
  • transmission parameters regarding the recorded message can also be queried by user B as further transaction parameters P6-Px ("Special Settings"), for example the confidentiality, urgency, encryption, etc., by means of a further clarification dialog.
  • the context information KI "Unified Messaging System: Messaging” is also stored in the memory unit 5 as last-available context information Klo t z t via the context information routine KIR.
  • the associated function (“send message") is called within the Unified Messaging system and the associated information Prompt AP generated and output via the output unit 4.
  • BEI 123456 System (AP2): Phone number 123456, please enter your password.
  • BE2 333666 System AP3: You are logged into the system. What can I do for you?
  • KIR context information routine LB logical condition parameters NBA postcondition actions NBP postcondition parameters NBR postcondition routine

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

The evaluation of at least one action information message contained in the statement of a user enables, in a vocal interaction system for determining at least one current transaction, at least one corresponding context information message to be respectively associated with interrelated transactions in the vocal interaction system. The context information of at least the last transaction is stored in the vocal interaction system and, during the determination of the current transaction, preferably the transactions containing associated context information corresponding to the stored context information are taken into account.

Description

Beschreibungdescription
Verfahren und Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer HintergrundapplikationMethod and speech dialog system for determining at least one transaction for operating a background application
Die Erfindung betrifft ein Verfahren sowie ein zugehöriges Sprachdialogsystem zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation unter Auswertung von in einer Benutzeräußerung enthaltenen Aktionsinformationen in einem derartigen Sprachdialogsystem, wobei jeweils einer Hintergrundapplikation eine endliche Menge auswählbarer Transaktionen zugeordnet ist und bei dem über eine im Sprachdialogsystem vorgesehene Eingabeeinheit zumindest eine Benut- zeräußerung erfasst und im Sprachdialogsystem gespeichert wird.The invention relates to a method and an associated speech dialogue system for determining at least one transaction for operating a background application by evaluating contained in a user statement action information in such a speech dialogue system, each of a background application is associated with a finite set of selectable transactions and in which provided for in the speech dialogue system Input unit at least one user utterance recorded and stored in the speech dialogue system.
Sprachdialogsysteme für Datenbankzugriffe, welche Informationszugriffe sowie eine Steuerung von Kommunikationsapplikati- onen via Sprachkommunikation ermöglichen, sind als Schnittstellen zu vielen computergestützten Anwendungen bekannt. Anwendungen bzw. Hintergrundapplikationen, wie z.B. ein technisches Gerät der Unterhaltungselektronik, ein telefonisches Auskunftsystem (Bahn, Flug, Kino, etc.), ein computergestütz- tes Transaktionssystem (Homebanking-System, elektronische Warenbestellung etc.) sind in zunehmendem Maße über derartige Sprachdialogsysteme als Zugangssysteme („User-Interfaces") bedienbar. Derartige Sprachdialogsysteme können in Hardware, Software oder in einer Kombination daraus realisiert werden.Speech dialog systems for database access, which permit information access and control of communication applications via voice communication, are known as interfaces to many computer-aided applications. Applications or background applications, e.g. A technical device for consumer electronics, a telephone information system (train, flight, cinema, etc.), a computer-aided transaction system (home banking system, electronic goods ordering, etc.) are increasingly being used as access systems ("user interfaces") via such speech dialogue systems. Such speech dialogue systems may be implemented in hardware, software or a combination thereof.
Der Dialogverlauf zur Erreichung von anwendungspezifischen Dialogzielen wird über ein derartiges Sprachdialogsystem gesteuert, welches die Interaktionen zwischen einer Dialog- Management-Einheit und dem einzelnen Benutzer verwaltet. Hierzu weist die Dialog-Management-Einheit eine Eingabeeinheit sowie Ausgabeeinheit auf. Eine von einem Benutzer erzeugte Benutzeräußerung beispielsweise in Form eines Sprachsignals wird durch die Eingabeeinheit erfasst und in der Dialog-Management-Einheit gespeichert. Der Eingabeeinheit kann beispielsweise eine Spracher- kennungseinheit nachgeschaltet sein, über welche eine Ermittlung von in einer Benutzeräußerung enthaltenen Aktionsinformationen durchgeführt wird. Zur Ausgabe von Aktionsprompts in Form von Sprachsignalen kann die Ausgabeeinheit als Sprachsyntheseeinheit ausgebildet sein.Dialogue progression to achieve application-specific dialogue goals is controlled via such a speech dialogue system, which manages the interactions between a dialogue management unit and the individual user. For this purpose, the dialogue management unit has an input unit and output unit. A user-generated user utterance, for example in the form of a voice signal, is detected by the input unit and stored in the dialog management unit. The input unit may for example be followed by a speech recognition unit, via which a determination of action information contained in a user statement is performed. To output action prompts in the form of speech signals, the output unit can be designed as a speech synthesis unit.
Über die in der Dialog-Management-Einheit vorgesehene Sprach- erkennungseinheit werden aus dem Sprachsignal Aktionsinformationen beispielsweise in Form von einzelnen Wörtern oder Wörterketten gewonnen, welche durch Vergleich mit in einer Par- sereinheit geladenen Schlüsselbegriffen bzw. Grammatiken ausgewertet werden. Abhängig von dem Auswerteergebnis wird eine einem oder mehreren Schlüsselbegriffen zugeordnete Transaktion zur Bedienung einer Hintergrundinformation gestartet. Abhängig von den Transaktionen wird über die Dialog-Management- Einheit ein Dialogverlauf mit dem jeweiligen Benutzer zurVia the speech recognition unit provided in the dialogue management unit, action information is obtained from the speech signal, for example in the form of individual words or word strings, which are evaluated by comparison with key words or grammars loaded in a parser. Depending on the evaluation result, a transaction associated with one or more key terms is started to handle background information. Depending on the transactions, a dialogue history with the respective user is created via the dialog management unit
Steuerung der zugehörigen Hintergrundapplikation aufgenommen.Control of the associated background application added.
Derzeit sind drei Ansätze zur Realisierung von derartigen Sprachdialogsystemen bekannt, nämlich der „Finite-State- Based" Ansatz, der „Frame-Based" Ansatz und der „Agent-Based" Ansatz. Der „Frame-Based" bzw. rahmenorientierte Ansatz findet derzeitig in der Praxis die weiteste Verbreitung. Da der Dialogverlauf von rahmenorientierten Sprachdialogsystemen nicht an einer hierarchischen Baumstruktur organisiert ist, ermöglichen dieser eine große Flexibilität. Vielmehr ist jede Transaktion anhand eines Rahmens modelliert, welcher mehrere Lücken aufweist, die durch die Zuordnung von Transaktionsparameter gefüllt werden.Currently, there are three approaches to implementing such speech dialogue systems, namely the "Finite State Based" approach, the "Frame Based" approach, and the "Agent Based" approach, the "Frame Based" approach is currently in place in practice the widest distribution. Since the dialogue process of frame-oriented speech dialogue systems is not organized on a hierarchical tree structure, they allow great flexibility. Rather, each transaction is modeled on a framework that has multiple gaps filled by the assignment of transaction parameters.
Damit ein Benutzer seine Anfragen in gesprochener natürlicher Sprache stellen kann, ist die Verwendung von Spracherken- nungsmodulen bzw. -einheiten erforderlich. Derartige Sprach- erkennungsmodule sind beispielsweise aus der DE 197 19 381 Cl und der DE 199 56 747 Cl bekannt.In order for a user to be able to place his requests in spoken natural language, the use of voice recognition modules or units is required. Such language Detection modules are known, for example, from DE 197 19 381 C1 and DE 199 56 747 C1.
Ferner ist bereits ein Verfahren zur Aktionsermittlung (DE 196 15 693 Cl) bekannt, bei dem ein Benutzer gezielte Befehle erteilt oder eine gezielte Anfrage an ein Sprachdialogsystem stellt, ohne dass ihm die zur Verfügung stehenden Auswahlalternativen langwierig aufgezählt werden. Hierdurch wird ein direkter Zugriff auf eine Vielzahl von Funktionen eines Sprachdialogsystems möglich, der lediglich einen Dialog erfordert, sofern die Anfangsäußerungen des Benutzers unvollständig oder mehrdeutig oder in Widerspruch zu einzelnen Möglichkeiten der Hintergrundapplikation stehen. In dem beschrieben Fällen greift das beschriebene Sprachdialogsystem mit der Bezeichnung DIANE ein und führt mit dem Benutzer einen Klärungsdialog durch, um die Benutzerintension zu ermitteln und fehlende Informationseinheiten zu erfragen. Dem beschriebenen Verfahren liegt das folgende abstrakte Aufgabenmodell zugrunde:Furthermore, a method for action determination (DE 196 15 693 Cl) is already known, in which a user gives targeted commands or a targeted request to a voice dialogue system, without him the choice alternatives available are tedious enumerated. As a result, a direct access to a variety of functions of a speech dialogue system is possible, which requires only a dialogue, provided that the initial utterances of the user are incomplete or ambiguous or in contradiction to individual possibilities of the background application. In the described cases, the described speech dialogue system with the name DIANE intervenes and carries out a clarification dialog with the user in order to determine the user's intention and to ask for missing information units. The described method is based on the following abstract task model:
Eine Hintergrundapplikation wird als eine endliche Menge von Transaktionen (Tl, T2, .... Tx) aufgefasst, wobei jeder Transaktion eine endliche Menge (die auch leer sein kann) von Transaktionsparametern (Pl, P2, Px) zugeordnet sind. Die Transaktionsparameter sind dem Sprachdialogsystem bekannt. Zu jedem Transaktionsparameter ist eine Grammatik vorgesehen, die dazu dient, den Transaktionsparameter im Dialog zu erfassen.A background application is considered to be a finite set of transactions (T1, T2, .... Tx), where each transaction is associated with a finite set (which may also be empty) of transaction parameters (Pl, P2, Px). The transaction parameters are known to the speech dialogue system. For each transaction parameter, a grammar is provided which serves to capture the transaction parameter in the dialog.
Der Benutzer kann die gewünschte Transaktion und die zugeordneten Transaktionsparameter in einem Satz benennen oder auch nicht. Im ersten Fall kann die Transaktion sofort durchgeführt werden, im zweiten Fall werden die noch unbekannten Parameter im Dialog mit dem Benutzer erfasst. Falls durch die Benutzeräußerung keine Transaktion eindeutig bestimmbar ist, führt das System automatisch einen Klärungsdialog zur Ermittlung der gewünschten Transaktion durch. Gleiches gilt für unklare oder unvollständige Transaktionsparametereingaben. Aus der DE 101 10 977 Cl ist ein Verfahren und eine Anordnung zum Bereitstellen von Hilfe-Informationen für einen Benutzer eines Sprachdialogssystems zum Bedienen einer Hintergrundap- plikation bekannt, bei dem abhängig von dem jeweils vorliegenden Dialogstatus vorgegebene Hilfeinformationen ermittelt und an den Benutzer ausgegeben werden. Dem Benutzer werden somit abhängig von seinem jeweiligen Dialogsstatus kontextsensitive Hilfe-Informationen durch das Sprachdialogssystem bereitgestellt.The user may or may not designate the desired transaction and associated transaction parameters in a sentence. In the first case, the transaction can be carried out immediately, in the second case, the still unknown parameters are recorded in dialogue with the user. If no transaction can be uniquely determined by the user statement, the system automatically carries out a clarification dialog to determine the desired transaction. The same applies to unclear or incomplete transaction parameter entries. DE 101 10 977 C1 discloses a method and an arrangement for providing help information for a user of a speech dialogue system for operating a background application, in which predetermined help information is determined and output to the user depending on the current dialog status. The user is thus provided with context-sensitive help information by the speech dialogue system, depending on his respective dialog status.
Ferner sind „Unified Messaging Systeme" bekannt, durch welche verschiedene Nachrichten auf einer Kommunikationsplattform gespeichert, verwaltet sowie der Zugriff auf diese über un- terschiedliche Zugriffsarten ermöglicht wird. Beispielsweise können Emails, SMS oder auch klassische Telefon-, Fax- und Anrufbeantworter-Funktionen hierüber verknüpft werden, so dass beispielsweise über ein derartiges „Unified Messaging System" ein Fax, eine Email oder per Email eine SMS-Botschaft an ein Handy geschickt werden können. Anrufbeantworter- Nachrichten können wie gewohnt abgehört werden oder auch SMS und Emails mittels „Text-To-Speech" (TTS) -Verfahren vorgelesen werden. Über ein Sprachdialogsystem können somit die einzelnen Nachrichten von unterwegs abgehört, beantwortet, wei- tergeleitet oder gelöscht werden. Insbesondere bei einer derartigen Vielzahl von Funktionen der Hintergrundapplikation „Unified Messaging System" ist es für einen Benutzer oft sehr mühsam, sich von einer bestimmten Funktion zu einer anderen Funktion zu bewegen.Furthermore, "unified messaging systems" are known, by means of which various messages are stored on a communication platform, managed and accessed via different types of access, for example emails, SMS or even classic telephone, fax and answering machine functions be linked, so that for example via such a "Unified Messaging System" a fax, an e-mail or email an SMS message can be sent to a mobile phone. Answering machine messages can be monitored as usual or texts and emails can be read out using the "Text-to-Speech" (TTS) procedure. In particular, with such a variety of functions of the background application "Unified Messaging System" it is often very difficult for a user to move from one particular function to another function.
Damit derartige Sprachdialogsystem auf Dauer von einem breiten Benutzerkreis akzeptiert werden, ist neben einer sicheren Spracherkennung auch der Einsatz von Sprachdialogsystemen erforderlich, die den Benutzer nicht unnötige Zeit damit verbringen lassen, auf die richtige Frage des Sprachdialogsystems zu warten oder die richtige Frage durch etwaige Manipulationen zu erzwingen. Die Aufgabe der vorliegenden Erfindung besteht somit darin, ein Verfahren zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation sowie ein zugehöriges Sprachdialogsystem anzugeben, bei dem eine eindeutige Identi- fizierung der vom Benutzer gewünschten Hintergrundapplikation schnell und benutzerfreundlich, insbesondere auch bereits anhand von reduzierten Aktionsinformationen möglich wird. Die Aufgabe wird durch ein Verfahren gemäß Patentanspruch 1 sowie ein Sprachdialogsystem gemäß Patentanspruch 16 gelöst.In order for such a speech dialogue system to be accepted by a wide circle of users in the long term, the use of speech dialogue systems is required in addition to a secure speech recognition, which does not allow the user to spend unnecessary time waiting for the right question of the speech dialogue system or the right question by any manipulation force. The object of the present invention is thus to provide a method for determining at least one transaction for operating a background application and an associated speech dialogue system, in which a clear identification of the desired user application background fast and user-friendly, in particular already on the basis of reduced action information possible becomes. The object is achieved by a method according to claim 1 and a speech dialogue system according to claim 16.
Der wesentliche Gedanke des erfindungsgemäßen Verfahrens zur Ermittlung zumindest einer Transaktion zur Bedienung einer Hintergrundapplikation und Auswertung von zumindest einer in einer Benutzungsäußerung enthaltenen Aktionsinformation in einem Sprachdialogsystem, bei dem jeweils einer Hintergrundapplikation eine endliche Menge auswählbarer Transaktionen zugeordnet ist und bei dem über eine im Sprachdialogsystem vorgesehene Eingabeeinheit zumindest eine Benutzeräußerung erfasst und im Sprachdialogsystem gespeichert wird, besteht darin, dass einzelnen in einem Sinnzusammenhang stehenden Transaktionen im Sprachdialogsystem jeweils zumindest eine übereinstimmende Kontextinformation zugeordnet wird und die Kontextinformation zumindest der zuletzt ausgeführten Transaktion im Sprachdialogsystem gespeichert wird. Bei der Er- mittlung einer Transaktion werden vorteilhaft bevorzugt diejenigen Transaktionen berücksichtigt, deren zugeordnete Kontextinformation mit der gespeicherten Kontextinformation ü- bereinstimmt . Vorteilhaft werden durch die Zuordnung zumindest einer Kontextinformationen zu den in einem Sinnzusammen- hang stehenden Transaktionen bevorzugt diejenigen Transaktionen bei der Suche nach der aktuell durch den Benutzer durch die Benutzeräußerung angesprochene Transaktion berücksichtigt und hierdurch der sowohl zeitintensive als auch rechenintensive Ermittlungsaufwand deutlich reduziert. Weiterhin vor- teilhaft können anhand von kontextabhängigen Grammatiken bereits verkürzte Schlüsselbegriffe ausreichen, um die vom Benutzer gewünschte Aktion zu bestimmen. Weitere vorteilhafte Ausgestaltungen des erfindungsgemäßen Verfahrens, insbesondere ein Sprachdialogsystem zur Ausführung des Verfahrens sind den weiteren Ansprüchen zu entnehmen .The essential idea of the method according to the invention for determining at least one transaction for operating a background application and evaluation of at least one action information contained in a user statement in a speech dialogue system, in each of which a background application is assigned a finite set of selectable transactions and in which via an input unit provided in the speech dialogue system at least one user statement is recorded and stored in the speech dialogue system, is that each in the context of transactions in the speech dialogue system is assigned at least one matching context information and the context information of at least the last executed transaction is stored in the speech dialogue system. In the determination of a transaction, those transactions whose associated context information corresponds with the stored context information are advantageously preferably taken into account. By assigning at least one context information to the transactions in a meaningful relationship, those transactions are preferably taken into account in the search for the transaction currently being addressed by the user through the user statement, thereby significantly reducing both the time-consuming and the computationally intensive investigation effort. Furthermore, on the basis of context-dependent grammars, shortened key terms can be sufficient to determine the action desired by the user. Further advantageous embodiments of the method according to the invention, in particular a speech dialogue system for carrying out the method, can be taken from the further claims.
Die vorliegende Erfindung wird nachfolgend an einem Ausführungsbeispiel anhand von Figuren näher erläutert.The present invention is explained below using an exemplary embodiment with reference to figures.
Es zeigen:Show it:
Fig. 1 in einem schematischen Blockschaltbild beispielhaft ein Sprachdialogsystem, Fig. 2 in einem weiteren Blockschaltbild beispielhaft die einzelnen Komponenten einer Transaktion und Fig. 3 in einem Ablaufdiagramm beispielhaft die einzelnen Schritte des erfindungsgemäßen Verfahren.1 shows a schematic block diagram of a speech dialogue system by way of example, FIG. 2 shows by way of example the individual components of a transaction in a further block diagram, and FIG. 3 shows by way of example the individual steps of the method according to the invention in a flowchart.
In Fig. 1 ist in einem schematischen Blockschaltbild beispielhaft ein Sprachdialogsystem 1 dargestellt, über welches ein Benutzer B zumindest eine Hintergrundapplikation HA bedienen kann. Die Bedienung der Hintergrundapplikation HA erfolgt hierbei beispielhaft anhand einzelner ausgewählter und im Sprachdialogsystem 1 hinterlegter Transaktionen Tl bis Tx, welche einer oder mehrerer Funktionen der Hintergrundapplika- tion HA zugeordnet sind. Das in Figur 1 dargestellte Sprachdialogsystem 1 umfasst hierzu eine Eingabeeinheit 2, eine Dialog-Management-Einheit 3 und eine Ausgabeeinheit 4, wobei die Dialog-Management-Einheit 3 jeweils mit der Eingabeeinheit 2, der Ausgabeeinheit 4 sowie der Hintergrundapplikation HA in Verbindung steht.In Fig. 1 is a schematic block diagram exemplified a voice dialogue system 1, via which a user B can operate at least one background application HA. The operation of the background application HA takes place here by way of example on the basis of individual selected and stored in the speech dialogue system 1 transactions Tl to Tx, which are assigned to one or more functions of the background application HA. The speech dialogue system 1 illustrated in FIG. 1 comprises an input unit 2, a dialog management unit 3 and an output unit 4, the dialog management unit 3 being in each case in communication with the input unit 2, the output unit 4 and the background application HA.
In der Dialog-Management-Einheit 3 ist eine Speichereinheit 5 zur Speicherung der Transaktionen Tl bis Tx zur Bedienung der Hintergrundapplikation HA sowie weiterer Parameter vorgese- hen. Die Dialog-Management-Einheit 3 weist ferner eineIn the dialog management unit 3, a memory unit 5 for storing the transactions Tl to Tx for operating the background application HA and other parameters is provided. The dialogue management unit 3 also has a
Spracherkennungseinheit 6, eine Sprachsyntheseeinheit 7, eine Parsereinheit 8 sowie eine Steuereinheit 9 auf, welche beispielsweise über ein Datenbussystem DBS miteinander verbunden sind. An das DatenbusSystem DBS ist ebenfalls die Hintergrundapplikation HA angeschlossen, welche in einer alternativen Ausführungsform über ein Schnittstellenmodul (nicht in Figur 1 dargestellt) mit der Dialog-Management-Einheit 3 ver- bunden sein kann. Die Eingabeeinheit 2 des Sprachdialogsystems 1 ist mit der Spracherkennungseinheit 6 und die Ausgabeeinheit 4 mit der Sprachsyntheseeinheit 7 verbunden.Speech recognition unit 6, a speech synthesis unit 7, a parser unit 8 and a control unit 9 which, for example, connected to each other via a data bus DBS system are. The background application HA, which in an alternative embodiment can be connected to the dialogue management unit 3 via an interface module (not shown in FIG. 1), is likewise connected to the data bus system DBS. The input unit 2 of the speech dialogue system 1 is connected to the speech recognition unit 6 and the output unit 4 to the speech synthesis unit 7.
Durch den Benutzer B wird eine Benutzeräußerung BE erzeugt, welche Aktionsinformationen AI aufweist. Hierbei kann eineBy the user B, a user statement BE is generated, which has action information AI. This can be a
Benutzeräußerung BE eine oder mehrere Aktionsinformationen AI aufweisen, welche innerhalb der Benutzeräußerung BE in unterschiedlichen Reihenfolgen angeordnet sein können. Über die Eingabeeinheit 2 wird eine Benutzeräußerung BE des Benutzers B, vorzugsweise als Sprachsignal erfasst und in der Dialog- Management-Einheit 3 abgespeichert. In einer bevorzugten Ausführungsform wird die Benutzeräußerung BE digitalisiert bzw. in digitaler Form der Speichereinheit 5 zugeführt und über die Spracherkennungseinheit 6 in an sich bekannter Weise die in der Benutzeräußerung BE enthaltenen Aktionsinformation (en) AI ermittelt sowie in der Speichereinheit 5 abgelegt.User statement BE have one or more action information AI, which can be arranged within the user statement BE in different orders. About the input unit 2, a user statement BE of the user B, preferably detected as a voice signal and stored in the dialogue management unit 3. In a preferred embodiment, the user utterance BE is digitized or supplied in digital form to the storage unit 5 and the action information (s) AI contained in the user statement BE is determined via the speech recognition unit 6 in a manner known per se and stored in the storage unit 5.
Über die Ausgabeeinheit 4 können darüber hinaus dem Benutzer B Ausgabeprompts bzw. Informationsprompts AP zur Verfügung gestellt werden, welche beispielsweise in Form eines durch die Sprachsyntheseeinheit 7 erzeugtes synthetisiertes Sprachsignal über die Ausgabeeinheit 4 ausgegeben werden. Hierdurch wird der Benutzer B beispielsweise über den aktuellen Status der zu bedienenden Hintergrundapplikation HA bzw. der vom System aufgrund der letzten Benutzeräußerung BE durchgeführten Aktionen informiert oder der Benutzer B zur Abgabe zumindest einer weiteren Benutzeräußerungen BE veranlasst. Hierzu kann ein zwischen Ausgabeprompts AP und Benutzeräußerungen BE wechselnder Klärungsdialog durchgeführt werden.In addition, the output unit 4 can provide the user B with output prompts or information prompts AP, which are output via the output unit 4, for example in the form of a synthesized speech signal generated by the speech synthesis unit 7. As a result, the user B is informed, for example, about the current status of the background application HA to be operated or the actions carried out by the system on the basis of the last user statement BE, or the user B initiates the delivery of at least one further user statement BE. For this purpose, a clarification dialog which alternates between output prompt AP and user statements BE can be carried out.
In Figur 2 sind in einer schematischen Darstellung beispielhaft die einzelnen Komponenten einer derartiger Transaktion Tl bis Tx dargestellt, welche zur Bedienung der unterschied- liehen Funktionen der Hintergrundapplikation HA in der Dialog-Management-Einheit 3 vorgesehen sind. Einer Hintergrundapplikation HA ist eine endliche Menge derartiger Transaktionen Tl - Tx zugeordnet, deren Auswahl über eine jeweils einer Transaktion Tl - Tx zugeordneten Grammatikroutine GR getrig- gert wird. Hierbei werden der Transaktion Tl eine oder mehrere derartiger Grammatiken Gl - Gx zugeordnet, welche zur Ermittlung der zur gespeicherten Aktionsinformation AI zugehörigen Transaktion Tl bis Tx in die Parsereinheit 8 geladen werden. In der Parsereinheit 8 werden die einzelnen für die jeweilige Transaktion Tl charakterisierenden Schlüsselbegriffe der Grammatiken Gl - Gx mit den Aktionsinformationen AI verglichen. Hierbei können die Grammatiken Gl - Gx beispielhaft durch bzw. um kontextabhängige Grammatiken Gl* - Gx* er- setzt bzw. erweitert werden, die unter Berücksichtigung desFIG. 2 is a schematic representation of the individual components of such a transaction T 1 to T x, which are used to operate the different lent functions of the background application HA are provided in the dialogue management unit 3. A background application HA is assigned a finite set of such transactions Tl-Tx whose selection is triggered via a respective grammatical routine GR assigned to a respective transaction Tl-Tx. In this case, one or more such grammars G1-Gx are assigned to the transaction T1, which are loaded into the parser unit 8 for determining the transactions T1 to Tx belonging to the stored action information AI. In the parser unit 8, the individual key terms of the grammars G1-Gx characterizing the respective transaction T1 are compared with the action information AI. In this case, the grammars G1-Gx can be replaced or extended, for example, by contextual grammars G1 * - Gx * which, taking into account the
Sinnzusammenhangs zwischen den einzelnen Transaktionen Tl bis Tx verkürzte Schlüsselbegriffe aufweisen.Meaning relationship between the individual transactions Tl to Tx have abbreviated keywords.
Ferner weist die in Figur 2 beispielhaft dargestellte erste Transaktion Tl eine Vorbedingungsroutine VBR auf, welche vor der weiteren Ausführung einer Transaktion Tl - Tx in der Steuereinheit 9 ausgeführt wird, um das Vorliegen von Vorbedingungen wie beispielsweise der erfolgreichen Ausführung einer weiteren Transaktion T2 zu verifizieren. Hierzu weist die Vorbedingungsroutine VBR einen oder mehrere Vorbedingungsparameter VBP sowie zugehörige Parameterprompts PP auf. Durch die in der Steuereinheit 9 ausgeführte Vorbedingungsroutine VBR wird beispielsweise die Aktivierung bzw. Deaktivierung einer weiteren Transaktion T2 überprüft und abhängig vom Er- gebnis der zugeordnete Parameterprompt PP ausgewählt und über die Sprachsyntheseeinheit 7 sowie die Ausgabeeinheit 4 an den Benutzer B ausgegeben. Ist die anhand der Vorbedingungsparameter VBP definierte Vorbedingung für die Ausführung der betrachteten ersten Transaktion Tl erfüllt, wird ohne eine Aus- gäbe eines Parameterprompts PP die weitere Ausführung der ermittelten ersten Transaktion Tl initiiert. Erfindungsgemäß wird den in einem Sinnzusammenhang stehenden Transaktionen Tl - Tx im Sprachdialogsystem 1 jeweils zumindest eine übereinstimmende Kontextinformation KI zugeordnet und somit die einen Sinnzusammenhang aufweisenden Transaktio- nen T2, T3 zu jeweils einer Transaktionsgruppe TGl - TGx mit übereinstimmender Kontextinformation KI zusammengefasst . In Figur 1 sind beispielhaft eine zweite und dritte Transaktion T2, T3 zu einer ersten Transaktionsgruppe TGl zusammenge- fasst .Furthermore, the first transaction T 1 shown by way of example in FIG. 2 has a preconditioning routine VBR, which is executed before the further execution of a transaction T 1 -Tx in the control unit 9 in order to verify the existence of preconditions such as, for example, the successful execution of another transaction T 2. For this purpose, the preconditioning routine VBR has one or more precondition parameters VBP and associated parameter prompts PP. The preconditioning routine VBR executed in the control unit 9 checks, for example, the activation or deactivation of a further transaction T2 and, depending on the result, selects the associated parameter prompt PP and outputs it to the user B via the speech synthesis unit 7 and the output unit 4. If the precondition defined by the precondition parameters VBP for the execution of the considered first transaction T1 is met, the further execution of the determined first transaction T1 is initiated without an output of a parameter prompt PP. According to the invention, the mutually correlated context information KI is assigned to the transactions T1-Tx in the speech dialogue system 1, and thus the transactions T2, T3 having a meaningful relationship are combined into a respective transaction group TG1-TGx with matching context information KI. In FIG. 1, by way of example, a second and third transaction T2, T3 are combined to form a first transaction group TG1.
Insbesondere eine Hintergrundapplikation HA wie beispielsweise ein „Unified Messaging System" mit einer Vielzahl von ähnlichen Funktionen betreffenden Transaktionen Tl - Tx, so dass viele der Transaktionen Tl - Tx derartige Übereinstimmungen aufweisen. Beispielsweise der ersten Transaktion Tl =,,Email lesen" und der zweiten Transaktion T2=„Email löschen" kann durch die Zuordnung der Kontextinformation KI =,,Email Verarbeitung" zu einer ersten Transaktionsgruppe TGl= „Email Verarbeitung" zusammengefasst werden. Somit wird durch die Kon- textinformation KI die kontextbedingte Verknüpfung unterschiedlicher Transaktionen Tl - Tx untereinander für die aktuelle Ermittlung einer Transaktion Tl bis Tx ausgewertet und hierdurch der Zeit- und Rechenaufwand für die Durchführung des Ermittlungsverfahrens deutlich reduziert.Specifically, a background application HA such as a "Unified Messaging System" having a plurality of similar functions related transactions Tl - Tx, so that many of the transactions Tl - Tx have such matches, for example, the first transaction Tl = "read email" and the second Transaction T2 = "delete e-mail" can be combined by assigning the context information KI = "e-mail processing" to a first transaction group TG1 = "e-mail processing." Thus, the context-related link KI interlinks different transactions Tl-Tx evaluated for the current determination of a transaction Tl to Tx, thereby significantly reducing the time and computational effort for the conduct of the investigation.
In der Speichereinheit 5 wird die Kontextinformation Klotzt zumindest der zuletzt in der Dialog-Management-Einheit 3 ausgeführten Transaktion Tietzt gespeichert und bei der aktuellen Ermittlung einer Transaktion Tl - Tx berücksichtigt, und zwar derart, dass bevorzugt diejenigen Transaktionen T2,T3 bei der Ermittlung berücksichtigt werden, deren zugeordnete Kontextinformation KI mit der gespeicherten Kontextinformtion Klotzt übereinstimmt. Für die Ermittlung der aktuellen Transaktion Tl - Tx wird somit zunächst diejenige Transaktionengruppe TGl - TGx betrachtet, der die zuletzt ausgeführte Transaktion Tietzt angehört. Hierdurch werden besonders vorteilhaft die Transaktionen Tl - Tx der ermittelten Transaktionsgruppe TGl - TGx im Auswahlverfahren priorisiert und somit diejenigen Transaktionen Tl - Tx ausgeführt, die die größte „Trefferwahrscheinlichkeit" aufweisen.In the memory unit 5, the context information Klo t z t is stored at least the last executed in the dialogue management unit 3 transaction T iet z t and taken into account in the current determination of a transaction Tl - Tx, in such a way that preferably those transactions T2 , T3 are considered in the determination whose associated context information KI matches the stored context information Klo t z t . For the determination of the current transaction Tl - Tx, first of all that transaction group TG1 - TGx is considered to which the last executed transaction Tietzt belongs. As a result, the transactions Tl-Tx of the determined transaction group TG1-TGx are particularly advantageously prioritized in the selection process, and thus those Transactions Tl - Tx executed having the largest "hit probability".
Zur Überprüfung der Kontextinformation KI ist der Transaktion Tl - Tx jeweils eine Kontextinformationsroutine KIR zugeordnet, die die Übereinstimmung der der Transaktion Tl zugeordneten Kontextinformation KI mit der in der Speichereinheit 5 gespeicherten Kontextinformation Klotzt der zuletzt in der Dialog-Management-Einheit 3 ausgeführten Transaktion Tietzt überprüft. Stimmen die zuletzt gespeicherte Kontextinformation Klotzt und die der ersten Transaktion Tl zugeordnete Kontextinformation KI überein, so wird die betrachtete erste Transaktion Tl bei der Ermittlung der aktuellen Transaktion bevorzugt berücksichtigt, d.h. die aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI über die in der Parsereinheit 8 ausgeführte Grammatikroutine GR der betrachteten Transaktion Tl ausgewertet. Die Kontextinformation KI kann beispielsweise den Parametertyp „String" aufweisen, der einen den Sinnzusammenhang zwischen den Transaktionen Tl bis Tx wiedergebenden Oberbegriff darstellt.To check the context information KI transaction Tl - Tx each associated with a context information routine KIR that t the conformity of the transaction Tl associated context information AI with the data stored in the storage unit 5. context information toilet z t of the last executed in the dialog management unit 3 Transaction T iet z t checked. If the last stored context information Klo t z t and the context information KI associated with the first transaction Tl match, the considered first transaction Tl is preferably taken into account in the determination of the current transaction, ie the action information AI obtained from the user statement BE in the parser unit 8 executed grammar routine GR of the considered transaction Tl evaluated. The context information KI may, for example, have the parameter type "string", which represents a preamble representing the meaning context between the transactions Tl to Tx.
Zusätzlich ist jeder Transaktion Tl - Tx eine Transaktionsparameterroutine TPR zugeordnet, die - neben den ermittelten Transaktionsparametern Pl - Px - Transaktionsparameterprompts TPP, eine Parametergrammatik PGR sowie eine Wertermittlungsinformation WEI aufweist. Die Transaktion Tl wird durch ihre Transaktionsparameter Pl - Px inhaltlich spezifiziert, deren Werte über die Transaktionsparameterroutine TPR ermittelt werden. Hierzu werden über die in Parsereinheit 8 ausgeführte Parametergrammatik PGR aus den Aktionsinformationen AI die Werte der Transaktionsparameter Pl - Pix ermittelt. Die zur Ausführung der Transaktion Tl - Tx noch zu bestimmenden Transaktionsparameter Pl - Px werden durch Ausgabe des jeweils zugeordneten Transaktionsparameterprompts TPP an den Benutzer B und dessen in einer weiteren Benutzeräußerung BE enthaltenen Aktionsinformationen AI im Rahmen eines Klärungsdialoges abgefragt. Ferner wird über jeweils den einzelnen Transaktionsparametern Pl - Px zugeordnete Wertermittlungsinformationen WEI festgelegt, auf welche Weise die Ermittlung der Transaktionsparameter Pl - Px erfolgen soll bzw. kann. Beispielsweise können zur Ermittlung der Transaktionsparameter Pl - Px neben derIn addition, each transaction Tl-Tx is assigned a transaction parameter routine TPR which, in addition to the determined transaction parameters P1-Px, has transaction parameter prompts TPP, a parameter grammar PGR and a value determination information WEI. The transaction Tl is specified content by its transaction parameters Pl - Px whose values are determined via the transaction parameter routine TPR. For this purpose, the values of the transaction parameters Pl-Pix are determined from the action information AI via the parameter grammar PGR executed in parser unit 8. The transaction parameters Pl - Px still to be determined for the execution of the transaction Tl - Tx are queried by issuing the respectively assigned transaction parameter prompt TPP to the user B and his action information AI contained in another user statement BE in the context of a clarification dialog. Furthermore, value determination information WEI assigned in each case to the individual transaction parameters Pl - Px is determined in which manner the determination of the transaction parameters P1 - Px should or can take place. For example, to determine the transaction parameters Pl - Px in addition to the
Durchführung eines Klärungsdialogs mit dem Benutzer B bereits im Sprachdialogsystem 1 vorliegende Parameterwerte bzw. Statusinformationen ausgewertet werden. Hierzu wird die Abhängigkeit eines Transaktionsparameters Pl - Px von dem Vorlie- gen oder Nicht-Vorliegen eines vorgegebenen Dialogstatus ausgewertet. Somit können mit Hilfe von Wertermittlungsinformationen WEI unterschiedliche Wege zur Ermittlung des Wertes eines Transaktionsparameters Pl - Px vorgegeben werden, wodurch unnötige Benutzerabfragen im Rahmen eines Klä- rungsdialoges vermieden werden können.Execution of a clarification dialogue with the user B already present in the speech dialogue system 1 parameter values or status information are evaluated. For this purpose, the dependency of a transaction parameter Pl - Px on the presence or non-existence of a given dialog status is evaluated. Thus, with the aid of value determination information WEI, different ways of determining the value of a transaction parameter Pl - Px can be predetermined, whereby unnecessary user queries can be avoided in the context of a clarification dialog.
Zur Überprüfung der Gültigkeit eines geänderten Transaktionsparameters ist eine Constraint-Routine CR pro Transaktion Tl - Tx vorgesehen, welche Triggerparameter TR, logische Bedin- gungen LB sowie Aktionsanweisungsprompts AA umfasst. Über die Contraint-Routine CR wird somit der geänderte Parameterwert eines Transaktionsparameters Pl - Px auf seine Gültigkeit mit Hilfe der vorgegebenen Triggerparameter TR sowie der logischen Bedingung LB ermittelt und bei einem Abweichen über Ak- tionsanweisungsprompts AA an dem Benutzer B kommuniziert.To check the validity of a changed transaction parameter, a constraint routine CR per transaction Tl-Tx is provided which includes trigger parameters TR, logical conditions LB and action instruction prompts AA. The modified parameter value of a transaction parameter P 1 -Px is thus ascertained for validity via the contraint routine CR with the aid of the predetermined trigger parameters TR and the logical condition LB and communicated to the user B in the event of a deviation via action instruction prompts AA.
Beispielsweise wird als logische Bedingung LB vorgegeben, die Summe aus zwei Transaktionsparametern Pl, P2 zu bilden und zu überprüfen, ob diese beispielsweise einen oberen Grenzwert Pmax überschreitet. Beim Überschreiten des oberen Grenzwertes Pmax wird der zugeordnete Aktionsanweisungsprompt AA derFor example, it is predetermined as a logical condition LB to form the sum of two transaction parameters P 1 , P 2 and to check whether this, for example, exceeds an upper limit P max . When the upper limit P max is exceeded, the associated action instruction prompt AA becomes the
Contraint-Routine CR ausgegeben. Alternativ kann auch abhängig von der Auswertung der logischen Bedingung LB eine vorgegebene Systemfunktion initiiert werden.Contraint routine CR issued. Alternatively, depending on the evaluation of the logical condition LB, a predetermined system function can also be initiated.
Über eine Nachbedingungsroutine NBR wird überprüft, ob sämtliche für die Ausführung der jeweiligen Transaktion Tl - Tx erforderlichen Nachbedingungen NB, beispielsweise die für die Ausführung zumindest erforderlichen Transaktionsparameter Pl - Px, nunmehr vorliegen, d.h. die Lücken der als Rahmen modellierten Transaktion Tl gefüllt sind und mit Hilfe der ausgewählten Transaktion Tl die zugeordnete Funktion der Hintergrundapplikation HA nunmehr gestartet werden kann. Somit wer- den über die Nachbedingungsroutine NBR diejenigen Nachbedingungen NB überprüft, welche am Ende des Dialoges vorliegen müssen, um eine Übergabe sämtlicher für die Bedienung der Hintergrundapplikation HA erforderlichen Informationen über die Transaktion Tl zu gewährleisten. Vorteilhaft können durch die Nachbedingungsroutine NBR unterschiedlich komplexe Nachbedingungen NB für unterschiedliche Transaktionen Tl - Tx individuell definiert und abgeprüft werden.A Nachbedingungsroutine NBR is checked whether all necessary for the execution of the respective transaction Tl - Tx post-conditions NB, for example, at least the required transaction parameter Pl - Px, now present, ie the gaps of the frame-modeled transaction Tl are filled and using the selected transaction Tl the associated function of the background application HA can now be started. Thus, the Nachbedingungsroutine NBR those post-conditions NB are checked, which must be present at the end of the dialog to ensure a transfer of all necessary for the operation of the background application HA information about the transaction Tl. Advantageously, the post-conditional routine NBR can be used to individually define and check different complex post-conditions NB for different transactions Tl-Tx.
Schließlich weist eine Transaktion Tl - Tx eine Systemakti- onsroutine SAR auf, mit deren Hilfe die Ausgabe von spezifischen Aktionsprompts AP bzw. Systemaktionen SA umgesetzt wird. Die Systemaktionsroutine SAR umfasst hierzu beispielsweise Systemtriggerparameter TRP sowie Vorbedingungsinformationen VBI als auch vorgegebene Systemaktionen SA. Bei einer Änderung der Systemtriggerparameter TRP wird über die Vorbedingungsinformationen VBI die Initiierung der vorgegeben Systemaktionen SA verifiziert und gegebenenfalls die zugeordneten Systemaktionen SA gestartet. Mit Hilfe der Systemaktionsroutine SAR wird somit der Benutzer B über eine Änderung des Dialogstatus oder des Status der Hintergrundapplikation HA informiert .Finally, a transaction Tl-Tx has a system operation routine SAR, with the aid of which the output of specific action prompts AP or system actions SA is implemented. The system action routine SAR comprises, for example, system trigger parameters TRP and precondition information VBI as well as predetermined system actions SA. When the system trigger parameter TRP changes, the initiation of the predetermined system actions SA is verified via the precondition information VBI and, if appropriate, the assigned system actions SA are started. With the aid of the system action routine SAR, the user B is thus informed about a change in the dialog status or the status of the background application HA.
In Figur 3 ist das erfindungsgemäße Verfahren zur Ermittlung zumindest einer Transaktion Tl -Tx im Sprachdialogsystem 1 in einem Ablaufdiagramm beispielhaft dargestellt. Mittels einer in der Steuereinheit 9 ausgeführten Auswahlroutine AR werden die in Figur 3 dargestellten fünf Verfahrensschritte Sl - S5 abgearbeitet. Zunächst wird in einem ersten Schritt Sl den in einem Sinnzusammenhang stehenden Transaktionen Tl - Tx je- weils eine übereinstimmende Kontextinformation KI zugeordnet.FIG. 3 shows by way of example the method according to the invention for determining at least one transaction Tl -Tx in the speech dialogue system 1 in a flow chart. By means of a selection routine AR executed in the control unit 9, the five method steps S1-S5 shown in FIG. 3 are executed. First of all, in a first step S1, the correlated context information KI is assigned to the transactions Tl-Tx that are in a context of meaning.
Ferner wird im Rahmen der Ausführung einer Transaktion Tl - Tx jeweils die dieser zugeordnete Kontextinformation KI als zuletzt zugeordnete Kontextinformation Klotzt im Sprachdia- logssystem 1 bzw. der Speichereinheit 5 der Dialog- Management-Einheit 3 gespeichert (zweiter Schritt S2).Furthermore, in the context of the execution of a transaction Tl-Tx, the context information KI associated therewith is used as last stock response associated context information i m Sprachdia- logssystem 1 and the memory unit 5 of the dialogue management unit 3 stored (second step S2).
Nach der Ermittlung der Aktionsinformationen AI aus der jeweils erfassten Benutzeräußerung BE (dritter Schritt S3) werden diejenigen Transaktionen Tl - Tx ermittelt, deren zugeordnete Kontextinformationen KI mit der zuletzt zugeordneten Kontextinformation Klotzt übereinstimmen (vierter Schritt S4) .After the determination of the action information AI from the respectively detected user statement BE (third step S3), those transactions Tl-Tx are determined whose assigned context information KI matches the last-assigned context information Klo t z t (fourth step S4).
In einem fünften und letzten Schritt S5 werden aus der endlichen Menge der Transaktionen Tl - Tx die zuvor ermittelten Transaktionen T2, T3 für die Ermittlung der aktuellen Trans- aktion Tl - Tx bevorzugt herangezogen.In a fifth and last step S5, the previously determined transactions T2, T3 are preferably used for determining the current transaction Tl-Tx from the finite quantity of the transactions Tl-Tx.
Im Folgenden wird an einem Ausführungsbeispiel der Aufbau sowie die Parameter Pl - Px einzelner Transaktionen Tl bis T4 innerhalb des Sprachdialogsystems 1 näher beschrieben. Als Hintergrundapplikation HA wird beispielhaft ein „Unified Messaging System" betrachtet, welches in der Regel eine Telefonverbindung zwischen dem Benutzer B und dem Sprachdialogsystem 1 besteht, d.h. die Eingabeeinheit 2 ist als Mikrofoneinheit eines Telefons und die Ausgabeeinheit 4 als Lautsprecherein- heit desselben ausgebildet. Als Grundfunktionen eines derartigen Unified Messaging System lassen sich folgende Funktionen nennen:The construction and the parameters P1-Px of individual transactions T1 to T4 within the speech dialogue system 1 will be described in more detail below using an exemplary embodiment. As a background application HA, a "unified messaging system" is considered by way of example, which as a rule consists of a telephone connection between the user B and the speech dialogue system 1, ie the input unit 2 is designed as a microphone unit of a telephone and the output unit 4 as a loudspeaker unit thereof Basic functions of such a Unified Messaging system can be called the following functions:
1. Benutzeridentifizierung im Sprachdialogsystem (Login) 2. Abfrage neuer Nachrichten1. User identification in the speech dialogue system (login) 2. Query of new messages
3. Abfrage neuer Nachrichten einer bestimmten Person3. Query new messages of a specific person
4. Senden von Nachrichten.4. Sending messages.
Zur Bedienung der genannten Grundfunktionen der Hintergrund- applikation Unified Messaging System werden vier Transaktionen Tl - T4 auf Dialoglevel modelliert, wobei beispielhaft jeweils eine Transaktion Tl - T4 eine der genannten Grundfunktionen zugeordnet ist, d.h. anhand der ersten Transaktion Tl wird die Benutzeridentifizierung, anhand der zweiten Transaktion T2 das Abhören von neuen Nachrichten, über die dritte Transaktion T3 das Abhören von Nachrichten einer bestimmten Person und mittels der vierten Transaktion T4 das Senden von Nachrichten über das Sprachdialogsystem 1 gesteuert .To operate the said basic functions of the background application Unified Messaging System, four transactions Tl-T4 are modeled at dialogle level, one transaction Tl-T4 being assigned one of the named basic functions by way of example, that is to say based on the first transaction Tl is controlled the user identification, on the basis of the second transaction T2 listening to new messages, on the third transaction T3 listening to messages of a specific person and the fourth transaction T4 sending messages via the speech dialogue system 1.
Erste Transaktion Tl : „Benutzeridentifizierung"First transaction Tl: "User identification"
Über die Dialog-Management-Einheit 3 werden anhand der Grammatikroutine GR die aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der ersten Transaktion Tl erforderlichen Grammatiken Gl - Gx bzw. deren Schlüsselbegriffe verglichen und bei Übereinstimmung die zu- gehörige Transaktion Tl gestartet.Using the grammar routine GR, the action information AI obtained from the user statement BE is compared with the grammars G1-Gx or their key terms required for executing the first transaction T1, and the associated transaction T1 is started if the match is correct.
Für die weitere Ausführung der ersten Transaktion Tl „Benutzeridentifizierung" ist es erforderlich, dass der Benutzer B noch nicht im Sprachdialogsystem 1 angemeldet ist. Dies ent- spricht zugleich dem Vorbedingungsparameter VBP für die Ausführung der ersten Transaktion Tl, welcher über die Vorbedingungsroutine VBR überprüft wird. Ist der Benutzer B bereits im Sprachdialogssystem 1 eingeloggt, so wird die Ausführung der ersten Transaktion Tl unterbrochen und dem Benutzer B ein entsprechendes Aktionsprompt AP ausgegeben. Ist der Benutzer noch nicht im Sprachdialogssystem 1 angemeldet, wird die erste Transaktion Tl weiter ausgeführt und anhand der Transaktionsparameterroutine TPR die der ersten Transaktion Tl „Benutzeridentifizierung" zugeordneten Transaktionsparame- ter Pl="Benutzername" und P2="Passwort" ermittelt. Als Benutzername wird im Folgenden beispielhaft die Telefonnummer des Benutzers B angenommen.For the further execution of the first transaction Tl "user identification", it is necessary that the user B is not yet logged on in the speech dialogue system 1. This also corresponds to the precondition parameter VBP for the execution of the first transaction Tl, which is checked via the preconditioning routine VBR If the user B is already logged in the speech dialogue system 1, the execution of the first transaction T 1 is interrupted and a corresponding action prompt AP is output to the user B. If the user has not yet logged in the speech dialogue system 1, the first transaction T 1 is executed further and based on the Transaction parameter routine TPR determines the first transaction Tl "user identification" associated transaction parameters Pl = "user name" and P2 = "password". As a user name, the telephone number of user B is assumed below by way of example.
Der Benutzer B gibt als Benutzeräußerung BE seine Telefonnum- mer und das zugehörige Passwort in das Sprachdialogsystem 1 ein. Die Benutzeräußerung BE wird über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Telefonnummer und das Passwort ermittelt sowie als Aktionsinformationen AI in der Speichereinheit 5 gespeichert. Mittels der Transaktionsparameterroutine TPR werden aus den gespeicherten Aktionsinformationen AI die zur Ausführung der ersten Transaktion Tl erforderli- chen ersten und zweiten Transaktionsparameter Pl =„Benutzername" und P2=„Passwort" bestimmt.The user B inputs his telephone number and the associated password in the voice dialogue system 1 as a user statement BE. The user utterance BE is detected via the input unit 2 and, based on the speech recognition unit 6, the telephone number contained in the user utterance BE and the password determined and stored as action information AI in the memory unit 5. By means of the transaction parameter routine TPR, the first and second transaction parameters P1 = "user name" and P2 = "password" required for executing the first transaction T1 are determined from the stored action information AI.
Über die Nachbedingungsroutine NBR wird das Vorliegen der für die Ausführung der der ersten Transaktion Tl „Benutzeridenti- fizierung" zugeordneten Funktion der HintergrundapplikationThe Nachbedingungsroutine NBR is the existence of the for the execution of the first transaction Tl "user identification" assigned function of the background application
HA „Unified Messaging System" erforderlichen ersten und zweiten Transaktionsparameter Pl, P2 überprüft und anschließend die zugehörige Funktion aufgerufen. Ferner wird ein den Status des Identifizierungsprozesses anzeigender Aktionsprompt AP an den Benutzer B über die Ausgabeeinheit 4 ausgegeben.In addition, an action prompt AP indicating the status of the identification process is output to the user B via the output unit 4.
Abschließend oder zu einem beliebig gewählten Zeitpunkt während der Transaktionsverarbeitung wird gegebenenfalls eine der ersten Transaktion Tl zugeordnete Kontextinformation KI in der Speichereinheit 5 gespeichert.Finally, or at any desired time during the transaction processing, a context information KI associated with the first transaction Tl is optionally stored in the memory unit 5.
Die geschilderte Dialogabfolge wird anhand der nachfolgenden schematischen Tabellendarstellung nochmals kurz zusammenge- fasst :The described dialogue sequence is briefly summarized again using the following schematic table representation:
Figure imgf000017_0001
Zweite Transaktion T2 : „Abfrage neuer Nachrichten"
Figure imgf000017_0001
Second transaction T2: "Request new messages"
Der Benutzer B gibt hierzu beispielsweise folgende Benutzer- äußerung BE in das Sprachdialogsystem 1 ein: „Ich möchte meine neuen Nachrichten abhören". Die Benutzeräußerung BE wird über die Eingabeeinheit 2 erfasst und anhand der Spracherken- nungseinheit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt und in der Speichereinheit 5 gespeichert. Mögliche Aktionsinformationen AI können hierbei die Begriffe „neue", „Nachrichten" und „abhören" sein.For example, the user B enters the following user statement BE in the speech dialogue system 1: "I want to listen to my new messages." The user utterance BE is recorded via the input unit 2 and the action information AI included in the user utterance BE using the speech recognition unit 6 determined and stored in the memory unit 5. Possible action information AI can here be the terms "new", "messages" and "listening".
Über die Kontextinformationsroutine KIR wird zunächst die jeweils einer Transaktion Tl - Tx zugeordnete Kontextinformati- on KI mit der der zuletzt abgespeicherten Kontextinformation Klotzt verglichen und bei einer Übereinstimmung dieser die betrachtete Transaktion T2, T3 bevorzugt zur Ermittlung der aktuellen Transaktion T2 herangezogen. Alternativ kann mittels der in der Steuereinheit 9 ausgeführten Auswahlroutine AR die zuletzt abgespeicherte Kontextinformation Klotzt geladen werden und nach Abfrage der Kontextinformationen KI der einzelnen Transaktionen Tl - Tx diejenigen Transaktionen T2, T3 mit übereinstimmender Kontextinformation KI für die Ermittlung der aktuellen Transaktion T2, T3 bereitgestellt wer- den.The context information routine KIR firstly compares the context information KI associated with each transaction Tl-Tx with the last stored context information Klo t z t , and preferably uses this transaction T2, T3 to determine the current transaction T2. Alternatively, by means of the selection routine AR executed in the control unit 9, the last stored context information Klo t z t can be loaded and after querying the context information KI of the individual transactions Tl-Tx those transactions T2, T3 with matching context information KI for the determination of the current transaction T2, T3 be provided.
Anschließend wird die jeweilige Grammatikroutine GR der in einem Sinnzusammenhang stehenden, d.h. dieselbe Kontextinformation KI aufweisenden Transaktionen T2, T3 gestartet und die Übereinstimmung der aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der zweiten bzw. dritten Transaktion T2,T3 erforderlichen Grammatiken Gl - Gx bzw. deren Schlüsselbegriffe überprüft und bei Übereinstimmung die ermittelte Transaktion T2 gestartet. Im vorlie- genden Fall ist der zweiten Transaktion T2 „Abfrage neuerThereafter, the respective grammar routine GR is considered to be meaningful, i. The transactions T2, T3 having the same context information KI are started, and the agreement of the action information AI obtained from the user statement BE with the grammars G1 - Gx required for executing the second or third transaction T2, T3 and their keywords is checked and, if they match, the determined transaction T2 started. In the present case, the second transaction T2 is "query new
Nachrichten" beispielsweise die Kontextinformation „Unified Messaging System: Nachrichtenabfrage" zugeordnet, welche bei Ausführung der zweiten Transaktion T2 wiederum in der Spei- chereinheit 5 der Dialog-Management-Einheit 3 als zuletzt zugeordnete Kontextinformation Klotzt gespeichert wird.Messages ", for example, the context information" Unified Messaging System: message query "assigned, which in turn executes the second transaction T2 in the memory storage unit 5 of the dialogue management unit 3 is stored as last assigned context information Klo t z t .
Bevor die ermittelte zweite Transaktion T2 „Abfrage neuer Nachrichten" weiter ausgeführt wird, wird analog zuvor anhand der zugeordneten Vorbedingungsroutine VBR überprüft, ob die erste Transaktion Tl „Benutzeridentifizierung" erfolgreich durchgeführt wurde, d.h. der Benutzer B im Sprachdialogsystem angemeldet bzw. eingeloggt ist.Before the determined second transaction T2 "new message retrieval" is carried out further, it is checked in analogy beforehand, based on the assigned preconditioning routine VBR, whether the first transaction T 1 "user identification" was successfully carried out, i. the user B is logged in or logged in the speech dialogue system.
Über die Nachbedingungsroutine NBR der zweiten Transaktion T2 wird im Anschluss die der zweiten Transaktion T2 zugeordnete Funktion („Abfragen neuer Nachrichten") der Hintergrundapplikation HA „Unified Messaging System" aufgerufen und der zugehörige Informationsprompt AP zusammen mit den Nachrichten an den Benutzer B über die Ausgabeeinheit 4 ausgegeben.Via the post-condition routine NBR of the second transaction T2, the function ("polling new messages") of the background application HA "Unified Messaging System" assigned to the second transaction T2 is subsequently called, and the associated information prompt AP together with the messages to the user B via the output unit 4 issued.
Die der zweiten Transaktion T2 zugrundeliegende Dialogstruktur lässt sich somit beispielhaft wie folgt schematisch dar- stellen:The dialogue structure on which the second transaction T2 is based can thus be illustrated as an example as follows:
Figure imgf000019_0001
Dritte Transaktion T3 : „Abfrage neuer Nachrichten einer bestimmten Person"
Figure imgf000019_0001
Third Transaction T3: "Request New News from a Particular Person"
Die abgegebene Benutzeräußerung BE „Ich möchte die neuen Nachrichten von Herrn Maier abhören" wird wiederum über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungsein- heit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt, welche in der Speichereinheit 5 gespeichert wird. In der Dialog-Management-Einheit 3 ist nach der Ausführung der zweiten Transaktion T2 als zuletzt abgespeicherte Kontextinformation Klotzt „Unified Messaging System: Nachrichtenabfrage" gespeichert.The submitted user statement BE "I would like to listen to the new messages from Mr. Maier" is in turn detected via the input unit 2 and the voice information unit 6 determines the action information AI contained in the user statement BE, which is stored in the memory unit 5. In the dialog Management unit 3 is stored after the execution of the second transaction T2 as the last stored context information Klo t z t "unified messaging system: message query".
Über die jeweilige Kontextinformationsroutine KIR der Trans- aktionen Tl -Tx wird die Übereinstimmung mit der Kontextinformation „Unified Messaging System: Nachrichtenabfrage" geprüft und aufgrund der Übereinstimmung der Kontextinformation KI der dritten Transaktion T3 mit der zuletzt abgespeicherten Kontextinformation Klotzt diese bevorzugt herangezogen.By means of the respective context information routine KIR of the transactions Tl -Tx, the correspondence with the context information "Unified Messaging System: Message interrogation" is checked and, on the basis of the coincidence of the context information KI of the third transaction T3 with the last stored context information Klo t z t, these are preferably used.
Anschließend wird die jeweilige Grammatikroutine GR der dritten Transaktion T3 gestartet und die Übereinstimmung der aus der Benutzeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der dritten Transaktion T3 erforderli- chen Grammatiken Gl - Gx bzw. deren Schlüsselbegriffe überprüft und bei Übereinstimmung dieser die dritte Transaktion T3 weiter ausgeführt.Subsequently, the respective grammar routine GR of the third transaction T3 is started and the correspondence of the action information AI obtained from the user statement BE with the grammars G1 - Gx required for executing the third transaction T3 or their key terms is checked and, if they match, the third transaction T3 continue running.
In analoger Weise wird anhand der Vorbedingungsroutine VBR auch im Rahmen der dritten Transaktion T3 die erfolgreiche Ausführung der ersten Transaktion Tl „Benutzeridentifizierung" überprüft und aus den gespeicherten Aktionsinformationen AI über die Transaktionsparameterroutine TPR als Transaktionsparameter Pl=„Name" der Name der Person („Herr Maier") ermittelt, dessen neue Nachrichten dem Benutzer B ausgegeben werden sollen. Ebenso wird die Kontextinformation KI „Unified Messaging System: Nachrichtenabfrage" in der Speichereinheit 5 als zuletzt vorliegende Kontextinformation Klotzt gespeichert .In an analogous manner, the preconditioning routine VBR also checks the successful execution of the first transaction Tl "user identification" in the context of the third transaction T3 and from the stored action information AI via the transaction parameter routine TPR as transaction parameter Pl = "name" the name of the person ("Mr. Maier ") whose new messages are to be output to user B. Similarly, the context information KI" Unified Messaging System: message query "in the memory unit 5 as the last present context information loo t z t stored.
Anhand der folgenden Tabelle werden die beschriebenen Schritte der dritten Transaktion T3 beispielhaft anhand einer Tabelle dargestellt:Using the following table, the described steps of the third transaction T3 are illustrated by way of example using a table:
Figure imgf000021_0001
Figure imgf000021_0001
Vierte Transaktion T4 : „Senden einer Nachricht"Fourth Transaction T4: "Sending a Message"
Um eine Nachricht über das Unified Messaging System aufzuzeichnen und anschließend an eine ausgewählte Person zu versenden ist die vierte Transaktion T4 vorgesehen.To record a message via the Unified Messaging system and then send it to a selected person, the fourth transaction T4 is provided.
Diese wird durch den Benutzer B mittels der Eingabe beispielsweise der Benutzeräußerung BE=„Ich möchte eine Nachricht an Herrn Maier senden" initiiert. Die Benutzeräußerung BE wird wiederum über die Eingabeeinheit 2 erfasst und anhand der Spracherkennungseinheit 6 die in der Benutzeräußerung BE enthaltene Aktionsinformationen AI ermittelt und in der Speichereinheit 5 gespeichert.This is initiated by the user B by means of the input, for example, of the user statement BE = "I would like to send a message to Mr. Maier." The user utterance BE is in turn detected via the input unit 2 and the speech utterance BE in the user utterance BE contained action information AI determined and stored in the memory unit 5.
Unter Berücksichtigung der in der Dialog-Management-Einheit 3 nach der Ausführung der dritten Transaktion T3 zuletzt gespeicherten Kontextinformation Klotzt „Unified Messaging System: Nachrichtenabfrage" werden zunächst die Grammatikroutinen GR der zweiten und dritten Transaktionen T2, T3 auf Übereinstimmungen mit den gespeicherten Aktionsinformationen AI überprüft und im Anschluss daran die weiteren Transaktionen T4 - Tx herangezogen.Taking into account the last stored in the dialogue management unit 3 after the execution of the third transaction T3 context information Klo t z t "Unified Messaging System: message query" are first the grammar routines GR of the second and third transactions T2, T3 to match the stored Action information AI checked and subsequently the further transactions T4 - Tx used.
Schließlich wird die Grammatikroutine GR der vierten Transaktion T4 gestartet und die Übereinstimmung der aus der Benut- zeräußerung BE gewonnenen Aktionsinformationen AI mit den zur Ausführung der vierten Transaktion T4 erforderlichen Grammatiken Gl - Gx bzw. deren Schlüsselbegriffe überprüft und aufgrund deren Übereinstimmung mit den gespeicherten Transaktionsinformationen die vierte Transaktion T4 weiter ausgeführt.Finally, the grammar routine GR of the fourth transaction T4 is started and the correspondence of the action information AI obtained from the user request BE with the grammars G1 - Gx required for executing the fourth transaction T4 or their key terms is checked and, on the basis of their agreement with the stored transaction information, the fourth transaction T4 further executed.
Als Vorbedingung ist hierbei wiederum die erfolgreiche Anmeldung des Benutzers im System erforderlich, welche anhand der Vorbedingungsroutine VBR verifiziert wird.As a precondition, this again requires the user to log in successfully in the system, which is verified by means of the precondition routine VBR.
Um eine Nachricht an den vorgegebenen Empfänger „Herrn Maier" zu senden, ist es zunächst erforderlich, dass der Benutzer BE die Nachricht in das Sprachdialogsystem 1 eingibt. Die Nachricht wird über die Dialog-Management-Einheit 3 als erster Transaktionsparameter Pl=,,Message" aufgezeichnet. Nachdem der Benutzer die Nachricht eingegeben hat, hat dieser die Möglichkeit die korrekte Eingabe durch Abhören der aufgezeichneten Nachricht überprüfen zu können. Der Benutzer B kann hierzu über einen zweiten Transaktionsparameter P2=,,Listen" festlegen, ob er die aufgenommene Nachricht abhören will oder nicht.In order to send a message to the given recipient "Mr Maier", it is first necessary for the user BE to enter the message into the speech dialogue system 1. The message is sent via the dialogue management unit 3 as the first transaction parameter Pl = "Message recorded. After the user has entered the message, this has the ability to verify the correct input by listening to the recorded message. For this purpose, the user B can specify via a second transaction parameter P2 = "lists" whether he wants to listen to the recorded message or not.
Auch sollte durch das Sprachdialogsystem 1 bei einer fehlerhaften Aufnahme der Benutzer B dahingehend Unterstützung er- fahren, dass eine erneute Aufnahme der Nachricht initiiert wird. Ist die aufgezeichnete Nachricht korrekt, so soll anhand eines dritten Transaktionsparameters P3=„Confirm Message" dem Sprachdialogsystem 1 angezeigt werden, dass die auf- gezeichnete Nachricht weiterbearbeitet werden kann.In addition, the user B was to receive assistance from the speech dialogue system 1 in the event of a faulty recording. drive that a re-recording of the message is initiated. If the recorded message is correct, it should be displayed on the basis of a third transaction parameter P3 = "Confirm Message" to the speech dialogue system 1 that the recorded message can be further processed.
Alternativ ist durch das Vorsehen der Wertermittlungsinformation WEI auch eine indirekte Bestätigung der korrekten Aufnahme der Nachricht, d.h. ohne Benutzereingriff möglich. Hierzu wird die Abhängigkeit zwischen dem zweiten und dritten Transaktionsparameter P2=„Listen" und P3=„Confirm Message" verwertet, und zwar derart, dass über die Wertermittlungsroutine WEI automatisch der Wert des dritten Transaktionsparameters P3="Confirm Message" auf „Ja" gesetzt wird und somit ei- ne Weiterverarbeitung der aufgezeichneten Nachricht ohne nochmaliges Abspielen umgesetzt wird, sofern der zweite Transaktionsparameter P3="Listen" den Wert „Nein" aufweist.Alternatively, by providing the value-determining information WEI, an indirect confirmation of the correct reception of the message, i. without user intervention possible. For this purpose, the dependency between the second and third transaction parameters P2 = "lists" and P3 = "Confirm Message" is used, in such a way that via the value determination routine WEI automatically set the value of the third transaction parameter P3 = "Confirm Message" to "Yes" and thus a further processing of the recorded message is implemented without replaying, provided that the second transaction parameter P3 = "lists" has the value "no".
Nach erfolgter Bestätigung der fehlerfreien Aufzeichnung der Nachricht wir mittels der Transaktionsparameterroutine TPR der Wert des vierten Transaktionsparameters P4="Receiver", nämlich der Empfänger der aufgezeichneten Nachricht, ermittelt.After confirming the error-free recording of the message, the value of the fourth transaction parameter P4 = "receiver", namely the receiver of the recorded message, is determined by means of the transaction parameter routine TPR.
Schließlich wird nochmals mittels einem fünften Transaktionsparameter P5="Confirm Sending" vom Benutzer B die Bestätigung zum Absenden der aufgezeichneten Nachricht an den im Dialog- Management-System 3 gespeicherten Empfänger („Herrn Maier") abgefragt .Finally, the confirmation for sending the recorded message to the recipient ("Mr. Maier") stored in the dialogue management system 3 is queried again by means of a fifth transaction parameter P5 = "Confirm Sending".
Zusätzlich können noch die Übermittlungsparameter bzgl. der aufgezeichneten Nachricht als weitere Transaktionsparameter P6 - Px („Special Settings") , beispielsweise die Vertraulichkeit, Dringlichkeit, Verschlüsselung etc., mittels eines wei- teren Klärungsdialogs vom Benutzer B abgefragt werden.In addition, the transmission parameters regarding the recorded message can also be queried by user B as further transaction parameters P6-Px ("Special Settings"), for example the confidentiality, urgency, encryption, etc., by means of a further clarification dialog.
Ferner werden abhängig von Systemtriggerparameter TRR bzgl. der vorliegenden Transaktionsparameter Pl - Px mittels der Systemactionroutine SAR zu den unterschiedlichen Systemtriggerparameter TRR zugeordnete Systemactions SA ausgeführt. Beispielsweise wird bei einem den Wert „Ja" aufweisenden zweiten Transaktionsparameter P2=„Listen" die Ausgabe der aufgezeichneten Nachricht gestartet und bei einem den Wert „Nein" aufweisenden dritten Transaktionsparameter P3=„Confirm Message" oder einem den Wert „Nein" aufweisenden fünften Transaktionsparameter P5="Confirm Sending" das Löschen der aufgezeichneten Nachricht vorgenommen.Furthermore, depending on system trigger parameters TRR with respect to the present transaction parameters Pl - Px by means of the System action routine SAR to the different system trigger parameters TRR associated systemactions SA executed. By way of example, if the second transaction parameter P2 = "lists" has the value "yes", the output of the recorded message is started and, with the value "no", the third transaction parameter P3 = "confirm message" or a fifth transaction parameter having the value "no" P5 = "Confirm Sending" to delete the recorded message.
Über die Kontextinformationsroutine KIR wird auch im Rahmen der vierten Transaktion T4 die Kontextinformation KI „Unified Messaging System: Nachrichtenversand" in der Speichereinheit 5 als zuletzt vorliegende Kontextinformation Klotzt gespeichert .In the context of the fourth transaction T4, the context information KI "Unified Messaging System: Messaging" is also stored in the memory unit 5 as last-available context information Klo t z t via the context information routine KIR.
Über die Nachbedingungsroutine NBR der vierten Transaktion T4 wird die zugeordnete Funktion („Nachricht senden") innerhalb des Unified Messaging Systems aufgerufen und der zugehörige Informationsprompt AP erzeugt und über die Ausgabeeinheit 4 ausgegeben.Via the Nachbedingungsroutine NBR of the fourth transaction T4, the associated function ("send message") is called within the Unified Messaging system and the associated information Prompt AP generated and output via the output unit 4.
Im Folgenden wird anhand einer Tabelle die Modellierung der vierten Transaktion T4 schematisch dargestellt:The modeling of the fourth transaction T4 is shown schematically below using a table:
Figure imgf000024_0001
Figure imgf000025_0001
Basierend auf der erläuterten Spezifizierung von vier Transaktionen Tl bis T4 wird im Folgenden beispielhaft ein Dialog zwischen einem Benutzer B und dem Sprachdialogsystem 1 beschrieben.
Figure imgf000024_0001
Figure imgf000025_0001
Based on the explained specification of four transactions Tl to T4, a dialog between a user B and the speech dialogue system 1 will be described below by way of example.
System (APl) : Willkommen im Unified Messaging System. Bitte identifizieren Sie sich im System.System (APl): Welcome to the Unified Messaging System. Please identify yourself in the system.
Benutzer (BEI) 123456 System (AP2) : Telefonnummer 123456, bitte geben Sie Ihr Passwort ein.User (BEI) 123456 System (AP2): Phone number 123456, please enter your password.
Benutzer (BE2) 333666 System (AP3) : Sie sind im System eingeloggt. Was kann ich für Sie tun?User (BE2) 333666 System (AP3): You are logged into the system. What can I do for you?
Benutzer (BE3) Ich möchte alle neuen Nachrichten von Herrn Maier abhören. System (AP4) : Nachrichten von Herrn Maier ... einen Moment bitte ... System (AP5) : Sie haben zwei neue Nachrichten von Herrn Maier: Erste Nachricht ...; Zweite Nachricht ...User (BE3) I would like to hear all new messages from Mr Maier. System (AP4): Messages from Mr Maier ... one moment please ... System (AP5): You have two new messages from Mr Maier: First message ...; Second message ...
Benutzer (BE4) Ich möchte eine Nachri cht an Herrn Maier senden . System (AP6) : Bitte geben Sie Ihre Nachricht ein und drücken Sie nach Ihrer Eingabe die #- Taste.User (BE4) I would like to send a message to Mr Maier. System (AP6): Please enter your message and press the # key after entering.
Benutzer (BE5) Sehr geehrter Herr Maier, ich nehme ... (# gedrückt) System (AP7) : Wollen Sie Ihre aufgenommen Nachricht abhören?User (BE5) Dear Mr. Maier, I take ... (# pressed) System (AP7): Do you want to listen to your recorded message?
Benutzer (BEβ) Nein System (AP8) : Wollen Sie die Nachricht normal senden? Benutzer (BEI) Ja System (AP9) : Ihre Nachricht wurde gesendet.User (BEβ) No System (AP8): Do you want to send the message normally? User (BEI) Yes System (AP9): Your message has been sent.
Anhand der nachfolgenden tabellarischen Darstellung wird die Veränderung der jeweiligen Transaktionsparameter Pl -Px im Rahmen des beschriebenen Dialoges tabellarisch dargestellt: BE4 : Ich möchte eine Nachricht an Herrn Maier senden.On the basis of the following tabular representation, the change of the respective transaction parameters Pl -Px is tabulated in the context of the described dialog: BE4: I would like to send a message to Mr Maier.
Figure imgf000027_0001
Figure imgf000027_0001
BE5: Sehr geehrter Herr Maier, ich nehme ... (# gedrückt)BE5: Dear Mr. Maier, I'll take ... (# pressed)
Figure imgf000027_0002
Figure imgf000027_0002
BE6: NeinBE6: No.
Figure imgf000027_0003
Figure imgf000027_0003
BE7: Ja BE7: Yes
Figure imgf000028_0001
Figure imgf000028_0001
Über die Vorbedingungsparameter VBP sowie die zugeordneten Kontextinformationen KI wird somit eine schnelle Identifizie- rung der vom Benutzer B gewünschten Funktion der Hintergrundapplikation bzw. der dieser zugeordneten Transaktion Tl - Tx realisiert. Insbesondere durch die Abspeicherung der zuletzt vorliegenden Kontextinformation Klotzt in der Speichereinheit 5 der Dialog-Management-Einheit 3 und die zunächst beschränk- te Auswertung der mit den erhaltenen Aktionsinformationen AI im Hinblick auf die eine übereinstimmende Kontextinformation KI aufweisenden Transaktionen T2, T3 einer Transaktionsgruppe TGl wird die Nutzerfreundlichkeit sowie der Bedienkomfort des Sprachdialogsystems 1 deutlich erhöht.By means of the precondition parameters VBP and the associated context information KI, a fast identification of the function of the background application or of the assigned transaction Tl-Tx requested by the user B is thus realized. In particular, by the storage of the last available context information Klo t z t in the memory unit 5 of the dialogue management unit 3 and the initially limited evaluation of the obtained with the received action information AI in terms of a matching context information KI having transactions T2, T3 one Transaction group TG1, the user-friendliness and ease of use of the speech dialogue system 1 is significantly increased.
Die Erfindung wurde voranstehend anhand eines Ausführungsbeispiels näher beschrieben. Es versteht sich von selbst, daß zahlreiche Modifikationen sowie Abwandlungen möglich sind, ohne daß dadurch der der Erfindung zugrunde liegende Erfin- dungsgedanke verlassen wird. BezugszeichenlisteThe invention has been described above with reference to an embodiment. It goes without saying that numerous modifications and modifications are possible without thereby departing from the inventive concept underlying the invention. LIST OF REFERENCE NUMBERS
1 Sprachdialogsystem1 voice dialogue system
2 Eingabeeinheit 3 Dialog-Management-Einheit2 input unit 3 dialogue management unit
4 Ausgabeeinheit4 output unit
5 Speichereinheit5 storage unit
6 Spracherkennungseinheit6 speech recognition unit
7 Sprachsyntheseeinheit 8 Parsereinheit7 speech synthesis unit 8 parser
9 Steuereinheit9 control unit
AA AktionspromptsAA action prompts
AI AktionsinformationAI action information
AP, AP1-AP9 Ausgabeprompt AR AuswählroutineAP, AP1-AP9 Output Prompt AR Selection Routine
B BenutzerB user
BE, BE1-BE7 BenutzeräußerungBE, BE1-BE7 user statement
CR Constraint-RoutineCR constraint routine
DBS DatenbusSystem Gl-Gx GrammatikenDBS data bus system Gl-Gx grammars
Gl*-Gx* kontextabhängige GrammatikenGl * -Gx * contextual grammars
GR GrammatikroutineGR grammar routine
HA HintergrundapplikationHA background application
KI Kontextinformation Klotzt zuletzt gespeicherte KontextinformationKI context information Pads last saved context information
KIR Kontextinformationsroutine LB logische Bedingungsparameter NBA Nachbedingungsaktionen NBP Nachbedingungsparameter NBR NachbedingungsroutineKIR context information routine LB logical condition parameters NBA postcondition actions NBP postcondition parameters NBR postcondition routine
Pl-Px TransaktionsparameterPl-Px transaction parameters
tmax oberer Grenzwert Tmax upper limit
PGR Parametergrammatiken PP Parameterprompt S1-S5 erster bis fünfter Schritt SA Systemaction SAR Systemactionroutine Tl-Tx Transaktionen Tietzt zuletzt ausgeführte TransaktionPGR Parameter Grammars PP Parameter Prompt S1-S5 First to 5th Steps SA System Action SAR System Auction Routine Tl-Tx Transactions Tietz last executed transaction
TG TransaktionsgruppeTG transaction group
TPP TriggerparameterTPP trigger parameter
TPR Transaktionsparameterroutine TRR SystemtriggerparameterTPR transaction parameter routine TRR system trigger parameter
VBI VorbedingungsinformationenVBI precondition information
VBP VorbedingungsparameterVBP precondition parameters
VBR VorbedingungsroutineVBR precondition routine
VBR Vorbedingungsroutine VB VorbedingungVBR precondition routine VB precondition
WEI Wertermittlungsinformation WEI valuation information

Claims

Patentansprüche claims
1. Verfahren zur Ermittlung zumindest einer Transaktion (Tl - Tx) zur Bedienung einer Hintergrundapplikation (HA) unter Auswertung von zumindest einer in einer Benutzeräußerung (BE) enthaltenen Aktionsinformation (AI) in einem Sprachdialogsystem (1) , wobei jeweils einer Hintergrundapplikation (HA) eine endliche Menge auswählbarer Transaktionen (Tl - Tx) zugeordnet sind und bei dem über eine im Sprachdialogsystem (1) vor- gesehene Eingabeeinheit (2) zumindest eine Benutzeräußerung (BE) erfasst und im Sprachdialogsystem (1) gespeichert wird, dadurch gekennzeichnet, dass in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) im Sprachdialogsystem (1) jeweils zumindest ei- ne übereinstimmende Kontextinformation (KI) zugeordnet wird, dass die Kontextinformation (Klotzt) zumindest der zuletzt ausgeführten Transaktion (Tietzt) im Sprachdialogsystem gespeichert wird und - dass zur Ermittlung der aktuellen Transaktion (Tl - Tx) bevorzugt diejenigen Transaktionen (T2, T3) berücksichtigt werden, deren zugeordnete Kontextinformation (KI) mit der gespeicherten Kontextinformation (Klotzt) übereinstimmt .1. Method for determining at least one transaction (Tl - Tx) for operating a background application (HA) by evaluating at least one action information (AI) contained in a user statement (BE) in a speech dialog system (1), one background application each (HA) a finite set of selectable transactions (Tl - Tx) are assigned and in which via an input unit (2) provided in the speech dialogue system (1) at least one user utterance (BE) is recorded and stored in the speech dialogue system (1), characterized in that at least one matching context information (KI) is assigned to transactions (T2, T3) in the speech dialogue system (1), that the context information (Klotzt) of at least the last executed transaction (T he tzt) is stored in the speech dialogue system and - For determining the current transaction (Tl - Tx), preference is given to those transactions (T2, T3) are made their associated context information (KI) with the stored context information (Klo t t ) t coincides.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) zu einer Transaktionsgruppe (TGl) mit jeweils über- einstimmender Kontextinformation (KI) zusammengefasst werden.2. Method according to claim 1, characterized in that the transactions (T2, T3) which are in a context of meaning are combined to form a transaction group (TG1), each having matching context information (KI).
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die aktuelle Transaktion (Tl - T4) mittels der jeweils einer Transaktion (Tl-Tx) zugeordneten Grammatikroutine (GR) und dieser zugeordneter Grammatiken (Gl - Gx) durch Auswertung der in der Benutzeräußerung (BE) enthaltenen Aktionsinformationen (AI) ermittelt wird. 3. The method according to claim 1 or 2, characterized in that the current transaction (Tl - T4) by means of each of a transaction (Tl-Tx) associated grammar routine (GR) and this associated grammars (Gl - Gx) by evaluating the in the User statement (BE) contained action information (AI) is determined.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass im Sprachdialogsystem (1) jeweils einer Transaktion (Tl - Tx) eine vorgebbare Anzahl an Transaktionsparametern (Pl - Px) zugeordnet wird.4. The method according to any one of claims 1 to 3, characterized in that in the speech dialogue system (1) each a transaction (Tl - Tx) a predetermined number of transaction parameters (Pl - Px) is assigned.
5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zumindest eine in der gespeicherten Benutzeräußerung (BE) enthaltene Aktionsinformation (AI) mit Hilfe einer Spracherkennungseinheit (6) ermittelt wird.5. The method according to any one of the preceding claims, characterized in that the at least one in the stored user statement (BE) contained action information (AI) using a speech recognition unit (6) is determined.
6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zumindest einer der Transaktionen (Tl - Tx) zumindest ein Vorbedingungsparameter (VBP) zugeordnet wird.6. The method according to any one of the preceding claims, characterized in that at least one of the transactions (Tl - Tx) at least one precondition parameter (VBP) is assigned.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass das Vorliegen des zumindest einen zugeordneten Vorbedingungsparameters (VBP) mittels einer zugehörigen Vorbedingungsroutine (VBR) verifiziert wird.7. The method according to claim 6, characterized in that the presence of the at least one associated preconditioning parameter (VBP) is verified by means of an associated preconditioning routine (VBR).
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass durch die Vorbedingungsroutine (VBR) die Aktivierung bzw. Deaktivierung einer weiteren Transaktion (Tl) überprüft wird.8. The method according to claim 7, characterized in that the activation or deactivation of a further transaction (Tl) is checked by the preconditioning routine (VBR).
9 . Verfahren nach Anspruch 8 , d a d u r c h g e k e n n z e i c h n e t , dass abhängig vom Ergebnis der Überprüfung ein im Sprachdialogsystem (1) gespeicherter, zugeordneter Parameterprompt (PP) ausgewählt und über die Ausgabeeinheit (4) ausgegeben wird oder die Ausführung der aktuell ermittelten Transaktion (T2, T3, T4) fortgeführt wird. 9. Method according to Claim 8, characterized in that, depending on the result of the check, an assigned parameter prompt (PP) stored in the speech dialogue system (1) is selected and output via the output unit (4) or the execution of the currently determined transaction (T2, T3, T4). is continued.
10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zumindest einer der Transaktionen (Tl - Tx) zumindest ein Nachbedingungsparameter (NBP) zugeordnet wird.10. The method according to any one of the preceding claims, characterized in that at least one of the transactions (Tl - Tx) at least one Nachbedingungsparameter (NBP) is assigned.
11. Verfahren nach Ansprüche 10, dadurch gekennzeichnet, dass nach der Ausführung der aktuell ermittelten Transaktion (Tl, T2, T3, T4) eine zugehörige Nachbedingungsroutine (BNR) gestartet wird und mittels dieser das Vorliegen der zugeordneten Nachbedingungsparameter (NBP) überprüft sowie zugeordnete Nachbedingungsaktionen (NBA) initiiert werden.11. The method according to claims 10, characterized in that after the execution of the currently determined transaction (Tl, T2, T3, T4) an associated Nachbedingungsroutine (BNR) is started and checked by means of this the presence of the associated Nachbedingungsparameter (NBP) and associated Nachbedingungsaktionen (NBA).
12. Verfahren nach einem der Ansprüche 4 bis 11, dadurch gekennzeichnet, dass der Parameterwert eines Transaktionsparameters (Pl - Px) mittels einer Transaktionsparameterroutine (TPR) ermittelt wird, wobei zumindest einem Transaktionsparameter (P5) eine Wertermittlungsinformation (WEI) zugeordnet ist, die den Er- mittlungsweg angibt.12. The method as claimed in one of claims 4 to 11, characterized in that the parameter value of a transaction parameter (Pl - Px) is determined by means of a transaction parameter routine (TPR), wherein at least one transaction parameter (P5) is assigned a value determination information item (WEI) containing the Indicates the course of investigation.
13. Verfahren nach einem der Ansprüche 4 bis 12, dadurch gekennzeichnet, dass bei einer Änderung eines Transaktionsparameters (Pl - Px) einer Transaktion (Tl - Tx) die Gültigkeit des geänderten Transaktionsparameters (Pl - Px) überprüft wird.13. The method as claimed in one of claims 4 to 12, characterized in that the validity of the changed transaction parameter (Pl - Px) is checked in the case of a change of a transaction parameter (Pl - Px) of a transaction (Tl - Tx).
14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass die Überprüfung der Gültigkeit des geänderten Transaktionsparameters (Pl - Px) mittels einer Constraint-Routine (CR) durchgeführt wird, welche Trigger-Parameter (TR) , zumindest eine logische Bedingung (LB) und Aktionsanweisungsprompts (AA) umfasst.14. The method according to claim 13, characterized in that the verification of the validity of the changed transaction parameter (Pl - Px) by means of a constraint routine (CR) is performed, which trigger parameters (TR), at least one logical condition (LB) and Action instruction prompts (AA).
15 . Verfahren nach einem der Ansprüche 1 bis 14 , d a d u r c h g e k e n n z e i c h n e t , dass dem Benutzer (B) des Sprachdialogsystem (1) während der Ausführung der aktuell ermittelten Transaktion (Tl - Tx) einer Hintergrundapplikation (HA) vorgegebene Informationsbzw. Aktionsprompts (AP) angezeigt werden.15. Method according to one of claims 1 to 14, characterized that the user (B) of the speech dialogue system (1) during the execution of the currently determined transaction (Tl - Tx) a background application (HA) given Informationsbzw. Action Prompts (AP) are displayed.
16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, dass die vorgegebenen Informations- bzw. Aktionsprompts (AP) mit Hilfe einer System-Action-Routine (SAR) ermittelt werden, welche Trigger-Parameter (TRR) , Vorbedingungsinformationen (VBI) und vorgegebene Systemactions (SA) umfasst.16. The method according to claim 15, characterized in that the predetermined information or Aktionsprompts (AP) using a system action routine (SAR) are determined, which trigger parameters (TRR), precondition information (VBI) and predetermined system actions (SA).
17. Verfahren nach Anspruch 1 bis 16, dadurch gekennzeichnet, dass den einzelnen Transaktionen (Tl - T4) jeweils eine von der zugeordneten Kontextinformation (KI) abhängige Grammatik (Gl*- Gx*) zugeordnet wird.17. The method according to claim 1 to 16, characterized in that the individual transactions (Tl - T4) each one of the associated context information (KI) dependent grammar (Gl * - Gx *) is assigned.
18. Sprachdialogsystem zur Durchführung des Verfahrens gemäß einer der Ansprüche 1 bis 17 bestehend aus zumindest einer18. Speech dialogue system for carrying out the method according to one of claims 1 to 17 consisting of at least one
Eingabeeinheit (2), einer Dialog-Management-Einheit (3) und einer Ausgabeeinheit (4), dadurch gekennzeichnet,Input unit (2), a dialogue management unit (3) and an output unit (4), characterized
- dass die Dialog-Management-Einheit (3) eine Steuerein- heit (9) zur Zuordnung zumindest einer übereinstimmenden- That the dialogue management unit (3) a control unit (9) for assigning at least one matching
Kontextinformation (KI) zu in einem Sinnzusammenhang stehenden Transaktionen (T2, T3) aufweist,Context information (KI) to meaningful transactions (T2, T3),
- dass eine Speichereinheit (5) zur Speicherung zumindest der Kontextinformation (Klotzt) der zuletzt ausgeführten Transaktion (Tietzt) vorgesehen ist und dass eine in der Steuereinheit (9) ausgeführte Auswahlroutine (AR) vorgesehen ist, die bevorzugt diejenigen Transaktionen (T2, T3) für die Ermittlung der aktuellen Transkation (Tl - Tx) auswählt, deren zugeordnete Kon- textinformation (KI) mit der gespeicherten Kontextinformation (Klotzt) übereinstimmt. - That a memory unit (5) for storing at least the context information (Klo t z t ) of the last executed transaction (Ti et zt) is provided and that in the control unit (9) executed selection routine (AR) is provided, preferably those transactions (T2, T3) for the determination of the current transaction (T1 - Tx) whose associated context information (KI) matches the stored context information (padded).
19. Sprachdialogsystem nach Anspruch 18, dadurch gekennzeichnet , dass die zu bedienende Hintergrundapplikation (HA) als „Uni- fied Messaging Systeme" ausgebildet ist. 19. Speech dialogue system according to claim 18, characterized in that the background application to be operated (HA) as "Unified messaging systems" is formed.
PCT/EP2006/064501 2005-08-09 2006-07-21 Method and vocal interaction system for determining at least one transaction for operating a background application WO2007017361A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102005037621A DE102005037621A1 (en) 2005-08-09 2005-08-09 Method and speech dialog system for determining at least one transaction for operating a background application
DE102005037621.5 2005-08-09

Publications (1)

Publication Number Publication Date
WO2007017361A1 true WO2007017361A1 (en) 2007-02-15

Family

ID=37179086

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2006/064501 WO2007017361A1 (en) 2005-08-09 2006-07-21 Method and vocal interaction system for determining at least one transaction for operating a background application

Country Status (2)

Country Link
DE (1) DE102005037621A1 (en)
WO (1) WO2007017361A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9661138B2 (en) 2015-01-14 2017-05-23 Unify Gmbh & Co. Kg System and method for automatic intention evaluation and communication routing

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008025532B4 (en) * 2008-05-28 2014-01-09 Audi Ag A communication system and method for performing communication between a user and a communication device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1033701A2 (en) * 1999-03-01 2000-09-06 Matsushita Electric Industrial Co., Ltd. Apparatus and method using speech understanding for automatic channel selection in interactive television
WO2001078065A1 (en) * 2000-04-06 2001-10-18 One Voice Technologies, Inc. Natural language and dialogue generation processing
EP1335352A1 (en) * 2002-02-11 2003-08-13 Sony International (Europe) GmbH Dialogue management server and method for dialogue management
WO2006037219A1 (en) * 2004-10-05 2006-04-13 Inago Corporation System and methods for improving accuracy of speech recognition

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1033701A2 (en) * 1999-03-01 2000-09-06 Matsushita Electric Industrial Co., Ltd. Apparatus and method using speech understanding for automatic channel selection in interactive television
WO2001078065A1 (en) * 2000-04-06 2001-10-18 One Voice Technologies, Inc. Natural language and dialogue generation processing
EP1335352A1 (en) * 2002-02-11 2003-08-13 Sony International (Europe) GmbH Dialogue management server and method for dialogue management
WO2006037219A1 (en) * 2004-10-05 2006-04-13 Inago Corporation System and methods for improving accuracy of speech recognition

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9661138B2 (en) 2015-01-14 2017-05-23 Unify Gmbh & Co. Kg System and method for automatic intention evaluation and communication routing
US9883039B2 (en) 2015-01-14 2018-01-30 Unify Gmbh & Co. Kg System and method for automatic intention evaluation and communication routing
US10154141B2 (en) 2015-01-14 2018-12-11 Unify Gmbh & Co. Kg System and method for automatic intention evaluation and communication routing

Also Published As

Publication number Publication date
DE102005037621A1 (en) 2007-02-22

Similar Documents

Publication Publication Date Title
EP1964110B1 (en) Method for triggering at least one first and second background application via a universal language dialogue system
DE69839068T2 (en) System and method for automatic processing of call and data transmission
DE69835718T2 (en) Method and apparatus for voice interaction over a network using configurable interaction definitions
DE60222093T2 (en) METHOD, MODULE, DEVICE AND VOICE RECOGNITION SERVER
DE60033733T2 (en) Database query system based on speech recognition
DE102009045187B4 (en) System and method for communicating with telephone agents in an automated call center
US7668716B2 (en) Incorporation of external knowledge in multimodal dialog systems
DE60313706T2 (en) Speech recognition and response system, speech recognition and response program and associated recording medium
EP3108476B1 (en) Method for acquiring at least two pieces of information to be acquired, comprising information content to be linked, using a speech dialogue device, speech dialogue device, and motor vehicle
EP0852051A1 (en) Process for automatic control of one or more devices by voice commands or by real-time voice dialog and apparatus for carrying out this process
EP0925578A1 (en) Speech-processing system and method
EP1956814A1 (en) Digital method and device for authenticating a user of a telecommunications / data network
DE10100725C1 (en) Automatic dialogue system for speech interrogation of databank entries uses speech recognition system assisted by speech model obtained before beginning of dialogue
DE102019217751B4 (en) Method for operating a speech dialogue system and speech dialogue system
DE60128372T2 (en) METHOD AND SYSTEM FOR IMPROVING ACCURACY IN A LANGUAGE IDENTIFICATION SYSTEM
EP1590797A1 (en) Communication system, communication emitter, and appliance for detecting erroneous text messages
DE10110977C1 (en) Providing help information in a speech dialogue system
DE102005060072A1 (en) Management of multilingual nametags for embedded speech recognition
DE69636731T2 (en) System and method for recording names in a voice recognition database
EP3058565B1 (en) Voice control method and computer program product for performing the method
WO2001086634A1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
WO2007017361A1 (en) Method and vocal interaction system for determining at least one transaction for operating a background application
EP1251680A1 (en) Voice-controlled directory service for connection to a Data Network
EP1340169A2 (en) Method and device for automatically issuing information using a search engine
DE60125597T2 (en) Device for the provision of services

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06764241

Country of ref document: EP

Kind code of ref document: A1